Python Dataset.convert_to_pyfm_format 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: src.dataset

클래스/타입: Dataset

메소드/함수: convert_to_pyfm_format

hotexamples.com에서의 예제들: 3

Python Dataset.convert_to_pyfm_format - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 src.dataset.Dataset.convert_to_pyfm_format에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Dataset(30)

_build_dataframe(9)

generate_batch_sample_iter(7)

graph(6)

filter_data(6)

convert_to_pyfm_format(3)

get_image_id(2)

from_indices(2)

load_custom_data(2)

encode(2)

get_statistic(2)

_create_cut_columns(2)

_preprocess_image(2)

drop_columns(2)

get_retrieval_list(1)

get_labeled_y(1)

get_tiny_imagenet_test_dataset(1)

get_labeled_X(1)

get_tiny_imagenet_train_dataset(1)

get_image_list(1)

get_unlabeled(1)

Y_decoded(1)

get_vocab_size(1)

getValid4Search(1)

inverse_transform_instance(1)

load(1)

load_data(1)

load_eval_data(1)

load_indexes(1)

load_input(1)

load_original(1)

load_train_data(1)

load_val_data(1)

input_size(1)

generate_x(1)

getTrain4Test(1)

decode(1)

add_feature(1)

attributes(1)

batch(1)

batch_size(1)

build_test_bg_dataset(1)

build_test_signal_dataset(1)

build_train_dataset(1)

build_train_test(1)

categorical_correlated(1)

class_column_name(1)

describe(1)

getTrain4Search(1)

ensure_normality(1)

예제 #1

파일 보기

    def train(self):
        if self.uses_features:
            df = pd.merge(self.dataset.training_df,
                          self.dataset.item_features,
                          on="item_id",
                          how="left")
        else:
            df = self.dataset.training_df.copy()

        training_data, training_columns = Dataset.convert_to_pyfm_format(df)
        self.one_hot_columns = training_columns

        self.fm.fit(training_data, self.dataset.y_train)

예제 #2

파일 보기

    def predict(self, df):
        if self.uses_features:
            df = pd.merge(df,
                          self.dataset.item_features,
                          on="item_id",
                          how="left")

        all_predictions = list()

        # divide in chunks to avoid memory errors
        chunk_size = 10
        chunks = np.array_split(df, chunk_size)
        for chunck in chunks:
            # convert
            test_data, _ = Dataset.convert_to_pyfm_format(chunck)

            # get predictions
            preds = self.fm.predict(test_data)
            all_predictions.extend(preds.round(3))

        return all_predictions

예제 #3

파일 보기

    def explain_instance(self,
                         instance,
                         rec_model,
                         neighborhood_entity,
                         labels=(1, ),
                         num_features=10,
                         num_samples=50,
                         distance_metric='cosine',
                         model_regressor=None):

        # get neighborhood
        neighborhood_df = self.generate_neighborhood(instance,
                                                     neighborhood_entity,
                                                     num_samples)

        # compute distance based on interpretable format
        data, _ = Dataset.convert_to_pyfm_format(
            neighborhood_df, columns=rec_model.one_hot_columns)
        distances = sklearn.metrics.pairwise_distances(
            data, data[0].reshape(1, -1), metric=distance_metric).ravel()

        # get predictions from original complex model
        yss = np.array(rec_model.predict(neighborhood_df))

        # for classification, the model needs to provide a list of tuples - classes along with prediction probabilities
        if self.mode == "classification":
            raise NotImplementedError(
                "LIME-RS does not currently support classifier models.")
        # for regression, the output should be a one-dimensional array of predictions
        else:
            try:
                assert isinstance(yss, np.ndarray) and len(yss.shape) == 1
            except AssertionError:
                raise ValueError(
                    "Your model needs to output single-dimensional \
                            numpyarrays, not arrays of {} dimensions".format(
                        yss.shape))

            predicted_value = yss[0]
            min_y = min(yss)
            max_y = max(yss)

            # add a dimension to be compatible with downstream machinery
            yss = yss[:, np.newaxis]

        ret_exp = explanation.Explanation(domain_mapper=None,
                                          mode=self.mode,
                                          class_names=self.class_names)
        if self.mode == "classification":
            raise NotImplementedError(
                "LIME-RS does not currently support classifier models.")
        else:
            ret_exp.predicted_value = predicted_value
            ret_exp.min_value = min_y
            ret_exp.max_value = max_y
            labels = [0]

        for label in labels:
            (ret_exp.intercept[label], ret_exp.local_exp[label], ret_exp.score,
             ret_exp.local_pred) = self.base.explain_instance_with_data(
                 data,
                 yss,
                 distances,
                 label,
                 num_features,
                 model_regressor=model_regressor,
                 feature_selection=self.feature_selection)

        return ret_exp