Python DataFormatter.get_pval_top_n_features примеры использования

Язык программирования: Python

Класс/Тип: DataFormatter

Метод/Функция: get_pval_top_n_features

Примеров на hotexamples.com: 2

Python DataFormatter.get_pval_top_n_features - 2 примера найдено. Это лучшие примеры Python кода для DataFormatter.get_pval_top_n_features из пакета commcare-hq, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

get_scikit_data_and_target(6)

get_expression_scikit_data_target_for_drug(5)

get_expression_frame_and_ic50_series_for_drug(4)

shuffle_scikit_data_target(4)

DataFormatter(3)

get_expression_frame_with_features(2)

formatData(2)

get_pval_top_n_features(2)

_format_array_v2(2)

get_normalized_full_expression_identifiers_and_data(2)

get_cell_line_expression_frame(2)

get_cell_line_and_patient_expression_data_target_for_drug(2)

make_recurrent(1)

remove_global_output_columns(1)

recurrent_regression_to_classification(1)

partition(1)

normalize_string(1)

normalize_expression_frame(1)

get_scikit_data(1)

get_alpha_vantage_data(1)

formatFile(1)

get_patients_expression_frame(1)

getFormattedData(1)

get_features_below_pval_threshold(1)

get_cell_line_and_patient_expression_data_target_top_features_for_drug(1)

get_cell_line_and_patient_expression_gene_intersection(1)

generate_distance_sums_for_individual_fish(1)

Пример #1

Показать файл

Файл: Classification.py Проект: joewledger/Cell-Line-Classification

    def get_predictions_full_CCLE_dataset_top_features(self,expression_file,ic50_file,num_features,drug):
        expression_frame,ic50_series = dfm.get_expression_frame_and_ic50_series_for_drug(expression_file,ic50_file,drug,normalized=True,trimmed=True)
        top_features = dfm.get_pval_top_n_features(expression_frame,ic50_series,num_features)
        expression_frame = expression_frame.ix[top_features]
        scikit_data,scikit_target = dfm.get_scikit_data_and_target(expression_frame,ic50_series)

        cell_lines, testing_data = dfm.get_normalized_full_expression_identifiers_and_data(expression_file,expression_frame.index)
        self.model.fit(scikit_data,scikit_target)
        predictions = self.model.predict(testing_data)

        return cell_lines,predictions,list(top_features)

Пример #2

Показать файл

Файл: Cross_Validator.py Проект: joewledger/Cell-Line-Classification

def trim_X_num_features(X,y,train,num_features):
    """
    Do calculations to trim X by taking the top num_features features based on p-value rank
    """
    all_samples = pd.DataFrame(X)
    all_labels = pd.Series(y)

    train_samples,train_labels = get_training_samples_labels(all_samples,all_labels,train)
    features = dfm.get_pval_top_n_features(train_samples.T,train_labels,num_features)

    trimmed_all_samples = all_samples[features]

    return np.array([list(trimmed_all_samples.ix[row]) for row in trimmed_all_samples.index])