Python Datasets.load_datasetsの例

プログラミング言語: Python

名前空間/パッケージ名: datasets

クラス/型: Datasets

メソッド/関数: load_datasets

hotexamples.comのコード掲載数: 2

Python Datasets.load_datasets - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdatasets.Datasets.load_datasetsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Datasets(28)

get(3)

make_stacked_frame_data(2)

mnist(2)

load_dataset(2)

read_data(2)

load_datasets(2)

create_manifest_file_s3(2)

create_dataset(2)

read_drift_data(1)

read_datasets(1)

split_indexes(1)

test_image_id_imagefeat_dict(1)

preprocess_newdata(1)

prepare_dataset(1)

population_data(1)

normalize_string(1)

train_image_id_imagefeat_dict(1)

make_split_generator(1)

make_single_frame_data(1)

make_lstm_data(1)

load_test_data(1)

read_calibration_data(1)

get_train_wider_calib_data(1)

load_data(1)

get_drift_data(1)

create(1)

delete_dataset(1)

describe_dataset(1)

download(1)

geo_data(1)

get_calibration_data(1)

get_dataset(1)

get_datasets(1)

get_groups(1)

load(1)

get_guyon_graph(1)

get_labeled_datasets(1)

get_scale_free_graph_edge(1)

get_session_dict(1)

get_sessions(1)

get_tokenized_data(1)

get_train_data(1)

covid_data(1)

update_dataset_entries(1)

コード例 #1

ファイルを表示

def main():
    datasets = [
        {"city": "beijing", "age": 500, "temperature": 26},
        {"city": "shanghai", "age": 550, "temperature": 27},
        {"city": "shenzheng", "age": 300, "temperature": 30},
    ]

    dict_vectorizer = DictVectorizer()
    dv_datasets = dict_vectorizer.fit_transform(datasets)
    print dv_datasets.toarray()
    print dict_vectorizer.vocabulary_
    print dict_vectorizer.feature_names_
    print "-" * 80

    #fh_vectorizer = FeatureHasher(n_features=10, input_type="dict")
    #fh_datasets = fh_vectorizer.fit_transform([{"text": 10, "words": 7}, {"name": 1, "words": 5}, {"gender": 1}])
    fh_vectorizer = FeatureHasher(n_features=10, input_type="string")
    fh_datasets = fh_vectorizer.fit_transform(["Liming love football", "Zhansan likes baseball"])
    print fh_datasets.toarray()

    raw_datasets, _ = Datasets.load_datasets()
    datasets = [v for v in raw_datasets.data[:10]]

    count_vectorizer = CountVectorizer(decode_error="ignore")
    cv_datasets = count_vectorizer.fit_transform(datasets)
    print count_vectorizer.vocabulary_

    tfidf_transformer = TfidfTransformer(smooth_idf=True)
    tfidft_datasets = tfidf_transformer.fit_transform(cv_datasets)
    print tfidft_datasets.toarray()
    print tfidf_transformer.idf_

    hash_vectorizer = HashingVectorizer(n_features=100, decode_error="ignore")
    hv_datasets = hash_vectorizer.fit_transform(datasets)
    print hv_datasets.toarray().shape

コード例 #2

ファイルを表示

ファイル: feature_selection.py プロジェクト: butlerwilson/learn4sklearn

def main():
    raw_datasets, _ = Datasets.load_datasets()
    X, Y = gen_datasets(raw_datasets)

    vectorizer = CountVectorizer(decode_error="ignore")
    cv_datasets = vectorizer.fit_transform(X).toarray()

    clf = ExtraTreesClassifier()
    clf = clf.fit(cv_datasets, Y)
    print cv_datasets.shape

    print clf.feature_importances_

    modle = SelectFromModel(clf, prefit=True)
    X_new = modle.transform(cv_datasets)
    print X_new.shape

    binarizer = Binarizer(threshold=1.0)
    b_datasets = binarizer.fit_transform(cv_datasets)
    variance_threshold = VarianceThreshold(.8 * (1 - .8))
    v_datasets = variance_threshold.fit_transform(b_datasets)
    print v_datasets.shape