Python Data.bag_of_words примеры использования

Язык программирования: Python

Пространство имен/Пакет: aethos

Класс/Тип: Data

Метод/Функция: bag_of_words

Примеров на hotexamples.com: 2

Python Data.bag_of_words - 2 примера найдено. Это лучшие примеры Python кода для aethos.Data.bag_of_words, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Data(30)

drop(3)

normalize_numeric(3)

apply(2)

drop_column_missing_threshold(2)

pca(2)

bag_of_words(2)

describe_column(1)

groupby(1)

onehot_encode(1)

nounphrases_spacy(1)

nounphrases_nltk(1)

normalize_quantile_range(1)

normalize_log(1)

mean(1)

groupby_analysis(1)

expand_json_column(1)

describe(1)

encode_target(1)

encode_labels(1)

checklist(1)

drop_rows_missing_threshold(1)

drop_duplicate_rows(1)

drop_duplicate_columns(1)

drop_correlated_features(1)

drop_constant_columns(1)

clean_text(1)

drop_unique_columns(1)

Пример #1

Показать файл

    def test_featureextractiontext_bow(self):

        list_of_sentences = ["Hi my name is pyml", "Hi name pyml"]

        columns = ["text"]
        data = pd.DataFrame(list_of_sentences, columns=columns)

        feature = Data(x_train=data,
                       test_split_percentage=0.5,
                       split=False,
                       report_name="test")
        feature.bag_of_words(keep_col=False)
        validate = feature.x_train.values.tolist()

        self.assertListEqual(validate, [[1, 1, 1, 1, 1], [1, 0, 0, 1, 1]])

Пример #2

Показать файл

    def test_report_feature_bow(self):

        list_of_sentences = ["Hi my name is pyml", "Hi name pyml"]

        columns = ["text"]
        data = pd.DataFrame(list_of_sentences, columns=columns)

        feature = Data(x_train=data,
                       test_split_percentage=0.5,
                       split=False,
                       report_name="test")
        feature.bag_of_words()

        with open(feature.report.filename) as f:
            content = f.read()
        validate = "representation" in content

        os.remove(feature.report.filename)

        self.assertTrue(validate)