Python DSReader.remove_duplicates примеры использования

Язык программирования: Python

Пространство имен/Пакет: src.reader

Класс/Тип: DSReader

Метод/Функция: remove_duplicates

Примеров на hotexamples.com: 2

Python DSReader.remove_duplicates - 2 примера найдено. Это лучшие примеры Python кода для src.reader.DSReader.remove_duplicates, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

DSReader(13)

make_dictionary(7)

vectorize(6)

split_train_and_test(3)

to_lower(3)

remove_digits(2)

remove_duplicates(2)

remove_punctuation_marks(2)

remove_stopwords(2)

Пример #1

Показать файл

Файл: test_pd.py Проект: awilliamson1889/Simple-SPAM-classificator

    def test_reader__remove_duplicates(self):
        """Check whether remove_duplicates method removes duplicates
        from dataset based on the email column."""

        NUMBER_DUP = 2
        reader = DSReader(dataset_dup_path)
        before_remove = reader.dataset.shape[0]
        reader.remove_duplicates()

        self.assertEqual(reader.dataset.shape[0], before_remove - NUMBER_DUP)

Пример #2

Показать файл

Файл: test_reader.py Проект: EgorHubBrest/Python-DS-Learning

# my_dataset.to_lower()
# my_dataset.remove_digits()
# my_dataset.remove_punctuation_marks()
# my_dataset.remove_duplicates()
# my_dataset.remove_stopwords()
# my_dataset.remove_stopwords()

# print(my_dataset.dataset)

my_dataset1 = DSReader('C:/Users/Masquerade/Downloads/emails.csv')

my_dataset1.to_lower()
my_dataset1.remove_digits()
my_dataset1.remove_punctuation_marks()
my_dataset1.remove_duplicates()
my_dataset1.remove_stopwords()
my_dataset1.remove_stopwords()

# print(my_dataset1.dataset)

list_email, list_label = my_dataset1.vectorize()
print(list_email.shape)
print(list_label.shape)

X, y = list_email, list_label
# X, y = my_dataset1.dataset.email, my_dataset1.dataset.label

X_train, X_test, y_train, y_test = train_test_split(X.values, y.values)
print("______________________________________________")
print(y_test)