Ejemplos de DSReader.to_lower en Python

Lenguaje de programación: Python

Namespace/Package Name: src.reader

Clase / Tipo: DSReader

Método / Función: to_lower

Ejemplos en hotexamples.com: 3

Python DSReader.to_lower - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de src.reader.DSReader.to_lower extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

DSReader(13)

make_dictionary(7)

vectorize(6)

split_train_and_test(3)

to_lower(3)

remove_digits(2)

remove_duplicates(2)

remove_punctuation_marks(2)

remove_stopwords(2)

Ejemplo n.º 1

Mostrar archivo

Archivo: test_pd.py Proyecto: awilliamson1889/Simple-SPAM-classificator

    def test_reader__to_lower(self):
        """Check whether to_lower method convert all emails in dataset
        to lower case."""

        reader = DSReader(dataset_capital)
        reader.to_lower()
        self.assertEqual(
            True,
            all([line.email.islower()
                 for line in reader.dataset.itertuples()]))

Ejemplo n.º 2

Mostrar archivo

Archivo: test_pd.py Proyecto: awilliamson1889/Simple-SPAM-classificator

    def test_reader__remove_punctuation_marks(self):
        """Check whether remove_punctuation_marks deletes all punctuation
        marks from the dataset"""

        reader = DSReader(dataset_punctuation_marks)
        reader.to_lower()
        reader.remove_punctuation_marks()
        for i, row in reader.dataset.iterrows():
            for word in row['email'].split(' '):
                self.assertEqual(
                    all([mark not in word for mark in string.punctuation]),
                    True)

Ejemplo n.º 3

Mostrar archivo

Archivo: test_reader.py Proyecto: EgorHubBrest/Python-DS-Learning

my_data_test1 = os.path.abspath('../tests/datasets/test_dataset_1_digits.csv')

# my_dataset = DSReader(my_data_test)

# my_dataset.to_lower()
# my_dataset.remove_digits()
# my_dataset.remove_punctuation_marks()
# my_dataset.remove_duplicates()
# my_dataset.remove_stopwords()
# my_dataset.remove_stopwords()

# print(my_dataset.dataset)

my_dataset1 = DSReader('C:/Users/Masquerade/Downloads/emails.csv')

my_dataset1.to_lower()
my_dataset1.remove_digits()
my_dataset1.remove_punctuation_marks()
my_dataset1.remove_duplicates()
my_dataset1.remove_stopwords()
my_dataset1.remove_stopwords()

# print(my_dataset1.dataset)

list_email, list_label = my_dataset1.vectorize()
print(list_email.shape)
print(list_label.shape)

X, y = list_email, list_label
# X, y = my_dataset1.dataset.email, my_dataset1.dataset.label