Ejemplos de LoadData.loadStopWords en Python

Lenguaje de programación: Python

Namespace/Package Name: LoadData

Clase / Tipo: LoadData

Método / Función: loadStopWords

Ejemplos en hotexamples.com: 3

Python LoadData.loadStopWords - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de LoadData.LoadData.loadStopWords extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

LoadData(30)

load(7)

load_data(6)

load_org_node(4)

loadData(4)

load_linking_table(3)

loadStopWords(3)

load_processed_data(2)

load_validation_data(2)

get_data(2)

loadTXT(2)

load_test_data(2)

load_org_path(2)

load_month_return_fname(1)

load_month_borrow_fname(1)

load_month_return_data(1)

read_data(1)

load_not_found_node(1)

process(1)

segments(1)

path(1)

preprocess_data(1)

load_train_data(1)

loadUrls(1)

load_month_borrow_data(1)

loadDataCSV(1)

cut_and_shuffle(1)

download(1)

filter_data(1)

getTestDataset(1)

getTrainDataset(1)

get_batches(1)

loadDataFeature(1)

load_csv(1)

loadDataNormalize(1)

loadDataTrain(1)

loadDataTxt(1)

loadNSplit(1)

loadParams(1)

create_model(1)

unprocessed(1)

Ejemplo n.º 1

Mostrar archivo

 def train_n_classes(self):
     l = LoadData()
     stopWords = l.loadStopWords()
     train_sizes = [100, 200, 300]  # size per class
     for train_size in train_sizes:
         print('Training size:',
               math.floor(train_size * 0.75) * 5, 'Test size:',
               math.ceil(train_size * 0.25) * 5)
         self.loadData(train_size)
         vect = TfidfVectorizer(stop_words=stopWords)
         self.train_and_test_split(0.75)
         classes = {}
         x = 0
         for i in self.data['class_name']:
             if i not in classes:
                 classes[i] = x
                 x += 1
         X_train = vect.fit_transform(self.train_data['data'])
         Y_train = [classes[i] for i in self.train_data['class_name']]
         X_test = vect.transform(self.test_data['data'])
         Y_test = [classes[i] for i in self.test_data['class_name']]
         nb = MultinomialNB()
         Y_pred = nb.fit(X_train, Y_train).predict(X_test)
         self.metric(Y_test, Y_pred)
         print('---------------------------------------------------')

Ejemplo n.º 2

Mostrar archivo

 def train(self):
     l = LoadData()
     stopWords = l.loadStopWords()
     self.loadDataCSV('bbc-text.csv')
     vect = TfidfVectorizer(stop_words=stopWords)
     self.train_and_test_split(0.75)
     X_train = vect.fit_transform(self.train_data['data'])
     Y_train = self.train_data['class_name']
     X_test = vect.transform(self.test_data['data'])
     Y_test = self.test_data['class_name']
     nb = MultinomialNB()
     Y_pred = nb.fit(X_train, Y_train).predict(X_test)
     self.metric(Y_test, Y_pred)

Ejemplo n.º 3

Mostrar archivo

    def train_1_class(self):
        l = LoadData()
        stopWords = l.loadStopWords()
        train_sizes = [100, 200]  # size per class
        for train_size in train_sizes:
            print('Training size:',
                  math.floor(train_size * 0.75) * 2, 'Test size:',
                  math.ceil(train_size * 0.25) * 2)
            self.loadData(train_size)
            vect = TfidfVectorizer(stop_words=stopWords)

            # balance classes
            temp_class = self.data['class_name'][train_size:]
            temp_data = self.data['data'][train_size:]
            idx = random.choices(range(len(temp_class)), k=train_size)
            temp_class = [temp_class[i] for i in idx]
            temp_data = [temp_data[i] for i in idx]
            del self.data['data'][train_size:]
            del self.data['class_name'][train_size:]
            self.data['class_name'].extend(temp_class)
            self.data['data'].extend(temp_data)

            self.train_and_test_split(0.75)
            X_train = vect.fit_transform(self.train_data['data'])
            Y_train = [
                1 if i == 'business' else 0
                for i in self.train_data['class_name']
            ]
            X_test = vect.transform(self.test_data['data'])
            Y_test = [
                1 if i == 'business' else 0
                for i in self.test_data['class_name']
            ]
            nb = MultinomialNB()
            Y_pred = nb.fit(X_train, Y_train).predict(X_test)
            self.metric(Y_test, Y_pred)
            print('---------------------------------------------------')