Python Dataset Examples

Programming Language: Python

Namespace/Package Name: Manteia.Dataset

Class/Type: Dataset

Examples at hotexamples.com: 19

Python Dataset - 19 examples found. These are the top rated real world Python examples of Manteia.Dataset.Dataset extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Dataset(18)

documents_train(1)

labels_train(1)

Example #1

Show file

File: exemple_Statistic.py Project: ym001/Manteia

def main(args):
	
	ds=Dataset('pubmed_rct20k')

	Statistic(ds.documents_train,ds.labels_train)
	
	return 0

Example #2

Show file

def main(args):

    ds = Dataset('20newsgroups')
    documents = ds.documents_train
    labels = ds.labels_train
    pp = Preprocess(documents=documents, labels=labels, nb_sample=500)
    documents = pp.documents
    labels = pp.labels

    cl = Classification(documents_train=documents, labels_train=labels)
    cl.list_labels = pp.list_labels

    cl.process()

    print(cl.predict(documents[:5]))

    return 0

Example #3

Show file

def main(args):

    ds = Dataset('Short_Jokes')

    model = Model(model_name='gpt2')
    text_loader = Create_DataLoader_generation(ds.documents_train[:10000],
                                               batch_size=32)
    model.load_type()
    model.load_tokenizer()
    model.load_class()
    model.devices()
    model.configuration(text_loader)

    gn = Generation(model)

    gn.model.fit_generation(text_loader)
    output = model.predict_generation('What did you expect ?')
    output_text = decode_text(output, model.tokenizer)
    print(output_text)

    return 0

Example #4

Show file

from Manteia.Dataset import Dataset

ds = Dataset('Amazon Review Full', test=True, desc=True)

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

print('Test : ')
print(ds.documents_test[:5])
print(ds.labels_test[:5])

print('Description :')
print(ds.description)

Example #5

Show file

from Manteia.Dataset import Dataset

ds=Dataset('pubmed_rct20k')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

Example #6

Show file

File: exemple_Dataset7.py Project: ym001/Manteia

from Manteia.Dataset import Dataset

ds = Dataset('Yelp Review Full', test=True, desc=True)

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

print('Test : ')
print(ds.documents_test[:5])
print(ds.labels_test[:5])

print('Description :')
print(ds.description)

Example #7

Show file

#modifier->parametre du notebook->GPU
#import nltk
#nltk.download('wordnet')
from Manteia.Classification import Classification 
from Manteia.Model import *
from Manteia.Dataset import Dataset
from Manteia.Preprocess import list_labels
from Manteia.Augmentation import *
from sklearn.model_selection import train_test_split,KFold

ds=Dataset('drugscom')
ds.documents_train=np.array(ds.documents_train[:100])
ds.labels_train=np.array(ds.labels_train[:100])

model = Model(model_name ='bert',early_stopping=True)
model.load_type()
model.load_tokenizer()
list_label=list_labels(ds.labels_train)
print(list_label)
model.num_labels=len(list_label)
model.load_class()
model.save('model_init')



#validation croisée
nb_pass=4
def coss_validation_idx(nb_pass,nb_docs):
  docs_idx = [idx for idx in range(nb_docs)]
  train_idx, test_idx = [], []
  for pli in range(nb_pass):

Example #8

Show file

from Manteia.Dataset import Dataset

ds = Dataset('20newsgroups')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

Example #9

Show file

File: exemple_Dataset6.py Project: ym001/Manteia

from Manteia.Dataset import Dataset

ds = Dataset('Yelp Review Polarity', test=True, desc=True)

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])
print(ds.documents_test[:5])
print(ds.labels_test[:5])
print(ds.description)

Example #10

Show file

from Manteia.Dataset import Dataset

ds = Dataset('Yahoo! Answers', test=True, desc=True)

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

print('Test : ')
print(ds.documents_test[:5])
print(ds.labels_test[:5])

print('Description :')
print(ds.description)

print('List labels :')
print(ds.list_labels)

Example #11

Show file

from Manteia.Dataset import Dataset

ds=Dataset('drugscom')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

Example #12

Show file

from Manteia.Dataset import Dataset

ds = Dataset('Amazon Review Polarity', test=True, desc=True)

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])
print(ds.documents_test[:5])
print(ds.labels_test[:5])
print(ds.description)

Example #13

Show file

File: exemple_Dataset8.py Project: ym001/Manteia

from Manteia.Dataset import Dataset

ds=Dataset('agnews')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

Example #14

Show file

from Manteia.Dataset import Dataset

ds=Dataset('DBPedia',path='test/test/',test=True,desc=True,classe=True)

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

print('Test : ')
print(ds.documents_test[:5])
print(ds.labels_test[:5])

print('Description :')
print(ds.description)

print('List labels :')
print(ds.list_labels)

Example #15

Show file

from Manteia.Dataset import Dataset

ds = Dataset('SST-5', dev=True)

print('Dev : ')
print(ds.documents_dev[:5])
print(ds.labels_dev[:5])

Example #16

Show file

File: exemple_Dataset15.py Project: ym001/Manteia

from Manteia.Dataset import Dataset

ds = Dataset('Tweeter Airline Sentiment')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

Example #17

Show file

File: exemple_Dataset14.py Project: ym001/Manteia

from Manteia.Dataset import Dataset

ds = Dataset('Short_Jokes')

print('Train : ')
print(ds.documents_train[:5])

Example #18

Show file

from Manteia.Dataset import Dataset

ds = Dataset('SST-2')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])

Example #19

Show file

File: exemple_Dataset9.py Project: ym001/Manteia

from Manteia.Dataset import Dataset

ds = Dataset('trec')

print('Train : ')
print(ds.documents_train[:5])
print(ds.labels_train[:5])