Exemplos de Dataset.get_partitioned_corpus em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: octis.dataset.dataset

Classe / Tipo: Dataset

Método / Função: get_partitioned_corpus

Exemplos em hotexamples.com: 5

Dataset.get_partitioned_corpus em Python - 5 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de octis.dataset.dataset.Dataset.get_partitioned_corpus em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Dataset(13)

load_custom_dataset_from_folder(8)

fetch_dataset(5)

get_partitioned_corpus(5)

get_vocabulary(4)

get_corpus(3)

get_labels(2)

Métodos Frequentes

Dataset (13)

load_custom_dataset_from_folder (8)

fetch_dataset (5)

get_partitioned_corpus (5)

get_vocabulary (4)

get_corpus (3)

get_labels (2)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: test_octis.py Projeto: phillette/OCTIS

def test_model_output_ctm_combined(data_dir): dataset = Dataset() dataset.load_custom_dataset_from_folder(data_dir + '/M10') num_topics = 3 model = CTM(num_topics=num_topics, num_epochs=5, inference_type='combined') output = model.train_model(dataset) assert 'topics' in output.keys() assert 'topic-word-matrix' in output.keys() assert 'test-topic-document-matrix' in output.keys() # check topics format assert type(output['topics']) == list assert len(output['topics']) == num_topics # check topic-word-matrix format assert type(output['topic-word-matrix']) == np.ndarray assert output['topic-word-matrix'].shape == (num_topics, len(dataset.get_vocabulary())) # check topic-document-matrix format assert type(output['topic-document-matrix']) == np.ndarray assert output['topic-document-matrix'].shape == ( num_topics, len(dataset.get_partitioned_corpus()[0])) # check test-topic-document-matrix format assert type(output['test-topic-document-matrix']) == np.ndarray assert output['test-topic-document-matrix'].shape == ( num_topics, len(dataset.get_partitioned_corpus()[2]))

Exemplo n.º 2

0

Exibir arquivo

Arquivo: test_octis.py Projeto: phillette/OCTIS

def test_model_output_lda_tomotopy(data_dir): dataset = Dataset() dataset.load_custom_dataset_from_folder(data_dir + '/M10') num_topics = 3 model = LDATOMOTO(num_topics=num_topics, alpha=0.1) output = model.train_model(dataset) assert 'topics' in output.keys() assert 'topic-word-matrix' in output.keys() assert 'test-topic-document-matrix' in output.keys() # check topics format assert type(output['topics']) == list assert len(output['topics']) == num_topics # check topic-word-matrix format assert type(output['topic-word-matrix']) == np.ndarray assert output['topic-word-matrix'].shape == (num_topics, len(dataset.get_vocabulary())) # check topic-document-matrix format assert type(output['topic-document-matrix']) == np.ndarray assert output['topic-document-matrix'].shape == ( num_topics, len(dataset.get_partitioned_corpus()[0])) # check test-topic-document-matrix format assert type(output['test-topic-document-matrix']) == np.ndarray assert output['test-topic-document-matrix'].shape == ( num_topics, len(dataset.get_partitioned_corpus()[2]))

Exemplo n.º 3

0

Exibir arquivo

Arquivo: test_octis.py Projeto: phillette/OCTIS

def test_model_output_nmf(data_dir): dataset = Dataset() dataset.load_custom_dataset_from_folder(data_dir + '/M10') num_topics = 3 model = NMF(num_topics=num_topics, w_max_iter=10, h_max_iter=10, use_partitions=True) output = model.train_model(dataset) assert 'topics' in output.keys() assert 'topic-word-matrix' in output.keys() assert 'test-topic-document-matrix' in output.keys() # check topics format assert type(output['topics']) == list assert len(output['topics']) == num_topics # check topic-word-matrix format assert type(output['topic-word-matrix']) == np.ndarray assert output['topic-word-matrix'].shape == (num_topics, len(dataset.get_vocabulary())) # check topic-document-matrix format assert type(output['topic-document-matrix']) == np.ndarray assert output['topic-document-matrix'].shape == ( num_topics, len(dataset.get_partitioned_corpus()[0])) # check test-topic-document-matrix format assert type(output['test-topic-document-matrix']) == np.ndarray assert output['test-topic-document-matrix'].shape == ( num_topics, len(dataset.get_partitioned_corpus()[2]))

Exemplo n.º 4

0

Exibir arquivo

Arquivo: test_datasets.py Projeto: espoirMur/OCTIS

def test_partitions_custom(data_dir): dataset = Dataset() dataset.load_custom_dataset_from_folder(data_dir + "M10") partitions = dataset.get_partitioned_corpus() assert len(partitions[0]) == 5847 assert len(partitions[1]) == 1254

Exemplo n.º 5

0

Exibir arquivo

Arquivo: test_datasets.py Projeto: espoirMur/OCTIS

def test_partitions_fetch(): dataset = Dataset() dataset.fetch_dataset("M10") partitions = dataset.get_partitioned_corpus() assert len(partitions[0]) == 5847 assert len(partitions[1]) == 1254