Python NLPTaskDataFetcher.fetch_column_corpusの例

プログラミング言語: Python

名前空間/パッケージ名: flair.data_fetcher

クラス/型: NLPTaskDataFetcher

メソッド/関数: fetch_column_corpus

hotexamples.comのコード掲載数: 3

Python NLPTaskDataFetcher.fetch_column_corpus - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのflair.data_fetcher.NLPTaskDataFetcher.fetch_column_corpusの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

load_corpus(30)

load_column_corpus(24)

fetch_data(22)

load_classification_corpus(20)

load_corpora(5)

fetch_column_corpus(3)

read_text_classification_file(2)

__sample(1)

read_column_data(1)

read_conll_ud(1)

コード例 #1

ファイルを表示

def read_data():
    # dirname = './conll_format'

    # define columns
    columns = {0: 'text', 1: 'pos', 2: 'np'}

    # this is the folder in which train, test and dev files reside
    data_folder = './conll_format'

    # retrieve corpus using column format, data folder and the names of the train, dev and test files
    corpus: TaggedCorpus = NLPTaskDataFetcher.fetch_column_corpus(data_folder, columns,
                                                              train_file='arr.train',
                                                              test_file='arr.test',
                                                              dev_file='arr.dev')

    return corpus

コード例 #2

ファイルを表示

ファイル: train_wv_glove.py プロジェクト: gungui98/ner

from flair.data import TaggedCorpus
from flair.data_fetcher import NLPTaskDataFetcher, NLPTask
from flair.embeddings import TokenEmbeddings, WordEmbeddings, StackedEmbeddings, MemoryEmbeddings, CharacterEmbeddings
from typing import List
import torch

# 1. get the corpus
columns = {0: 'text', 1: 'ner'}
corpus: TaggedCorpus = NLPTaskDataFetcher.fetch_column_corpus(
    "data1",
    columns,
    train_file="train.txt",
    test_file="test.txt",
    dev_file="dev.txt")
print(corpus)

# 2. what tag do we want to predict?
tag_type = 'ner'

# 3. make the tag dictionary from the corpus
tag_dictionary = corpus.make_tag_dictionary(tag_type=tag_type)
print(tag_dictionary.idx2item)

# 4. initialize embeddings
embedding_types: List[TokenEmbeddings] = [

    # WordEmbeddings('glove'),

    # comment in this line to use character embeddings
    # CharacterEmbeddings(),

コード例 #3

ファイルを表示

ファイル: train_1.py プロジェクト: stefan-it/flair-experiments

import gensim
import re

from flair.data import Sentence, TaggedCorpus, Token
from flair.data_fetcher import NLPTaskDataFetcher, NLPTask
from flair.embeddings import TokenEmbeddings, WordEmbeddings, StackedEmbeddings, CharLMEmbeddings
from typing import List

columns = {0: 'text', 1: 'pos', 2: 'ner'}

corpus: TaggedCorpus = NLPTaskDataFetcher.fetch_column_corpus(".", columns, train_file="ned.train",
                                                        dev_file="ned.testa",
                                                        test_file="ned.testb",
                                                        tag_to_biloes='ner')

tag_type = 'ner'



tag_dictionary = corpus.make_tag_dictionary(tag_type=tag_type)

print(corpus)

word_vectors = gensim.models.KeyedVectors.load_word2vec_format('wiki.nl.vec', binary=False)
word_vectors.save('wiki.nl.vec.gensim')

custom_embedding = WordEmbeddings('wiki.nl.vec.gensim')

char_lm_forward = CharLMEmbeddings('lm-nl-large-forward-v0.1.pt')
char_lm_backward = CharLMEmbeddings('lm-nl-large-backward-v0.1.pt')