Python Dataset.load_conllの例

プログラミング言語: Python

名前空間/パッケージ名: stanza.text.dataset

クラス/型: Dataset

メソッド/関数: load_conll

hotexamples.comのコード掲載数: 4

Python Dataset.load_conll - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのstanza.text.dataset.Dataset.load_conllの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Dataset(10)

load_conll(4)

shuffle(1)

write_conll(1)

コード例 #1

ファイルを表示

def load_datasets(fnames, lowercase=True):
    datasets = []
    for fn in fnames:
        d = Dataset.load_conll(fn)
        print "\t%d examples in %s" % (len(d), fn)
        if lowercase:
            converters = {'word': lambda word_list: [x.lower() if x is not None else None for x in word_list]}
            d.convert(converters, in_place=True)
        datasets.append(d)
    return datasets

コード例 #2

ファイルを表示

ファイル: get_vocab.py プロジェクト: frankxu2004/feedforward-RE

def get_counter_for_field(filelist, field):
    c = Counter()
    for fin_name in filelist:
        print('loading {}'.format(fin_name))
        d = Dataset.load_conll(fin_name)
        for i, row in enumerate(d):
            for j in range(len(row['word'])):
                t = row[field][j]
                if t == SKIP_TOKEN or t is None:
                    continue
                else:
                    c[t] += 1
    return c

コード例 #3

ファイルを表示

from stanza.text.dataset import Dataset

# for fin_name in ['train.conll', 'dev.conll', 'test.conll']:
#     fout_name = fin_name.replace('.conll', '.anon.conll')
#     print('loading {}'.format(fin_name))
#     d = Dataset.load_conll(fin_name)
#     print(d)
#     for i, row in enumerate(d):
#         if row['subj'] == 'SUBJECT':
#             d.fields['word'][i] = row['subj_ner']
#         if row['obj'] == 'OBJECT':
#             d.fields['word'][i] = row['obj_ner']
#     d.write_conll(fout_name)

for fin_name in ['train.conll', 'dev.conll', 'test.conll']:
    fout_name = fin_name.replace('.conll', '.anon.conll')
    print('loading {}'.format(fin_name))
    d = Dataset.load_conll(fin_name)
    print(d)
    for i, row in enumerate(d):
        for j in range(len(row['word'])):
            if row['subj'][j] == 'SUBJECT':
                d.fields['word'][i][j] = 'NER-' + row['subj_ner'][j]
            if row['obj'][j] == 'OBJECT':
                d.fields['word'][i][j] = 'NER-' + row['obj_ner'][j]
    d.write_conll(fout_name)

コード例 #4

ファイルを表示

ファイル: test_dataset.py プロジェクト: Nawan090/effective-chainsaw

 def test_load_conll(self):
     with NamedTemporaryFile() as f:
         f.write(self.CONLL)
         f.flush()
         d = Dataset.load_conll(f.name)
         self.assertDictEqual(self.CONLL_MOCK, d.fields)