Python LazyCorpusLoader.chunked_sents示例

编程语言: Python

命名空间/包名称: nltk.corpus.util

类/类型: LazyCorpusLoader

方法/功能: chunked_sents

hotexamples.com的示例: 2

Python LazyCorpusLoader.chunked_sents - 已找到2个示例。这些是从开源项目中提取的最受好评的nltk.corpus.util.LazyCorpusLoader.chunked_sents现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

LazyCorpusLoader(30)

fileids(12)

parsed_sents(7)

categories(2)

chunked_sents(2)

iob_sents(2)

morphs2str(2)

dict(1)

entries(1)

freqs(1)

instances(1)

mentions(1)

rolesets(1)

示例#1

显示文件

文件： util.py 项目： sushengyang/NLP-project

def treebank_chunk_tagger_demo():
    from nltk.corpus.util import LazyCorpusLoader    
    from nltk.corpus.reader import PlaintextCorpusReader
    from nltk_contrib.coref.util import TreebankChunkTaggerCorpusReader
    
    state_union = LazyCorpusLoader(
        'state_union', PlaintextCorpusReader, r'(?!\.svn).*\.txt')
    state_union = TreebankChunkTaggerCorpusReader(state_union)

    print 'Treebank chunker demo...'
    print 'Chunked sentences:'
    for sent in state_union.chunked_sents()[500:505]:
        print sent
        print
    print
    print 'Parsed sentences:'
    for tree in state_union.parsed_sents()[500:505]:
        print tree
        print
    print

示例#2

显示文件

文件： test.py 项目： eeghor/structured-ner

import codecs
import pickle
from nltk.corpus.reader.conll import ConllChunkCorpusReader
from nltk.corpus.util import LazyCorpusLoader
from nltk.stem.wordnet import WordNetLemmatizer
from sentence import load_conll
from case.MosesTrueCaser import MosesTrueCaser

lemmatizer = WordNetLemmatizer()
truecaser  = MosesTrueCaser(open('models/truecase/truecase-model.en'))

m = pickle.load(open("models/eng.pickle"))

gazetteer = None #m.feature_generator.feature_sets[-1]

corpus = LazyCorpusLoader('conll2003', ConllChunkCorpusReader, '.*\.(test|train).*', ('LOC', 'PER', 'ORG', 'MISC'), encoding='utf-8')
test    = load_conll(corpus.chunked_sents('eng.testa'), lemmatizer, truecaser, gazetteer=gazetteer)

out, acc = m.test(test)

codecs.open('test.txt', 'w', encoding='utf-8').write(out)