Python WordListCorpusReader.categories 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nltk.corpus.reader

클래스/타입: WordListCorpusReader

메소드/함수: categories

hotexamples.com에서의 예제들: 1

Python WordListCorpusReader.categories - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nltk.corpus.reader.WordListCorpusReader.categories에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

WordListCorpusReader(19)

words(14)

fileids(4)

raw(3)

categories(1)

chunked_paras(1)

chunked_sents(1)

chunked_words(1)

paras(1)

sents(1)

tagged_paras(1)

tagged_sents(1)

tagged_words(1)

예제 #1

파일 보기

파일: custom_corpus_creation.py 프로젝트: IHI-Zittau/pdm_research_python

''' draw tree '''
reader.chunked_sents()[0].draw()

''' get leaves '''
reader.chunked_words()[0].leaves()
reader.chunked_sents()[0].leaves()
reader.chunked_paras()[0][0].leaves()

''' categorized corpus '''
from nltk.corpus import brown
brown.categories()

from nltk.corpus.reader import CategorizedPlaintextCorpusReader
reader = CategorizedPlaintextCorpusReader(path + '/corpora/cookbook/', r'movie_.*\.txt', cat_pattern=r'movie_(\w+)\.txt')
reader.categories()
reader.fileids(categories=['neg'])
reader.fileids(categories=['pos'])


''' using a categorized chunked corpus reader '''
#import nltk.data
from catchunked import CategorizedChunkedCorpusReader
path = nltk.data.find('corpora/treebank/tagged')
reader = CategorizedChunkedCorpusReader(path, r'wsj_.*\.pos',cat_pattern=r'wsj_(.*)\.pos')
#len(reader.categories()) == len(reader.fileids())
len(reader.chunked_sents(categories=['0001']))

''' Lazy corpus loader '''
from nltk.corpus.util import LazyCorpusLoader
#from nltk.corpus.reader import WordListCorpusReader