Python ChunkedCorpusReader.chunked_words示例

编程语言: Python

命名空间/包名称: nltk.corpus.reader

方法/功能: chunked_words

hotexamples.com的示例: 5

Python ChunkedCorpusReader.chunked_words - 已找到5个示例。这些是从开源项目中提取的最受好评的nltk.corpus.reader.ChunkedCorpusReader.chunked_words现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ChunkedCorpusReader(3)

chunked_words(3)

chunked_paras(2)

chunked_sents(2)

tagged_paras(2)

tagged_sents(2)

tagged_words(2)

__init__(1)

chunked_para(1)

iob_sents(1)

iob_words(1)

paras(1)

raw(1)

sents(1)

words(1)

示例#1

显示文件

文件： MessageTokenizer.py 项目： JCarri14/ScrapingLS-v1

    def readCorpusList(self):
        reader = ChunkedCorpusReader('C:/nltk_data/corpora/cookbook',
                                     r'.*\.chunk')

        for chunk in reader.chunked_words():
            try:
                print(chunk.leaves())
            except:
                print(chunk)

示例#2

显示文件

 def chunked_words(self, fileids=None, categories=None):
     return ChunkedCorpusReader.chunked_words(
         self, self._resolve(fileids, categories))

示例#3

显示文件

文件： tutCorpusReader03.py 项目： bindaasamit/pycode

########## CHUNKED CORPUS READER ###############

###Implementing CCR
from nltk.corpus.reader import ChunkedCorpusReader
root="C:\\Users\\Matrix\\AppData\\Roaming\\nltk_data\\corpora\\cookbook\\"

reader=ChunkedCorpusReader(root,r'.*\.chunk')
#Each chunk-represented in braces is considered as a word
print reader.chunked_words()
#Each sentence will be included in a Tree()
print reader.chunked_sents()
print reader.chunked_paras()

#Getting tagged tokens for each chunk (each chunk is a word but each word is not a chunk)
print reader.chunked_words()[0].leaves()
print reader.chunked_sents()[1].leaves()
#Cant apply leaves directly to a para - but we can access a sentence of a given para.
print reader.chunked_para()[0][0].leaves()
###Implementing CCCR
from nltk.corpus.reader import ConllChunkCorpusReader
root="C:\\Users\\Matrix\\AppData\\Roaming\\nltk_data\\corpora\\cookbook\\"

reader=ConllChunkCorpusReader(root,r'.*\.iob',('NP','VP'.'PP'))
print reader.chunked_words()
print reader.chunked_sents()
print reader.iob_words()
print reader.iob_sents()

示例#4

显示文件

文件： catchunked.py 项目： RomanZacharia/python_text_processing_w_nltk2_cookbook

	def chunked_words(self, fileids=None, categories=None):
		return ChunkedCorpusReader.chunked_words(
			self, self._resolve(fileids, categories))

示例#5

显示文件

from nltk.corpus.reader import ChunkedCorpusReader
from nltk.tokenize import SpaceTokenizer
import nltk

d = nltk.data.find('corpora/cookbook')
reader = ChunkedCorpusReader(d, r'.*\.chunk')
print(reader.chunked_words())
print(reader.chunked_sents())
print(reader.chunked_paras())

# reader.chunked_sents()[0].draw()
print(reader.chunked_sents()[0].leaves())