Python StreamBackedCorpusViewの例

プログラミング言語: Python

名前空間/パッケージ名: nltk.corpus.reader.util

hotexamples.comのコード掲載数: 17

Python StreamBackedCorpusView - 17件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのnltk.corpus.reader.util.StreamBackedCorpusViewの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

__init__(8)

StreamBackedCorpusView(4)

コード例 #1

ファイルを表示

ファイル: aligned.py プロジェクト: VinodhSubramanian1193/NLP

 def __init__(self, corpus_file, encoding, aligned, group_by_sent,
              word_tokenizer, sent_tokenizer, alignedsent_block_reader):
     self._aligned = aligned
     self._group_by_sent = group_by_sent
     self._word_tokenizer = word_tokenizer
     self._sent_tokenizer = sent_tokenizer
     self._alignedsent_block_reader = alignedsent_block_reader
     StreamBackedCorpusView.__init__(self, corpus_file, encoding=encoding)

コード例 #2

ファイルを表示

ファイル: corpus.py プロジェクト: ylwctyt/Python3

 def __init__(self, *args, **kwargs):
     StreamBackedCorpusView.__init__(self, *args, **kwargs)
     # open self._stream
     self._open()
     # skip the heading block
     read_blankline_block(self._stream)
     # reset the start position to the current position in the stream
     self._filepos = [self._stream.tell()]

コード例 #3

ファイルを表示

ファイル: aligned.py プロジェクト: approximatelylinear/nltk

 def __init__(self, corpus_file, encoding, aligned, group_by_sent,
              word_tokenizer, sent_tokenizer, alignedsent_block_reader):
     self._aligned = aligned
     self._group_by_sent = group_by_sent
     self._word_tokenizer = word_tokenizer
     self._sent_tokenizer = sent_tokenizer
     self._alignedsent_block_reader = alignedsent_block_reader
     StreamBackedCorpusView.__init__(self, corpus_file, encoding=encoding)

コード例 #4

ファイルを表示

ファイル: corpus.py プロジェクト: ShunyuanZ/nltk3-cookbook

	def __init__(self, *args, **kwargs):
		StreamBackedCorpusView.__init__(self, *args, **kwargs)
		# open self._stream
		self._open()
		# skip the heading block
		read_blankline_block(self._stream)
		# reset the start position to the current position in the stream
		self._filepos = [self._stream.tell()]

コード例 #5

ファイルを表示

ファイル: test_corpus_views.py プロジェクト: vincent732/nltk

    def test_correct_length(self):
        # Check that the corpus views report the correct lengths:

        for f, file_data in self.data():
            v = StreamBackedCorpusView(f, read_whitespace_block)
            self.assertEqual(len(v), len(file_data.split()))

            v = StreamBackedCorpusView(f, read_line_block)
            self.assertEqual(len(v), len(self.linetok.tokenize(file_data)))

コード例 #6

ファイルを表示

ファイル: test_corpus_views.py プロジェクト: vincent732/nltk

    def test_correct_values(self):
        # Check that corpus views produce the correct sequence of values.

        for f, file_data in self.data():
            v = StreamBackedCorpusView(f, read_whitespace_block)
            self.assertEqual(list(v), file_data.split())

            v = StreamBackedCorpusView(f, read_line_block)
            self.assertEqual(list(v), self.linetok.tokenize(file_data))

コード例 #7

ファイルを表示

    def __init__(self, fileid, delete_on_gc=False):
        """
        Create a new corpus view that reads the pickle corpus
        ``fileid``.

        :param delete_on_gc: If true, then ``fileid`` will be deleted
            whenever this object gets garbage-collected.
        """
        self._delete_on_gc = delete_on_gc
        StreamBackedCorpusView.__init__(self, fileid, encoding=None)

コード例 #8

ファイルを表示

ファイル: ipipan.py プロジェクト: B-Rich/Fem-Coding-Challenge

    def __init__(self, filename, startpos=0, **kwargs):
        StreamBackedCorpusView.__init__(self, filename, None, startpos, None)
        self.in_sentence = False
        self.position = 0

        self.show_tags = kwargs.pop('tags', True)
        self.disamb_only = kwargs.pop('disamb_only', True)
        self.mode = kwargs.pop('mode', IPIPANCorpusView.WORDS_MODE)
        self.simplify_tags = kwargs.pop('simplify_tags', False)
        self.one_tag = kwargs.pop('one_tag', True)
        self.append_no_space = kwargs.pop('append_no_space', False)
        self.append_space = kwargs.pop('append_space', False)
        self.replace_xmlentities = kwargs.pop('replace_xmlentities', True)

コード例 #9

ファイルを表示

ファイル: ipipan.py プロジェクト: Leehon008/Social-Media-traker

    def __init__(self, filename, startpos=0, **kwargs):
        StreamBackedCorpusView.__init__(self, filename, None, startpos, None)
        self.in_sentence = False
        self.position = 0

        self.show_tags = kwargs.pop('tags', True)
        self.disamb_only = kwargs.pop('disamb_only', True)
        self.mode = kwargs.pop('mode', IPIPANCorpusView.WORDS_MODE)
        self.simplify_tags = kwargs.pop('simplify_tags', False)
        self.one_tag = kwargs.pop('one_tag', True)
        self.append_no_space = kwargs.pop('append_no_space', False)
        self.append_space = kwargs.pop('append_space', False)
        self.replace_xmlentities = kwargs.pop('replace_xmlentities', True)

コード例 #10

ファイルを表示

    def __init__(self, filename, startpos=0, **kwargs):
        StreamBackedCorpusView.__init__(self, filename, None, startpos, None)
        self.in_sentence = False
        self.position = 0

        self.show_tags = kwargs.pop("tags", True)
        self.disamb_only = kwargs.pop("disamb_only", True)
        self.mode = kwargs.pop("mode", IPIPANCorpusView.WORDS_MODE)
        self.simplify_tags = kwargs.pop("simplify_tags", False)
        self.one_tag = kwargs.pop("one_tag", True)
        self.append_no_space = kwargs.pop("append_no_space", False)
        self.append_space = kwargs.pop("append_space", False)
        self.replace_xmlentities = kwargs.pop("replace_xmlentities", True)

コード例 #11

ファイルを表示

ファイル: TwitterReader.py プロジェクト: akbog/urban_data

 def __init__(self, fileid, block_reader=None, startpos=0, encoding='utf8'):
     StreamBackedCorpusView.__init__(self,
                                     fileid,
                                     block_reader=block_reader,
                                     startpos=0,
                                     encoding='utf8')
     try:
         if isinstance(self._fileid, GzipFileSystemPathPointer):
             if re.match(r'.*\.gz$', str(self._fileid)):
                 self._eofpos = self.getuncompressedsize(self._fileid)
             else:
                 self._eofpos = self._fileid.file_size()
         else:
             self._eofpos = os.stat(self._fileid).st_size
     except Exception as exc:
         raise ValueError('Unable to open or access %r -- %s' %
                          (fileid, exc))

コード例 #12

ファイルを表示

 def docs(self, fileids=None):
     """
     @return: A list of corpus document strings.
     @rtype: C{list} of C{StreamBackedCorpusView}
     @param fileids: A list of corpus files.
     @type fileids: C{list} of C{str} or regular expression
     """
     return concat([
         StreamBackedCorpusView(fileid, self._read_block, encoding=enc)
         for (fileid, enc) in self.abspaths(fileids, True)
     ])

コード例 #13

ファイルを表示

ファイル: pbrxml.py プロジェクト: rafaelanchieta/rbamr

 def verbs(self):
     """
     @return: a corpus view that acts as a list of all verb lemmas in this corpus (from verbsfile).
     """
     return StreamBackedCorpusView(self.abspath(self._verbsfile),
                                   read_line_block, encoding=self.encoding(self._verbsfile))

コード例 #14

ファイルを表示

ファイル: transliterate.py プロジェクト: ikarth/guten-processor

 def __init__(self, *args, **kwargs):
     StreamBackedCorpusView.__init__(self, *args, **kwargs)

コード例 #15

ファイルを表示

ファイル: corpus.py プロジェクト: RomanZacharia/python_text_processing_w_nltk2_cookbook

	def __init__(self, *args, **kwargs):
		StreamBackedCorpusView.__init__(self, *args, **kwargs)
		# open self._stream
		self._open()
		# skip the heading block
		 self.read_block(self._stream)

コード例 #16

ファイルを表示

 def __init__(self, *args, **kwargs):
     StreamBackedCorpusView.__init__(self, *args, **kwargs)
     self._open()
     self.read_block(self._stream)
     self._filepos = [self._stream.tell()]

コード例 #17

ファイルを表示

ファイル: corpus.py プロジェクト: andacsafa/nltk_book

 def __init__(self, *args, **kwargs):
     StreamBackedCorpusView.__init__(self, *args, **kwargs)
     self._open()
     self.read_block(self._stream)
     self._filepos = [self._stream.tell()]