Python TaggedCorpusReader.tagged_words Beispiele

Programmiersprache: Python

Namespace / Paketname: nltk.corpus

Klasse / Typ: TaggedCorpusReader

Methode / Funktion: tagged_words

Beispiele auf hotexamples.com: 2

Python TaggedCorpusReader.tagged_words - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die nltk.corpus.TaggedCorpusReader.tagged_words, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

TaggedCorpusReader(9)

tagged_sents(7)

sents(3)

tagged_words(2)

fileids(1)

Beispiel #1

Datei anzeigen

Datei: freq_pos.py Projekt: rueshyna/Taipei.py_20130425

#!/usr/bin/env python
# -*- coding: utf-8

from nltk.probability import ConditionalFreqDist
from nltk.corpus import TaggedCorpusReader
from nltk.tag import simplify

FIRST = 0
END = 150
POS = "V"
#POS = "N"
#POS = "ADJ"

corpus_root = './data'
fileids = 'tagged_sent'

corpus = TaggedCorpusReader(corpus_root,
    fileids,
    encoding='utf-8')

processing = [(simplify.simplify_wsj_tag(tag), word.lower()) for (word, tag) in corpus.tagged_words()]
cfd_corpus = ConditionalFreqDist(processing)

for term,freq in cfd_corpus[POS].items():
  print term.encode("utf-8"),freq

Beispiel #2

Datei anzeigen

Datei: score_corpus.py Projekt: dlaz/gmail-corpus

from gmail_corpus.nltk_util.bigram_score import make_score_dict, save_score_dict
from nltk.corpus import TaggedCorpusReader
import numpy as np
from glob import glob
import os, sys

if __name__ == '__main__':
	corpus_path = sys.argv[1]
	# remove empty files
	files = glob('%s/*.txt' % corpus_path)
	for f in files:
		if os.path.getsize(f) == 0:
			os.remove(f)
			print 'Removed empty file %s' % f

	corpus = TaggedCorpusReader(corpus_path, '.*\.txt')
	score_dict = make_score_dict(corpus.tagged_words())
	save_score_dict(score_dict, 'bigram_scores.pkl')
	print 'saved bigram_scores.pkl'