Ejemplos de PerceptronTagger.load en Python

Lenguaje de programación: Python

Namespace/Package Name: nltk.tag.perceptron

Clase / Tipo: PerceptronTagger

Método / Función: load

Ejemplos en hotexamples.com: 11

Python PerceptronTagger.load - 11 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de nltk.tag.perceptron.PerceptronTagger.load extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

PerceptronTagger(30)

tag(30)

load(8)

train(8)

evaluate(3)

__init__(1)

tag_sents(1)

Ejemplo n.º 1

Mostrar archivo

def ap(train_path, test_path):
    modelref = 'ap-' + md5(('ap///' + train_path).encode()).hexdigest() + '.pickle'

    test_sentences = list(gen_corpus(test_path))

    if not isfile(modelref):
        start = perf_counter()
        training_sentences = list(gen_corpus(train_path))

        ap_model = PerceptronTagger(load=False)
        ap_model.train(list(convert_sents_to_zipped(training_sentences)), save_loc=modelref)
        end = perf_counter()
        print('Training took {} ms.'.format(int((end - start) * 1000)))
    else:
        ap_model = PerceptronTagger(load=False)
        ap_model.load(modelref)
        print('Model loaded from file.')

    # Evaluation
    start = perf_counter()
    y_pred, y_true = [], []
    for words, tags in test_sentences:
        y_pred.extend(y for x, y in ap_model.tag(words))
        y_true.extend(tags)

    end = perf_counter()
    print('Testing took {} ms.'.format(int((end - start) * 1000)))

    for l in classification_report(y_true, y_pred).split('\n'):
        print(l)

Ejemplo n.º 2

Mostrar archivo

def _get_tagger(lang=None):
    if lang == "rus":
        tagger = PerceptronTagger(False)
        ap_russian_model_loc = "file:" + str(find(RUS_PICKLE))
        tagger.load(ap_russian_model_loc)
    else:
        tagger = PerceptronTagger()
    return tagger

Ejemplo n.º 3

Mostrar archivo

Archivo: __init__.py Proyecto: Weiming-Hu/text-based-six-degree

def _get_tagger(lang=None):
    if lang == 'rus':
        tagger = PerceptronTagger(False)
        ap_russian_model_loc = 'file:' + str(find(RUS_PICKLE))
        tagger.load(ap_russian_model_loc)
    else:
        tagger = PerceptronTagger()
    return tagger

Ejemplo n.º 4

Mostrar archivo

Archivo: preparation.py Proyecto: WhiteWalker72/PoliFLW

 def _get_tagger():
     # TODO: Instead of manually downloading the dutch_tagger, download it from an external source if it isn't installed at Data/
     try:
         os.chdir(r"Data")
         tagger = PerceptronTagger(load=False)
         tagger.load('model.perc.dutch_tagger_small.pickle')
         return tagger
     except (IndexError, FileNotFoundError):
         return None

Ejemplo n.º 5

Mostrar archivo

Archivo: __init__.py Proyecto: DrDub/nltk

def _get_tagger(lang=None):
    if lang == "rus":
        tagger = PerceptronTagger(False)
        ap_russian_model_loc = "file:" + str(find(RUS_PICKLE))
        tagger.load(ap_russian_model_loc)
    elif lang == "eng":
        tagger = PerceptronTagger()
    else:
        tagger = PerceptronTagger()
    return tagger

Ejemplo n.º 6

Mostrar archivo

Archivo: __init__.py Proyecto: hfiuza/Text-Mining-and-NLP

def _get_tagger(lang=None):
    if lang == 'rus':
        tagger = PerceptronTagger(False)
        ap_russian_model_loc = 'file:' + str(find(RUS_PICKLE))
        tagger.load(ap_russian_model_loc)
    elif lang == 'eng':
        tagger = PerceptronTagger()
    else:
        tagger = PerceptronTagger()
    return tagger

Ejemplo n.º 7

Mostrar archivo

https://github.com/evanmiltenburg/Dutch-tagger

We got a POS tagger and a CHUNK tagger. In combination they can be used to apply NER...


"""

import os
import nltk

from nltk.tag.perceptron import PerceptronTagger
from nltk.corpus import alpino as alp  # Trained on ALP data.

tagger = PerceptronTagger(load=False)
os.chdir(r'D:\nlp_lib')
tagger.load('model.perc.dutch_tagger_small.pickle'
            )  # I don't know the source of training data

# Tag a sentence.
tagger.tag('Alle vogels zijn nesten begonnen , behalve ik en jij .'.split())

training_corpus = alp.tagged_sents()
unitagger = nltk.tag.UnigramTagger(training_corpus)
bitagger = nltk.tag.BigramTagger(training_corpus, backoff=unitagger)
perctagger = PerceptronTagger(load=True)  # What does load=True mean??
perctagger.train(training_corpus)

sent = 'NLTK is een goeda taal voor NLP'.split()
bitagger.tag(sent)
unitagger.tag(sent)
perctagger.tag(sent)

Ejemplo n.º 8

Mostrar archivo

Archivo: nltk_downloader.py Proyecto: yuravariat/TweetsClassifier

import nltk
from nltk.tag.perceptron import PerceptronTagger

# nltk.download()

sentence = """At eight o'clock on Thursday morning... Arthur didn't feel very good."""
tokens = nltk.word_tokenize(sentence)

tagger = PerceptronTagger(False)
tagger.load('file:///C:/Users/yarov/nltk_data/taggers/averaged_perceptron_tagger/averaged_perceptron_tagger.pickle')
tagged = tagger.tag(tokens)
print tagged

Ejemplo n.º 9

Mostrar archivo

Archivo: wiki-to-index-nl.py Proyecto: cltl/multilingual-finegrained-entity-typing

# 17 February 2017

import sys
import re
from bs4 import BeautifulSoup
from urllib.parse import unquote
from nltk import word_tokenize, sent_tokenize
import nltk
import glob

from nltk.tag.perceptron import PerceptronTagger

# Dutch POS tagger from https://github.com/evanmiltenburg/Dutch-tagger
# Make sure the model.perc.dutch_tagger_small.pickle is in the same directory
tagger = PerceptronTagger(load=False)
tagger.load('model.perc.dutch_tagger_small.pickle')

dbpedia_types = {}
with open('dbpedia-wikipedia-type.tsv', 'r') as f:
    for line in f:
        line = line.rstrip()
        elems = line.split('\t')
        elems[1] = elems[1].lstrip('<http://nl.wikipedia.org/wiki/')
        elems[1] = elems[1].rstrip('>')
        if 'dbpedia' in elems[2]:
            elems[2] = elems[2].lstrip('<http://dbpedia.org/ontology/')
            elems[2] = elems[2].rstrip('>')
            dbpedia_types[elems[1]] = elems[2]


def analyse_and_store_links(text):

Ejemplo n.º 10

Mostrar archivo

Archivo: tagger.py Proyecto: mozillakab/KabyleNLP

def tokenize(sentence, suffixe, prefixe):
    a = sentence.split()
    sentence1 = ""
    for i in a:  #mots
        if (i.find('-') < 0):
            sentence1 = sentence1 + ' ' + i
        else:
            words = tokenize_word(i, suffixe, prefixe)
            sentence1 = sentence1 + ' ' + words
    sentence1 = sentence1.strip()
    return sentence1


trained_model = "file:///c:/tal/trained_model12.pickle"
tagger = PerceptronTagger()
tagger.load(trained_model)

f = open("c:/tal/tokenized_text.txt", "w+", encoding='utf-8')
h = open("c:/tal/tagged_text.txt", "w+", encoding='utf-8')
g = open("c:/tal/brut_text.txt", encoding='utf-8')
for line in g:
    #print (line)
    for i in Ponctuation:

        if i == '.':
            line = line.replace(i, ' ' + i + ' ')
        else:
            line = line.replace(i, ' ' + i + ' ')
    line = line.replace("\ufeff", "")

    ligne = tokenize(line, suffixe, prefixe)

Ejemplo n.º 11

Mostrar archivo

Archivo: nltk_downloader.py Proyecto: yuravariat/twix

import nltk
from nltk.tag.perceptron import PerceptronTagger

# nltk.download()

sentence = """At eight o'clock on Thursday morning... Arthur didn't feel very good."""
tokens = nltk.word_tokenize(sentence)

tagger = PerceptronTagger(False)
tagger.load(
    'file:///C:/Users/yarov/nltk_data/taggers/averaged_perceptron_tagger/averaged_perceptron_tagger.pickle'
)
tagged = tagger.tag(tokens)
print tagged