Esempi in Python per Unigram

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ngram.LetterModels

Classe/tipologia: Unigram

Esempi su hotexamples.com: 9

Unigram in Python: 9 esempi trovati. Questi sono i migliori esempi reali in Python per ngram.LetterModels.Unigram, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Unigram(3)

frequency_model(3)

__init__(1)

corpus(1)

save(1)

Esempio n. 1

Mostra file

File: tamilvu_ngram.py Progetto: vasurenganathan/tamil-tts

class TamilVUNgram:
    def __init__(self):
        self.filename = u'tamilvu_dictionary_words.txt'
        self.unigram = Unigram(self.filename)
        self.unigram.frequency_model()
        print(u"--- completed Unigram model ---")
        self.bigram = Bigram(self.filename)
        self.bigram.language_model(verbose=False)
        self.trigram = Trigram(self.filename)
        self.trigram.language_model(verbose=False)
        
        print(u"--- completed Bigram,Trigram model ---")
        
    def save(self):
        # save letter2 of bigram
        # save letter of unigram
        with codecs.open("tvu_bigram.txt","w","utf-8") as fp:
            d = {}
            for k,v in self.bigram.letter2.items():
                for k2,v2 in v.items():
                    if v2 == 0:
                        continue
                    d[k+k2] = v2
            for k,v in sorted(d.items(),key=operator.itemgetter(1),reverse=True):
                fp.write(u"%s - %d\n"%(k,v))
            
        with codecs.open("tvu_unigram.txt","w","utf-8") as fp:
            for k,v in sorted(self.unigram.letter.items(),key=operator.itemgetter(1),reverse=True):
                if v == 0:
                    continue
                fp.write(u"%s - %d\n"%(k,v))
        self.trigram.save(u'tvu_trigram.txt')
        print(u"SAVED tvu_unigram.txt, tvu_bigram.txt")

Esempio n. 2

Mostra file

def get_stats():
    obj = Unigram("out-tamil-words.txt")
    obj.frequency_model()
    with codecs.open("ta_data_freq.txt", "w", "utf-8") as fp:
        pprint.pprint(obj.letter, stream=fp)
    proc_stats(obj.letter, u"ta_data_freq2.txt")
    return

Esempio n. 3

Mostra file

File: ta_data.py Progetto: Ezhil-Language-Foundation/open-tamil

def get_stats():
    obj = Unigram("out-tamil-words.txt")
    obj.frequency_model()
    with codecs.open("ta_data_freq.txt","w","utf-8") as fp:
        pprint.pprint( obj.letter, stream=fp)    
    proc_stats(obj.letter,u"ta_data_freq2.txt")
    return

Esempio n. 4

Mostra file

    def __init__(self):
        self.filename = u'tamilvu_dictionary_words.txt'
        self.unigram = Unigram(self.filename)
        self.unigram.frequency_model()
        print(u"--- completed Unigram model ---")
        self.bigram = Bigram(self.filename)
        self.bigram.language_model(verbose=False)
        self.trigram = Trigram(self.filename)
        self.trigram.language_model(verbose=False)

        print(u"--- completed Bigram,Trigram model ---")

Esempio n. 5

Mostra file

File: tamilvu_ngram.py Progetto: vasurenganathan/tamil-tts

 def __init__(self):
     self.filename = u'tamilvu_dictionary_words.txt'
     self.unigram = Unigram(self.filename)
     self.unigram.frequency_model()
     print(u"--- completed Unigram model ---")
     self.bigram = Bigram(self.filename)
     self.bigram.language_model(verbose=False)
     self.trigram = Trigram(self.filename)
     self.trigram.language_model(verbose=False)
     
     print(u"--- completed Bigram,Trigram model ---")

Esempio n. 6

Mostra file

class TamilVUNgram:
    def __init__(self):
        self.filename = "tamilvu_dictionary_words.txt"
        self.unigram = Unigram(self.filename)
        self.unigram.frequency_model()
        print("--- completed Unigram model ---")
        self.bigram = Bigram(self.filename)
        self.bigram.language_model(verbose=False)
        self.trigram = Trigram(self.filename)
        self.trigram.language_model(verbose=False)

        print("--- completed Bigram,Trigram model ---")

    def save(self):
        # save letter2 of bigram
        # save letter of unigram
        with codecs.open("tvu_bigram.txt", "w", "utf-8") as fp:
            d = {}
            for k, v in list(self.bigram.letter2.items()):
                for k2, v2 in list(v.items()):
                    if v2 == 0:
                        continue
                    d[k + k2] = v2
            for k, v in sorted(list(d.items()),
                               key=operator.itemgetter(1),
                               reverse=True):
                fp.write("%s - %d\n" % (k, v))

        with codecs.open("tvu_unigram.txt", "w", "utf-8") as fp:
            for k, v in sorted(
                    list(self.unigram.letter.items()),
                    key=operator.itemgetter(1),
                    reverse=True,
            ):
                if v == 0:
                    continue
                fp.write("%s - %d\n" % (k, v))
        self.trigram.save("tvu_trigram.txt")
        print("SAVED tvu_unigram.txt, tvu_bigram.txt")

Esempio n. 7

Mostra file

File: harvest_unigram.py Progetto: Ezhil-Language-Foundation/uliveeran

def run(parent,outputfile):
    x=None
    for filename in glob.glob(os.path.join(parent,"*.word")):
        if not x:
            x = Unigram(filename)
        else:
            x.corpus = Corpus(filename) #update file
        x.frequency_model()
    x.save(outputfile)
    proc_stats(get_prob(x.letter), outputfile)
    return

Esempio n. 8

Mostra file

 def __init__(self, filename):
     Unigram.__init__(self, filename)
     self.bigram = dict()

Esempio n. 9

Mostra file

File: ta_data.py Progetto: Ezhil-Language-Foundation/open-tamil

 def __init__(self,filename):
     Unigram.__init__(self,filename)
     self.bigram = dict()