Esempi in Python per NGram._split

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ngram

Classe/tipologia: NGram

Metodo/funzione: _split

Esempi su hotexamples.com: 3

NGram._split in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per ngram.NGram._split, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

NGram(30)

compare(30)

search(14)

add(9)

split(6)

find(5)

ngrams(4)

next_word(3)

clean(2)

train(2)

prob(2)

intersection_update(2)

print_attrib(2)

train_model(1)

trigrams(1)

unigrams(1)

save(1)

remove(1)

pad(1)

items_sharing_ngrams(1)

ngram_similarity(1)

load(1)

_split(1)

intersection(1)

get(1)

generate_token(1)

generate(1)

display_stats(1)

count(1)

classify(1)

bigrams(1)

append(1)

update(1)

Esempio n. 1

Mostra file

File: validation_checker.py Progetto: al-indigo/transcriptome-assemblies-refiner

def get_distr(strlist, n_len):
    alphabet = ['A', 'C', 'G', 'T', 'N']
    n = NGram(N=n_len, pad_len=0)
    all_ngrams = 0
    grams = init_grams_dict(n_len, alphabet)
    for item in strlist:
        if item == '':
            continue
        ngram_list = list(n._split(item))
        for ng in ngram_list:
            if ng in grams:
                grams[ng] += float(1)
                all_ngrams += 1
    for item in grams.keys():
        grams[item] /= all_ngrams
    return grams

Esempio n. 2

Mostra file

File: validation_checker.py Progetto: aimly/transcriptome-assemblies-refiner

                and oases_item['top'] == trinity_item['top'] \
                and oases_item['n'] == trinity_item['n']\
                and oases_item['kernel'].values()[0] == trinity_item['kernel'].values()[0]:
            print (oases_item, trinity_item)

#intersect = set(good_list_oases) & set(good_list_trinity)

from tr_parser import get_assemblies
(ref, oases_reads, oases_name_index, trinity_reads, trinity_name_index) = get_assemblies("data/ref_for_reads.fasta",
                                                                                         "data/Oases.fasta",
                                                                                         "data/Trinity.fasta")
from ngram import NGram

n = NGram(N=4, pad_len=0)
grams = dict()
for transcript in ref:
    if transcript == '':
        continue
    ngram_list = list(n._split(transcript))
    for ng in ngram_list:
        if ng == 'TTSG':
            pdb.set_trace()
        if ng in grams:
            grams[ng] += 1
        else:
            grams[ng] = 1

pp = pprint.PrettyPrinter()
pp.pprint(grams)
print len(grams)

Esempio n. 3

Mostra file

File: features_extraction_with_masking.py Progetto: jselvi/docker-r-masked-ngrams

            ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'], "n")
        masked_domain_name = multi_replace(aux3_domain_name, ['-'], "s")
        #print domain_name + " -> " + masked_domain_name
        #continue

        feature.append(domain_name)
        feature.append(masked_domain_name)
        feature.append(tag)

        if len(domain_name) < 5:
            continue

        ### ID Designation
        ### V4-6   1-gram (mean, variance and standard deviation)
        n = NGram(N=1)
        v = list(n._split(domain_name))
        [f1, f2, f3] = ngram_stats(v)
        feature.extend([f1, f2, f3])

        ### V6-9   2-gram (mean, variance and standard deviation)
        n = NGram(N=2)
        v = list(n._split(domain_name))
        [f1, f2, f3] = ngram_stats(v)
        feature.extend([f1, f2, f3])

        ### V10-12   3-gram (mean, variance and standard deviation)
        n = NGram(N=3)
        v = list(n._split(domain_name))
        [f1, f2, f3] = ngram_stats(v)
        feature.extend([f1, f2, f3])