Python TextModel.text_transformations Examples

Programming Language: Python

Namespace/Package Name: b4msa.textmodel

Class/Type: TextModel

Method/Function: text_transformations

Examples at hotexamples.com: 3

Python TextModel.text_transformations - 3 examples found. These are the top rated real world Python examples of b4msa.textmodel.TextModel.text_transformations extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

TextModel(30)

tokenize(9)

transform(3)

params(2)

text_transformations(2)

tonp(2)

__init__(1)

_num_terms(1)

default_parameters(1)

fit(1)

Example #1

Show file

File: test_lang_dependency.py Project: valjime95/b4msa

def test_stopwords():
    from b4msa.textmodel import TextModel
    tm = TextModel(lang='es', del_dup=False)
    text = tm.text_transformations('como esta mi carro')
    print(text)
    text1 = tm.lang.transform(text, stopwords='delete')
    print(text1)
    assert text1 == '~carro~'
    text1 = tm.lang.transform(text, stopwords='group')
    print(text1)
    assert text1 == '~_sw~_sw~_sw~carro~'

Example #2

Show file

File: test_lang_dependency.py Project: INGEOTEC/b4msa

def test_stopwords():
    from b4msa.textmodel import TextModel
    tm = TextModel(lang='es', del_dup=False)
    text = tm.text_transformations('como esta mi carro')
    print(text)
    text1 = tm.lang.transform(text, stopwords='delete')
    print(text1)
    assert text1 == '~carro~'
    text1 = tm.lang.transform(text, stopwords='group')
    print(text1)
    assert text1 == '~_sw~_sw~_sw~carro~'

Example #3

Show file

File: 05TextNormalization.py Project: INGEOTEC/NLP-Course

text = 'I like playing football'
output = []
for word in text.split():
    w = stemmer.stem(word)
    output.append(w)
output = " ".join(output)
output

text = 'I like playing football on Saturday'
words = text.split()
n = 3
n_grams = []
for a in zip(*[words[i:] for i in range(n)]):
    n_grams.append("~".join(a))
n_grams

text = 'I like playing'
q = 4
q_grams = []
for a in zip(*[text[i:] for i in range(q)]):
    q_grams.append("".join(a))
q_grams

text = 'I like playing football with @mgraffg'
tm = TextModel(token_list=[-1, 5],
               lang='english',
               usr_option=OPTION_GROUP,
               stemming=True)
tm.text_transformations(text)

tm.tokenize(text)