Python Dataset.tm_words 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: text_models.dataset

클래스/타입: Dataset

메소드/함수: tm_words

hotexamples.com에서의 예제들: 4

Python Dataset.tm_words - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 text_models.dataset.Dataset.tm_words에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Dataset(13)

add(9)

load_emojis(7)

klass(4)

tm_words(4)

process(3)

keys(2)

remove(1)

text_transformations(1)

예제 #1

파일 보기

파일: test_dataset.py 프로젝트: INGEOTEC/text_models

def test_klass():
    dset = Dataset()
    # dset.add(dset.load_emojis())
    dset.add(dset.tm_words())
    kl = dset.klasses
    xx = dset.klass("xxx good xxx morning xxT")
    for k in xx:
        assert k in kl

예제 #2

파일 보기

파일: test_dataset.py 프로젝트: INGEOTEC/text_models

def test_add():
    dset = Dataset()
    assert len(dset.klasses) == 0
    dset.add(dset.load_emojis())
    cnt = len(dset.klasses)
    assert cnt > 0
    words = dset.tm_words()
    dset.add(words)
    print(len(dset.klasses), len(words), cnt)
    assert len(dset.klasses) <= len(words) + cnt

예제 #3

파일 보기

파일: test_dataset.py 프로젝트: INGEOTEC/text_models

def test_remove():
    dset = Dataset()
    dset.add(dset.load_emojis())
    dset.add(dset.tm_words())
    xx = dset.klass("xxx good morning xxx asdfa")
    print(xx)
    assert len(xx) == 2
    dset.remove("~good~")
    xx = dset.klass("xxx good xxx morning xxx")
    print(xx)
    assert len(xx) == 1

예제 #4

파일 보기

파일: test_dataset.py 프로젝트: INGEOTEC/text_models

def test_process():
    
    from microtc.emoticons import convert_emoji
    dset = Dataset()
    dset.add(dset.load_emojis())
    dset.add(dset.tm_words())
    xx = dset.process("xxx good 9 morning xxx fax x la", "~x~")
    for a, b in zip(xx, ["~xxx~good~9~morning~xxx~fax~", "~la~", "~la~"]):
        print(a, b)
        assert a == b
    txt = 'xxx good {} morning xxx fax x la'.format(convert_emoji('1F600'))
    xx = dset.process(txt, convert_emoji('1F600'))
    print(xx)
    for a, b in zip(xx, ["~xxx~good~", "~morning~xxx~fax~x~la~"]):
        assert a == b