Python Stemmer примеры использования

Язык программирования: Python

Пространство имен/Пакет: textmining.stemmer

Класс/Тип: Stemmer

Примеров на hotexamples.com: 11

Python Stemmer - 11 примеров найдено. Это лучшие примеры Python кода для textmining.stemmer.Stemmer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Stemmer(11)

compute_stem_hist(4)

normalize_text(2)

compute_nice_stem_hist(1)

flatten_stem_corpus(1)

get_complete_vocabulary(1)

stem_text(1)

stem_word(1)

strip_accents_and_lower(1)

Пример #1

Показать файл

def test_compute_nice_stem_hist():
    s = Stemmer()

    txt = "chateau Châteaux Châteaux chateaux exemple EXEMPLE exemples EXEMPLES exemple"
    ans = s.compute_nice_stem_hist(txt)
    print("[" + str(ans) + "]")
    assert (ans["Châteaux"] == 4 and ans["exemple"] == 5)

Пример #2

Показать файл

def test_flatten_stem_corpus():
    s = Stemmer()

    corpus = [
        s.compute_stem_hist(text) for text in [
            "chateau Châteaux Châteaux chateaux exemple EXEMPLE exemples EXEMPLES exemple",
            "Château café IRENE ça arène Noël",
            "J'ai acheté du pain, des croissants & des chocolatines ; ça fait beaucoup !"
        ]
    ]
    ans = s.flatten_stem_corpus(corpus)
    print("[" + str(ans) + "]")
    assert (ans == [{
        'chateau': 4,
        'exempl': 5
    }, {
        'caf': 1,
        'chateau': 1,
        'aren': 1,
        'iren': 1,
        'noel': 1,
    }, {
        'croiss': 1,
        'beaucoup': 1,
        'achet': 1,
        'chocolatin': 1,
        'pain': 1
    }])

Пример #3

Показать файл

def test_stem_text():
    s = Stemmer()

    txt = "J'ai acheté du pain, des croissants & des chocolatines ; ça fait beaucoup ! Bla. Bla ? \ a | b - c ( d ) e"
    ans = " ".join(s.stem_text(txt))
    print("[" + ans + "]")
    assert (ans == "achet pain croiss chocolatin beaucoup bla bla")

Пример #4

Показать файл

def test_stem_word():
    s = Stemmer()

    txt = "mayenne cassoulet nature la a ? ! 34?"
    ans = " ".join([s.stem_word(t) for t in txt.split()])
    print("[" + ans + "]")
    assert (ans == "mayen cassoulet natur     ")

Пример #5

Показать файл

def test_strip_accents_and_lower():
    s = Stemmer()

    txt = "Château café IRENE ça arène Noël"
    ans = s.strip_accents_and_lower(txt)
    print("[" + ans + "]")
    assert (ans == "chateau cafe irene ca arene noel")

Пример #6

Показать файл

def test_compute_stem_hist():
    s = Stemmer()

    txt = "chateau Châteaux chateaux exemple EXEMPLE exemples EXEMPLES exemple"
    ans = s.compute_stem_hist(txt)
    print("[" + str(ans) + "]")
    assert (sum(ans["chateau"].values()) == 3
            and sum(ans["exempl"].values()) == 5)

Пример #7

Показать файл

def test_languages():
    # If you read this test, you should try listening the zaaiuien word : translate.google.com/#nl/fr/zaaiuien
    s = Stemmer()
    txt = "zaaiuien"

    nl_hist = s.compute_stem_hist(txt, "NL")
    fr_hist = s.compute_stem_hist(txt, "FR")

    assert "zaaiui" in nl_hist and "zaaiui" not in fr_hist

Пример #8

Показать файл

def test_normalize_text():
    s = Stemmer()

    txt = "J'ai acheté du pain, des croissants & des chocolatines ; ça fait beaucoup ! Bla. Bla ? \ a | b - c ( d ) e"
    ans = s.normalize_text(txt)
    print("[" + ans + "]")
    assert (
        ans ==
        "J ai acheté du pain des croissants des chocolatines ça fait beaucoup Bla Bla a b - c d e"
    )

Пример #9

Показать файл

def test_normalize_text_with_digits():
    s = Stemmer(keep_digits=True)

    txt = "J'ai acheté 1 pain, 3 croissants & 4 chocolatines ; ça fait beaucoup ! Bla. Bla ? \ a | b - c ( d ) e"
    ans = s.normalize_text(txt)
    print("[" + ans + "]")
    assert (
        ans ==
        "J ai acheté 1 pain 3 croissants 4 chocolatines ça fait beaucoup Bla Bla a b - c d e"
    )

Пример #10

Показать файл

def test_get_complete_vocabulary():
    s = Stemmer()

    corpus = [
        s.compute_stem_hist(text) for text in [
            "chateau Châteaux Châteaux chateaux exemple EXEMPLE exemples EXEMPLES exemple",
            "Château café IRENE ça arène Noël",
            "J'ai acheté du pain, des croissants & des chocolatines ; ça fait beaucoup !"
        ]
    ]
    ans = s.get_complete_vocabulary(corpus)
    print("[" + str(ans) + "]")
    assert (ans == {
        'achet', 'chateau', 'beaucoup', 'chocolatin', 'croiss', 'aren', 'iren',
        'pain', 'noel', 'caf', 'exempl'
    })

Пример #11

Показать файл

    def __init__(self, proxy, cs):
        if proxy is not None and "url" in proxy:
            self.proxy = Proxy(url=proxy["url"],
                               username=proxy["username"],
                               password=proxy["password"])
        else:
            self.proxy = None
        self.cs = CrawlStore(conf=cs)
        self.stemmer = Stemmer()

        # Logging initialization
        self.logger = logging.getLogger("company_crawler")
        self.logger.setLevel(logging.INFO)
        file_handler = logging.FileHandler(filename=LIB_PATH +
                                           "../log/log.txt")
        file_handler.setFormatter(
            logging.Formatter(
                '[%(levelname)s][%(name)s][%(asctime)s] %(message)s'))

        self.logger.addHandler(file_handler)