Ejemplos de segment en Python

Lenguaje de programación: Python

Namespace/Package Name: MicroTokenizer.dag_tokenizer

Método / Función: segment

Ejemplos en hotexamples.com: 5

Python segment - 5 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de MicroTokenizer.dag_tokenizer.segment extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: test_tokenizer_with_legacy.py Proyecto: howl-anderson/MicroTokenizer

def test_main():
    from MicroTokenizer import (
        hmm_tokenizer,
        crf_tokenizer,
        dag_tokenizer,
        max_match_forward_tokenizer,
        max_match_backward_tokenizer,
        max_match_bidirectional_tokenizer,
    )

    input_text = "王小明在北京的清华大学读书。"

    # 使用相关的算法来分词。

    result = hmm_tokenizer.segment(input_text)
    print(result)

    result = crf_tokenizer.segment(input_text)
    print(result)

    result = max_match_forward_tokenizer.segment(input_text)
    print(result)

    result = max_match_backward_tokenizer.segment(input_text)
    print(result)

    result = max_match_bidirectional_tokenizer.segment(input_text)
    print(result)

    result = dag_tokenizer.segment(input_text)
    print(result)

Ejemplo n.º 2

Mostrar archivo

def _cut_by_dag_hmm_joint_model(message):
    solutions = [
        dag_tokenizer.segment(message),
        hmm_tokenizer.segment(message)
    ]
    merge_solutions = MergeSolutions()
    best_solution = merge_solutions.merge(solutions)

    return best_solution

Ejemplo n.º 3

Mostrar archivo

Archivo: test_tokenize_with_DAG.py Proyecto: howl-anderson/MicroTokenizer

def test_main():
    from MicroTokenizer import dag_tokenizer

    tokens = dag_tokenizer.segment("知识就是力量")
    print(tokens)

Ejemplo n.º 4

Mostrar archivo

def cut(message, HMM=False):
    if HMM:
        return _cut_by_dag_hmm_joint_model(message)
    else:
        return dag_tokenizer.segment(message)

Ejemplo n.º 5

Mostrar archivo

from MicroTokenizer import (
    hmm_tokenizer,
    crf_tokenizer,
    dag_tokenizer,
    max_match_forward_tokenizer,
    max_match_backward_tokenizer,
    max_match_bidirectional_tokenizer,
)

input_text = "王小明在北京的清华大学读书。"

# 使用相关的算法来分词。

result = hmm_tokenizer.segment(input_text)
print(result)

result = crf_tokenizer.segment(input_text)
print(result)

result = max_match_forward_tokenizer.segment(input_text)
print(result)

result = max_match_backward_tokenizer.segment(input_text)
print(result)

result = max_match_bidirectional_tokenizer.segment(input_text)
print(result)

result = dag_tokenizer.segment(input_text)
print(result)