Python HanLP.convertToTraditionalChinese примеры использования

Язык программирования: Python

Пространство имен/Пакет: pyhanlp

Класс/Тип: HanLP

Метод/Функция: convertToTraditionalChinese

Примеров на hotexamples.com: 4

Python HanLP.convertToTraditionalChinese - 4 примера найдено. Это лучшие примеры Python кода для pyhanlp.HanLP.convertToTraditionalChinese, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

segment(30)

parseDependency(29)

newSegment(14)

extractKeyword(12)

convertToSimplifiedChinese(6)

extractSummary(6)

convertToTraditionalChinese(4)

convertToPinyinList(3)

extractPhrase(3)

extractWords(2)

s2hk(2)

s2tw(2)

HanLP(1)

convertToPinyinFirstCharString(1)

convertToPinyinString(1)

getSummary(1)

Пример #1

Показать файл

Файл: word_segmentation.py Проект: Architect1st/STC-Conditional-SeqGAN-Pytorch

def ws(filename, convert2zh=False):

    if not os.path.exists(REPO_DIR):
        os.makedirs(REPO_DIR)

    file = os.path.join(REPO_DIR, filename)
    fw = codecs.open(file + '.seg.sc', 'w', encoding = 'utf-8')
    
    regex = re.compile(r'[\u4e00-\u9fffa-zA-Z0-9]+')

    with codecs.open(file, 'r', encoding = 'utf-8') as fr:
        for line in fr:
            line = line.split('\t', 1)[1].strip().replace('“', '').replace('”', '')
            line = clean(line)
            _list = regex.findall(line.strip())
            seq = ''
            for span in _list:
                result = analyzer.analyze(span)
                for terms in result.toSimpleWordList():
                    field = terms.toString().split('/')
                    word = field[0] if not convert2zh else HanLP.convertToTraditionalChinese(field[0])
                    pos = field[1]
                    seq += word.lower() + '_' + pos + ' '

                seq += '，_， '
                    
            fw.write(seq.rsplit('_', 1)[0][:-1] + '。_。\n')

    fw.close()

Пример #2

Показать файл

Файл: api.py Проект: wisonwang/pyhanlp

def convertToTraditionalChinese(simplifiedChineseString):
    """
     * 简转繁
     *
     * @param simplifiedChineseString 简体中文
     * @return 繁体中文

    """
    return HanLP.convertToTraditionalChinese(simplifiedChineseString)

Пример #3

Показать файл

Файл: word_segment.py Проект: Architect1st/STC-Conditional-SeqGAN-Pytorch

def ws(line, convert2zh=False):

    regex = re.compile(r'[\u4e00-\u9fffa-zA-Z0-9]+')

    line = line.strip().replace('“', '').replace('”', '')
    line = clean(line)
    _list = regex.findall(line.strip())
    seq = ''
    for span in _list:
        result = analyzer.analyze(span)
        for terms in result.toSimpleWordList():
            field = terms.toString().split('/')
            word = field[
                0] if not convert2zh else HanLP.convertToTraditionalChinese(
                    field[0])
            seq += word.lower() + " "
        seq += '， '

    return (seq.rsplit('，', 1)[0] + '。').split()

Пример #4

Показать файл

def zh_traditional_standard(line, server_model):
    return HanLP.convertToTraditionalChinese(line)