Python vietnamese_cleanerの例

プログラミング言語: Python

名前空間/パッケージ名: vietnamese_cleaner.vietnamese_cleaners

メソッド/関数: vietnamese_cleaner

hotexamples.comのコード掲載数: 3

Python vietnamese_cleaner - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのvietnamese_cleaner.vietnamese_cleaners.vietnamese_cleanerの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: cleaner.py プロジェクト: diamondasr/espnet-1

    def __call__(self, text: str) -> str:
        for t in self.cleaner_types:
            if t == "tacotron":
                text = tacotron_cleaner.cleaners.custom_english_cleaners(text)
            elif t == "jaconv":
                text = jaconv.normalize(text)
            elif t == "vietnamese":
                text = vietnamese_cleaners.vietnamese_cleaner(text)
            else:
                raise RuntimeError(f"Not supported: type={t}")

        return text

コード例 #2

ファイルを表示

ファイル: cleaner.py プロジェクト: winlaic/espnet

    def __call__(self, text: str) -> str:
        for t in self.cleaner_types:
            if t == "tacotron":
                text = tacotron_cleaner.cleaners.custom_english_cleaners(text)
            elif t == "jaconv":
                text = jaconv.normalize(text)
            elif t == "vietnamese":
                if vietnamese_cleaners is None:
                    raise RuntimeError("Please install underthesea")
                text = vietnamese_cleaners.vietnamese_cleaner(text)
            elif t == "korean_cleaner":
                text = KoreanCleaner.normalize_text(text)
            else:
                raise RuntimeError(f"Not supported: type={t}")

        return text

コード例 #3

ファイルを表示

#!/usr/bin/env python3

# Copyright 2018 Nagoya University (Tomoki Hayashi) and Kính Phan (@enamoria)
# Apache 2.0  (http://www.apache.org/licenses/LICENSE-2.0)

import argparse
import codecs

from vietnamese_cleaner.vietnamese_cleaners import vietnamese_cleaner


if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("text", type=str, help="text to be cleaned")
    args = parser.parse_args()

    lines = {}
    with codecs.open(args.text, "r", "utf-8") as fid:
        for line in fid.readlines():
            id, _, content = line.split("|")

            clean_content = vietnamese_cleaner(content)
            lines[id] = clean_content

        for id in sorted(lines.keys()):
            print(f"{id} {lines[id]}")