Python Syllabifierの例

プログラミング言語: Python

名前空間/パッケージ名: cltk.stem.sanskrit.indian_syllabifier

クラス/型: Syllabifier

hotexamples.comのコード掲載数: 14

Python Syllabifier - 14件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのcltk.stem.sanskrit.indian_syllabifier.Syllabifierの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

get_phonetic_feature_vector(3)

Syllabifier(2)

get_offset(2)

orthographic_syllabify(2)

in_coordinated_range_offset(1)

is_anusvaar(1)

is_consonant(1)

is_dependent_vowel(1)

is_misc(1)

is_nukta(1)

is_plosive(1)

is_valid(1)

is_vowel(1)

コード例 #1

ファイルを表示

ファイル: test_stem.py プロジェクト: vierth/cltk

 def test_is_dependent_vowel(self):
     """Test Indic Syllabifier is_dependent_vowel method"""
     syllabifier = IndianSyllabifier('hindi')
     v = syllabifier.get_phonetic_feature_vector('न', 'hi')
     self.assertFalse(syllabifier.is_dependent_vowel(v))

コード例 #2

ファイルを表示

ファイル: test_stem.py プロジェクト: vierth/cltk

 def test_is_anusvaar(self):
     """Test Indic Syllabifier is_anusvaar method"""
     syllabifier = IndianSyllabifier('hindi')
     v = syllabifier.get_phonetic_feature_vector('न', 'hi')
     self.assertFalse(syllabifier.is_anusvaar(v))

コード例 #3

ファイルを表示

ファイル: test_stem.py プロジェクト: vierth/cltk

 def test_is_valid(self):
     """Test Indic Syllabifier is_valid method"""
     syllabifier = IndianSyllabifier('hindi')
     v = syllabifier.get_phonetic_feature_vector('न', 'hi')
     self.assertTrue(syllabifier.is_valid(v))

コード例 #4

ファイルを表示

ファイル: test_stem.py プロジェクト: vierth/cltk

 def test_get_offset(self):
     """Test Indic Syllabifier get_offset method"""
     correct = 40
     syllabifier = IndianSyllabifier('hindi')
     current = syllabifier.get_offset('न', 'hi')
     self.assertEqual(current, correct)

コード例 #5

ファイルを表示

ファイル: test_stem.py プロジェクト: vierth/cltk

 def test_coordinated_range(self):
     """Test Indic Syllabifier in_coordinated_range method"""
     syllabifier = IndianSyllabifier('hindi')
     current = syllabifier.get_offset('न', 'hi')
     current1 = syllabifier.in_coordinated_range_offset(current)
     self.assertTrue(current1)

コード例 #6

ファイルを表示

ファイル: test_stem.py プロジェクト: manu-chroma/cltk

 def test_is_dependent_vowel(self):
     """Test Indic Syllabifier is_dependent_vowel method"""
     syllabifier = IndianSyllabifier('hindi')
     v = syllabifier.get_phonetic_feature_vector('न', 'hi')
     self.assertFalse(syllabifier.is_dependent_vowel(v))

コード例 #7

ファイルを表示

ファイル: test_stem.py プロジェクト: vierth/cltk

 def test_syllabify(self):
     """Test Indic Syllabifier method"""
     correct = ['न', 'म', 'स्ते']
     syllabifier = IndianSyllabifier('hindi')
     current = syllabifier.orthographic_syllabify('नमस्ते')
     self.assertEqual(current, correct)

コード例 #8

ファイルを表示

ファイル: test_stem.py プロジェクト: manu-chroma/cltk

 def test_is_anusvaar(self):
     """Test Indic Syllabifier is_anusvaar method"""
     syllabifier = IndianSyllabifier('hindi')
     v = syllabifier.get_phonetic_feature_vector('न', 'hi')
     self.assertFalse(syllabifier.is_anusvaar(v))

コード例 #9

ファイルを表示

ファイル: test_stem.py プロジェクト: manu-chroma/cltk

 def test_is_valid(self):
     """Test Indic Syllabifier is_valid method"""
     syllabifier = IndianSyllabifier('hindi')
     v = syllabifier.get_phonetic_feature_vector('न', 'hi')
     self.assertTrue(syllabifier.is_valid(v))

コード例 #10

ファイルを表示

ファイル: test_stem.py プロジェクト: manu-chroma/cltk

 def test_coordinated_range(self):
     """Test Indic Syllabifier in_coordinated_range method"""
     syllabifier = IndianSyllabifier('hindi')
     current = syllabifier.get_offset('न', 'hi')
     current1 = syllabifier.in_coordinated_range_offset(current)
     self.assertTrue(current1)

コード例 #11

ファイルを表示

ファイル: test_stem.py プロジェクト: manu-chroma/cltk

 def test_get_offset(self):
     """Test Indic Syllabifier get_offset method"""
     correct = 40
     syllabifier = IndianSyllabifier('hindi')
     current = syllabifier.get_offset('न', 'hi')
     self.assertEqual(current, correct)

コード例 #12

ファイルを表示

ファイル: test_stem.py プロジェクト: manu-chroma/cltk

 def test_syllabify(self):
     """Test Indic Syllabifier method"""
     correct = ['न', 'म', 'स्ते']
     syllabifier = IndianSyllabifier('hindi')
     current = syllabifier.orthographic_syllabify('नमस्ते')
     self.assertEqual(current, correct)

コード例 #13

ファイルを表示

from cltk.corpus.sanskrit.itrans.unicode_transliterate import ItransTransliterator
from cltk.tokenize.sentence import TokenizeSentence
from cltk.stem.sanskrit.indian_syllabifier import Syllabifier

lang = "hi"
language = "hindi"
tokenizer = TokenizeSentence("sanskrit")
syl = Syllabifier(language)

#List of phonemes that should not be counted as separate diphones while splitting
check_phonemes_1 = ["ः", "ऽ", "ङ्‍\u200d"]
check_phonemes_2 = ["\u200c"]

#List of characters that should be taken to the left in case they are present to the right while splitting
move_left_1 = ['म्', 'र्', 'न्']


#Checking for numbers and purna-viram
def check_token(token):
    flag = True
    if token == "।":
        flag = False
    elif token.isdigit():
        flag = False

    return flag


#Checking for splitting position
def check_proximity(split, pos, next_token):
    if len(split) - pos in range(1, 3):

コード例 #14

ファイルを表示

"""
@author: sourabh garg
"""
import itertools
import re
import words_tagging
from cltk.stem.sanskrit.indian_syllabifier import Syllabifier
from cltk.corpus.sanskrit.alphabet import *

lang = 'hindi'
h = Syllabifier(lang)

VOWELS = [
    INDEPENDENT_VOWELS_SIMPLE, INDEPENDENT_VOWELS_DIPTHONGS, INDEPENDENT_VOWELS
]

VOWELS = list(itertools.chain(*VOWELS))
CONSONANTS = [
    CONSONANT_GUTTURALS, CONSONANT_PALATALS, CONSONANT_CEREBRALS,
    CONSONANT_DENTALS, CONSONANT_LABIALS, SEMIVOWEL_CONSONANT,
    SIBILANT_CONSONANT, SONANT_ASPIRATE
]
CONSONANTS = list(itertools.chain(*CONSONANTS))
CONSONANT_HALANTA = [x + '्' for x in CONSONANTS]
CONS_TO_CONS = dict(zip(CONSONANT_HALANTA, CONSONANTS))
matraa_to_vowel = {
    '': 'अ',
    'ा': 'आ',
    'ि': 'इ',
    'ी': 'ई',
    'ु': 'उ',