Beispiel #1
0
'''形態素列マッチングを単品で実行して確認する
'''

from psc_parse import JumanPsc, MrphMatch, MRPH_MTCH_PTN
from juman_settings import *

juman = JumanPsc(command=JUMAN_COMMAND, option=JUMAN_OPTION)

# line = '   男「ようこそ皆さん、私の名前はジョニー。今日は私のリサイタルショーにおいで下さってありがとうございます。今宵、しばし皆様の時間を拝借して、私の歌をお聞きください。では、まずはこの歌から」'
line = '女「男  イヌ'

mrphs = juman.analysis(line).mrph_list()

mrph_match = MrphMatch(mrphs)

# kwargs = {
#     'ptn': (
#         MrphMatch.match_spaces,
#         MrphMatch.match_noun,
#         MrphMatch.match_left_bracket,
#     ),
#     'idx': 0
# }

kwargs = MRPH_MTCH_PTN['0002']

result = mrph_match.match(**kwargs)

print(f'マッチ判定: {result.matched}')
print(f'マッチ範囲文字列: "{result.matched_str}"')
print(f'マッチ範囲内形態素数: {result.matched_count}')
Beispiel #2
0
'''JumanPsc の形態素解析を単品の文字列で試す
'''

from psc_parse import JumanPsc
from juman_settings import JUMAN_COMMAND, JUMAN_OPTION

juman = JumanPsc(command=JUMAN_COMMAND, option=JUMAN_OPTION)

s = '今日もいい天気'

try:
    mrphs = juman.analysis(s)

    for mrph in mrphs:
        print(f'"{mrph.midasi}"')  # 見出し
        print(f'  genkei:   {mrph.genkei}')  # 原形
        print(f'  hinsi:    {mrph.hinsi}')  # 品詞
        print(f'  bunrui:   {mrph.bunrui}')  # 品詞細分類
        print(f'  katuyou2: {mrph.katuyou2}')  # 活用形

except Exception as e:
    print(e)