Skip to content

taylor-ahn/tossi

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

토씨

[![Build Status] (https://travis-ci.org/what-studio/tossi.svg?branch=master)] (https://travis-ci.org/what-studio/tossi) [![Coverage Status] (https://coveralls.io/repos/github/what-studio/tossi/badge.svg?branch=master)] (https://coveralls.io/r/what-studio/tossi)

'토씨'는 '조사'의 순우리말 이름입니다.

설치

$ pip install tossi

사용법

>>> import tossi
>>> tossi.postfix_particle(u'집', u'(으)로')
집으로
>>> tossi.postfix_particle(u'말', u'으로는')
말로는
>>> tossi.postfix_particle(u'대한민국', u'은(는)')
대한민국은
>>> tossi.postfix_particle(u'민주공화국', u'다')
민주공화국이다

자연스러운 조사 선택

, , 만~, 에~, 께~, 뿐~, 하~, 보다~, 밖에~, 같이~, 부터~, 까지~, 마저~, 조차~, 마냥~, 처럼~, 커녕~에는 어떤 단어가 앞서도 형태가 변하지 않습니다:

나오, 모리안, 키홀, 나오, 모리안, 키홀

반면 은(는), 이(가), 을(를), 과(와)~는 앞선 단어의 마지막 음절의 받침 유무에 따라 형태가 달라집니다:

나오, 모리안, 키홀

(으)로~도 비슷한 규칙을 따르지만 앞선 받침이 일 경우엔 받침이 없는 것과 같게 취급합니다:

나오, 모리안으로, 키홀

서술격 조사 (이)다는 어미가 활용되어 다양한 형태로 변형될 수 있습니다:

나오지만, 모리안이지만, 키홀이에요, 나오예요

토씨는 가장 자연스러운 조사 형태를 선택합니다. 만약 어떤 형태가 자연스러운지 알 수 없을 때에는 은(는), (으)로처럼 모든 형태를 병기합니다:

>>> tossi.postfix_particle(u'벽돌', u'으로')
벽돌로
>>> tossi.postfix_particle(u'짚', u'으로')
짚으로
>>> tossi.postfix_particle(u'黃金', u'으로')
黃金()

단어가 숫자로 끝나더라도 자연스러운 조사 형태가 선택됩니다:

>>> tossi.postfix_particle(u'레벨 10', u'이')
레벨 10
>>> tossi.postfix_particle(u'레벨 999', u'이')
레벨 999

괄호 속 단어나 구두점은 조사 형태를 선택할 때 참고하지 않습니다:

>>> tossi.postfix_particle(u'나뭇가지(만렙)', u'을')
나뭇가지(만렙)

병기 순서

조사의 형태를 모두 병기해야할 때 병기할 순서를 고를 수 있습니다. 가령 대부분의 인자가 일본어 단어일 경우엔 단어가 모음으로 끝날 확률이 높습니다. 이 경우 기본형인 은(는) 스타일보단 는(은) 스타일이 더 자연스러울 수 있습니다:

>>> tolerance_style = tossi.parse_tolerance_style(u'는(은)')
>>> tossi.postfix_particle(u'さくら', u'이', tolerance_style=tolerance_style)
さくら가()

은(는), (은)는, 는(은), (는)은 네 가지 스타일 중 프로젝트에 맞는 것을 고르세요.

만든이와 사용권

넥슨 왓 스튜디오이흥섭김찬웅이 만들었고 제3조항을 포함하는 BSD 허가서를 채택했습니다.

About

Supports Korean particles

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 100.0%