jctconv

jctconv (Japanese Character Type Converter) はひらがな・カタカナ・全角・半角の文字種変換を高速に行います。 Pythonのみで実装されているので、Cコンパイラが使えない環境でも利用できます。

normalizeメソッドは、unicodedata.normalize を日本語処理向けに特化した拡張を行っています。具体的には以下のように変換します。

u'〜' -> u'ー',
u'～' -> u'ー',
u"’" -> "'",
u'”' -> '"',
u'―' -> '-',
u'‐' -> '-'

INSTALLATION

$ pip install jctconv

USAGE

import jctconv
jctconv.hira2kata(u'ともえまみ')
# => u'トモエマミ'
jctconv.hira2hkata(u'ともえまみ')
# => u'ﾄﾓｴﾏﾐ'
jctconv.kata2hira(u'巴マミ')
# => u'巴まみ'
jctconv.h2z(u'ﾃｨﾛ･ﾌｨﾅｰﾚ')
# => u'ティロ･フィナーレ'
jctconv.h2z(u'abc', ascii=True)
# => u'ａｂｃ'
jctconv.h2z(u'123', digit=True)
# => u'１２３'
jctconv.h2z(u'ｱabc123', kana=False, digit=True, ascii=True)
# => u'ｱａｂｃ１２３'
jctconv.z2h(u'ティロ・フィナーレ')
# => u'ﾃｨﾛ・ﾌｨﾅｰﾚ'
jctconv.z2h(u'ａｂｃ', ascii=True)
# => u'abc'
jctconv.z2h(u'１２３', digit=True)
# => u'123'
jctconv.z2h(u'アａｂｃ１２３', kana=False, digit=True, ascii=True)
# => u'アabc123'
jctconv.normalize(u'ティロ･フィナ〜レ', 'NFKC')
# => u'ティロ・フィナーレ'

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
jctconv		jctconv
.gitignore		.gitignore
.travis.yml		.travis.yml
CHANGES.rst		CHANGES.rst
LICENSE		LICENSE
README.rst		README.rst
setup.py		setup.py
test_jctconv.py		test_jctconv.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

jctconv

jctconv

.gitignore

.gitignore

.travis.yml

.travis.yml

CHANGES.rst

CHANGES.rst

LICENSE

LICENSE

README.rst

README.rst

setup.py

setup.py

test_jctconv.py

test_jctconv.py

Repository files navigation

jctconv

INSTALLATION

USAGE

About

Releases

Packages

Languages

License

pombredanne/jctconv

Folders and files

Latest commit

History

Repository files navigation

jctconv

INSTALLATION

USAGE

About

Resources

License

Stars

Watchers

Forks

Languages