Python segmentの例

プログラミング言語: Python

名前空間/パッケージ名: pythainlp.segment

メソッド/関数: segment

hotexamples.comのコード掲載数: 14

Python segment - 14件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpythainlp.segment.segmentの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: WordExecutor.py プロジェクト: oat9002/SentimentalPrediction

def createNgram(word, gram):
    segmented_word = segment(word_cleaning(word))
    ret_word = []
    grams = ngrams(segmented_word, gram)
    for t in grams:
        ret_word.append(''.join(t))
    return ret_word

コード例 #2

ファイルを表示

def romanization(txt):
	txt = segment(txt)  # (','.join(str(x) for x in txt))  # แยกออกมาเป็น list
	cc=''
	#print(txt)
	for b in txt:
		cc+=consonant(b)
	return cc

コード例 #3

ファイルを表示

ファイル: WordExecutor.py プロジェクト: oat9002/SentimentalPrediction

def create_ngram_from_list_bynltk(word_arr, gram):
    keywords = []
    for item in word_arr:
        segmented_word = segment(word_cleaning(item))
        grams = ngrams(segmented_word, gram)
        for t in grams:
            keywords.append(''.join(t))
    return list(set(keywords))

コード例 #4

ファイルを表示

def nlp_segment(text):  # type: str
    parts = []
    for part in text.split(" "):
        try:
            subparts = segment(part)
            parts.extend(subparts)
        except Exception:
            parts.append(part)
    return parts

コード例 #5

ファイルを表示

 def cutSentence(self, sentence):
     '''cut thai language
     input:
         @sentence : input text
     output:
         a list of words
     '''
     try:
         result_cut = segment(sentence)
         Log().write('thai language cut words complete.')
         return result_cut
     except Exception as e:
         Log().write(e, 'Error')
     return False

コード例 #6

ファイルを表示

def review_to_wordlist(review):
    review_text = review
    review_text = review_text.lower()
    review_text = review_text.replace(u'é', 'e')
    pokemonSyn = [u'pokemongo', u'โปเกม่อนโก', u'โปเกมอนโก', u'pokemon go']
    for syn in pokemonSyn:
        review_text = review_text.replace(syn, u'ม่อน')
    removeCharList = ['rt', '!', '?']
    for c in removeCharList:
        review_text = review_text.replace(c, '')
    elimSet = ['http', '@', '#']
    review_word_list = review_text.split()
    for e in elimSet:
        review_word_list = [word for word in review_word_list if e not in word]

    reviewSentence = "".join(review_word_list)
    wordList = segment(reviewSentence)

    return wordList

コード例 #7

ファイルを表示

ファイル: __init__.py プロジェクト: gain9999/pythainlp

	def testSegment(self):
		self.assertEqual(segment('ฉันรักภาษาไทยเพราะฉันเป็นคนไทย'),[u'ฉัน', u'รัก', u'ภาษา', u'ไทย', u'เพราะ', u'ฉัน', u'เป็น', u'คน', u'ไทย'])

コード例 #8

ファイルを表示

def tag(text):
    """รับค่าเป็นข้อความ ''str'' คืนค่าเป็น ''list'' เช่น [('ข้อความ', 'ชนิดคำ')]"""
    text = segment(text)
    tagger = nltk.tag.UnigramTagger(model=data1)  # backoff=default_tagger)
    return tagger.tag(text)

コード例 #9

ファイルを表示

ファイル: text.py プロジェクト: nlsntcs/pythainlp

def tag(text):
	"""รับค่าเป็นข้อความ ''str'' คืนค่าเป็น ''list'' เช่น [('ข้อความ', 'ชนิดคำ')]"""
	text= segment(text)
	tagger = nltk.tag.UnigramTagger(model=data1)# backoff=default_tagger)
	return tagger.tag(text)

コード例 #10

ファイルを表示

ファイル: __init__.py プロジェクト: gain9999/pythainlp

def word_tokenize(text):
    return segment(text)

コード例 #11

ファイルを表示

ファイル: test.py プロジェクト: nlsntcs/pythainlp

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

from pythainlp.segment import segment
a = 'ฉันรักภาษาไทยเพราะฉันเป็นคนไทย'
b = segment(a)
print(b)
from pythainlp.segment.dict import segment
print(segment(a))
print(type(b))
from pythainlp.rank import rank
aa = rank(b)
print(aa)
from pythainlp.romanization import romanization
b=romanization("แมว")
print(b)
from pythainlp.change import *
a="l;ylfu8iy["
a=texttothai(a)
b="นามรสนอำันี"
b=texttoeng(b)
print(a)
print(b)
from pythainlp.segment.dict import segment
print(segment('ปีคริสต์ศักราช'))
from pythainlp.number import numtowords
print("5611116.50")
print(numtowords(5611116.50))

from pythainlp.postaggers import tag

コード例 #12

ファイルを表示

ファイル: test.py プロジェクト: magma2/pythainlp

from pythainlp.segment import segment
a = 'ฉันรักภาษาไทยเพราะฉันเป็นคนไทย'
b = segment(a)
print(b)
from pythainlp.segment.dict import segment
print(segment(a))
print(type(b))
from pythainlp.rank import rank
aa = rank(a)
print(aa)
from pythainlp.romanization import romanization
b=romanization("ต้นกก")
print(b)
from pythainlp.change import *
a="l;ylfu8iy["
a=texttothai(a)
b="นามรสนอำันี"
b=texttoeng(b)
print(a)
print(b)
from pythainlp.segment.dict import segment
print(segment('ฉันรักคุณ'))
from pythainlp.number import numtowords
print("5611116.50")
print(numtowords(5611116.50))

コード例 #13

ファイルを表示

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

from pythainlp.segment import segment
a = 'ฉันรักภาษาไทยเพราะฉันเป็นคนไทย'
b = segment(a)
print(b)
from pythainlp.segment.dict import segment
print(segment(a))
print(type(b))
from pythainlp.rank import rank
aa = rank(b)
print(aa)
from pythainlp.romanization import romanization
b = romanization("แมว")
print(b)
from pythainlp.change import *
a = "l;ylfu8iy["
a = texttothai(a)
b = "นามรสนอำันี"
b = texttoeng(b)
print(a)
print(b)
from pythainlp.segment.dict import segment
print(segment('ปีคริสต์ศักราช'))
from pythainlp.number import numtowords
print("5611116.50")
print(numtowords(5611116.50))

from pythainlp.postaggers import tag

コード例 #14

ファイルを表示

ファイル: segment.py プロジェクト: gain9999/pythainlp

from pythainlp.segment import segment
a = 'ฉันรักภาษาไทยเพราะฉันเป็นคนไทยและฉันใช้ภาษาไทย'
b = segment(a)
print(b)