Python getCleanedWordsの例

プログラミング言語: Python

名前空間/パッケージ名: TextTools

メソッド/関数: getCleanedWords

hotexamples.comのコード掲載数: 6

Python getCleanedWords - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのTextTools.getCleanedWordsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

0

ファイルを表示

ファイル: LDAModel.py プロジェクト: KshitizSethia/AcroDisam

def parallelGetCleanedWords(article):
    return article[0], getCleanedWords(article[1], stem_words=stem_words, removeNumbers=removeNumbers)

コード例 #2

0

ファイルを表示

ファイル: TestTextTools.py プロジェクト: KshitizSethia/AcroDisam

 def test_getCleanedWords_noStemming_Punctuations(self):
     words = getCleanedWords(
         "Purpose, of; his. life: with\r\n \"productive\" achievement\n (as) <his> noblest! activity?", stem_words=False, removeNumbers=False)
     self.assertTrue(len(words) == 6)
     self.assertEquals(
         words, ['purpose', 'life', 'productive', 'achievement', 'noblest', 'activity'])

コード例 #3

0

ファイルを表示

ファイル: TestTextTools.py プロジェクト: KshitizSethia/AcroDisam

 def test_getCleanedWords_removeNumbersAndPercentageAndFormulas(self):
     inputText = "This is a sentence with 01 2 10 numbers and 10% and 1+2=5."
     words = getCleanedWords(
         inputText, stem_words=False, removeNumbers=True)
     self.assertEquals(words, ["sentence", "numbers"])

コード例 #4

0

ファイルを表示

ファイル: TestTextTools.py プロジェクト: KshitizSethia/AcroDisam

 def test_getCleanedWords_noStemming_stopwords(self):
     words = getCleanedWords(
         "this is a test string", stem_words=False, removeNumbers=False)
     self.assertEquals(words, ["test", "string"])

コード例 #5

0

ファイルを表示

ファイル: TestTextTools.py プロジェクト: KshitizSethia/AcroDisam

 def test_getCleanedWords_noStemming_stopwordsWithCapitals(self):
     words = getCleanedWords(
         "This Is A Test String", stem_words=False, removeNumbers=False)
     self.assertEquals(words, ["test", "string"])

コード例 #6

0

ファイルを表示

ファイル: TestTextTools.py プロジェクト: KshitizSethia/AcroDisam

 def test_getCleanedWords_blankString(self):
     words = getCleanedWords(
         "", stem_words=False, removeNumbers=False)
     self.assertEquals(words, [])