Python FsmMorphologicalAnalyzer.robustMorphologicalAnalysis示例

编程语言: Python

命名空间/包名称: MorphologicalAnalysis.FsmMorphologicalAnalyzer

方法/功能: robustMorphologicalAnalysis

hotexamples.com的示例: 2

Python FsmMorphologicalAnalyzer.robustMorphologicalAnalysis - 已找到2个示例。这些是从开源项目中提取的最受好评的MorphologicalAnalysis.FsmMorphologicalAnalyzer.FsmMorphologicalAnalyzer.robustMorphologicalAnalysis现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

FsmMorphologicalAnalyzer(16)

morphologicalAnalysis(7)

getPossibleWords(3)

getDictionary(2)

robustMorphologicalAnalysis(2)

示例#1

显示文件

文件： RootFirstDisambiguationTest.py 项目： salihercan/TurkishMorphologicalDisambiguation-Py

 def test_Disambiguation(self):
     fsm = FsmMorphologicalAnalyzer("../turkish_dictionary.txt",
                                    "../turkish_misspellings.txt",
                                    "../turkish_finite_state_machine.xml")
     corpus = DisambiguationCorpus("../penntreebank.txt")
     algorithm = RootFirstDisambiguation()
     algorithm.train(corpus)
     correctParse = 0
     correctRoot = 0
     for i in range(corpus.sentenceCount()):
         sentenceAnalyses = fsm.robustMorphologicalAnalysis(
             corpus.getSentence(i))
         fsmParses = algorithm.disambiguate(sentenceAnalyses)
         for j in range(corpus.getSentence(i).wordCount()):
             word = corpus.getSentence(i).getWord(j)
             if isinstance(word, DisambiguatedWord):
                 if fsmParses[j].transitionList() == word.getParse(
                 ).__str__():
                     correctParse = correctParse + 1
                 if fsmParses[j].getWord() == word.getParse().getWord():
                     correctRoot = correctRoot + 1
     self.assertEqual(0.9590, (correctRoot + 0.0) / corpus.numberOfWords(),
                      0.002)
     self.assertEqual(0.8639, (correctParse + 0.0) / corpus.numberOfWords(),
                      0.002)

示例#2

显示文件

文件： HmmDisambiguationTest.py 项目： StarlangSoftware/TurkishMorphologicalDisambiguation-Cy

 def test_Disambiguation(self):
     fsm = FsmMorphologicalAnalyzer()
     corpus = DisambiguationCorpus("../penntreebank.txt")
     algorithm = HmmDisambiguation()
     algorithm.train(corpus)
     correctParse = 0
     correctRoot = 0
     for i in range(corpus.sentenceCount()):
         sentenceAnalyses = fsm.robustMorphologicalAnalysis(corpus.getSentence(i))
         fsmParses = algorithm.disambiguate(sentenceAnalyses)
         for j in range(corpus.getSentence(i).wordCount()):
             word = corpus.getSentence(i).getWord(j)
             if isinstance(word, DisambiguatedWord):
                 if fsmParses[j].transitionList().lower() == word.getParse().__str__().lower():
                     correctParse = correctParse + 1
                 if fsmParses[j].getWord() == word.getParse().getWord():
                     correctRoot = correctRoot + 1
     self.assertAlmostEqual(0.9233, (correctRoot + 0.0) / corpus.numberOfWords(), 3)
     self.assertAlmostEqual(0.8630, (correctParse + 0.0) / corpus.numberOfWords(), 3)