Python PhrasePositionFinder.find_phrase_int_source_textの例

プログラミング言語: Python

名前空間/パッケージ名: lexnlp.extract.common.annotations.phrase_position_finder

メソッド/関数: find_phrase_int_source_text

hotexamples.comのコード掲載数: 5

Python PhrasePositionFinder.find_phrase_int_source_text - 5件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlexnlp.extract.common.annotations.phrase_position_finder.PhrasePositionFinder.find_phrase_int_source_textの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

find_phrase_in_source_text(10)

find_phrase_int_source_text(5)

コード例 #1

ファイルを表示

ファイル: test_phrase_position_finder.py プロジェクト: yushu-liu/lexpredict-lexnlp

 def test_exact_entry(self):
     text = 'The Treebank tokenizer uses regular  expressions to tokenize text as in Penn Treebank.'
     phrases = ['regular  expressions']
     tagged = PhrasePositionFinder.find_phrase_int_source_text(
         text, phrases)[0]
     pos = tagged[1]
     self.assertEqual(text.find(phrases[0]), pos)

コード例 #2

ファイルを表示

def get_trademark_annotations(text: str) -> \
        Generator[TrademarkAnnotation, None, None]:
    """
    Find trademarks in text.
    """
    # Iterate through sentences
    if TRADEMARK_PTN_RE.search(text):
        for scd in get_sentence_span(text):
            sentence = scd[2]
            phrases = list(np_extractor.get_np(sentence))
            tagged_phrases = PhrasePositionFinder.find_phrase_int_source_text(
                sentence, phrases)
            for phrase in tagged_phrases:
                for tm in TRADEMARK_PTN_RE.finditer(phrase[0]):
                    coords = tm.span()
                    coords = (coords[0] + scd[0] + phrase[1],
                              coords[1] + scd[0] + phrase[1])
                    if coords[1] >= len(text):
                        coords = (coords[0], len(text) - 1)
                    ant = TrademarkAnnotation(coords=coords,
                                              trademark=tm.group())
                    yield ant

コード例 #3

ファイルを表示

ファイル: test_phrase_position_finder.py プロジェクト: yushu-liu/lexpredict-lexnlp

 def test_similar_entries(self):
     text = 'aa aaa aaa aaaaa aa aaa aa'
     tagged = PhrasePositionFinder.find_phrase_int_source_text(
         text, ['aaa', 'aa'])
     self.assertEqual((3, 7), (tagged[0][1], tagged[1][1]))

コード例 #4

ファイルを表示

ファイル: test_phrase_position_finder.py プロジェクト: yushu-liu/lexpredict-lexnlp

 def test_corrupted_entry(self):
     text = 'The Treebank tokenizer uses regular(expressions) to tokenize text as in Penn Treebank.'
     phrases = ['regular expressions']
     tagged = PhrasePositionFinder.find_phrase_int_source_text(
         text, phrases)[0]
     self.assertEqual(0, tagged[1])

コード例 #5

ファイルを表示

 def extract_phrases_with_coords(cls,
                                 sentence: str) -> List[Tuple[str, int]]:
     phrases = list(np_extractor.get_np(sentence))
     tagged_phrases = PhrasePositionFinder.find_phrase_int_source_text(
         sentence, phrases)
     return tagged_phrases