Python upgrade_streamcorpus_v0_3_0の例

プログラミング言語: Python

名前空間/パッケージ名: streamcorpus_pipeline._upgrade_streamcorpus_v0_3_0

メソッド/関数: upgrade_streamcorpus_v0_3_0

hotexamples.comのコード掲載数: 4

Python upgrade_streamcorpus_v0_3_0 - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのstreamcorpus_pipeline._upgrade_streamcorpus_v0_3_0.upgrade_streamcorpus_v0_3_0の実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: test_upgrade_streamcorpus_v0_3_0.py プロジェクト: naimdjon/streamcorpus-pipeline

def test_upgrade_streamcorpus_v0_3_0(test_data_dir):
    up = upgrade_streamcorpus_v0_3_0(config={})
    count = 0

    for si in streamcorpus.Chunk(get_test_chunk_path(test_data_dir), message=streamcorpus.StreamItem_v0_2_0):
        count += 1
        si3 = up(si)
        assert si3.version == streamcorpus.Versions._NAMES_TO_VALUES["v0_3_0"]
        if count > 10:
            break

コード例 #2

ファイルを表示

def test_upgrade_streamcorpus_v0_3_0(test_data_dir):
    up = upgrade_streamcorpus_v0_3_0(config={})
    count = 0

    for si in streamcorpus.Chunk(get_test_chunk_path(test_data_dir),
                                 message=streamcorpus.StreamItem_v0_2_0):
        count += 1
        si3 = up(si)
        assert si3.version == streamcorpus.Versions._NAMES_TO_VALUES['v0_3_0']
        if count > 10:
            break

コード例 #3

ファイルを表示

def test_upgrade_streamcorpus_v0_3_0_check_mention_ids(test_data_dir):
    up = upgrade_streamcorpus_v0_3_0(config={})
    all_mention_ids = set()
    for si in streamcorpus.Chunk(os.path.join(
            test_data_dir,
            'test/MAINSTREAM_NEWS-15-9d6218f0aa7c9585cda12a10d642a8b3-41600ffca7703f7914102da5256233ce.sc.xz'
    ),
                                 message=streamcorpus.StreamItem_v0_2_0):
        si3 = up(si)
        assert si3.version == streamcorpus.Versions._NAMES_TO_VALUES['v0_3_0']
        mention_ids = set()
        for sentence in si3.body.sentences['lingpipe']:
            sentence_mention_ids = set()
            for token in sentence.tokens:
                if token.mention_id not in [None, -1]:
                    sentence_mention_ids.add(token.mention_id)

            assert mention_ids.intersection(sentence_mention_ids) == set()
            mention_ids.update(sentence_mention_ids)
            all_mention_ids.update(sentence_mention_ids)
    assert len(all_mention_ids) > 0

コード例 #4

ファイルを表示

ファイル: test_upgrade_streamcorpus_v0_3_0.py プロジェクト: naimdjon/streamcorpus-pipeline

def test_upgrade_streamcorpus_v0_3_0_check_mention_ids(test_data_dir):
    up = upgrade_streamcorpus_v0_3_0(config={})
    all_mention_ids = set()
    for si in streamcorpus.Chunk(
        os.path.join(
            test_data_dir,
            "test/MAINSTREAM_NEWS-15-9d6218f0aa7c9585cda12a10d642a8b3-41600ffca7703f7914102da5256233ce.sc.xz",
        ),
        message=streamcorpus.StreamItem_v0_2_0,
    ):
        si3 = up(si)
        assert si3.version == streamcorpus.Versions._NAMES_TO_VALUES["v0_3_0"]
        mention_ids = set()
        for sentence in si3.body.sentences["lingpipe"]:
            sentence_mention_ids = set()
            for token in sentence.tokens:
                if token.mention_id not in [None, -1]:
                    sentence_mention_ids.add(token.mention_id)

            assert mention_ids.intersection(sentence_mention_ids) == set()
            mention_ids.update(sentence_mention_ids)
            all_mention_ids.update(sentence_mention_ids)
    assert len(all_mention_ids) > 0