Python TokenAligner.project_spanの例

プログラミング言語: Python

名前空間/パッケージ名: jiant.utils.retokenize

クラス/型: TokenAligner

メソッド/関数: project_span

hotexamples.comのコード掲載数: 4

Python TokenAligner.project_span - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのjiant.utils.retokenize.TokenAligner.project_spanの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

TokenAligner(21)

project_token_idxs(14)

project_tokens(14)

project_span(4)

project_token_span(4)

project_token_to_char_span(2)

_project_span(1)

project_char_to_token_span(1)

コード例 #1

ファイルを表示

ファイル: test_token_alignment.py プロジェクト: pruksmhc/jiant-1

def test_project_invalid_span():
    src_tokens = ["Members", "of", "the", "House", "clapped", "their", "hands"]
    tgt_tokens = [
        "Members", "Ġof", "Ġthe", "ĠHouse", "Ġcl", "apped", "Ġtheir", "Ġhands"
    ]
    # reference: tgt_token_index = [[0], [1], [2], [3], [4, 5], [6], [7]]
    ta = TokenAligner(src_tokens, tgt_tokens)
    with pytest.raises(ValueError):
        ta.project_span(0, 0)

コード例 #2

ファイルを表示

ファイル: test_token_alignment.py プロジェクト: pruksmhc/jiant-1

def test_token_aligner_project_span_last_token_range_is_end_exclusive():
    source_tokens = ["abc", "def", "ghi", "jkl"]
    target_tokens = ["abc", "d", "ef", "ghi", "jkl"]
    ta = TokenAligner(source_tokens, target_tokens)
    m = ta.project_span(3, 4)
    m_expected = np.array([4, 5])
    assert (m == m_expected).all()

コード例 #3

ファイルを表示

ファイル: test_token_alignment.py プロジェクト: pruksmhc/jiant-1

def test_token_aligner_project_span():
    source_tokens = ["abc", "def", "ghi", "jkl"]
    target_tokens = ["abc", "d", "ef", "ghi", "jkl"]
    ta = TokenAligner(source_tokens, target_tokens)
    m = ta.project_span(1, 2)
    m_expected = np.array([1, 3])
    assert (m == m_expected).all()

コード例 #4

ファイルを表示

ファイル: test_token_alignment.py プロジェクト: pruksmhc/jiant-1

def test_project_span_covering_whole_sequence():
    src_tokens = ["Members", "of", "the", "House", "clapped", "their", "hands"]
    tgt_tokens = [
        "Members", "Ġof", "Ġthe", "ĠHouse", "Ġcl", "apped", "Ġtheir", "Ġhands"
    ]
    # reference: tgt_token_index = [[0], [1], [2], [3], [4, 5], [6], [7]]
    ta = TokenAligner(src_tokens, tgt_tokens)
    assert (0, 8) == ta.project_span(0, 7)