Python Corpus.dump_from_queryの例

プログラミング言語: Python

名前空間/パッケージ名: ccc.cwb

クラス/型: Corpus

メソッド/関数: dump_from_query

hotexamples.comのコード掲載数: 3

Python Corpus.dump_from_query - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのccc.cwb.Corpus.dump_from_queryの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Corpus(27)

query(10)

start_cqp(9)

dump_from_query(3)

dump_from_s_att(2)

marginals(2)

コード例 #1

ファイルを表示

ファイル: test_06_counts.py プロジェクト: bingokorean/cwb-ccc

def test_counts_dump_2(germaparl):
    strategy = 2

    corpus = Corpus(germaparl['corpus_name'],
                    registry_path=germaparl['registry_path'])
    dump = corpus.dump_from_query('[lemma="Helmut"%cd] [lemma="Kohl"%cd]')

    df = corpus.counts.dump(dump,
                            p_atts=['word'],
                            split=True,
                            strategy=strategy)
    assert (df["freq"]["Helmut"] == 6)

    df = corpus.counts.dump(dump,
                            p_atts=['word', 'pos'],
                            split=True,
                            strategy=strategy)
    assert (df["freq"][("Helmut", "NE")] == 6)

    df = corpus.counts.dump(dump,
                            p_atts=['word'],
                            split=False,
                            strategy=strategy)
    assert ("Helmut Kohl" in df.index)
    assert (df["freq"].iloc[0] == 6)

    df = corpus.counts.dump(dump,
                            p_atts=['word', 'pos'],
                            split=False,
                            strategy=strategy)
    assert (("Helmut Kohl", "NE NE") in df.index)
    assert (df["freq"].iloc[0] == 6)

コード例 #2

ファイルを表示

ファイル: test_06_counts.py プロジェクト: bingokorean/cwb-ccc

def test_counts_dump_1_split(germaparl):
    strategy = 1

    corpus = Corpus(germaparl['corpus_name'],
                    registry_path=germaparl['registry_path'])
    dump = corpus.dump_from_query('[lemma="die" %cd] [pos="N.*"]')

    df = corpus.counts.dump(dump,
                            p_atts=['word'],
                            split=True,
                            strategy=strategy)
    assert (int(df["freq"]["der"]) == 3775)

    df = corpus.counts.dump(dump,
                            p_atts=['word', 'lemma'],
                            split=True,
                            strategy=strategy)
    assert (int(df["freq"][("der", "die")]) == 3775)

コード例 #3

ファイルを表示

ファイル: test_06_counts.py プロジェクト: bingokorean/cwb-ccc

def test_counts_dump_1_no_split(germaparl):
    strategy = 1

    corpus = Corpus(germaparl['corpus_name'],
                    registry_path=germaparl['registry_path'])
    dump = corpus.dump_from_query('[lemma="Helmut"%cd] [lemma="Kohl"%cd]')

    # no split
    df = corpus.counts.dump(dump,
                            p_atts=['word'],
                            split=False,
                            strategy=strategy)
    assert ("Helmut Kohl" in df.index)

    df = corpus.counts.dump(dump,
                            p_atts=['word', 'pos'],
                            split=False,
                            strategy=strategy)
    assert (("Helmut Kohl", "NE NE") in df.index)