Python Corpus.collocates 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ccc

클래스/타입: Corpus

메소드/함수: collocates

hotexamples.com에서의 예제들: 2

Python Corpus.collocates - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ccc.Corpus.collocates에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

query(30)

Corpus(30)

dump_from_query(3)

query_s_att(3)

collocates(2)

concordance(2)

dump_from_s_att(2)

activate_subcorpus(1)

get_s_annotations(1)

get_s_extents(1)

keywords(1)

marginals(1)

show_nqr(1)

start_cqp(1)

subcorpus_from_ids(1)

예제 #1

파일 보기

파일: demo-ccc.py 프로젝트: dokempf/cwb-ccc

corpus = Corpus(corpus_name="SZ_2009_14")

query = r'@0[lemma="Angela"]? @1[lemma="Merkel"] [word="\("] @2[lemma="CDU"] [word="\)"]'
result = corpus.query(query)
concordance = corpus.concordance(result)

print(concordance.breakdown)
print(concordance.size)
print(concordance.lines([567792]))

corpus = Corpus(corpus_name="SZ_2009_14")

query = '[lemma="Angela"]? [lemma="Merkel"] [word="\\("] [lemma="CDU"] [word="\\)"]'
result = corpus.query(query, s_meta=['text_id'])
collocates = corpus.collocates(result)

print(collocates.show(window=5, order="log_likelihood").head())


@pytest.mark.readme_keywords
def test_keywords_sz():
    meta = read_csv(
        "/home/ausgerechnet/corpora/cwb/upload/efe/sz-2009-14.tsv.gz",
        sep="\t",
        index_col=0,
        dtype=str)
    ids = set(meta.loc[(meta['ressort'] == "Panorama")
                       & (meta['month'] == '201103')].index.values)
    meta['s_id'] = meta.index

예제 #2

파일 보기

from ccc import Corpus

corpus = Corpus("BREXIT_V20190522_DEDUP")
matches = corpus.query('[lemma="Merkel"%cd]', context=20, s_context='tweet')
collocates = corpus.collocates(matches, p_query="lemma")
df = collocates.show(order='log_likelihood')
df.to_csv("BREXIT_merkel-ll.tsv", sep="\t")