Python CoNLLReader.read_conll_u_8cols 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: lib.conll

클래스/타입: CoNLLReader

메소드/함수: read_conll_u_8cols

hotexamples.com에서의 예제들: 2

Python CoNLLReader.read_conll_u_8cols - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 lib.conll.CoNLLReader.read_conll_u_8cols에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

CoNLLReader(10)

read_conll_u(8)

write_conll(5)

read_conll_2006_dense(3)

read_conll_2006(2)

read_conll_u_8cols(2)

read_conll(1)

예제 #1

파일 보기

파일: projecmetrics.py 프로젝트: hectormartinez/eval_multisource

def main():
    parser = argparse.ArgumentParser(description="""Convert conllu to conll format""")
    parser.add_argument('--infile', help="conllu file")
    parser.add_argument('--lang', help="")

    args = parser.parse_args()

    #try:

    header = ["proj_pred", "proj_gold", "leaf_viol_pred", "leaf_viol_gold", "posAcc", "UAS"]

    if True:
        vals = []
        rdr = CoNLLReader()
        predicted_sentences = []
        gold_sentences = []

        if args.infile:
            gold_sentences = rdr.read_conll_u_8cols(args.infile)


        numwords = sum([len(s.nodes()[1:]) for s in predicted_sentences])
        #print([int(s.is_fully_projective()) for s in predicted_sentences])

        for idx,s in enumerate(gold_sentences):
            print(idx,s.is_fully_projective())

예제 #2

파일 보기

파일: treebank_stats.py 프로젝트: hectormartinez/eval_multisource

def main():
    parser = argparse.ArgumentParser(
        description="""Convert conllu to conll format""")
    parser.add_argument('--predicted', help="conllu file")
    parser.add_argument('--gold', help="conllu file")
    parser.add_argument('--lang', help="")

    args = parser.parse_args()

    #try:

    header = [
        "proj_pred", "proj_gold", "leaf_viol_pred", "leaf_viol_gold", "posAcc",
        "UAS"
    ]

    if True:
        vals = []
        rdr = CoNLLReader()
        predicted_sentences = []
        gold_sentences = []

        if args.predicted:
            predicted_sentences = rdr.read_conll_u_8cols(args.predicted)

        if args.gold:
            gold_sentences = rdr.read_conll_u(args.gold)

        numwords = sum([len(s.nodes()[1:]) for s in predicted_sentences])
        #print([int(s.is_fully_projective()) for s in predicted_sentences])
        proj_pred = sum(
            [int(s.is_fully_projective()) for s in predicted_sentences])
        proj_gold = sum([int(s.is_fully_projective()) for s in gold_sentences])
        punct_non__proj_pred = sum(
            [int(s.punct_proj_violations()) for s in predicted_sentences])
        punct_non__proj_gold = sum(
            [int(s.punct_proj_violations()) for s in gold_sentences])

        leaf_violations_pred = sum(
            [s.leaf_violations()[0] for s in predicted_sentences])
        leaf_violations_gold = sum(
            [s.leaf_violations()[0] for s in gold_sentences])
        wrongPOSgoodHeadscore = wrongPOSgoodHead(predicted_sentences,
                                                 gold_sentences)
        posAcc_accum = sum([
            POSAcc(p, g) for p, g in zip(predicted_sentences, gold_sentences)
        ]) / numwords
        UAS_accum = sum(
            [UAS(p, g)
             for p, g in zip(predicted_sentences, gold_sentences)]) / numwords
        prelength = edgelengths(predicted_sentences)
        goldlength = edgelengths(gold_sentences)
        avgprelength = np.std(prelength)
        avggoldlength = np.std(goldlength)

        vals.append(wrongPOSgoodHeadscore)
        vals.append(avgprelength)
        vals.append(avggoldlength)
        vals.append(proj_pred / len(predicted_sentences))
        vals.append(proj_pred / len(predicted_sentences))
        vals.append(proj_gold / len(gold_sentences))
        vals.append(punct_non__proj_pred / numwords)
        vals.append(punct_non__proj_gold / numwords)
        vals.append(leaf_violations_pred / numwords)
        vals.append(leaf_violations_gold / numwords)
        vals.append(KLdivFromMACRO_POS_from_Training(predicted_sentences))
        vals.append(KLdivFromMACRO_POS_from_Training(gold_sentences))
        vals.append(posAcc_accum)
        vals.append(UAS_accum)
        lineout = " ".join([args.lang] + ["{0:.2f}".format(x) for x in vals])
    #except:
    #    lineout = "_\t_"
    print(lineout)