Python construct_unwanted_tags 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils

메소드/함수: construct_unwanted_tags

hotexamples.com에서의 예제들: 2

Python construct_unwanted_tags - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.construct_unwanted_tags에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: generateWordMap.py 프로젝트: fever324/NLP-Projects

def get_word_definition_overlap_count(a, b):
    unwantedTags = utils.construct_unwanted_tags()
    defs_a = wn.synsets(a)
    defs_b = wn.synsets(b)

    # Unigram overlap count
    unigramOverlapCount = 0
    bigramOverlapCount = 0
    aUnigramSet = set()
    bUnigramSet = set()
    aBigramSet = set()
    bBigramSet = set()
    # Construct a ngram sets
    for d in defs_a:
        aUnigramArray = utils.process_string(
            d.definition().lower(), unwantedTags).split()

        # Unigram
        add_list_to_set(aUnigramSet, aUnigramArray)
        # Bigram
        for i in range(len(aUnigramArray) - 1):
            aBigramSet.add(aUnigramArray[i] + aUnigramArray[i + 1])

    # Construct b ngram sets
    for d in defs_b:
        bUnigramArray = utils.process_string(
            d.definition().lower(), unwantedTags).split()
        # Unigram
        add_list_to_set(bUnigramSet, bUnigramArray)

        # Bigram
        for i in range(len(bUnigramArray) - 1):
            bBigramSet.add(bUnigramArray[i] + bUnigramArray[i + 1])

    for word in bUnigramSet:
        if(word in aUnigramSet):
            unigramOverlapCount += 1
    for word in bBigramSet:
        if word in aBigramSet:
            bigramOverlapCount += 1
    return unigramOverlapCount * alpha + bigramOverlapCount * (1 - alpha)

예제 #2

파일 보기

파일: preprossing.py 프로젝트: fever324/NLP-Projects

import xml.etree.ElementTree as ET
import utils

unwantedTags = utils.construct_unwanted_tags()


def main():
    tree = ET.parse('test-data2.data')
    root = tree.getroot()
    contexts = root.findall("./lexelt/instance/context")

    for context in contexts:
        context.text = utils.process_string(context.text, unwantedTags)
        for head in context:
            head.tail = utils.process_string(head.tail, unwantedTags)
    tree.write('processed_test2.xml')


if __name__ == "__main__":
    main()