Python NLP.filter_features 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nlp

클래스/타입: NLP

메소드/함수: filter_features

hotexamples.com에서의 예제들: 3

Python NLP.filter_features - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nlp.NLP.filter_features에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NLP(3)

filter_features(3)

analyze_entities(3)

removeDuplicates(1)

get_lines(1)

lemmatize(1)

namedEntityRecognition(1)

negationCheck(1)

reconstruct(1)

relationSearch(1)

replaceAttr(1)

removePunctAndStop(1)

get_entities_list(1)

replaceContractions(1)

replaceOperators(1)

replaceRelations(1)

replaceSynAttr(1)

replaceSynCommon(1)

tag(1)

tokenize(1)

get_entity_types(1)

getMorphology(1)

get_dependencies(1)

clean_string(1)

add_msg_gzh(1)

analyze(1)

analyze_sentiment(1)

andOr(1)

array_merge(1)

check(1)

checkSatz(1)

cleaningSelectList(1)

add_msg(1)

clearCheckWord(1)

detect_language(1)

divide_train_test(1)

docDetails(1)

encode(1)

extract_keywords(1)

getKeywords(1)

unknownAttr(1)

예제 #1

파일 보기

    def get_dict(features, labels, percentage_words=0.1, iterations=50):
        real_features = features.copy()

        words_label = USES_MULTI.words_label(features, labels)

        number_words = len(words_label)
        number_selected_words = int(round(number_words * percentage_words))

        distinct_labels = list(set(labels))
        number_selected_words_label = int(number_selected_words /
                                          len(distinct_labels))

        features_score = USES_MULTI.feature_score(words_label, labels)

        candidates = {}

        for label in features_score:
            positive_candidates = features_score[
                label][:number_selected_words_label]
            candidates.update(positive_candidates)
            negative_candidates = features_score[label][
                -number_selected_words_label:]
            candidates.update(negative_candidates)

        results = {}
        actual_iteration = 0

        while (actual_iteration < iterations):
            actual_candidates = USES_MULTI.random_items(
                candidates, number_selected_words)
            filtered_features = NLP.filter_features(features,
                                                    actual_candidates)
            try:
                #pprint(actual_iteration)
                FMeasure = USES_MULTI.classifier(filtered_features, labels)
                #pprint(FMeasure)
            except Exception as e:
                #pprint(e)
                FMeasure = 0

            results.update({FMeasure: actual_candidates})

            actual_iteration = actual_iteration + 1

        results = sorted(results.items(), key=lambda x: x[0], reverse=True)

        best_FM = results[0][0]
        dict_words = results[0][1]

        #print('Best: ', best_FM)

        return dict_words

예제 #2

파일 보기

파일: alter_uses.py 프로젝트: andrebandeira/nlp-severity

    def get_dict(features, labels, max_words=5):
        real_features = features.copy()
        real_labels = labels.copy()

        words_label = USES_MULTI.words_label(features, labels)
        number_words = len(words_label)

        if (number_words < max_words):
            max_words = number_words

        features_score = ALTER_USES.feature_score(words_label, labels)

        results = {}
        number_words = 1

        while (number_words <= max_words):
            dict_words = ALTER_USES.build_dict(features, labels,
                                               features_score, number_words)

            filtered_features = NLP.filter_features(features, dict_words)

            try:
                #pprint(number_words)
                FMeasure = USES_MULTI.classifier(filtered_features, labels)
                #pprint(FMeasure)
            except Exception as e:
                #pprint(e)
                FMeasure = 0

            results.update({FMeasure: dict_words})

            number_words = number_words + 1

        results = sorted(results.items(), key=lambda x: x[0], reverse=True)

        best_FM = results[0][0]
        dict_words = results[0][1]

        #print('Best FM: ', best_FM)

        return dict_words

예제 #3

파일 보기

defect = ' '.join(lines)

defect = defect.lower().strip().replace("\n", "")

features = NLP.tokenizer([defect])

features = NLP.remove_numbers(features)
features = NLP.remove_small_words(features)
features = NLP.remove_stop_words(features, 'portuguese')
features = NLP.lemmatizer(features, 'portuguese')
features = NLP.remove_punctuation(features)

dict_words = load('files/dict.joblib')
dict_words = dict_words[0]

features = NLP.filter_features(features, dict_words)

features = NLP.text_to_numeric(features, [dict_words])

model = load('files/model.joblib')

labels = model.predict(features)

if (labels[0] == '1'):
    print('High Severity')
else:
    print('Low Severity')

fim = time.time()
#print ("Tempo decorrido: ", fim-ini)