Python Parse.findword_sym Beispiele

Programmiersprache: Python

Namespace / Paketname: parse

Klasse / Typ: Parse

Methode / Funktion: findword_sym

Beispiele auf hotexamples.com: 1

Python Parse.findword_sym - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die parse.Parse.findword_sym, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Parse(30)

fixed(23)

setEc(10)

evaluate(9)

parse(9)

printStaff(8)

addVariable(7)

parsePage(4)

json(4)

crime(3)

get_specific_crime(3)

dynamic(3)

array(3)

grep(3)

key_values(3)

location(3)

parse_main_page_get_total_pagenum(2)

getRiemannIntegrals(2)

getDifferenceQuotion(2)

model(2)

parseCorpus(2)

hasMoreCommands(2)

main(2)

progress(2)

advance(2)

cmdType(2)

addVarFromList(2)

arg2(2)

arg1(2)

set_timespan(1)

parseData(1)

next(1)

nl_command(1)

parseToJSON(1)

ner(1)

moves(1)

shutdown(1)

modifyNote(1)

start(1)

set_file_path(1)

parse_content(1)

parse_Img(1)

parse_school(1)

prepare(1)

parser(1)

parse_title(1)

regex(1)

regexes(1)

request(1)

parse_request(1)

Beispiel #1

Datei anzeigen

class Information_Retrieval:
    def __init__(self, article, saveTags=False):
        self.article_name = article
        self.raw_text = open(article, 'r').read().replace("\xc2\xa0", " ")
        self.article = Parse(self.raw_text)
        self.default_person = None
        self.default_location = None
        self.tags = None
        if saveTags:
            self.tags = (Sentence(self.raw_text, 0).get_ner_tags())
            self.default_person = self.get_default_pronoun(
                self.tags, ['PERSON'])
            self.default_location = self.get_default_pronoun(
                self.tags, ['LOCATION'])

    def get_default_pronoun(self, tags, answer_tag):
        counts = defaultdict(int)
        for (word, tag) in tags:
            if tag in answer_tag:
                counts[word] += 1
        max = ''
        max_count = 0
        for key in counts:
            count = counts[key]
            if count > max_count:
                max = key
                max_count = count
        return max

    def ranked_list(self, question):
        relevant_sentences = dict()

        for (word, tag) in question.get_pos_tags():
            if 'DT' not in tag and '.' not in tag:
                sents = self.article.findword(word)
                weight = len(sents)
                #print word
                for sent in sents:
                    if sent not in relevant_sentences:
                        relevant_sentences[sent] = 1.0 / weight
                    else:
                        relevant_sentences[sent] += 1.0 / weight

        syn_sentences = dict()
        for (word, tag) in question.get_pos_tags():
            if 'DT' not in tag and '.' not in tag:
                sents = self.article.findword_sym(word)
                weight = len(sents)
                #print word
                for sent in sents:
                    if sent not in syn_sentences:
                        syn_sentences[sent] = 1.0 / weight
                    else:
                        syn_sentences[sent] += 1.0 / weight

        #print relevant_sentences
        (best_sen_reg, max1) = self.find_best_sentences(relevant_sentences)
        (best_sen_syn, max2) = self.find_best_sentences(syn_sentences)

        if max1 > max2:
            return best_sen_reg
        else:
            return best_sen_syn

    def find_best_sentences(self, relevant_sentences):
        best_indices = sorted(relevant_sentences.keys(),
                              key=lambda x: relevant_sentences[x],
                              reverse=True)
        max = 0
        top = []
        for ind in best_indices:
            count = relevant_sentences[ind]
            if count > max:
                top = [ind]
                max = count
            elif count == max:
                top.append(ind)

        best_sentences = [
            Sentence(self.article.sentences[x], 0).raw_text for x in top
        ]
        return (sorted(best_sentences, key=lambda x: len(x)), max)