Python Pattern_Parsing.retrieve_top_freq_noun_phrases_fr_file Beispiele

Programmiersprache: Python

Klasse / Typ: Pattern_Parsing

Methode / Funktion: retrieve_top_freq_noun_phrases_fr_file

Beispiele auf hotexamples.com: 2

Python Pattern_Parsing.retrieve_top_freq_noun_phrases_fr_file - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die Pattern_Parsing.retrieve_top_freq_noun_phrases_fr_file, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

get_plain_text_fr_website(1)

replace_special_char_as_newline(1)

retain_text_with_min_sentences_len(1)

retrieve_top_freq_noun_phrases_fr_file(1)

Beispiel #1

Datei anzeigen

Datei: Consolidated_Search_Results.py Projekt: nakamichikun/google_search_module_alt

    
    ww = WebCrawler(hh.merged_result_links_list)
    ww.set_limit_on_output_sentences(SENTENCE_LIMIT)
    ww.min_of_words_in_sentence = MIN_WORD_IN_SENTENCE #minimize this if want to see the frequency of words (but might need to increase the num of sentences)
    ww.parse_all_urls()

    RESULT_FILE = r'c:\data\results_file.txt'
    ## Dump results to text file
    with open(RESULT_FILE,'w') as f:
        for url, desc in zip(ww.list_of_urls, ww.parse_results_list):
            f.write('\n')
            f.write('#'*20)
            f.write('\n')
            f.write(url + '\n')
            f.write('\n')
            f.write(desc.encode(errors = 'ignore') + '\n' + '#'*18 + '\n')

    ## Enable freq note
    print 'Measure phrases Frequency'
    freq_save_filename =  r'C:\data\results_file_freq.txt'

    most_common_phrases_list, phrases_freq_list = Pattern_Parsing.retrieve_top_freq_noun_phrases_fr_file(RESULT_FILE, 5000, 100, freq_save_filename)

    for (phrase, freq) in phrases_freq_list:
        print phrase, '  ', freq

Beispiel #2

Datei anzeigen

    hh.consolidated_results()

    print 'End Search'
    print 'Start crawling individual results'

    ww = WebCrawler(hh.merged_result_links_list)
    ww.set_limit_on_output_sentences(SENTENCE_LIMIT)
    ww.min_of_words_in_sentence = MIN_WORD_IN_SENTENCE  #minimize this if want to see the frequency of words (but might need to increase the num of sentences)
    ww.parse_all_urls()

    RESULT_FILE = r'c:\data\results_file.txt'
    ## Dump results to text file
    with open(RESULT_FILE, 'w') as f:
        for url, desc in zip(ww.list_of_urls, ww.parse_results_list):
            f.write('\n')
            f.write('#' * 20)
            f.write('\n')
            f.write(url + '\n')
            f.write('\n')
            f.write(desc.encode(errors='ignore') + '\n' + '#' * 18 + '\n')

    ## Enable freq note
    print 'Measure phrases Frequency'
    freq_save_filename = r'C:\data\results_file_freq.txt'

    most_common_phrases_list, phrases_freq_list = Pattern_Parsing.retrieve_top_freq_noun_phrases_fr_file(
        RESULT_FILE, 5000, 100, freq_save_filename)

    for (phrase, freq) in phrases_freq_list:
        print phrase, '  ', freq