Python Filters.keep Examples

Programming Language: Python

Namespace/Package Name: filters

Class/Type: Filters

Method/Function: keep

Examples at hotexamples.com: 1

Python Filters.keep - 1 examples found. These are the top rated real world Python examples of filters.Filters.keep extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Filters(30)

load(3)

filter_gre_quant(2)

pupil_analysis(2)

fir(2)

filters(2)

filter_rank_usnews(2)

filter_rank_times(2)

filter_rank_overall(2)

filter_rank_forbes(2)

filter_overall_expenses(2)

filter_location_zip(2)

filter_location_state(2)

filter_location_region(2)

filter_location_city(2)

filter_gre_verbal(2)

filter_rank_cwur(2)

filter_gpa(2)

filter_fees_in_state(2)

filter_data(2)

smooth(2)

filter_books(2)

filter_boarding(2)

filter_admission_rate(2)

filter_fees_out_state(2)

core(2)

butter_lowpass(2)

threshold(2)

medianFilter(1)

negatif(1)

median_filter(1)

listUsers(1)

mean_filter(1)

verticalFilter(1)

ok(1)

linregress(1)

laplaceOfGaussianKernel(1)

noisyUser(1)

search(1)

prewittKernel(1)

update(1)

require_filters(1)

reset(1)

scharr(1)

setImage(1)

set_config(1)

transpose(1)

sobelKernel(1)

sobel(1)

keep(1)

Example #1

Show file

class WordExtractor(object):

    def __init__(self, output_file, get_word_freq = None):
        self.get_word_freq = get_word_freq
        self.new_words = wordb.open(output_file)
        self.filters = Filters()
        self.n_killed = 0
        self.n_added = 0

    def __call__(self, words):
        self.process_words(words, threshold=2560000)
        
    def process_files(files):
        """process file in batch
        """
        for fn in files:
            with codecs.open(fn, 'r', 'utf-8') as f:
                self.process_file(f)

    def process_file(self, input_file):
        """process segmented file
        """
        words = set()
        for line in input_file:
            words.add(set(line.split(u'/')))
        self.process_words(words)

    def process_words(self, words, threshold=30000):
        for word in words:
            if self.filters.keep(word) and \
               word not in self.new_words:
                if self.get_word_freq:
                    freq = self.get_word_freq(word)
                    if freq > threshold:
                        logging.info("%s\tadded into db" % word)
                        self.new_words[word] = freq
                else:
                    logging.info("%s\tadded into db" % word)
                    self.new_words[word] = 1
                self.n_added += 1
            else:
                self.n_killed +=1