Esempi in Python per BloomFilter.add_value

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: bloomfilter

Classe/tipologia: BloomFilter

Metodo/funzione: add_value

Esempi su hotexamples.com: 1

BloomFilter.add_value in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per bloomfilter.BloomFilter.add_value, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

BloomFilter(30)

add(30)

add_by_hash(16)

_filter_array_for_storing(3)

lookup(3)

add_key(2)

_add(2)

container_size(1)

toJSON(1)

isContain(1)

fromJSON(1)

add_value(1)

bic_occurrence(1)

adding_item_bf(1)

add_data(1)

_filter_array_from_storing(1)

_check(1)

update(1)

Esempio n. 1

Mostra file

class SearchEngine:
    def __init__(self):
        self.filter = BloomFilter(10000)
        self.terms = defaultdict(set)
        self.urls = []
        self.generate_engine()

    def generate_engine(self):
        names = ['url', 'title']
        df = pd.read_csv('no_intermediary_data.csv', sep=',', encoding='utf-8', header=None, names=names)
        for i in range(1, len(df)):
            urlid = len(self.urls)
            self.urls.append(df.iloc[i]['url'])
            for term in jieba.cut_for_search(df.iloc[i]['title']):
                self.filter.add_value(term)
                self.terms[term].add(urlid)

    def search(self, term):
        if not self.filter.might_contain(term):
            return
        if term not in self.terms:
            return
        for uid in sorted(self.terms[term]):
            yield self.urls[uid]

    def search_all(self, terms=[]):
        result = set(range(len(self.urls)))
        for term in terms:
            if not self.filter.might_contain(term) or term not in self.terms:
                return
            result = result.intersection(self.terms[term])
        for uid in sorted(result):
            yield self.urls[uid]

    def search_any(self, terms):
        result = set()
        for term in terms:
            if not self.filter.might_contain(term) or term not in self.terms:
                continue
            result = result.union(self.terms[term])
        for uid in sorted(result):
            yield self.urls[uid]