Python Levenshtein_search.populate_wordset示例

编程语言: Python

方法/功能: populate_wordset

hotexamples.com的示例: 10

Python Levenshtein_search.populate_wordset - 已找到10个示例。这些是从开源项目中提取的最受好评的Levenshtein_search.populate_wordset现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

populate_wordset(8)

lookup(6)

clear_wordset(4)

remove_string(2)

add_string(1)

示例#1

显示文件

    def __init__(self):
        self.index_key = Levenshtein_search.populate_wordset(-1, [])

        try : # py 2
            self._doc_to_id = collections.defaultdict(itertools.count(1).next)
        except AttributeError : # py 3
            self._doc_to_id = collections.defaultdict(itertools.count(1).__next__)

        self.docs = []

示例#2

显示文件

 def test_remove_doc(self):
     index = Levenshtein_search.populate_wordset(-1, self.excerpt1)
     Levenshtein_search.remove_string(index, 'overcoat')
     results = Levenshtein_search.lookup(index, 'overcoat', 6)
     assert results == [['went', 6, 0.024390243902439025],
                        ['cold', 6, 0.024390243902439025],
                        ['Versh', 6, 0.04878048780487805],
                        ['overshoes', 4, 0.04878048780487805],
                        ['not', 6, 0.024390243902439025]]

示例#3

显示文件

    def test_query_overcoat(self):
        index = Levenshtein_search.populate_wordset(-1, self.excerpt1)
        results = Levenshtein_search.lookup(index, 'overcoat', 6)
        assert results == [['overcoat', 0, 0.023809523809523808],
                           ['went', 6, 0.023809523809523808],
                           ['cold', 6, 0.023809523809523808],
                           ['Versh', 6, 0.047619047619047616],
                           ['overshoes', 4, 0.047619047619047616],
                           ['not', 6, 0.023809523809523808]]

        
        index = Levenshtein_search.populate_wordset(-1, self.excerpt2)
        results = Levenshtein_search.lookup(index, 'overcoat', 6)
        assert results == [['Versh', 6, 0.044444444444444446],
                           ['overshoes', 4, 0.022222222222222223],
                           ['coat', 4, 0.022222222222222223],
                           ['out', 6, 0.044444444444444446],
                           ['here', 6, 0.022222222222222223]]

示例#4

显示文件

文件： levenshtein.py 项目： vuchau/dedupe

    def __init__(self):
        self.index_key = Levenshtein_search.populate_wordset(-1, [])

        try:  # py 2
            self._doc_to_id = collections.defaultdict(itertools.count(1).next)
        except AttributeError:  # py 3
            self._doc_to_id = collections.defaultdict(
                itertools.count(1).__next__)

        self.docs = []

示例#5

显示文件

 def test_index_increment(self):
     first = Levenshtein_search.populate_wordset(-1, self.excerpt1)
     second = Levenshtein_search.populate_wordset(-1, self.excerpt2)
     print(first, second)
     
     assert first != second

示例#6

显示文件

 def test_clear(self):
     index = Levenshtein_search.populate_wordset(-1, self.excerpt1)
     Levenshtein_search.clear_wordset(index)

示例#7

显示文件

文件： levenshtein.py 项目： jamal2300/dedupe-1

 def __init__(self):
     self.index_key = Levenshtein_search.populate_wordset(-1, [])
     self._doc_to_id = Enumerator(start=1)

示例#8

显示文件

文件： levenshtein.py 项目： datamade/dedupe

 def __init__(self):
     self.index_key = Levenshtein_search.populate_wordset(-1, [])
     self._doc_to_id = Enumerator(start=1)

示例#9

显示文件

 def unindex(self, doc):
     del self._doc_to_id[doc]
     Levenshtein_search.clear_wordset(self.index_key)
     self.index_key = Levenshtein_search.populate_wordset(
         -1, list(self._doc_to_id))

示例#10

显示文件

文件： test1.py 项目： fagan2888/Benchmark-of-Levenshtein_search

import Levenshtein_search

conn = psycopg2.connect("host='127.0.0.1' port='5432' dbname='benchmark' user='******' password=''")
cur = conn.cursor()
cur.execute("set schema 'public';")
query_word = "\"philippe the original\""
max_dist = 2
sqlquery = "select name from restaurant_nophone_training where levenshtein_less_equal(name, '" + query_word + "', " + str(max_dist) + ") <= " + str(max_dist) + ";"
print(sqlquery)
starttime = time.clock()
cur.execute(sqlquery)
results = cur.fetchall()
print(str(time.clock() - starttime) + " sec")
print(results)
print(" ")

print("Levenshtein_search algorithm:")
cur.execute("select name from restaurant_nophone_training")
names = cur.fetchall()
namelist = []
for name in names:
    namelist.append(name[0])
	
idx = Levenshtein_search.populate_wordset(-1,namelist)
starttime = time.clock()
results = Levenshtein_search.lookup(idx,query_word,max_dist)
print(str(time.clock() - starttime) + " sec")
print(results)

Levenshtein_search.clear_wordset(idx)
conn.close()