Exemplos de sortBySimilar em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: calculate.similarCal

Método / Função: sortBySimilar

Exemplos em hotexamples.com: 2

sortBySimilar em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de calculate.similarCal.sortBySimilar em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Exemplo n.º 1

0

Exibir arquivo

Arquivo: mainprocess.py Projeto: MemoryAndDream/searchForAll

def keywordSearch(keyword, page='1', type='0', sites=[], sitesType=''): TYPES = { '0': 'searchEngine', '1': 'movie', '2': 'music', '3': 'novel', '4': 'news', '5': 'code' } keywordbf = keyword keyword = urllib.quote(keyword.encode('utf8')) #输入的是str print keyword type = str(type) page = int(page) websitelist={ #这里应该放的是代码网站url，配置网站另外弄代码网站自动检索，要做到更新只需要新增文件即可！ 1:{'baidu':[keyword,page]}, 2:{'bing':[keyword,page]}, 3:{'taobao':[keyword,page]}, 4:{'jd':[keyword,page]}, 5:{'amazon':[keyword,page]}, 6:{'google':[keyword,page]}, 7:{'githubReposity':[keyword,page] },#github 8:{'tmall':'https://list.tmall.com/search_product.htm?q=%s&s=%s'%(keyword,page*60)},#天猫 9:{'suning':'https://search.suning.com/%s/&iy=0&cp=%s'%(keyword,page-1)}, #苏宁 10:{'dangdang':[keyword,page]}, 11:{'gome':[keyword,page]}, #资源搜索 #12:{'mj0351':[keyword,page]}, 13:{'zimuzu':[keyword,page]}, 15:{'591mov':'https://591mov.com/zh-hans/search/soe/?c=&s=create_time&p=%s'%{keyword,page}}, 16:{'56wangpan':'http://www.56wangpan.com/search/kw%spg%s'%(keyword,page)}, 18:{'torrentz2':[keyword,page]}, 19:{'panduoduo':[keyword,page]}, 20:{'atugu':'http://www.atugu.com/infos/%s/%s'%(keyword,page-1)}, 21:{'searchcode':[keyword,page]}, #22:{'daimugua':[keyword,page]}#这个需要json处理 23:{'pansousou':[keyword,page]}, 24:{'sosuopan': [keyword, page]}, 25:{'57fx':[keyword, page]}, 26: {'slimego': [keyword, page]}, 27: {'baiduyunpan': [keyword, page]}, 28: {'wiseso':[keyword, page]}, 29: {'523525': [keyword, page]}, } websiteType = { "searchEngine": [1, 2, 6], "shopping": [3, 4, 5, 8, 9, 10, 11], "Scholar": [], "travel": [], #http://scholar.chongbuluo.com/ "downloads": [12, 13, 14, 15, 16, 17, 18, 19, 20], "dataAnalyse": [], #http://data.chongbuluo.com/ "onlineMovies": [], "music": [], "novel": [], "news": [], "blog_it": [], "code": [7, 21] } if type == '0' or type == 'null': SITES = dict(websitelist[1].items() + websitelist[2].items()) # 域名和模块对应关系 elif type == '1': SITES = dict(websitelist[3].items() + websitelist[4].items() + websitelist[5].items()) elif type == '2': SITES = dict(websitelist[6].items()) elif type == '5': SITES = dict(websitelist[7].items()) else: SITES = dict(websitelist[1].items()) if sites: #sites列表优先级更高 SITES = {} for site in sites: try: SITES = dict(SITES.items() + websitelist[int(site)].items()) except: pass print SITES response = [] suggestInfos = [] class MyThread(threading.Thread): def __init__(self, func, args=()): super(MyThread, self).__init__() self.func = func self.args = args def run(self): self.result = self.func(*self.args) def get_result(self): try: return self.result # 如果子线程不使用join方法，此处可能会报没有self.result的错误 except Exception: return None li = [] for k, v in SITES.items(): try: mo = importlib.import_module('.'.join( ['searchForAll', 'crawler', 'extractors', k])) #这个地方需要并发 except: mo = importlib.import_module('.'.join( ['searchForAll', 'crawler', 'extractors', 'universal'])) v.append(k) # response+=(mo.process(v)) t = MyThread(mo.process, args=v) print k, v li.append(t) t.start() for t in li: t.join() # 一定要join，不然主线程比子线程跑的快，会拿不到结果 #print t.get_result() rs = t.get_result() if rs: response += rs.get('urlinfos') #结果数组拼接 suggestInfos += rs.get('suggestInfos', []) # 到最后取个前6个之类 #print v #根据url去重 sortedResponse = {} for result in response: sortedResponse[result.get('url')] = result response = [] for k, v in sortedResponse.items(): #暂且根据长度排列？ response.append(v) #print response #response需要来个智能排序 rsAfterSort = None if type == '1' or sitesType == 'shoppingSites': #目前看来商品的结果比较合适用关键词排序 try: rsAfterSort = similarCal.sortBySimilar(response, 'title', firstkeyword=keywordbf) except Exception, e: print str(e)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: mainprocess.py Projeto: MemoryAndDream/searchForAll

#根据url去重 sortedResponse = {} for result in response: sortedResponse[result.get('url')] = result response = [] for k, v in sortedResponse.items(): #暂且根据长度排列？ response.append(v) #print response #response需要来个智能排序 rsAfterSort = None if type == '1' or sitesType == 'shoppingSites': #目前看来商品的结果比较合适用关键词排序 try: rsAfterSort = similarCal.sortBySimilar(response, 'title', firstkeyword=keywordbf) except Exception, e: print str(e) if sitesType == 'netDiskSites': try: rsAfterSort = similarCal.sortBySimilar(response, 'title', firstkeyword=keywordbf, repeat=False) except Exception, e: print str(e) if rsAfterSort: response = rsAfterSort return {"urlinfos": response, "suggestInfos": suggestInfos}