Esempi in Python per DealUrl

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: utils.dealUrl

Classe/tipologia: DealUrl

Esempi su hotexamples.com: 3

DealUrl in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per utils.dealUrl.DealUrl, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DealUrl(2)

dealUrl(2)

Esempio n. 1

Mostra file

    def saveresult(self):
        '''
        :对获取到的网站连接处理并将结果保存到文件
        '''
        if ggv.pterminate:return None
        self.window.gauge.Hide()
        self.window.SetStatusText(u'3/4暂存网站广度遍历结果！',1)
        du = DealUrl()
        ofile = open(self.outfile,'w+')
        urls = []
        while True:                                         #搜索引擎返回的结果，使之保存到列表中
            if self.outqueue.empty():break
            url = self.outqueue.get()
            if url not in self.webknown:                    #排除已经存在的网站
                logging.info('url:%s'%url)
                urls.append(url)
#             self.queue.task_done()
#         print 'urls:',urls
        urls = set(urls)
        if ggv.pterminate:return None
        urldict = du.dealUrl(urls)                          #分别返回链接的域名、子域名、子目录、二级目录、收集到的网页数量
        self.window.SetStatusText(u'共有%d个网站'%len(urls),2)
        for domain in urldict:
            urlitem = domain + '\t' + '\t'.join(urldict[domain][:-1]) + '\t' + str(urldict[domain][-1])
            ofile.write(urlitem + '\r\n')
        ofile.close()
        self.window.SetStatusText(u'3/4保存结果完毕！',1)

Esempio n. 2

Mostra file

File: engineResultThread.py Progetto: hyphenliu/cnminlangwebcollect

    def saveResult(self):
        '''
        :保存搜索返回结果的后处理结果
        :功能：处理返回的链接依次剥离域名、子域名、二级目录，将处理结果保存到文档
        '''
        if ggv.pterminate:return None
        self.window.SetStatusText(u'1/4暂存搜索引擎结果！',1)
        du = DealUrl()
        ofile = open(self.TEMPFILE,'w+')
        urls = []
        while True:                                         #搜索引擎返回的结果，使之保存到列表中
            if self.inqueue.empty():break
            urls.append(self.inqueue.get())
#             self.queue.task_done()
        urls = set(urls)
        urldict = du.dealUrl(urls)                          #分别返回链接的域名、子域名、子目录、二级目录、收集到的网页数量
        self.window.SetStatusText(u'共有%d个网站'%len(urls),2)
        for domain in urldict:
            urlitem = domain + '\t' + '\t'.join(urldict[domain][:-1]) + '\t' + str(urldict[domain][-1])
            ofile.write(urlitem + '\r\n')
        ofile.close()
        self.window.SetStatusText(u'1/4保存结果完毕！',1)

Esempio n. 3

Mostra file

File: engineResultThread.py Progetto: yourmansoham/cnminlangwebcollect

    def saveResult(self):
        '''
        :保存搜索返回结果的后处理结果
        :功能：处理返回的链接依次剥离域名、子域名、二级目录，将处理结果保存到文档
        '''
        if ggv.pterminate: return None
        self.window.SetStatusText(u'1/4暂存搜索引擎结果！', 1)
        du = DealUrl()
        ofile = open(self.TEMPFILE, 'w+')
        urls = []
        while True:  #搜索引擎返回的结果，使之保存到列表中
            if self.inqueue.empty(): break
            urls.append(self.inqueue.get())
#             self.queue.task_done()
        urls = set(urls)
        urldict = du.dealUrl(urls)  #分别返回链接的域名、子域名、子目录、二级目录、收集到的网页数量
        self.window.SetStatusText(u'共有%d个网站' % len(urls), 2)
        for domain in urldict:
            urlitem = domain + '\t' + '\t'.join(
                urldict[domain][:-1]) + '\t' + str(urldict[domain][-1])
            ofile.write(urlitem + '\r\n')
        ofile.close()
        self.window.SetStatusText(u'1/4保存结果完毕！', 1)