Python UrlTransDir示例

编程语言: Python

命名空间/包名称: parser.UrlTransID

类/类型: UrlTransDir

hotexamples.com的示例: 3

Python UrlTransDir - 已找到3个示例。这些是从开源项目中提取的最受好评的parser.UrlTransID.UrlTransDir现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

UrlTransDir(3)

renameDoc(3)

示例#1

显示文件

    def url_trans_dir(self,p1,p2,p3):
        '''
        重新命名
        '''
        urlTransDir = UrlTransDir(p1)

        urlTransDir.renameDoc(p2)

        urlTransDir.renameDoc(p3)

示例#2

显示文件

# -*- coding: utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

from parser.UrlTransID import UrlTransDir

urlTransDir = UrlTransDir('store/sorted_url.txt')

urlTransDir.renameDoc('store/document')

示例#3

显示文件

    def run(self,site_id):
        '''
        运行主程序
        '''
        p = path(site_id)
        #初始化目录
        #清空wordsplit
        p.clean_dir(p.g_wordsplit())
        #清空hits
        p.clean_dir(p.g_hits())
        #初始化数据库
        p.cp_chun()

        ###################################################################
        #   解析  parser
        #
        ###################################################################
        parser = Parser(site_id)
        
        ###################################################################
        #   url处理 url_sort
        #
        ###################################################################
        url_trans = UrlTransID(p.g_urltest())
        #将url进行排序
        url_trans.sort()
        #存储为　sorted_url.txt
        url_trans.save(p.g_sorted_url())

        ###################################################################
        #   parser 进行分词
        #
        ###################################################################
        parser.splitWord()
        
        ###################################################################
        #  根据　docID 修改文件名
        #
        ###################################################################
        url_trans_dir = UrlTransDir(p.g_sorted_url())
        #对document进行重命名
        url_trans_dir.renameDoc( p.g_document() )
        #对wrdsplit进行重命名
        url_trans_dir.renameDoc( p.g_wordsplit() )
        
        ###################################################################
        #   parser 产生词库　wordbar
        #
        ###################################################################
        parser.transWbar()
        
        ###################################################################
        #   title_处理
        #
        ###################################################################
        title_des_sqlite = Title_des_sqlite(site_id)
        #对原始数据进行刷新
        title_des_sqlite.clear()
        title_des_sqlite.run()
        title_des_sqlite.add_url()
        title_des_sqlite.intro_split_des_title()
        title_des_sqlite.cx.commit()

        ###################################################################
        #   index 索引操作
        #
        ###################################################################
        index = Indexer(site_id)
        index.run()

        ###################################################################
        #   index 对hits进行排序
        #
        ###################################################################
        hit_sort = Sort_hits(p.g_hit_size())
        for i in range(20):
            hit_sort.sort_wid(p.g_hits()+'/',i)
            hit_sort.save(p.g_hits()+'/',i)