Ejemplo n.º 1
0
def main():
    db = OracleDB()

    # 查文章
    sql = '''
        select *
          from (select rownum r, id, title
                  from tab_iopm_article_info
                 where rownum >= 1)
         where r <= 100000
    '''
    articles = db.find(sql)

    # 查热点
    sql = 'select id, title from tab_iopm_hot_info'
    hots = db.find(sql)

    for article in articles:
        max_similar = {
            'similarity': 0,
            'hot_id': -1,
            'article_id': -1,
            'hot_title': ''
        }  # 最相似的文章 similarity表示相似度(0~1)
        article_id = article[1]
        article_text = article[2]

        for hot in hots:
            hot_id = hot[0]
            hot_text = hot[1]

            similarity = compare_text(hot_text, article_text)
            # print('''
            #     article_text %s
            #     hot_text     %s
            #     similarity   %s
            #     '''%(article_text, hot_text, similarity))
            if similarity > max_similar['similarity']:
                max_similar['similarity'] = similarity
                max_similar['hot_id'] = hot_id
                max_similar['article_id'] = article_id
                max_similar['hot_title'] = article_text if len(hot_text) > len(
                    article_text) else hot_text

        if max_similar['similarity'] > SIMILARITY:
            sql = 'update tab_iopm_article_info set hot_id = %s where id = %s' % (
                max_similar['hot_id'], max_similar['article_id'])
            db.update(sql)
            sql = "update tab_iopm_hot_info set hot = hot + 1, title = '%s' where id = %s" % (
                max_similar['hot_title'], max_similar['hot_id'])
            db.update(sql)

        else:
            sql = 'select sequence.nextval from dual'
            hot_id = db.find(sql)[0][0]
            sql = "insert into tab_iopm_hot_info (id, title, hot) values (%s, '%s', 1)" % (
                hot_id, article_text)
            db.add(sql)
            sql = 'update tab_iopm_article_info set hot_id = %s where id = %s' % (
                hot_id, article_id)
            db.update(sql)

        sql = 'select id, title from tab_iopm_hot_info'
        hots = db.find(sql)
Ejemplo n.º 2
0
import sys

sys.path.append('..')
import init

import utils.tools as tools
from utils.log import log
from db.oracledb import OracleDB
from base.wechat_public_platform import WechatPublicPlatform
from base.wechat_sogou import WechatSogou

if __name__ == '__main__':
    db = OracleDB()
    # wechat_public_platform =  WechatPublicPlatform()
    wechat_sogou = WechatSogou()
    # 取微信号
    # sql = 'select t.name, t.keyword2 from TAB_IOPM_CLUES t where t.zero_id = 7 and t.first_id = 137 and t.second_id = 183'
    # accounts = db.find(sql)
    accounts = ['骨朵网络影视']
    for account in accounts:
        account_id = ''
        account_name = account
        biz = wechat_sogou.get_biz(account_id=account_id, account=account_name)
        if biz:
            sql = "insert into TAB_IOPM_SITE t (t.id, t.name, t.position, t.classify, t.mointor_status, t.biz, t.priority) values (seq_iopm_site.nextval, '{name}', 1, 2, 701, '{biz}', 1)".format(
                name=account_name, biz=biz)
            print(sql)
            db.add(sql)
        tools.delay_time(10)
        # break
Ejemplo n.º 3
0
    filename = "persons.txt"
    # with open(filename, mode = 'w', encoding = 'utf-8') as file:
    #     for origation, names in person.items():
    #         print(origation)
    #         print(name)
    #         content = origation + ':\n' + ','.join(names)
    #         file.write(content)
    #         file.write('\n------------------------------------\n')

    sequence = 1
    for origation, names in person.items():
        print(origation)

        # sql = 'insert into TAB_IOPM_FIRST_CLUES_CLASSIFY t (t.first_classify_id, t.first_classify, t.zero_id) values (%s, \'%s\', 1)'%(sequence, '')
        # oracle.add(sql)

        for name in names:
            print(name)
            sql = 'insert into TAB_IOPM_CLUES (id, name, Keyword2, First_Id) values (%s, \'%s\', \'%s\', %s)'%("sequence.nextval", name, name, 1)
            oracle.add(sql)
        sequence+=1

# parse_docx_table('test.docx')

jigous = '中华人民共和国国家新闻出版广电总局,中央人民广播电台,中央电视台,中国国际广播电台,国家新闻出版广电总局广播电视卫星直播管理中心,国家新闻出版广电总局广播电视规划院,中广电广播电影电视设计研究院,国家新闻出版广电总局电影剧本规划策划中心,国家新闻出版广电总局电影数字节目管理中心,国家新闻出版广电总局机关服务,国家新闻出版广电总局研修学院(培训中心),中国广播电影,视社会组织联合会,中央新影集团,中国新闻出版研究院,新闻出版广电总局培训中心,新闻出版总署出版产品质量监督检测中心,中国版本图书馆(国家新闻出版广电总局出版物数据中心),国家出版基金规划管理办公室,中国印刷博物馆,天津市文化广播影视局,河北省新闻出版广电局,山西省新闻出版广电局,新疆维吾尔自治区广播电影电视局,宁夏回族自治区新闻出版广电局,青海省广播电影电视局,甘肃省新闻出版广电局,陕西省新闻出版广电局,西藏自治区新闻出版广电局,云南省新闻出版局,贵州省新闻出版广电局,四川省新闻出版广电局,重庆市文化委员会,海南省文化广电出版体育厅,广西壮族自治区新闻出版广电局,广东省新闻出版广电局,湖南省新闻出版广电局,湖北省新闻出版广电局湖北省版权局,江西省新闻出版广电局(江西省版权局),山东省新闻出版广电局,辽宁省新闻出版广电局,吉林省省新闻出版广电局,黑龙江省新闻出版广电局 黑龙江省版权局,福建省新闻出版广电(版权)局,上海市文化广播影视管理局,江苏省新闻出版广电局(版权局),浙江省新闻出版广电局(省版权局),安徽省新闻出版广电局'.split(',')

for name in jigous:
    sql = 'insert into TAB_IOPM_CLUES (id, name, Keyword2, First_Id, zero_id) values (%s, \'%s\', \'%s\', %s, %s)'%("sequence.nextval", name, name, 6, 3)
    oracle.add(sql)