def main(): db = OracleDB() # 查文章 sql = ''' select * from (select rownum r, id, title from tab_iopm_article_info where rownum >= 1) where r <= 100000 ''' articles = db.find(sql) # 查热点 sql = 'select id, title from tab_iopm_hot_info' hots = db.find(sql) for article in articles: max_similar = { 'similarity': 0, 'hot_id': -1, 'article_id': -1, 'hot_title': '' } # 最相似的文章 similarity表示相似度(0~1) article_id = article[1] article_text = article[2] for hot in hots: hot_id = hot[0] hot_text = hot[1] similarity = compare_text(hot_text, article_text) # print(''' # article_text %s # hot_text %s # similarity %s # '''%(article_text, hot_text, similarity)) if similarity > max_similar['similarity']: max_similar['similarity'] = similarity max_similar['hot_id'] = hot_id max_similar['article_id'] = article_id max_similar['hot_title'] = article_text if len(hot_text) > len( article_text) else hot_text if max_similar['similarity'] > SIMILARITY: sql = 'update tab_iopm_article_info set hot_id = %s where id = %s' % ( max_similar['hot_id'], max_similar['article_id']) db.update(sql) sql = "update tab_iopm_hot_info set hot = hot + 1, title = '%s' where id = %s" % ( max_similar['hot_title'], max_similar['hot_id']) db.update(sql) else: sql = 'select sequence.nextval from dual' hot_id = db.find(sql)[0][0] sql = "insert into tab_iopm_hot_info (id, title, hot) values (%s, '%s', 1)" % ( hot_id, article_text) db.add(sql) sql = 'update tab_iopm_article_info set hot_id = %s where id = %s' % ( hot_id, article_id) db.update(sql) sql = 'select id, title from tab_iopm_hot_info' hots = db.find(sql)
import sys sys.path.append('..') import init import utils.tools as tools from utils.log import log from db.oracledb import OracleDB from base.wechat_public_platform import WechatPublicPlatform from base.wechat_sogou import WechatSogou if __name__ == '__main__': db = OracleDB() # wechat_public_platform = WechatPublicPlatform() wechat_sogou = WechatSogou() # 取微信号 # sql = 'select t.name, t.keyword2 from TAB_IOPM_CLUES t where t.zero_id = 7 and t.first_id = 137 and t.second_id = 183' # accounts = db.find(sql) accounts = ['骨朵网络影视'] for account in accounts: account_id = '' account_name = account biz = wechat_sogou.get_biz(account_id=account_id, account=account_name) if biz: sql = "insert into TAB_IOPM_SITE t (t.id, t.name, t.position, t.classify, t.mointor_status, t.biz, t.priority) values (seq_iopm_site.nextval, '{name}', 1, 2, 701, '{biz}', 1)".format( name=account_name, biz=biz) print(sql) db.add(sql) tools.delay_time(10) # break
filename = "persons.txt" # with open(filename, mode = 'w', encoding = 'utf-8') as file: # for origation, names in person.items(): # print(origation) # print(name) # content = origation + ':\n' + ','.join(names) # file.write(content) # file.write('\n------------------------------------\n') sequence = 1 for origation, names in person.items(): print(origation) # sql = 'insert into TAB_IOPM_FIRST_CLUES_CLASSIFY t (t.first_classify_id, t.first_classify, t.zero_id) values (%s, \'%s\', 1)'%(sequence, '') # oracle.add(sql) for name in names: print(name) sql = 'insert into TAB_IOPM_CLUES (id, name, Keyword2, First_Id) values (%s, \'%s\', \'%s\', %s)'%("sequence.nextval", name, name, 1) oracle.add(sql) sequence+=1 # parse_docx_table('test.docx') jigous = '中华人民共和国国家新闻出版广电总局,中央人民广播电台,中央电视台,中国国际广播电台,国家新闻出版广电总局广播电视卫星直播管理中心,国家新闻出版广电总局广播电视规划院,中广电广播电影电视设计研究院,国家新闻出版广电总局电影剧本规划策划中心,国家新闻出版广电总局电影数字节目管理中心,国家新闻出版广电总局机关服务,国家新闻出版广电总局研修学院(培训中心),中国广播电影,视社会组织联合会,中央新影集团,中国新闻出版研究院,新闻出版广电总局培训中心,新闻出版总署出版产品质量监督检测中心,中国版本图书馆(国家新闻出版广电总局出版物数据中心),国家出版基金规划管理办公室,中国印刷博物馆,天津市文化广播影视局,河北省新闻出版广电局,山西省新闻出版广电局,新疆维吾尔自治区广播电影电视局,宁夏回族自治区新闻出版广电局,青海省广播电影电视局,甘肃省新闻出版广电局,陕西省新闻出版广电局,西藏自治区新闻出版广电局,云南省新闻出版局,贵州省新闻出版广电局,四川省新闻出版广电局,重庆市文化委员会,海南省文化广电出版体育厅,广西壮族自治区新闻出版广电局,广东省新闻出版广电局,湖南省新闻出版广电局,湖北省新闻出版广电局湖北省版权局,江西省新闻出版广电局(江西省版权局),山东省新闻出版广电局,辽宁省新闻出版广电局,吉林省省新闻出版广电局,黑龙江省新闻出版广电局 黑龙江省版权局,福建省新闻出版广电(版权)局,上海市文化广播影视管理局,江苏省新闻出版广电局(版权局),浙江省新闻出版广电局(省版权局),安徽省新闻出版广电局'.split(',') for name in jigous: sql = 'insert into TAB_IOPM_CLUES (id, name, Keyword2, First_Id, zero_id) values (%s, \'%s\', \'%s\', %s, %s)'%("sequence.nextval", name, name, 6, 3) oracle.add(sql)