Python CommonUtil.get_datetime_from_cell 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: util

클래스/타입: CommonUtil

메소드/함수: get_datetime_from_cell

hotexamples.com에서의 예제들: 2

Python CommonUtil.get_datetime_from_cell - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 util.CommonUtil.get_datetime_from_cell에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

read_csv(12)

write_csv(10)

get_interval_seconds(5)

check_platform(5)

get_next_sample_time(4)

get_string_from_datetime(4)

read_excel(4)

get_datetime_from_string(4)

get_datetime_from_string_(4)

get_dirs(3)

timestamp_to_date(2)

set_network(2)

save_to_file(2)

check_privileges(2)

get_datetime_from_cell(2)

convert_size(2)

convert_long_to_date(2)

check_connection(2)

convert_date_to_long(1)

get_minute_changed(1)

get_today(1)

md5(1)

check_date(1)

cut_message(1)

setup_logger(1)

예제 #1

파일 보기

def prepare_raw_news():
    logger.info("In Prepare Raw News...")
    raw_news_data = CommonUtil.read_excel(RAW_NEWS_PATH)
    raw_news_table = raw_news_data.sheet_by_index(0)
    raw_news_rows = raw_news_table.nrows
    for rowN in range(0, raw_news_rows):
        news_item = list()
        news_index = int(raw_news_table.cell_value(rowN, 0))
        news_time = CommonUtil.get_datetime_from_cell(
            raw_news_table.cell_value(rowN, 1))
        news_content = raw_news_table.cell_value(rowN, 2)
        news_item.append(news_index)
        news_item.append(news_time)
        news_item.append(news_content)
        newsList.append(news_item)
    logger.info("Prepare Raw News...Done!")

예제 #2

파일 보기

def splitwords_word2vec(filename, fname, weightWord):
    filetxt = open(filename, 'a+', encoding='utf-8')
    model = gensim.models.KeyedVectors.load_word2vec_format(
        '../word2veczzh/news_12g_baidubaike_20g_novel_90g_embedding_64.bin',
        binary=True)
    word_vec = model.wv
    del model

    # fname = '../files/splitedsentence.xls'
    data = xlrd.open_workbook(fname)
    table = data.sheet_by_index(0)
    nrows = table.nrows
    ncols = table.ncols
    #一行一行读取新闻内容
    for i in range(0, nrows):
        #读取新闻的时间
        # newsTime = table.cell(i, 0).value
        news_time = table.cell(i, 0).value
        newsTime = CommonUtil.get_datetime_from_cell(news_time)
        #读取新闻的内容
        newsContent = table.cell(i, 1).value
        #获取极性值 -1，0,1
        polarity = int(table.cell(i, 3).value)
        print(newsTime)
        # print(newsContent)
        # print(polarity)

        # 分词
        words, wordsList = ltpmanner.splitwords(newsContent)  #对这一条新闻进行分词
        #去停用词
        new_wordsList = ltpmanner.stopwords(wordsList)
        vec_array = np.zeros(64, dtype=float)  #一条新闻初始化词向量，为0
        #循环对词进行向量化
        total_array = []
        total_array.append(newsTime)
        length = len(new_wordsList)
        for each in new_wordsList:
            try:
                if each in weightWord:
                    value = word_vec[each] * 10 / length
                    vec_array += value
                else:
                    value = word_vec[each] / length
                    vec_array += value
            except Exception as e:
                print("error:", e)

        #转成list
        vec_array = vec_array.tolist()
        #合并到一起 total_array
        for each in vec_array:
            total_array.append(each)

        total_array.append(polarity)
        # print(total_array)
        # print('len(total_array)',len(total_array))
        #向量化后写入文件
        for each in total_array:
            print(each)
            filetxt.write(str(each) + '\t')
        filetxt.write('\n')