Python DocumentsExporter 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: classes.DocumentsExporter

클래스/타입: DocumentsExporter

hotexamples.com에서의 예제들: 2

Python DocumentsExporter - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 classes.DocumentsExporter.DocumentsExporter에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

process_daily_documents_for_company(1)

process_documents_for_selected_companies(1)

예제 #1

파일 보기

파일: class_text_output.py 프로젝트: jontesek/mendelu-finance-analyzer

from datetime import datetime
import os

from classes.DocumentsExporter import DocumentsExporter


file_paths = {
    'stopwords': '../input_sources/google_en_stopwords.txt',
    #'output_dir': 'C:/text_mining/data/test',
    'output_dir': os.path.abspath('../../outputs/class_text/xtest'),
}
tp = DocumentsExporter(file_paths)
#from_date = datetime(2015, 8, 5)
from_date = datetime(2009, 1, 1)

delay = 2
company_id = 1

#### Individual files
#tp.process_documents_for_company('fb_post', company_id, from_date, delay, 'close', (3, 3), False)
#tp.process_documents_for_company('fb_comment', company_id, from_date, delay, 'close')
#tp.process_documents_for_company('article', company_id, from_date, delay, 'adjclose', (-2, 2), False)
#tp.process_documents_for_company('tweet', company_id, from_date, delay, 'close')

#twc_ids = [44, 202, 233, 300]
nonsearch_cids = [48, 217, 458, 479]

for c_id in nonsearch_cids:
    print ('====COMPANY %s====') % c_id
    tp.process_daily_documents_for_company('tweet', c_id, datetime(2015, 8, 5).date(), datetime(2016, 4, 2).date(),
                                            delay, 'adjclose', (-3, 3), False, 25000, False, nonsearch_cids)

예제 #2

파일 보기

파일: export_docs.py 프로젝트: jontesek/mendelu-finance-analyzer

from datetime import datetime
import os
import itertools

from classes.DocumentsExporter import DocumentsExporter

#####
# PARAMETERS definition
####

# Prepare exporter object
file_paths = {
    'stopwords': '../input_sources/google_en_stopwords.txt',
    'output_dir': os.path.abspath('../../outputs/class_text/sma20_ewma5/twitter'),
}
d_exporter = DocumentsExporter(file_paths)
# Set lowest published date.
# Yahoo: 2014-06-18 21:24:00, twitter: 2014-11-20 09:32:02, fb post: 2009-04-15 17:10:55, fb commnent: 2009-04-16 13:51:28
#from_date = datetime(2000, 1, 1)

# Parameters lists
delays = [1, 2, 3]
price_types = ['adjclose', 'ewma', 'sma']
const_boundaries = [(-1, 1), (-2, 2), (-3, 3), (-4, 4), (-5, 5)]

# Create all combinations of parameters.
params_combinations = list(itertools.product(price_types, delays, const_boundaries))

#######
# EXECUTION
#######