Python FileLocations.get_dropbox_datasets_path 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sellibrary.locations

클래스/타입: FileLocations

메소드/함수: get_dropbox_datasets_path

hotexamples.com에서의 예제들: 3

Python FileLocations.get_dropbox_datasets_path - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sellibrary.locations.FileLocations.get_dropbox_datasets_path에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

get_dropbox_intermediate_path(14)

get_dropbox_dexter_path(10)

get_dropbox_wikipedia_path(6)

get_temp_path(6)

get_dropbox_datasets_path(3)

get_trec_eval_executable_location(1)

예제 #1

파일 보기

파일: hack_33_trec_grep_washington_post_corpus.py 프로젝트: dwanev/SEL

 def grep_articles(self):
     for docid in self.docid_set:
         self.logger.info('%s', docid)
         cmd = '/usr/bin/grep'
         param1 = docid
         param2 = FileLocations.get_dropbox_datasets_path(
         ) + 'washingtonpost/WashingtonPost/data/*.txt'
         self.logger.info('%s %s %s  ', cmd, param1, param2)
         full_cmd = cmd + ' ' + param1 + ' ' + param2 + ' >> wp.txt'
         process = subprocess.Popen(full_cmd,
                                    shell=True,
                                    stdout=subprocess.PIPE)
         process.wait()
         self.logger.info('return code %d ', process.returncode)

예제 #2

파일 보기

파일: main_use_or_build_baseline_tf_model.py 프로젝트: dwanev/SEL

            '%(asctime)s %(name)-12s %(levelname)-8s %(message)s'))
    logger = logging.getLogger(__name__)
    logger.addHandler(handler)
    logger.propagate = False
    logger.setLevel(logging.INFO)

    smb = BaseDocToSentiment()
    datasetDexter = DatasetDexter
    wikipediaDataset = WikipediaDataset()

    if use_dexter_dataset:
        document_list = datasetDexter.get_dexter_dataset(
            path=FileLocations.get_dropbox_dexter_path())
    if use_wahington_post_dataset:
        document_list = datasetDexter.get_dexter_dataset(
            path=FileLocations.get_dropbox_datasets_path() + 'washingtonpost/',
            filename="washington_post.json")

    spotter = GoldenSpotter(document_list, wikipediaDataset)
    golden_saliency_by_entid_by_docid = datasetDexter.get_golden_saliency_by_entid_by_docid(
        document_list, wikipediaDataset)

    if train_model:
        salience_by_entity_by_doc_id = smb.build_output_using_dexter_dataset(
            spotter,
            golden_saliency_by_entid_by_docid,
            output_filename,
            document_to_feature_converter,
            None,
            train_docid_set,
            wikipediaDataset,

예제 #3

파일 보기

파일: main_build_sel_model_for_washington_post.py 프로젝트: dwanev/SEL

    aws_util = AWSUtil()
    smb = SelModelBuilder()


    # if build_model:
    #     sentiment_processor = smb.train_and_save_model(filename)
    # else:
    #     sentiment_processor = SentimentProcessor()
    #     sentiment_processor.load_model(filename)

    dd = smb.get_dexter_datset()
    wikipediaDataset = WikipediaDataset()



    document_list = dd.get_dexter_dataset(path=FileLocations.get_dropbox_datasets_path()+'washingtonpost/', filename="washington_post.json")
    spotter = GoldenSpotter(document_list, wikipediaDataset)

    golden_saliency_by_entid_by_docid = dd.get_golden_saliency_by_entid_by_docid(document_list, wikipediaDataset)



    output_filename = FileLocations.get_dropbox_intermediate_path() + 'sel_all_features_golden_spotter.washington_post.docnum.'+ str(min_number) + '-' + str(max_number) + '.txt'
    heavy_feature_filename = FileLocations.get_temp_path() + 'sel_heavy_features_golden_spotter.washington_post.docnum.'+ str(min_number) + '-' + str(max_number) + '.txt'
    light_feature_filename = FileLocations.get_temp_path() + 'sel_light_features_golden_spotter.washington_post.docnum.'+ str(min_number) + '-' + str(max_number) + '.txt'

    document_to_feature_converter = SelFeatureExtractor(spotter, binary_classifier_threshold=0.5,
                                                        min_candidates_to_pass_through = 5000,
                                                        binary_classifier=None,
                 light_feature_filename = light_feature_filename, heavy_feature_filename = heavy_feature_filename, num_light_features = 23, break_early = break_early)