Python DataExtractor.extract Beispiele

Programmiersprache: Python

Namespace / Paketname: data_extractor

Klasse / Typ: DataExtractor

Methode / Funktion: extract

Beispiele auf hotexamples.com: 5

Python DataExtractor.extract - 5 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die data_extractor.DataExtractor.extract, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

DataExtractor(30)

location_mapping(10)

get_movie_actor_data(7)

get_mlmovies_data(6)

choose_versions(5)

get_data_vectors(4)

extract(4)

get_variable_values_sets(4)

get_mltags_data(4)

get_genome_tags_data(4)

get_imdb_actor_info_data(3)

get_bugged_files_path(3)

save(2)

read(2)

location_title_to_id_mapping(2)

checkout_version(2)

get_selected_versions(2)

extract_data(2)

get_data(1)

prepare_dataset_for_task1(1)

load_train_labels(1)

load_valid_data(1)

load_valid_labels(1)

extractTextFromTagList(1)

extractText(1)

prepare_dataset_for_task3(1)

load_test_labels(1)

prepare_dataset_for_task6(1)

dropna(1)

create_dataset(1)

save_csv(1)

set_selected_config(1)

to_json(1)

load_train_data(1)

load_test_data(1)

get_details_from_results(1)

init_jira_commits(1)

import_matches(1)

get_versions_by_type(1)

get_task4_feedback_data(1)

get_task2_feedback_data(1)

collect_data(1)

get_race(1)

append_givenloc_to_list(1)

findAllTags(1)

get_mlratings_data(1)

getData(1)

get_all_files_prefixed_with(1)

get_bugged_methods_path(1)

get_files_bugged(1)

Beispiel #1

Datei anzeigen

 def _extract(self):
     extractor = DataExtractor(self.project)
     extractor.extract(True)
     path = extractor.get_bugged_methods_path(self.version, True)
     df = pd.read_csv(path, sep=';')
     key = 'method_id'
     bugged = df.groupby(key).apply(lambda x: dict(
         zip(["is_method_buggy"], x.is_method_buggy))).to_dict()
     self.data.set_raw_data(bugged)

Beispiel #2

Datei anzeigen

Datei: data_extractor_test.py Projekt: gperetin/kart-stats

class DataExtractorTest(unittest.TestCase):
    def setUp(self):
        self.extractor = DataExtractor(raw_data)
        self.extractor.extract()
        self.race = self.extractor.get_race()

    def test_extracts_heat(self):
        self.assertEquals(60, self.race.heat)

    def test_extracts_race_date_and_time(self):
        self.assertEquals(datetime.date(2011,12,23), self.race.date)
        self.assertEquals(datetime.time(20,36), self.race.time)

    def test_extract_driver_list(self):
        drivers = [u'CiglaR', u'CASPER', u'Brzi', u'bR1ck', u'gogoGT', u'Shorty', u'dastrong', u'skrla', u'slavisha', u'VINKO']
        self.assertEquals(drivers, self.race.driver_list)

Beispiel #3

Datei anzeigen

Datei: 3__extract_data.py Projekt: inbalros/repository_mining

def extract_data(project_ref):
    index = project_ref[0]
    project = project_ref[1]

    general_log = logging.getLogger(__name__)
    success_log = logging.getLogger("success")
    failure_log = logging.getLogger("failure")
    failure_verbose_log = logging.getLogger("failure_verbose")

    general_log.info(str(index) + ": " + project.github())
    try:
        extractor = DataExtractor(project)
        extractor.extract()
        success_log.info("Succeeded to extract {0}.".format(project.github()))
    except Exception as e:
        failure_log.error("Failed to extract {0}.".format(project.github()))
        failure_verbose_log.exception("Failed to extract {0}.".format(
            project.github()))
        return e
    return

Beispiel #4

Datei anzeigen

 def test_extract(self):
     project = ProjectName.CommonsLang.value
     extractor = DataExtractor(project)
     extractor.extract()

Beispiel #5

Datei anzeigen

Datei: run.py Projekt: lywong92/yelp_review_prediction

from data_extractor import DataExtractor
# from model import build_model
from preprocess import write_to_file, preprocess_data
import sys

dataset_folder = sys.argv[1]
dataset_file = "dataset.json"
normalised_dataset_file = "normalised_data.json"

# extract data from review.json and business.json
data_extractor = DataExtractor(dataset_folder)
data_extractor.extract()
data_extractor.write_to_file()

# preprocess data and write final datasets to normalised_data.json
preprocess_data(dataset_file)

# build model
# build_model(normalised_dataset_file)