Python DataExtractor.get_bugged_files_path примеры использования

Язык программирования: Python

Пространство имен/Пакет: data_extractor

Класс/Тип: DataExtractor

Метод/Функция: get_bugged_files_path

Примеров на hotexamples.com: 3

Python DataExtractor.get_bugged_files_path - 3 примера найдено. Это лучшие примеры Python кода для data_extractor.DataExtractor.get_bugged_files_path, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

DataExtractor(30)

location_mapping(10)

get_movie_actor_data(7)

get_mlmovies_data(6)

choose_versions(5)

get_data_vectors(4)

extract(4)

get_variable_values_sets(4)

get_mltags_data(4)

get_genome_tags_data(4)

get_imdb_actor_info_data(3)

get_bugged_files_path(3)

save(2)

read(2)

location_title_to_id_mapping(2)

checkout_version(2)

get_selected_versions(2)

extract_data(2)

get_data(1)

prepare_dataset_for_task1(1)

load_train_labels(1)

load_valid_data(1)

load_valid_labels(1)

extractTextFromTagList(1)

extractText(1)

prepare_dataset_for_task3(1)

load_test_labels(1)

prepare_dataset_for_task6(1)

dropna(1)

create_dataset(1)

save_csv(1)

set_selected_config(1)

to_json(1)

load_train_data(1)

load_test_data(1)

get_details_from_results(1)

init_jira_commits(1)

import_matches(1)

get_versions_by_type(1)

get_task4_feedback_data(1)

get_task2_feedback_data(1)

collect_data(1)

get_race(1)

append_givenloc_to_list(1)

findAllTags(1)

get_mlratings_data(1)

getData(1)

get_all_files_prefixed_with(1)

get_bugged_methods_path(1)

get_files_bugged(1)

Пример #1

Показать файл

 def _extract(self):
     extractor = DataExtractor(self.project)
     path = extractor.get_bugged_files_path(self.version, True)
     df = pd.read_csv(path, sep=';')
     key = 'file_name'
     assert key in df.columns
     bugged = df.groupby(key).apply(
         lambda x: dict(zip(["is_buggy"], x.is_buggy))).to_dict()
     self.data.set_raw_data(bugged)

Пример #2

Показать файл

Файл: version_metrics.py Проект: amir9979/repository_mining

    def _extract(self):
        # get version_date from apache_versions
        config = Config().config
        repository_data = config["CACHING"]["RepositoryData"]
        path = os.path.join(repository_data,
                            config['DATA_EXTRACTION']["AllVersions"],
                            self.project.github_name,
                            self.project.github_name + ".csv")
        df = pd.read_csv(path, sep=';')
        version_date = df[df['version_name'] ==
                          self.version]['version_date'].to_list()[0]
        version_date = datetime.strptime(version_date, '%Y-%m-%d %H:%M:%S')
        # get file list from committed_files
        path = os.path.join(repository_data,
                            config['DATA_EXTRACTION']["CommittedFiles"],
                            self.project.github_name,
                            self.project.github_name + ".csv")
        df = pd.read_csv(path, sep=';')
        issues_path = os.path.join(repository_data,
                                   config['DATA_EXTRACTION']["Issues"],
                                   self.project.github_name,
                                   self.project.github_name + "_dummies.csv")
        issues_df = pd.read_csv(issues_path, sep=';')
        issues_df = df[['commit_id', 'issue_id']].merge(issues_df,
                                                        on=['issue_id'],
                                                        how='right')
        # filter commits after version date
        df = df[df.apply(lambda r: datetime.strptime(r[
            'commit_date'], '%Y-%m-%d %H:%M:%S') < version_date,
                         axis=1)]
        # split by file_name
        data = {}
        issues_data = {}

        extractor = DataExtractor(self.project)
        path = extractor.get_bugged_files_path(self.version, True)
        files = pd.read_csv(path, sep=';')['file_name'].to_list()
        df = df[df.apply(lambda r: r['file_name'].endswith('.java') and r[
            'file_name'] in files,
                         axis=1)]

        for file_name, file_df in df.groupby('file_name', as_index=False):
            norm_name = os.path.normpath(file_name).lower()
            if norm_name not in self.file_analyser.relative_paths:
                continue
            name = self.file_analyser.relative_paths[norm_name]
            data[name] = self._extract_process_features(file_df)
            issues_data[name] = self._extract_issues_features(
                file_df, issues_df, self._get_blame_data(file_name))
        # extract the following features:
        self.data.add(ProcessData(self.project, self.version, data=data)).add(
            IssuesProductData(self.project, self.version,
                              data=issues_data)).add(
                                  IssuesProcessData(self.project,
                                                    self.version,
                                                    data=issues_data))

Пример #3

Показать файл

Файл: version_metrics.py Проект: amir9979/repository_mining

 def _extract(self):
     extractor = DataExtractor(self.project)
     path = extractor.get_bugged_files_path(self.version, True)
     df = pd.read_csv(path, sep=';')
     key = 'file_name'
     assert key in df.columns
     bugged = df.groupby(key).apply(
         lambda x: dict(zip(["is_buggy"], x.is_buggy))).to_dict()
     ans = dict()
     for name, value in bugged.items():
         norm_name = os.path.normpath(name.lower())
         if norm_name in self.file_analyser.relative_paths:
             ans[self.file_analyser.relative_paths[norm_name]] = value
     self.data.set_raw_data(ans)