Python normalize_given_distribution 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: generative_models.data_synthesiser_utils.utils

메소드/함수: normalize_given_distribution

hotexamples.com에서의 예제들: 5

Python normalize_given_distribution - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 generative_models.data_synthesiser_utils.utils.normalize_given_distribution에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def infer_distribution(self):
     if self.is_categorical:
         distribution = self.data_dropna.value_counts()
         for value in set(self.distribution_bins) - set(distribution.index):
             distribution[value] = 0
         distribution.sort_index(inplace=True)
         self.distribution_probabilities = normalize_given_distribution(distribution)
         self.distribution_bins = np.array(distribution.index)
     else:
         distribution = np.histogram(self.data_dropna_len, bins=self.histogram_size)
         self.distribution_bins = distribution[1][:-1]
         self.distribution_probabilities = normalize_given_distribution(distribution[0])

예제 #2

파일 보기

파일: AbstractAttribute.py 프로젝트: spring-epfl/synthetic_data_release

    def infer_distribution(self):
        if self.is_categorical:
            histogram = self.data_dropna.value_counts()
            for value in set(self.distribution_bins) - set(histogram.index):
                histogram[value] = 0
            histogram = histogram[self.distribution_bins]
            self.distribution_probabilities = normalize_given_distribution(
                histogram)

        else:
            histogram, _ = np.histogram(self.data_dropna,
                                        bins=self.distribution_bins)
            self.distribution_probabilities = normalize_given_distribution(
                histogram)

예제 #3

파일 보기

파일: data_synthesiser.py 프로젝트: spring-epfl/synthetic_data_release

    def _construct_conditional_probabilities(self, bayesian_network,
                                             encoded_dataset):
        k = len(bayesian_network[-1][1])
        conditional_distributions = {}

        # first k+1 attributes
        root = bayesian_network[0][1][0]
        kplus1_attributes = [root]
        for child, _ in bayesian_network[:k]:
            kplus1_attributes.append(child)

        freqs_of_kplus1_attributes = self._get_attribute_frequency_counts(
            kplus1_attributes, encoded_dataset)

        # get distribution of root attribute
        root_marginal_freqs = freqs_of_kplus1_attributes.loc[:, [
            root, 'count'
        ]].groupby(root).sum()['count']
        conditional_distributions[root] = normalize_given_distribution(
            root_marginal_freqs).tolist()

        for idx, (child, parents) in enumerate(bayesian_network):
            conditional_distributions[child] = {}

            if idx < k:
                stats = freqs_of_kplus1_attributes.copy().loc[:, parents +
                                                              [child, 'count']]
            else:
                stats = self._get_attribute_frequency_counts(
                    parents + [child], encoded_dataset)

            stats = DataFrame(
                stats.loc[:, parents +
                          [child, 'count']].groupby(parents + [child]).sum())

            if len(parents) == 1:
                for parent_instance in stats.index.levels[0]:
                    dist = normalize_given_distribution(
                        stats.loc[parent_instance]['count']).tolist()
                    conditional_distributions[child][str([parent_instance
                                                          ])] = dist
            else:
                for parents_instance in product(*stats.index.levels[:-1]):
                    dist = normalize_given_distribution(
                        stats.loc[parents_instance]['count']).tolist()
                    conditional_distributions[child][str(
                        list(parents_instance))] = dist

        return conditional_distributions

예제 #4

파일 보기

파일: StringAttribute.py 프로젝트: spring-epfl/synthetic_data_release

    def infer_distribution(self):

        histogram = self.data_dropna.value_counts()
        for attr_cat in set(self.distribution_bins) - set(histogram.index):
            histogram[attr_cat] = 0
        histogram = histogram[self.distribution_bins]
        self.distribution_probabilities = normalize_given_distribution(
            histogram)

예제 #5

파일 보기

 def infer_distribution(self):
     frequency_counts, _ = histogram(self.data_dropna,
                                     bins=self.distribution_bins)
     self.distribution_probabilities = normalize_given_distribution(
         frequency_counts)