Python local_aggregation 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: anonymizer.transformations

메소드/함수: local_aggregation

hotexamples.com에서의 예제들: 8

Python local_aggregation - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 anonymizer.transformations.local_aggregation에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: anonymity.py 프로젝트: SGMAP-AGD/anonymisation

def all_local_aggregation(tab, k, variables, method, unknown=''):
    '''
        retourne une table k-anonymisée par aggrégation locale
        
        tab: la table à anonymiser
        k: un entier est le k-anonymat recherché
        variables est une liste de variable de tab :
            on traitera les données dans cet ordre et 
            la première variable sera celle dont on est le plus
            prêt à sacrifier l'aggrégation
        method : voir local_aggregation
    
    Remarque: si pour un groupe donné, plusieurs modalité ont moins de k
    éléments, on les remplace toutes par "dropped", on peut ainsi avoir un
    groupe avec dropped d'une taille supérieure à k. 
    Si ensuite on a une modalité plus grande que k à l'intérieur du groupe 
    hétéroclyte avec dropped, on peut afficher cette variable
    '''
    assert(isinstance(k, int))
    assert(all([var in tab.columns for var in variables]))
    assert(all(tab[variables].dtypes == 'object'))

    if get_k(tab, variables) >= k:
        return tab

    variable_a_aggreger = variables[-1]
    if len(variables) == 1:
        new_serie = local_aggregation(tab[variable_a_aggreger],
                                      k, method, unknown)
        tab[variable_a_aggreger] = new_serie        
        return tab

    if get_k(tab, variables[:-1]) < k:
        tab = all_local_aggregation(tab, k, variables[:-1], method, unknown)
    # on a une table k-anonymisée lorsqu'elle est restreinte aux 
    # len(variables) - 1 premières variables
        
    # on applique l'aggrégation locale d'une variable par groupe
    grp = tab.groupby(variables[:-1])
    new_serie = grp[variable_a_aggreger].apply(
        lambda x: local_aggregation(x, k, method, unknown)
        )
    tab[variable_a_aggreger] = new_serie
    
    assert get_k(tab, variables, unknown) >= k

    return tab

예제 #2

파일 보기

파일: anonymity.py 프로젝트: poedevop-fm/anonymisation

def all_local_aggregation(tab, k, variables, method, unknown=''):
    '''
        retourne une table k-anonymisée par aggrégation locale
        
        tab: la table à anonymiser
        k: un entier est le k-anonymat recherché
        variables est une liste de variable de tab :
            on traitera les données dans cet ordre et 
            la première variable sera celle dont on est le plus
            prêt à sacrifier l'aggrégation
        method : voir local_aggregation
    
    Remarque: si pour un groupe donné, plusieurs modalité ont moins de k
    éléments, on les remplace toutes par "dropped", on peut ainsi avoir un
    groupe avec dropped d'une taille supérieure à k. 
    Si ensuite on a une modalité plus grande que k à l'intérieur du groupe 
    hétéroclyte avec dropped, on peut afficher cette variable
    '''
    assert (isinstance(k, int))
    assert (all([var in tab.columns for var in variables]))
    assert (all(tab[variables].dtypes == 'object'))

    if get_k(tab, variables) >= k:
        return tab

    variable_a_aggreger = variables[-1]
    if len(variables) == 1:
        new_serie = local_aggregation(tab[variable_a_aggreger], k, method,
                                      unknown)
        tab[variable_a_aggreger] = new_serie
        return tab

    if get_k(tab, variables[:-1]) < k:
        tab = all_local_aggregation(tab, k, variables[:-1], method, unknown)
    # on a une table k-anonymisée lorsqu'elle est restreinte aux
    # len(variables) - 1 premières variables

    # on applique l'aggrégation locale d'une variable par groupe
    grp = tab.groupby(variables[:-1])
    new_serie = grp[variable_a_aggreger].apply(
        lambda x: local_aggregation(x, k, method, unknown))
    tab[variable_a_aggreger] = new_serie

    assert get_k(tab, variables, unknown) >= k

    return tab

예제 #3

파일 보기

파일: _test_AnonymDF.py 프로젝트: poedevop-fm/anonymisation

def transfo_1(x):
    return transfo.local_aggregation(x, 5, 'regroup_with_smallest', unknown='')

예제 #4

파일 보기

파일: _test_AnonymDF.py 프로젝트: poedevop-fm/anonymisation

def transfo_0(x):
    return transfo.local_aggregation(x, 5, 'with_closest', unknown='')

예제 #5

파일 보기

파일: _test_AnonymDF.py 프로젝트: SGMAP-AGD/anonymisation

def transfo_1(x):
    return transfo.local_aggregation(x, 5, 'regroup_with_smallest', unknown='')

예제 #6

파일 보기

파일: _test_AnonymDF.py 프로젝트: SGMAP-AGD/anonymisation

def transfo_0(x):
    return transfo.local_aggregation(x, 5, 'with_closest', unknown='')

예제 #7

파일 보기

def aggregation_year(x):
        return(local_aggregation(x, 5, 'with_closest', 'non renseigné'))

예제 #8

파일 보기

def aggregation_serie(x):
        return(local_aggregation(x, 5, 'regroup_with_smallest', 'non renseigné'))