コード例 #1
0
ファイル: Meta.py プロジェクト: INECC-PCCS/01_Dmine
 def fillmeta(self):
     self.ArchivoDataset = self.nomarchivodataset + "." + self.extarchivodataset
     self.DirFuente = r'D:\PCCS\01_Dmine\Datasets\{}'.format(
         self.ClaveDataset)
     self.DSBase = '"{}", disponible en https://github.com/INECC-PCCS/01_Dmine/tree/master/Datasets/{}'.format(
         self.ArchivoDataset, self.ClaveDataset)
     self.ClaveDimension = self.ClaveParametro[1:3]
     self.NomDimension = AsignarDimension(self.ClaveDimension)['nombre']
     self.DirDimension = self.ClaveDimension + "_" + AsignarDimension(
         self.ClaveDimension)['directorio']
     self.RepoMina = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/{}/{}'.format(
         self.DirDimension, self.ClaveParametro)
     self.DirDestino = r'D:\PCCS\01_Dmine\{}'.format(
         self.ClaveDimension + "_" +
         AsignarDimension(self.ClaveDimension)['directorio'])
     if self.getmetafromds == 1:
         self.metafromds(self)
     DescIntegridad = {
         1:
         'La variable de integridad municipal para esta Dataset es binaria: \n'
         '1 =  El municipio cuenta con informacion \n0 = El municipio no cuenta con información',
         2:
         'Para calcular la variable de integridad de este dataset, se verifica la existencia de datos en '
         'cada una de las variables que se utilizaron para construir el parámetro. El valor de la variable '
         'de integridad multiplicado por 100 indica el porcentaje de variables del dataset que tienen '
         'datos para la construcción del parámetro',
         3:
         'Los datos para este parametro se agregaron desde los individuos de una poblacion, por lo que se '
         'considera que los datos están completos y que si un municipio no tiene datos significa que ese '
         'municipio tiene cero unidades de las que está considerando el parámetro',
     }
     self.DescVarIntegridad = DescIntegridad[self.TipoInt]
コード例 #2
0
Notas = 'S/N'
DescVarIntegridad = 'La variable de integridad municipal para esta Dataset es binaria: \n' \
                    '1 =  El municipio cuenta con informacion \n0 = El municipio no cuenta con información'
NomFuente = 'INEGI (Microdatos)'
UrlFuente = 'http://www.beta.inegi.org.mx/proyectos/registros/economicas/accidentes/'
ActDatos = '2015'
DispTemp = '1997 a 2015'
PeriodoAct = 'Anual'
DesagrMax = 'Municipal'

# Descripciones generadas desde la clave del parámetro
DirFuente = r'D:\PCCS\01_Dmine\Datasets\{}'.format(ClaveDataset)
DSBase = '"{}.xlsx", disponible en ' \
         'https://github.com/INECC-PCCS/01_Dmine/tree/master/Datasets/{}'.format(ClaveDataset, ClaveDataset)
ClaveDimension = ClaveParametro[1:3]
NomDimension = AsignarDimension(ClaveDimension)['nombre']
DirDimension = ClaveDimension + "_" + AsignarDimension(
    ClaveDimension)['directorio']
RepoMina = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/{}/{}'.format(
    DirDimension, ClaveParametro)
DirDestino = r'D:\PCCS\01_Dmine\{}'.format(
    ClaveDimension + "_" + AsignarDimension(ClaveDimension)['directorio'])

# Construccion del Parámetro -----------------------------------------------------------------------------------------
# Dataset Inicial
dataset = pd.read_excel(DirFuente + r'\{}.xlsx'.format(ClaveDataset),
                        sheetname="ACCIDENTES_URBANA",
                        dtype={'CVE_MUN': str})
dataset.set_index('CVE_MUN', inplace=True)

# Generar dataset para parámetro y Variable de Integridad
コード例 #3
0
Notas = 'S/N'
DescVarIntegridad = 'La variable de integridad municipal para esta Dataset es binaria: \n' \
                    '1 =  El municipio cuenta con informacion \n0 = El municipio no cuenta con información'
NomFuente = 'Programa de Indicadores de Gestión de Organismos Operadores'
UrlFuente = 'http://www.pigoo.gob.mx/index.php?option=com_content&view=article&id=674&Itemid=1677'
ActDatos = '2015'
DispTemp = '2002 a 2015'
PeriodoAct = 'Anual'
DesagrMax = 'Municipal'

# Descripciones generadas desde la clave del parámetro
DirFuente = r'D:\PCCS\01_Dmine\Datasets\{}'.format(ClaveDataset)
DSBase = '"{}.xlsx", disponible en ' \
         'https://github.com/INECC-PCCS/01_Dmine/tree/master/Datasets/{}'.format(ClaveDataset, ClaveDataset)
ClaveDimension = ClaveParametro[1:3]
NomDimension = AsignarDimension(ClaveDimension)['nombre']
DirDimension = ClaveDimension + "_" + AsignarDimension(ClaveDimension)['directorio']
RepoMina = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/{}/{}'.format(DirDimension, ClaveParametro)
DirDestino = r'D:\PCCS\01_Dmine\{}'.format(ClaveDimension+"_"+AsignarDimension(ClaveDimension)['directorio'])

# Construccion del Parámetro -----------------------------------------------------------------------------------------
# Dataset Inicial
dataset = pd.read_excel(DirFuente + r'\{}.xlsx'.format(ClaveDataset),
                        sheetname="Macromedición (%)", dtype={'CVE_MUN': str})
dataset.set_index('CVE_MUN', inplace=True)

# Generar dataset para parámetro y Variable de Integridad
del dataset['indicador']   # Quitar Columnas que no se utilizarán más
del dataset['ciudad']      # Quitar Columnas que no se utilizarán más
par_dataset = dataset['2015'].rename('Total_Parametro').to_frame()
par_dataset, variables_dataset = VarInt(par_dataset, dataset, tipo = 1)
コード例 #4
0

def HazProxyIntegridad(ID_PARAMETRO):
    indice = HojaParametros.index
    ProxyValores = np.random.sample(135).tolist()
    Proxy = pd.Series(data=ProxyValores, index=indice, name=ID_PARAMETRO)
    return Proxy.round(decimals=3)


EsProxy = '(Mineria de datos de parametro pendiente)\n\nProxy creado con fines de coordinacion'

for indecs, row in lista.iterrows():
    DirBase = r'D:\PCCS\01_Dmine'
    SubDir = '{}_{}'.format(
        row['ClaveDimension'],
        AsignarDimension(row['ClaveDimension'])['directorio'])
    DirDestino = r'{}\{}\{}'.format(DirBase, SubDir, indecs)
    RepoBase = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/'
    SubRepo = '{}{}/{}'.format(RepoBase, SubDir, indecs)
    if not os.path.isdir(DirDestino):  # Crea un Directorio si es que no existe
        os.makedirs(DirDestino)
        readmefile = '{}\README.md'.format(DirDestino)
        Glosa = '# [PROXY] {} - {}\n\n{}'.format(indecs,
                                                 row['Nombre Parametro'],
                                                 EsProxy)
        with open(readmefile, 'w') as README:
            README.write(Glosa)

    if not indecs in HojaIndice.index:  # Crea un proxy de informacion para un solo parametro
        DatosIndice = pd.DataFrame(index=[indecs],
                                   data={