def fillmeta(self): self.ArchivoDataset = self.nomarchivodataset + "." + self.extarchivodataset self.DirFuente = r'D:\PCCS\01_Dmine\Datasets\{}'.format( self.ClaveDataset) self.DSBase = '"{}", disponible en https://github.com/INECC-PCCS/01_Dmine/tree/master/Datasets/{}'.format( self.ArchivoDataset, self.ClaveDataset) self.ClaveDimension = self.ClaveParametro[1:3] self.NomDimension = AsignarDimension(self.ClaveDimension)['nombre'] self.DirDimension = self.ClaveDimension + "_" + AsignarDimension( self.ClaveDimension)['directorio'] self.RepoMina = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/{}/{}'.format( self.DirDimension, self.ClaveParametro) self.DirDestino = r'D:\PCCS\01_Dmine\{}'.format( self.ClaveDimension + "_" + AsignarDimension(self.ClaveDimension)['directorio']) if self.getmetafromds == 1: self.metafromds(self) DescIntegridad = { 1: 'La variable de integridad municipal para esta Dataset es binaria: \n' '1 = El municipio cuenta con informacion \n0 = El municipio no cuenta con información', 2: 'Para calcular la variable de integridad de este dataset, se verifica la existencia de datos en ' 'cada una de las variables que se utilizaron para construir el parámetro. El valor de la variable ' 'de integridad multiplicado por 100 indica el porcentaje de variables del dataset que tienen ' 'datos para la construcción del parámetro', 3: 'Los datos para este parametro se agregaron desde los individuos de una poblacion, por lo que se ' 'considera que los datos están completos y que si un municipio no tiene datos significa que ese ' 'municipio tiene cero unidades de las que está considerando el parámetro', } self.DescVarIntegridad = DescIntegridad[self.TipoInt]
Notas = 'S/N' DescVarIntegridad = 'La variable de integridad municipal para esta Dataset es binaria: \n' \ '1 = El municipio cuenta con informacion \n0 = El municipio no cuenta con información' NomFuente = 'INEGI (Microdatos)' UrlFuente = 'http://www.beta.inegi.org.mx/proyectos/registros/economicas/accidentes/' ActDatos = '2015' DispTemp = '1997 a 2015' PeriodoAct = 'Anual' DesagrMax = 'Municipal' # Descripciones generadas desde la clave del parámetro DirFuente = r'D:\PCCS\01_Dmine\Datasets\{}'.format(ClaveDataset) DSBase = '"{}.xlsx", disponible en ' \ 'https://github.com/INECC-PCCS/01_Dmine/tree/master/Datasets/{}'.format(ClaveDataset, ClaveDataset) ClaveDimension = ClaveParametro[1:3] NomDimension = AsignarDimension(ClaveDimension)['nombre'] DirDimension = ClaveDimension + "_" + AsignarDimension( ClaveDimension)['directorio'] RepoMina = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/{}/{}'.format( DirDimension, ClaveParametro) DirDestino = r'D:\PCCS\01_Dmine\{}'.format( ClaveDimension + "_" + AsignarDimension(ClaveDimension)['directorio']) # Construccion del Parámetro ----------------------------------------------------------------------------------------- # Dataset Inicial dataset = pd.read_excel(DirFuente + r'\{}.xlsx'.format(ClaveDataset), sheetname="ACCIDENTES_URBANA", dtype={'CVE_MUN': str}) dataset.set_index('CVE_MUN', inplace=True) # Generar dataset para parámetro y Variable de Integridad
Notas = 'S/N' DescVarIntegridad = 'La variable de integridad municipal para esta Dataset es binaria: \n' \ '1 = El municipio cuenta con informacion \n0 = El municipio no cuenta con información' NomFuente = 'Programa de Indicadores de Gestión de Organismos Operadores' UrlFuente = 'http://www.pigoo.gob.mx/index.php?option=com_content&view=article&id=674&Itemid=1677' ActDatos = '2015' DispTemp = '2002 a 2015' PeriodoAct = 'Anual' DesagrMax = 'Municipal' # Descripciones generadas desde la clave del parámetro DirFuente = r'D:\PCCS\01_Dmine\Datasets\{}'.format(ClaveDataset) DSBase = '"{}.xlsx", disponible en ' \ 'https://github.com/INECC-PCCS/01_Dmine/tree/master/Datasets/{}'.format(ClaveDataset, ClaveDataset) ClaveDimension = ClaveParametro[1:3] NomDimension = AsignarDimension(ClaveDimension)['nombre'] DirDimension = ClaveDimension + "_" + AsignarDimension(ClaveDimension)['directorio'] RepoMina = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/{}/{}'.format(DirDimension, ClaveParametro) DirDestino = r'D:\PCCS\01_Dmine\{}'.format(ClaveDimension+"_"+AsignarDimension(ClaveDimension)['directorio']) # Construccion del Parámetro ----------------------------------------------------------------------------------------- # Dataset Inicial dataset = pd.read_excel(DirFuente + r'\{}.xlsx'.format(ClaveDataset), sheetname="Macromedición (%)", dtype={'CVE_MUN': str}) dataset.set_index('CVE_MUN', inplace=True) # Generar dataset para parámetro y Variable de Integridad del dataset['indicador'] # Quitar Columnas que no se utilizarán más del dataset['ciudad'] # Quitar Columnas que no se utilizarán más par_dataset = dataset['2015'].rename('Total_Parametro').to_frame() par_dataset, variables_dataset = VarInt(par_dataset, dataset, tipo = 1)
def HazProxyIntegridad(ID_PARAMETRO): indice = HojaParametros.index ProxyValores = np.random.sample(135).tolist() Proxy = pd.Series(data=ProxyValores, index=indice, name=ID_PARAMETRO) return Proxy.round(decimals=3) EsProxy = '(Mineria de datos de parametro pendiente)\n\nProxy creado con fines de coordinacion' for indecs, row in lista.iterrows(): DirBase = r'D:\PCCS\01_Dmine' SubDir = '{}_{}'.format( row['ClaveDimension'], AsignarDimension(row['ClaveDimension'])['directorio']) DirDestino = r'{}\{}\{}'.format(DirBase, SubDir, indecs) RepoBase = 'https://github.com/INECC-PCCS/01_Dmine/tree/master/' SubRepo = '{}{}/{}'.format(RepoBase, SubDir, indecs) if not os.path.isdir(DirDestino): # Crea un Directorio si es que no existe os.makedirs(DirDestino) readmefile = '{}\README.md'.format(DirDestino) Glosa = '# [PROXY] {} - {}\n\n{}'.format(indecs, row['Nombre Parametro'], EsProxy) with open(readmefile, 'w') as README: README.write(Glosa) if not indecs in HojaIndice.index: # Crea un proxy de informacion para un solo parametro DatosIndice = pd.DataFrame(index=[indecs], data={