from regions import Regions z = Regions.summable_regions() print(z) for r in Regions.district_names(): w = Regions.region_by_district(r) print('\n', r) print(w) # passes now # assert set(Regions.region_by_district("Уральский федеральный округ")) == set (['Курганская область', 'Свердловская область', 'Ханты-Мансийский авт. округ - Югра', 'Ямало-Ненецкий авт. округ', 'Тюменская область без авт. округов', 'Челябинская область']) # must pass: assert set(Regions.region_by_district("Уральский федеральный округ")) == set([ 'Курганская область', 'Свердловская область', #'Ханты-Мансийский авт. округ - Югра', #'Ямало-Ненецкий авт. округ', #'Тюменская область без авт. округов', 'Тюменская область', 'Челябинская область' ]) print(Regions.region_by_district("Северо-Западный федеральный округ")) # Regions.region_by_district("Северо-Западный федеральный округ") must return: [ 'Республика Карелия', 'Республика Коми', #'Ненецкий авт. округ', #'Архангельская область без авт. округа',
# + test_anchor() # tests to pass: # 3.1 for summable values summ by regions equals Russian Federation total p = abs(reg.sum(axis=1) - rf) # QUESTION: print( "\nSummable regions do not match Russia total: OK, Crimea reporting effect for these dates" ) print(p[p > 0.1]) # 3.2 for summable values summ by districts equals Russian Federation total print( "\nRussia total does not match for several dates: OK, Crimea reporting effect for these dates" ) z = abs(okr.sum(axis=1) - rf) print(z[z > 0.1]) # 3.3 with summation matrix for summable values summ by region in district equals district total print("\nSumm by districts - seems to match") # todo: concat diff by distrist into one dataframe *diffs* from regions import Regions for r in Regions.district_names(): cols = Regions.region_by_district(r) diff = round(reg[cols].sum(axis=1) - okr[r], 1) print('\n', r) # partial indexing print(diff["2015-12-01"]) # todo: need summation matrix by region
reg = get_regions_dataframe(def_dict_2) okr = get_okrug_dataframe(def_dict_2) rf = get_rf_dataframe(def_dict_2) # + test_anchor() # tests to pass: # 3.1 for summable values summ by regions equals Russian Federation total p = abs(reg.sum(axis = 1) - rf) # QUESTION: print("\nSummable regions do not match Russia total: OK, Crimea reporting effect for these dates") print(p[p > 0.1]) # 3.2 for summable values summ by districts equals Russian Federation total print("\nRussia total does not match for several dates: OK, Crimea reporting effect for these dates") z = abs(okr.sum(axis = 1) - rf) print(z[z > 0.1]) # 3.3 with summation matrix for summable values summ by region in district equals district total print("\nSumm by districts - seems to match") # todo: concat diff by distrist into one dataframe *diffs* from regions import Regions for r in Regions.district_names(): cols = Regions.region_by_district(r) diff = round(reg[cols].sum(axis = 1) - okr[r], 1) print ('\n', r) # partial indexing print (diff["2015-12-01"]) # todo: need summation matrix by region
from regions import Regions z = Regions.summable_regions() print(z) for r in Regions.district_names(): w = Regions.region_by_district(r) print ('\n', r) print (w) # passes now # assert set(Regions.region_by_district("Уральский федеральный округ")) == set (['Курганская область', 'Свердловская область', 'Ханты-Мансийский авт. округ - Югра', 'Ямало-Ненецкий авт. округ', 'Тюменская область без авт. округов', 'Челябинская область']) # must pass: assert set(Regions.region_by_district("Уральский федеральный округ")) == set (['Курганская область', 'Свердловская область', #'Ханты-Мансийский авт. округ - Югра', #'Ямало-Ненецкий авт. округ', #'Тюменская область без авт. округов', 'Тюменская область', 'Челябинская область']) print(Regions.region_by_district("Северо-Западный федеральный округ")) # Regions.region_by_district("Северо-Западный федеральный округ") must return: ['Республика Карелия', 'Республика Коми', #'Ненецкий авт. округ', #'Архангельская область без авт. округа', 'Архангельская область', 'Вологодская область', 'Калининградская область',