def poglej_funkcijo_uredi_smucisce_na_mapi(mapa): for html_datoteka in definicije.datoteke(mapa): if html_datoteka[-4:] != 'html': continue else: for smucisce in re.finditer(vzorec, definicije.odpri(html_datoteka)): ime_smucisca, podatki = uredi_smucisce(smucisce) print(ime_smucisca, podatki) for smucisce in re.finditer(vzorec, definicije.odpri('eva.html')): ime_smucisca, podatki=uredi_smucisce(smucisce) print(ime_smucisca, podatki)
def najdi_vsa_smucisca(mapa): imena=set() for html_datoteka in definicije.datoteke(mapa): if html_datoteka[-5:] != '.html': continue for smucisce in re.finditer(vzorec,definicije.odpri(html_datoteka)): ime,slovar=uredi_smucisce(smucisce) imena.add(ime) return imena
def poglej_delovanje_ragularnega_izraza_vzorec_na_datoteki(datoteka): for ujemanje in re.finditer(vzorec, definicije.odpri(datoteka)): print(ujemanje.groupdict())
## SPREMENI DATOTEKE IZ .HTML V .CSV for html_datoteka in definicije.datoteke('sneg/'): if html_datoteka[-5:] != '.html': continue csv_datoteka=html_datoteka.replace('.html','.csv') cas=csv_datoteka[5:-4] datum=cas[:-9] ura=cas[-8:-3] cas1=datum + ' ' + ura imena_polj = ['smucisce','cas','datum','vreme','temperatura','sneg','obratovanje','odprto','sedeznice','proge'] with open(csv_datoteka, 'w', encoding='utf8') as csv_dat: writer = csv.DictWriter(csv_dat , imena_polj) writer.writeheader() drugi=csv.writer(csv_dat) drugi.writerow([cas]) for ujemanje in re.finditer(vzorec,definicije.odpri(html_datoteka)): _,slovar=uredi_smucisce(ujemanje) slovar['cas']=pd.to_datetime(cas1) slovar['datum']=datum slovar['odprto']=definicije.nova_funkcija(slovar['obratovanje']) slovar['proge']=definicije.solata(slovar['sedeznice']) slovar['sedeznice']=definicije.koliko_prog(slovar['sedeznice']) writer.writerow(slovar) ## SKUPNA DATOTEKA definicije.pripravi_imenik('csv_datoteke/skupna.csv') imena_polj=['smucisce','cas','datum','vreme','temperatura','sneg','obratovanje','odprto','sedeznice','proge'] with open('csv_datoteke/skupna.csv', 'w', encoding='utf8') as dat: writer=csv.DictWriter(dat, imena_polj) writer.writeheader() for html_datoteka in definicije.datoteke('sneg/'):