Analizirala bom knjige glede na njihovo oceno na strani GoodReads.
Za vsako knjigo bom zajela:
- naslov in id naslova
- avtorja in id avtorja
- povprečno oceno
- število glasov za povprečno oceno
- končno oceno, ki je odvisna tudi od števila komentarjev, priporočil
- žanre knjige
Izluščila bom 3 razpredelnice in sicer:
- knjige: vsebuje vse od zgoraj naštetih podatkov razen žanra
- avtorji: vsebuje ime avtorja in id avtorja
- žanri: vsebuje id knjige in žaner, ki ji pripada
Delovne hipoteze:
- Ali se kakšen avtor pojavi večkrat in kako so ocenjene njegove knjige
- seznam knjig s povprečno oceno večjo ali enako 4.5
- ali obstaja povezava med popularnostjo knjige in njeno oceno
- kateri žanri so najbolj zastopani