Skip to content

john-smith/jubatus_hackathon2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

なにこれ?

jubatus ハッカソンにて作成したもの ユーザに興味なさそうなニュースも読ませたかった

なお、提供いただいた読売新聞の記事データは勝手に公開できないものと思われるので、 残念ながらこのプログラムを動かすのは難しい (スクレイプしたデータを追加できるので全く無理ではない)

何ができるの?

jubatusを使って記事の付いているジャンルの推定を行うモデルを作成

現在読んでいる記事に対してジャンル推定を行った際もっともスコアの低い予測ラベルをジャンルとして持つ記事を推薦
コンソール上で動作するのでブラウザバックなどもできず出された記事を読むしかない

見出しを10件表示して、その中からユーザが選択できるよになっているので 一見自らの意思で選択しているように思えるが、実は選ばされている

コンソール上で動くので仕事しているふりをしながら新聞が読めます。

プログラム

  • genre_classify.py
  • 記事を読むためのプログラム
  • 最初に日付降順でソートしたもの上位10件から一つ選択させられる
  • その後は選択した記事からスコアの低いラベルを持ってきてそれに属する記事を日付順でソートしたものから選択を繰り返す
  • get_url.py
  • 読売新聞新着記事urlリストを取得します。
  • add_data.py
  • urlを入力するとその記事に関する情報が登録されgenre_classify.pyで読めるようになる
  • genre_classifyでは選択肢の幅が狭いので積ん読もすくなくなるね!
  • get_url.pyで取得したものを入れるといいです(連携させずにあえて苦労してもらってます)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages