転移学習を用いた天海春香AI
詳しくは天海春香会話bot開発チャレンジ3 - かわみのメモ帳を参照。
赤間 怜奈, 稲田 和明, 小林 颯介, 佐藤 祥多, 乾 健太郎: 転移学習を用いた対話応答のスタイル制御, 言語処理学会第23回年次大会 発表論文集, pp.338-341, 2017
で提案されている手法をそのままChainerで実装。
発話生成には一般的なEncoder-Decoderモデルを用い、事前学習とスタイル付与学習の際に一部語彙を入れ替え。
なお、この実装自体に特に天海春香要素はありません。
MeCab本体およびPythonバインディングをインストールし、config.ymlに値を設定したのち、
python3 transfer.py
で動くと思われます。ただしお手数ですが、ソースコード中のTRAINの値をTrueにしないと学習モードになりません。GPUの設定も然り。
だいたい見ていただければどこに何の値を設定すれば良いのかお分かりかと思います。
ちなみに"max_vocab_size"は事前学習およびスタイル付与データを用いた学習で用いる最大語彙数、
"replaced_vocab_size"はスタイル付与データを用いた学習の際に入れ替える語彙数です。