今更ながら「言語処理 100 本ノック 2015」をやってみた。「素人の言語処理 100 本ノック:まとめ」の解説がなかったら無理だった。作者の方、ありがとうございます。
3 ~ 6 章がいわゆる構文解析に関する基本的な処理になると思われる。正規表現は普段あまり使わないので良い勉強になったし、言語を形態素解析して文の構成を分析する基本的な手法を学ぶことができた。5 章の日本語解析した結果を機械学習に用いるために数値変換するところまでやってみたかったが、英語と違って難易度が高いのだろうか。別の機会に調べて見たいと思う。