機械学習を勉強したいのだ!

 こんにちは。

 前の日記に書いたとおり、趣味で色々な分野の勉強をしていければいいなと思います。現在、私が興味あるのは「機械学習」という分野です。

 機械学習は、人工知能の研究分野の一部でして、データからパターン認識を学習する方法のようです。応用例としては、画像認識・スパム検知・Web検索(ページランク)に用いられています。機械学習をツールとして、身の回りで利用できれば便利ですよね。

 さて、「お前は機械学習を専攻してたのか?」と問われた時、胸を張って「いいえ、違います。」と回答する自信があります。ゼロからのスタートでございます。まさにFrom Ground State状態でございます。

 どの参考書からつついていけばよいのでしょうか。私がこの間、三省堂で衝動買いしてしまった本はこちらの本です。

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

 

  どうやら、プログラミング言語Python」を用いて実装していくようです。Pythonはあまりつついたことが無いですね。OpenCVという画像処理ライブラリで遊んだときに少しつついたことがあるくらいでして。まぁ、私自身、プログラム歴1年の初心者なわけですが。(しかも趣味レベル。)

  Amazonページから引用した目次は以下のようになります。

1章 「データから学習する能力」をコンピュータに与える
2章 分類問題 —機械学習アルゴリズムのトレーニング
3章 分類問題 —機械学習ライブラリscikit-learnの活用
4章 データ前処理 —よりよいトレーニングセットの構築
5章 次元削減でデータを圧縮する
6章 モデル評価とハイパーパラメータのチューニングのベストプラクティス
7章 アンサンブル学習 —異なるモデルの組み合わせ
8章 機械学習の適用1 —感情分析
9章 機械学習の適用2 —Webアプリケーション
10章 回帰分析 —連続値をとる目的変数の予測
11章 クラスタ分析 —ラベルなしデータの分析
12章 ニューラルネットワーク —画像認識トレーニング
13章 ニューラルネットワーク数値計算ライブラリTheanoによるトレーニングの並列化
付録 Jupyter Notebookの基本/matplotlibによる可視化/行列の固有分解

  8月中には読破したいと考えております。勉強しますかね。