Amazon Machine Learning その① そもそも機械学習とは。Amazon Machine Learningとは

最近の流行りのビッグデータとか機械学習とかIoTとかAIとか勉強したいなーって前々から思ってたので、今回は表題の通り、Amazon Machine Learningについて学習します。

まずはAmazon Machine Learningがどういうサービスかの調査

参考にしたページ:
AWS再入門 Amazon Machine Learning編 | Developers.IO

そもそも機械学習とは、その名の通り機械(≠ロボット)に学習をさせて、その学習結果を活用すること。
もうちょっと具体的に言うと機械に大量のデータを読み込ませることによって、そのデータ内に潜むパターンを発見(これを学習という)させることにより、その学習した結果を新たなデータにあてはめることで、パターンにしたがって将来を予測すること。

更に分かりやすくするために具体例を挙げるとディズニーの日毎の入場者数,曜日,天気,気温あたりを100日分くらい読み込ませておきます。
すると、祝休日は入場者数が多いとか、気温が寒すぎたり暑すぎたりする日は入場者数が少ないとかのパターンを機械が発見してくれて、それによって3日後とかの天気予報と曜日とを入力しておけば入場者数を予測してくれる、みたいな感じです。

今のディズニーの例で挙げたような入力データから数値の予測を行う場合には"回帰"と呼ばれる学習手法を使うことになりますが、Amazon Machine Learningではそれ以外にも"二項分類"と"多項分類"という学習手法を使用できるようです。
それぞれ簡単に説明すると以下のようなものです。

  • 二項分類
    • 結果がYesかNoの2択(○と×でもいいです)のどちらかで表すことができるもの。 例えば、花子さんって名前を入力したときに、その名前が女性らしい名前か男性らしい名前かを判断するような機能です。
  • 多項分類
    • 結果が複数パターンの中から選択されるもの。ただし、有限な範囲で。 例えば、(ネットショッピングの)Amazonでいう『この商品はこんな商品も買っています。』みたいな感じで関連性をみつける機能って感じですかね。 ・・・ちゃんと理解してないので違ってたらすみません。m( )m
  • 回帰
    • 先ほどのディズニーのように入場者数を予測したりと、数値を予測するもの。

単純に考えると
簡単 二項分類 > 多項分類 > 回帰 複雑
であって、つまり精度も 二項分類 > 多項分類 > 回帰 になりそうな気がするんだけどどうなんだろうなー

次回あたりからMachine Learningを使っていきたいと思います。