Amazon Machine Learning その② Amazon Machine Learningに触れてみる

早速ですがAWSにログインしてAmazon Machine Learningサービスを開いてみましょう。

と、ここで早速注意点が・・・。
2016年12月4日現在、東京リージョンではAmazon Machine Learningサービスが提供されていません。
なので、EU (アイルランド)か米国東部 (バージニア北部)リージョンを利用しましょう。

f:id:hosibui:20161204232625j:plain

ちなみに、東京リージョンでサービス提供されていないということは、日本語の公式チュートリアルも存在しません。
頑張って英語版読みましょう・・・

Tutorial: Using Amazon ML to Predict Responses to a Marketing Offer - Amazon Machine Learning

さて、気を取り直してリージョンをEU (アイルランド)か米国東部 (バージニア北部)に変更して画面を進めます。

f:id:hosibui:20161204234144j:plain

まずはInput Dataの設定

まずはInput dataとして、学習を行う為のデータを読み込ませます。
データの読み込ませ方には二種類の方法があり、

  • S3上に保存されているcsvファイルを指定
  • RDSかRedshift(共にデータベースサービス)上に保存してあるデータを指定

のどちらかの方法でデータを指定します。

今回は手元にある株情報のcsvファイルをs3にアップロードして使います。
本題じゃないので銘柄はなんでもいいのですが、例として9432のNTT株を使います。
なお、csvファイルは株価データサイト k-db.comさんからダウンロードさせて頂きました。

csvファイルはこんな内容ね。
2015/11/16~2016/12/2の約一年分のデータ。

f:id:hosibui:20161205002157j:plain

verifyボタンを押して先に進めようと思ったらこんな画面が。
Amazon Machine LearningがS3にアクセスしてもいいですか?ってメッセージなのでYESを選択

f:id:hosibui:20161205002709j:plain

と、エラーメッセージが出ました。
UTF-8にしろってメッセージでした。日本語が入ってるからかな?
日本語で改めてファイルをアップロードして再試行

"The validation is successful. To go to the next step, choose Continue " ってメッセージが出たら成功みたいです。

continueを押して次の画面に進むと、各スキーマの設定
それぞれのスキーマの種類が自動で選択されているので、問題がないかをチェックしてcontinueをクリック。
日付はできればTextじゃなくてdate型を指定したいんですが、選択肢にないものは仕方ない。

f:id:hosibui:20161205005445j:plain

次が似たような画面でTargetの設定。
予測させたいスキーマを選択する・・・ってことだと思います。たぶん
高値と安値を予測したいんですが、ひとつしか選択できなさそうなのでひとまず高値で。

f:id:hosibui:20161205005805j:plain

次がID項目の設定。
・・・ID項目って何だ?
説明読んだ感じ、レコードを特定するためのユニークな情報を選択すりゃいいのかな?
今回は日付を選択。

f:id:hosibui:20161205011219j:plain

最後にreviewで設定内容を見直して、問題なければcontinue

f:id:hosibui:20161205011055j:plain

これでInput Dataの設定は完了。
まだ全設定完了までの道のりは遠いですが今回はここまでです。

f:id:hosibui:20161205011744j:plain