Amazon Machine Learning その② Amazon Machine Learningに触れてみる
早速ですがAWSにログインしてAmazon Machine Learningサービスを開いてみましょう。
と、ここで早速注意点が・・・。
2016年12月4日現在、東京リージョンではAmazon Machine Learningサービスが提供されていません。
なので、EU (アイルランド)か米国東部 (バージニア北部)リージョンを利用しましょう。
ちなみに、東京リージョンでサービス提供されていないということは、日本語の公式チュートリアルも存在しません。
頑張って英語版読みましょう・・・
Tutorial: Using Amazon ML to Predict Responses to a Marketing Offer - Amazon Machine Learning
さて、気を取り直してリージョンをEU (アイルランド)か米国東部 (バージニア北部)に変更して画面を進めます。
まずはInput Dataの設定
まずはInput dataとして、学習を行う為のデータを読み込ませます。
データの読み込ませ方には二種類の方法があり、
- S3上に保存されているcsvファイルを指定
- RDSかRedshift(共にデータベースサービス)上に保存してあるデータを指定
のどちらかの方法でデータを指定します。
今回は手元にある株情報のcsvファイルをs3にアップロードして使います。
本題じゃないので銘柄はなんでもいいのですが、例として9432のNTT株を使います。
なお、csvファイルは株価データサイト k-db.comさんからダウンロードさせて頂きました。
csvファイルはこんな内容ね。
2015/11/16~2016/12/2の約一年分のデータ。
verifyボタンを押して先に進めようと思ったらこんな画面が。
Amazon Machine LearningがS3にアクセスしてもいいですか?ってメッセージなのでYESを選択
と、エラーメッセージが出ました。
UTF-8にしろってメッセージでした。日本語が入ってるからかな?
日本語で改めてファイルをアップロードして再試行
"The validation is successful. To go to the next step, choose Continue " ってメッセージが出たら成功みたいです。
continueを押して次の画面に進むと、各スキーマの設定
それぞれのスキーマの種類が自動で選択されているので、問題がないかをチェックしてcontinueをクリック。
日付はできればTextじゃなくてdate型を指定したいんですが、選択肢にないものは仕方ない。
次が似たような画面でTargetの設定。
予測させたいスキーマを選択する・・・ってことだと思います。たぶん
高値と安値を予測したいんですが、ひとつしか選択できなさそうなのでひとまず高値で。
次がID項目の設定。
・・・ID項目って何だ?
説明読んだ感じ、レコードを特定するためのユニークな情報を選択すりゃいいのかな?
今回は日付を選択。
最後にreviewで設定内容を見直して、問題なければcontinue
これでInput Dataの設定は完了。
まだ全設定完了までの道のりは遠いですが今回はここまでです。