万年素人からHackerへの道

万年素人がHackerになれるまで殴り書きするぜ。

はじめての機械学習 ~気軽に機械学習を体験してみましょう~

はじめての機械学習

  • 2018/02/27

  • connpass

https://azure.connpass.com/event/79216/

参加以前

https://signup.azure.com/signup 30 日間の ¥ 22,500 のクレジットから開始し、引き続き無料でご利用いただけます

クレジット
1.
外貨を必要とする政府・会社などが、外国の政府・会社と短期の借入れの契約をすること。借款。信用供与。 「―を設定する」
2.
信用販売。

どういう意味?

f:id:shinriyo:20180227125602p:plain

クレジットの意味がわからないけど、ここにあった。 プリペイドカード?あらかじめ払う?と誤解されそう。

怖いので調べたらここにあった。

無料評価版のクレジットについて – Microsoft Azure サポート チーム サイト

行き方

渋谷ヒカリエの2Fからいける。

f:id:shinriyo:20180227114213j:plain

会場

f:id:shinriyo:20180227114443j:plain

Excelはあったほうが良さげ。 PCってあったけど、英語的にWindowsだが、MacBook Proだけど大丈夫。他にもMacの人居た。

講師:クラウドAIアーキテクトの方。

機械学習 予測・・・未来

統計解析 特定の仮説を立てて

データマイニング ものを見つけ出す

機械学習 データマイニング

深層学習・・・機械学習の一分野

教師データ・・・閾値を用意しておいてその75%が犬ですよなどで判断させる。

教師あり学習・・・よく使う 回帰・・・与えられたデータから数値を予測。需要予測でよく使う、飲料水など      昔はハードウェアのパワーがなかったのでデータを絞ってたが、今はいろんなパラメータを入れてる。

分類・・・与えられたデータからラベルを予測。      予測するようなものを「ラベル」

教師なし学習・・・データマイニングとほぼ同じ、マーケティングでよく使う          目標はどうやって与えるの?          正解データが存在してないので。

与えるデータと、結果の判断。人間の介入。 100%でないので、人間の介入はある。

強化学習・・・囲碁、将棋に使われる。マージン、こうすると得するよを学習させる。

クラスタリング・・・近いものでグルーピングする。

学習済みモデル

  • Cognitive Services 画像, 音声, 文章 AI民主化・・MSが一年前から言ってる。 Skypeは実はTranslaterが動いている。 Power Pointも。

  • Azure Machine Learning Studio

深層学習はできない。

学習モデルを作るもの

  • Cognitive Toolkit

C# C++ Pythonなど。 教化学習、Q学習、Tenserflowと似たもの。

Azure Machine Learning Studio

検索はAI検索と関わりが深い。

indexを使ってる。

Workbench

Jupyter pycharm

Cognitive Toolkit

オープンソース ハイレベル。 使い易い。 TensorFlowは情報量が多い。

決定木・・「けっていぼく」と言ってたが、「けっていぎ」だと思う。

金額の請求は実際に計算した時間。

・手書きのAIが試せる。 ↓ https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/

ASWは精度悪い。 Googleはいい。 IBMは結構高め。

f:id:shinriyo:20180227143309p:plain Azureは分ベース課金 昔は分ベース課金

ハンズオン

ここから入らないといけない。 f:id:shinriyo:20180227164417p:plain

これなら課金されないと思う。

f:id:shinriyo:20180227164358p:plain

いったん、作ったらここで選択する。

f:id:shinriyo:20180227164454p:plain

Split Dataは右の点、左の点に意味がある。

f:id:shinriyo:20180227170835p:plain

Vivaldiブラウザだと、Visualizeが選択できないっぽい・・・・。 しゃあなしでSafariを使った。

f:id:shinriyo:20180227154940p:plain

0.8は、モデルと検証データ(テスト)

仮説と検証

MacExcelでは対応してない・・・・

データ加工の時は課金されない

power draw > 消費電力 duty cycle > デューティサイクル(英: Duty Cycle)とは、周期的な現象において、"ある期間" に占める "その期間で現象が継続される期間" の割合である。制御、電気通信や電子工学で使う。

Volt drop > Voltage drop・・・電圧降下(でんあつこうか)とは、電気回路に電流を流したとき、回路中に存在する電気抵抗の両端に電位差が生ずる現象のこと。

ExcelのInputを入れてない状態で特にエラーが出ないのでてっきりサーバに繋がらないのかと思った・・。 Predictでダメだった。

f:id:shinriyo:20180227164538p:plain

statusを消したのは結果として知りたいものなので、入力では不要であるから。 statusが予測するラベル。

ショートカット

保存・・・control + Sで「Saving...」が実は出ている。アイコンは白のままなので見かけ上保存されたように見えないが・・。

f:id:shinriyo:20180227171701p:plain f:id:shinriyo:20180227171654p:plain

その他

ワークベンチとマシンラーニングは今後並行していく。

FPGAも対応。 Microsoftがやったのをお客さんに提供。

US・・・テロ対策。

データセンターは普通住所見せない。 MSは東京、埼玉などは公開 AWSは住所公開してない。

VisualStudio for AI