ガジェット通信

見たことのないものを見に行こう

DataRobotシバタアキラ氏が語る「誰もが簡単に、機械学習による予測分析ができる時代が来る」

DATE:
  • ガジェット通信を≫

DataRobotシバタアキラ氏「レンジでチンする機械学習」をテーマに登壇

登壇者のシバタアキラさんは、元々物理学の出身。ロンドン大学で高エネルギー物理学を学び博士号を取得。この頃よりPythonを使い始めたという。

2007年よりニューヨーク大学に移ってからは、データサイエンティストとして加速器データの統計モデル構築を行い、ヒッグス粒子の発見に貢献。物理学の基礎研究分野でデータ分析に携わっていた。

▲DataRobot Inc. シバタアキラ氏

2010年には戦略コンサルティングファームに転職。3年間コンサルタントとして活躍した後に、白ヤギコーポレーションのCEOに就き、ニュースキュレーションアプリ「カメリオ」の開発を行う。自然言語解析に携わる。

2015年にDataRobotに転職し、現在はデータサイエンティストとして活動している。その一方で、2014年よりPyData.Tokyoというコミュニティ活動も実施。Pythonを使ってデータ分析をする実務者のための勉強会などを開催。

このコミュニティはデータサイエンティストたちのたまり場として、すごく面白いことになっているのだそうだ。

今回の講演タイトルは「レンジでチンする機械学習」。つまり電子レンジを使えば簡単に調理できるのと同様、人工知能系技術において、「誰もがすごく簡単に使えるようになる」と語る。

そしてそのとき、「エンジニアはどう関わっていけるのかについて話をしていきたい」とシバタ氏は説明し、本題へと入っていった。基調講演の概要は以下の通り。

AIはすでにビジネスやスポーツ分野で活用されている

まずは人工知能とは何かについて。データはBIからAIへという象徴的な動きが起こっている。1つはデータベースの技術の発展。今はビッグデータと言われるさまざまなデータを溜めて分析する技術が求められている。

Hadoopはその代表的な技術だ。データを見るための技術もTableauをはじめ、さまざまなBIツールが登場し、発展している。

BIは記述統計と言われる分野だが、AIはデータを使って未来のことが予測できるようになる。これが今起こっている最も大きな変化である。

AIの要素技術はさまざまあり、機械学習やディープラーニング(深層学習)はその一部でしかない。機械学習とはパターン認識能力のことで、人が常日頃に自然に行っているパターン認識能力を使ってさまざまなことを予測する。

例えば前回のイベント参加人数が500人ぐらいだった場合、今回もそれぐらいの人数は参加するだろうと予測できるのもこの能力を活用しているからだ。

そして機械学習の一種であるディープラーニングは、人が定義することなく学習データから機械が特徴を抽出して識別するため、画像や音声など、今まではデータとして認識されていなかったものを入力値として使えるようになった。

予測には次の種類がある。1つは分類。カテゴリー分類するのは価値分類と言う。

もう1つは回帰で、例えば「今日、何人お客さまが来ますか?」という連続値や数値を予測するのが回帰で、機械学習が得意とする分野である。

例えば為替の動きや機械からはき出されるデータをモニタリングして故障するタイミングを予測するなどということにも応用されている。

そのほかにも、インターネット系のサービスであればレコメンデーションなどに使われていたりする。ここで挙げたのは、答えが事前にわかっているデータを用いて、パターンを学習するという種類のもの。

過去のデータに基づいてまだ見ていない未知のデータについて予測していくのが、基本的な機械学習のモデルの作り方となっている。

さらに進んだものだと、そういう答えがなくてもタイプ分けをするクラスタリングのような技術や、トポロジカル分析という技術がある。後者の技術についてはシバタ氏も注目しているという。

機械学習は既に幅広い分野で応用されている。例えば野球チームの中には、「この選手はヒットを打てるか」を予測し、選手を起用したりしている。

また保険会社では、病気にかかるリスクなどのモデルを作成し、そのリスクを予測している。これらのモデルはこれまで専門家の人が経験と勘で作るしかなかった。しかし今はDataRobotを使えば、誰もが簡単にできるようになっている。そういう時代が来ている。

「DataRobot」は世界最高クラスのデータサイエンティストが開発

タイトルの「レンジでチンする機械学習」は、AI Labの西村氏が付けたのだが、「レンジでチンして料理ができるのと同様、機械学習も簡単になった」ということ。

料理も昔は木を切ってきて火をおこすというところから始まっていたのが、今やレンジの中に入れてボタンを押したら料理ができるという時代になった。機械学習もそこまできており、それに貢献しているのがDataRobotである。

DataRobotはKaggleという世界中のデータサイエンティストたちが最適モデルを競い合う場所で、何度も1位に輝いたという世界最高クラスのデータサイエンティストが集まっている会社だ。

その彼らが知識のない人でも機械学習を活用した分析が簡単にできるように作ったのがDataRobotというサービスだ。

DataRobotのデモでは、Lending Clubというお金を必要としている借り手と、資産を運用したい個人投資家とをWeb上でマッチングするサイトを運営している会社の過去データをDataRobotに読み込ませて実施。

データには各個人のローンの額や勤続年数、返済があったかどうかなどの情報が入っていた。これらの過去のデータを使って予測するには、自社のデータに精通したデータサイエンティストやデータ系のエンジニアに依頼して、予測モデルの作成、およびプログラミング必要になる。

DataRobotの場合は、データを読み込ませて開始ボタンを押すとターゲットという予測するモノが決まり、最も精度の良い予測・分析モデルを提案してくれる。

ただ、簡単に使えるだけではない。データサイエンティストなど、データ分析のプロでも満足できるような詳細設定もできるようになっている。

例えば分析結果をAUCで見たり、また自動で作成されたモデルが一般的に使えるモノかどうか、妥当性の検証・確認ができる交差検定の機能も提供している。

最大の特徴は、20種類にもおよぶアルゴリズムを自動でパラメータチューニングしながらいくつも試して予測モデルを作成するところだ。

Pythonのオープンソースのアルゴリズムもあれば、DataRobot社のデータサイエンティストが作成した独自のものもある。20種類もの予測モデルを一気に作成できることで、精度の高い予測ができるというわけだ。

DataRobotを自社のサービスに導入したいというときは、APIが提供されているのでプログラミングは不要。「モデルのデプロイ」というボタンを押すだけで完了する。

機械学習が専門の知識のない人でも簡単に使えるように

DataRobotを活用すれば、今まで一握りの人しか使えなかった機械学習が、解析の専門知識の無い人でも簡単に使うことができるようになるというわけだ。

機械学習や人工知能は技術としてはすでに完成しているが、それをどのように応用していくかは人間のクリエイティブ力にかかっている。

もう一つ大事なことがある。それはデータ収集にも戦略が必要になるということ。「こういう予測をするからこういうデータが必要になる」ように、データ収集の段階から戦略性を持つことが求められる。

また一度作ったモデルは永遠に通用するわけではない。時間の経過と共に人の行動も変わってくるため、モデルの精度も落ちてくるからだ。従ってモデルの精度についても、モニタリングしていくことも必要になる。

AIは最終的に現場の問題解決をしないと価値がない。例えば明日、お客さんがサービスをやめることがわかったときに、どうしたら辞めないでいてくれるかという対策。

いかにすれば人の行動を変えられるかについては、私たち人間が考えなければいけないところだ。DataRobotでAIが簡単に活用できるようになったこれからは、そこが重要になってくる。

DataRobotの登場により、機械学習を誰もが簡単に活用できるようになった。今後は目的が実現できるデータをいかに精度良く収集するか、データ収集の企画ができる人や、DataRobotで解析された結果をいかにビジネスに応用していくのか。

データ活用によるビジネス戦略の立案ができる人が求められていくということだろう。

第5回CodeIQ感謝祭「食欲とプログラミングの秋」開催!

次回のCodeIQ感謝祭は、9月24日に開催します。今回も司会の喜屋武ちあきさんをはじめ、澤円さん、増井雄一郎さんほか、豪華ゲストがたくさん!

なんとヨッピーさんと伊藤直也さんのパネルディスカッションも実現します。まだ未発表の登壇者やテーマも正式決定したらお伝えしていきますので、まずはこちらから参加表明をどうぞー!

カテゴリー : デジタル・IT タグ :
CodeIQ MAGAZINEの記事一覧をみる ▶
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。

TOP