体験を伝える―『ガジェット通信』の考え方

面白いものを探しにいこう 本物を体験し体感しよう 会いたい人に会いに行こう 見たことのないものを見に行こう そしてそれをやわらかくみんなに伝えよう [→ガジェ通についてもっと詳しく] [→ガジェット通信フロアについて]

DataRobotシバタアキラ氏が語る「誰もが簡単に、機械学習による予測分析ができる時代が来る」

DataRobotシバタアキラ氏「レンジでチンする機械学習」をテーマに登壇

登壇者のシバタアキラさんは、元々物理学の出身。ロンドン大学で高エネルギー物理学を学び博士号を取得。この頃よりPythonを使い始めたという。

2007年よりニューヨーク大学に移ってからは、データサイエンティストとして加速器データの統計モデル構築を行い、ヒッグス粒子の発見に貢献。物理学の基礎研究分野でデータ分析に携わっていた。

▲DataRobot Inc. シバタアキラ氏

2010年には戦略コンサルティングファームに転職。3年間コンサルタントとして活躍した後に、白ヤギコーポレーションのCEOに就き、ニュースキュレーションアプリ「カメリオ」の開発を行う。自然言語解析に携わる。

2015年にDataRobotに転職し、現在はデータサイエンティストとして活動している。その一方で、2014年よりPyData.Tokyoというコミュニティ活動も実施。Pythonを使ってデータ分析をする実務者のための勉強会などを開催。

このコミュニティはデータサイエンティストたちのたまり場として、すごく面白いことになっているのだそうだ。

今回の講演タイトルは「レンジでチンする機械学習」。つまり電子レンジを使えば簡単に調理できるのと同様、人工知能系技術において、「誰もがすごく簡単に使えるようになる」と語る。

そしてそのとき、「エンジニアはどう関わっていけるのかについて話をしていきたい」とシバタ氏は説明し、本題へと入っていった。基調講演の概要は以下の通り。

AIはすでにビジネスやスポーツ分野で活用されている

まずは人工知能とは何かについて。データはBIからAIへという象徴的な動きが起こっている。1つはデータベースの技術の発展。今はビッグデータと言われるさまざまなデータを溜めて分析する技術が求められている。

Hadoopはその代表的な技術だ。データを見るための技術もTableauをはじめ、さまざまなBIツールが登場し、発展している。

BIは記述統計と言われる分野だが、AIはデータを使って未来のことが予測できるようになる。これが今起こっている最も大きな変化である。

AIの要素技術はさまざまあり、機械学習やディープラーニング(深層学習)はその一部でしかない。機械学習とはパターン認識能力のことで、人が常日頃に自然に行っているパターン認識能力を使ってさまざまなことを予測する。

例えば前回のイベント参加人数が500人ぐらいだった場合、今回もそれぐらいの人数は参加するだろうと予測できるのもこの能力を活用しているからだ。

そして機械学習の一種であるディープラーニングは、人が定義することなく学習データから機械が特徴を抽出して識別するため、画像や音声など、今まではデータとして認識されていなかったものを入力値として使えるようになった。

予測には次の種類がある。1つは分類。カテゴリー分類するのは価値分類と言う。

もう1つは回帰で、例えば「今日、何人お客さまが来ますか?」という連続値や数値を予測するのが回帰で、機械学習が得意とする分野である。

例えば為替の動きや機械からはき出されるデータをモニタリングして故障するタイミングを予測するなどということにも応用されている。

そのほかにも、インターネット系のサービスであればレコメンデーションなどに使われていたりする。ここで挙げたのは、答えが事前にわかっているデータを用いて、パターンを学習するという種類のもの。

過去のデータに基づいてまだ見ていない未知のデータについて予測していくのが、基本的な機械学習のモデルの作り方となっている。

さらに進んだものだと、そういう答えがなくてもタイプ分けをするクラスタリングのような技術や、トポロジカル分析という技術がある。後者の技術についてはシバタ氏も注目しているという。

1 2次のページ
CodeIQ MAGAZINEの記事一覧をみる
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。