体験を伝える―『ガジェット通信』の考え方

面白いものを探しにいこう 本物を体験し体感しよう 会いたい人に会いに行こう 見たことのないものを見に行こう そしてそれをやわらかくみんなに伝えよう [→ガジェ通についてもっと詳しく] [→ガジェット通信フロアについて]

MITが開発の自動機械学習システム、仕事効率はデータサイエンティストの100倍速オーバー!

企業などでデータを分析して課題解決に導くデータサイエンティストは、さぞかし高度な仕事をこなしていると考えられがちだが、実は業務のうちの膨大な時間を、モデルの選択やパラメーターのチューニングなどの泥臭い作業に費やしている。

こうした作業には時間や手間だけではなく専門的知見や経験も必要だが、最近ではモデルの選択/チューニングプロセスの自動化手法が用いられるようになってきた。

今回ご紹介する自動機械学習システムもそのなかの1つ。なんでも「人間より100倍以上高速」とのことで、企業の機械学習導入のティッピングポイントとなる可能性も指摘されている。

MITとミシガン州立大学の研究者による自動機械学習システム、「Auto Tune Models(ATM)」は、どこがそんなにすごいのだろうか。

・数千のモデルを並行してテスト

機械学習では、どのモデルを使ってデータを解釈するかの選択や、ニューラルネットワークを何層にするかなどのハイパーパラーメーターのチューニング…といった面倒な作業を経て最適な分析結果を導き出す。

選択するモデルによって発見できる事柄が変わってくるので、例えば、モデルにサポートベクターマシンを選択して結論を出した場合も、常にほかの選択肢からのものが気がかりとなるだろう。

ATMは、作成した数千パターンのモデルを並行テストして評価。特定タスクに対して最も適したモデルに多くの計算リソースを割り当ててその結果を表示する。これによって、研究者は容易に異なるいくつもの手法を比較することができるのだ。

・最適なモデルの作成を1日で

ATMでは、クラウドベースのコンピューティング環境を使用して、扱う課題に対しての最適なモデルを決定する。

MITとミシガン州立大学の論文によると、ATMはモデルの選択において速度・精度ともに人間よりも優れたものだったようだ。

機械学習のクラウドソーシングプラットフォームOpenML.orgを利用して、人間とATMを比較したところ、ATMは47のデータセットを分析して人間よりも優れた解決策を見出した。

さらにはOpenMLでの、解決策を提示するのに要する平均時間が200日なのに対し、ATMは最適なモデルの作成に1日もかからなかったとのこと。

完全な自動化ではなく結果の比較がデータサイエンティストの手に委ねられている点で人間に仕事を残してくれている。モデル選択プのロセスを自動化することで、データサイエンティストはより複雑な業務にリソースを割くことができるというわけだ。

ATMの活用で、機械学習を迅速かつ容易に扱うことができて、人材不足といわれるデータサイエンティストの能力のギャップを補完し、企業の機械学習導入を後押しするだろう。

参照元:Auto-tuning data science: New research streamlines machine learning/MIT News

Techableの記事一覧をみる
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。

山寺宏一&高木渉で『ポプテピピック』

GetNews girl / GetNews boy