体験を伝える―『ガジェット通信』の考え方

面白いものを探しにいこう 本物を体験し体感しよう 会いたい人に会いに行こう 見たことのないものを見に行こう そしてそれをやわらかくみんなに伝えよう [→ガジェ通についてもっと詳しく] [→ガジェット通信フロアについて]

Scalaプログラマから見た機械学習サーバー「Apache PredictionIO」とは?─by Scala福岡2017

デジタル・IT

機械学習の課題

竹添直樹さんはビズリーチでScalaのプログラマを務めながら、OSS開発や技術書(「Scalaパズル」「Scala逆引きレシピ」)の執筆、さらにはPredictionIOやGitBucket、Scalatraのコミッターを務めている。

今回は、セッションではScala製機械学習サーバ「Apache PredictionIO」について紹介した。

機械学習の一般的な課題は大きく2つある。1つはスケーラビリティ。データが増えたときに学習させたり予測する処理、学習用のデータが大量にあるのでストレージのスケーラビリティが求められる。

もう一つがガバナンス。開発・メンテナンス、運用などの効率などだ。これらの課題を解決するのがオープンソースの機械学習サーバ「Apache PredictionIO」である。

PredictionIOの特徴は、第一にカスタマイズ可能なテンプレートから予測APIをWebサービスとしてデプロイできること。

第二にライブラリとしてSparl MLlibやOpenNLPをサポートしていること。第三に学習データやモデルを格納するためのストレージの管理も統合していることだ。

つまりPredictionIOとは、AWSやGCPなどが提供するような機械学習サービスを自前で構築するための基盤ソフトウェア。細かいチューニングが可能でクラウドロックインが回避でき、オンプレでの活用ができるというものだ。

一般的に、機械学習はCPUのリソースを非常に使う。その際にマネージドサービスでは費用対効果が悪くなる場合があり、オンプレサーバで運用する方がコストメリットが出るケースが多い。

株式会社ビズリーチ 竹添直樹さん

Apache Software Foundationの役割

PredictionIOは2013年、PredictionIO社が設立され、オープンソースでの提供が始まる。2016年にSalesforceに買収されて、ASF(Apache Software Foundation)に寄贈された。現在、Apache Incubatorで開発が続けられている。

ASFはもともとApacheのためにできた非営利団体で、オープンソースのソフトウェアプロジェクトを支援。JavaやBigDataとオープンソースのトレンドを支え続けている。

具体的な役割は大きく3つ。まずは、オープンソースプロジェクトへのインフラ提供。次に法的訴訟から開発者の保護。第三はソフトウェアの法的権利の保障である。

1 2 3 4 5 6次のページ
CodeIQ MAGAZINEの記事一覧をみる
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。
GetNews girl / GetNews boy

オスカー2018年晴れ着撮影会