MIT研究者がセキュアなマシーンラーニングを爆速化！AIがクラウド上で安全につかえる

2018/08/20 21:00 Techable

データ解析やマシーンラーニング（ML）をクラウド上でおこなうケースが増加傾向にあるが、データの流出が懸念事項だ。なかでも、医療データなど重要な個人情報を含むものについては、処理の段階で人目に触れることすら抵抗があるだろう。

こうした問題を解決するためは、匿名化したままデータを処理する秘匿計算が用いられる。ただし、秘匿計算はデータをそのまま処理する場合と比べて何百万倍も遅くなることがあり、これが実用に支障をきたしている。

実は日本でもさかんに研究が進められているこの分野だが、このほどMITの研究者が、クラウド上でおこなう秘匿計算を爆速化する手法を見いだしたようだ。

・「準同型暗号」と「Garbled Circuit」を組み合わせる

MITの研究者は、暗号化手法の「準同型暗号」と「Garbled Circuit（スクランブルされた回路）」を組み合わせることで、プライバシーを保ったままのMLを、従来のアプローチよりも数桁速く動作するようなシステムを開発した。

「準同型暗号」では、複数の暗号文を演算してから全体として処理。暗号化された結果を生成する。

ただ、ニューラルネットワークで利用する際は、データに含まれるノイズが複数レイヤーにわたって累積するため、ノイズのフィルタリングに要する計算量が膨大になるのが欠点。

「Garbled Circuit」では、2者間の入力を暗号化したまま計算する。こちらも、計算の複雑さに比例してネットワークの帯域幅が大きくなるため、計算量の多いMLでの活用が難しい。

そこで研究者は、各レイヤーで一度におこなわれる計算量を最適に制御して、2つの手法を組み合わせた。

「GAZELLE」と呼ばれるこのシステムで、暗号化された画像の分類処理をテストしたところ、最先端のモデルよりも20～30倍高速に動作し、ネットワークの帯域幅も1桁小さくなったとのこと。

「GAZELLE」は、医用画像診断などで有効活用が期待できる。医用画像診断における学習モデルは、患者のデータを用いて訓練する必要があったため、安全で効率的に再利用することが難しかった。

「GAZELLE」を活用すれば、病院がMRI画像を用いてニューラルネットワークによるトレーニングを実施。学習モデルを作成できて、さらには他の病院もアップロードしたMRI画像から病状を識別するなどの利用が可能となるという。

次のステップとしては、いよいよ医療データを用いてテストするようで、実用に耐えられるパフォーマンスを発揮してくれることを期待したい。

2018/08/20 21:00 Techable