トランプ氏の演説も作れてしまう⁉︎1分間聞かせるだけで声をコピーできるアルゴリズムを開発

2017/05/10 00:00 Techable

人によって表情や性格、考え方が違うように、声にもそれぞれ特徴がある。固有のものだと思われてきた声だが、1分間聞かせるだけで声をコピーできるアルゴリズムをカナダ・モントリオールのスタートアップ「Lyrebird」が開発した。

・模倣音声で議論も

同社のサイトでは、サンプルとしてアメリカのトランプ大統領、オバマ前大統領、ヒラリー・クリントン氏のコピー音声による議論を公開している。

それを聞くと、会話は機械的なところがあり若干ぎこちないものの、各氏の声の特徴をよく捉えている。知らされなければ「模倣してマシーンでつくられた声」と気づかない人もいるのではないかと思わせるレベルだ。

このアルゴリズム、モントリオール大学のラボで開発されたディープラーニニング（ニュートラルネットワークを用いた機械学習）をベースに構築された。1分ほど“本当の声”を聞かせて声の特徴を集め、そのデータをキーに変換して音声をつくるのだ。

社名のLyrebirdは日本語で「ココドリ」という鳥の名称。ココドリが他の鳥の声や、あらゆる音を上手に真似ることにちなんでいる。

もちろん、声の模倣というのは、倫理的な危うさをはらんでいる。最近では、指紋同様に声を生体認証として使うサービスも開発されているだけに、悪用の可能性を指摘する声もでてきそうだ。

この点について、Lyrebirdは「この技術を一般公開し、誰でも使えるようにすることで、声はコピーできるものととらえてもらう」としている。また、技術の実用化としては、オーディブックやスピーチアシスタント機能などへの活用を想定しているようだ。

声をコピーできるとはなんとも不思議な感じがするが、興味のある人はまずはサンプルを聴いてほしい。

2017/05/10 00:00 Techable