トランプ氏の演説も作れてしまう⁉︎1分間聞かせるだけで声をコピーできるアルゴリズムを開発

fullsizeoutput_294c人によって表情や性格、考え方が違うように、声にもそれぞれ特徴がある。固有のものだと思われてきた声だが、1分間聞かせるだけで声をコピーできるアルゴリズムをカナダ・モントリオールのスタートアップ「Lyrebird」が開発した。

・模倣音声で議論も

同社のサイトでは、サンプルとしてアメリカのトランプ大統領、オバマ前大統領、ヒラリー・クリントン氏のコピー音声による議論を公開している。

それを聞くと、会話は機械的なところがあり若干ぎこちないものの、各氏の声の特徴をよく捉えている。知らされなければ「模倣してマシーンでつくられた声」と気づかない人もいるのではないかと思わせるレベルだ。

・たったの1分で特徴を収集

このアルゴリズム、モントリオール大学のラボで開発されたディープラーニニング(ニュートラルネットワークを用いた機械学習)をベースに構築された。1分ほど“本当の声”を聞かせて声の特徴を集め、そのデータをキーに変換して音声をつくるのだ。

社名のLyrebirdは日本語で「ココドリ」という鳥の名称。ココドリが他の鳥の声や、あらゆる音を上手に真似ることにちなんでいる。

・オーディオブックに活用?

もちろん、声の模倣というのは、倫理的な危うさをはらんでいる。最近では、指紋同様に声を生体認証として使うサービスも開発されているだけに、悪用の可能性を指摘する声もでてきそうだ。

この点について、Lyrebirdは「この技術を一般公開し、誰でも使えるようにすることで、声はコピーできるものととらえてもらう」としている。また、技術の実用化としては、オーディブックやスピーチアシスタント機能などへの活用を想定しているようだ。

声をコピーできるとはなんとも不思議な感じがするが、興味のある人はまずはサンプルを聴いてほしい。

Lyrebird

  1. HOME
  2. デジタル・IT
  3. トランプ氏の演説も作れてしまう⁉︎1分間聞かせるだけで声をコピーできるアルゴリズムを開発
Techable

Techable

ウェブサイト: https://techable.jp/

  • ガジェット通信編集部への情報提供はこちら
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。