ガジェット通信

見たことのないものを見に行こう

徹底究明!「携帯電話の声は、本人の声ではない」説は本当!?【前編】 ~人の声が届くしくみ~

DATE:
  • ガジェット通信を≫

通信業界では、更なる技術向上に向け、日進月歩で研究が進められています。たとえば携帯電話に関しては、2014年に超高速通信サービス(LTE)による音声通話サービス「VoLTE」が登場。通話音声の品質は格段に向上し、より円滑なコミュニケーションが可能となりました。

そんななか、世間では「携帯電話から聞こえる声は、しゃべっている本人の声ではない」という噂が囁かれているのをご存知でしょうか?

そこで今回は、「携帯電話から聞こえる声って、いったいどんなしくみなのか知りたい!」と、KDDI研究所で、音声・音響技術の研究開発を担当している、堀内俊治氏へインタビューを敢行。前後編に分けて、この噂の真相を解明します! お伝えするのは、学校の理科室でおなじみの私、人体模型です!

モ「T&S読者の皆さんはじめまして。人体模型です。皆さんは、「携帯電話から聞こえる声は、しゃべっている本人の声ではない」って噂を知ってますか? 私も以前ネットで見て気になっていまして、今回はその真相を探るために、埼玉県はふじみ野市にあるKDDI研究所にやって来た次第です。」

 

ピンポーン。「あ、堀内さんにアポ取っている人体模型です」
 

「人体模型さん、お待ちしておりました。会議室へどうぞ」受付のお姉さんが笑顔で対応。かわいいなあ。

モ「おじゃましまーす。さすがKDDI、研究所広いっすね。すれ違う社員さんがみんな、僕のことを怯えた目で見ているのは気のせいかな? 会議室は……っとここだな。コンコン(ノック)。」

堀内「これはこれは人体模型くん。よく来てくれたね。KDDI研究所の堀内と申します。」

モ「はじめまして、人体模型です。あ、いま名刺切らしちゃってて。すいません。」

堀内「(名刺あるんだ……) 見るのは小学生のとき以来だけど、あいかわらず剥き出しなんだね。」

モ「仕事なんで、仕方ないんすよ……。あ、今日は例の噂の件、よろしくお願いします。」

堀内「はい、お話は聞いていますよ。」

モ「さっそくですけど、「携帯電話から聞こえる声は、しゃべっている本人の声ではない」って本当なんですかね? 聞いたときは結構衝撃を受けましたけど。」

堀内「人体模型くん、噂が本当かどうかを結論づける前に、まずは人の声のしくみの説明が必要です。」

モ「え〜、焦らすパターン……。まぁ時間あるし、いいですけど。でも「人の声のしくみ」って、いまいちピンとこないんスよね。」

堀内「つまり、人の声はどのようにして出しているのか? ということです。」

知っているようで知らない! 通話の大前提「人の声のしくみ」

堀内「ご存知の通り、人の喉の奥下には「声帯」という器官がありますね。……人体模型くん、ちょっと失礼。」

モ「あっ……。」

堀内「顔半分だけ借りますね。声というのは、まずこの声帯が振動するかしないか、そして通り道となる喉、口や鼻の形、舌、唇や歯の位置を変えることで、普段聴こえるような音として出てくるんです。」

①肺からの呼気により、音源が作られる。声帯の振動は、実はここでは「ブー」というようなブザーのような音で、音の高低の違いしかないのだ。
②喉、口や鼻で音源を共鳴させ、舌、唇や歯で空気中に放射する。
③人が話す声(音波)になる。

堀内「そして、その声というのは、大きく「有声音」と「無声音」に分類できます。」

モ「……「有声音」と「無声音」?」

堀内「有声音とは、母音をはじめとして、聴き取りやすい「ア」のような音。無声音とは、ただ空気を吐き出したような「スッ」「シッ」のような音のことです。もっと言うと、有声音とは声帯の振動を伴う音で同じ波の繰り返し、無声音は声帯の振動を伴わない音のことです。」

モ「声帯が震えるか震えないかで、声の出方が変化するってことスかね。声帯がないと、声はつくれないから。」

堀内「そうですね、それが基本です。」

モ「病気でやむを得ず、声帯を切除した患者さんでも、声を出せる方法があるって聞いたことありますよ。」

堀内「はい、それは”ブー”と振動する棒を利用する『人工咽頭』ですね。声帯を模擬した電気機器を喉に押し付けることで、発声を可能にしているんです。まさに、この人体のしくみを使った発声法です。」

モ「「声は口から出ている」ってつい思いがちだけど、声帯がかなり重要な役割を果たしてるってことッスね。よくわかりました。で、その声のしくみと、電話の通話ってどんな関係があるんです?」

噂は本当だった! 携帯電話から聴こえる声は、まさかの”合成音声”

堀内「大変大きな関係がありますよ。本題に入りましょう。たとえば固定電話だったら、人の声、つまり口から出した声をそのまま届けています。原理的にはね。」

モ「??? 電話で「人の声をそのまま届けている」って、つまりどういうこと? 糸電話みたいに、近くでつながっているわけじゃないし……。」

堀内「そう、糸電話と同じようなことです。糸が震えて声が届くように、固定電話では声を電気の波形に変え、電線に乗せて送っているんです。」

モ「ほほう。じゃあ噂は間違っていて、電話はやっぱり自分の声が相手に届いている、ってことッスね! あ〜スッキリした! 今日はありがとうございました!」

堀内「いやいや人体模型くん、ちょっと待って。このしくみは、携帯電話、つまり無線となると違っているんですよ。」

モ「なん…ですと……?」

堀内「携帯電話で通話をするときには、波形をそのまま届ける固定電話と違って「ハイブリッド符号化方式」という方法を使っています。そこでは、原理的には「本人の声に似て聴こえる声」を相手に聴かせているんです。限りなくの本人の声には近いけど、厳密には「つくられた声」なんです。」

モ「じゃあ、噂は本当ってこと……?」

堀内「携帯電話に関しては、事実です。」

モ「そうなのか……。でも僕、理科の先生に遅刻の電話をするときは、まちがいなく先生の声に聴こえますよ。それもつくられた声っていうことなんですか?」

堀内「はい、これが技術のすごいところですね。厳密には本人の声ではないけど、限りなく本人の声に近い声になっています。
えーと、携帯電話同士の「声が届くしくみ」は後から説明するのだけど、せっかくですから同じ合成音声でも分野の違うもののしくみから、説明していきましょう。」

モ「まだ焦らす……。でもなんか興味が湧いてきましたよ!」

合成音声の種類とその使い分けを徹底解説!

堀内「同じ合成音声でも、分野の違うもの。それは皆さんの身近なところにある、Siriや、初音ミクのことです。」

モ「Siriや初音ミク。あの2人は明らかに合成音声って感じだけど、流暢に人間の言葉を話しててすごいなぁって思ってました。」

堀内「あの2つは、もともと声優さんがいて成り立つ合成法を使っているんですよ。」

モ「声優がいるの!?」

堀内「そうそう、SiriにはSiriの声優さんがいて、初音ミクには初音ミクの声優さんがいます。でも、そうとは思えないくらい、いろんな言葉を話すでしょう?」

モ「まさか、あらかじめ声優を使って全部の言葉を録音しているってことッスか……!?」

堀内「それが違っていて、この合成方法というのは、声優さんの声をひと通り収録したら、それらの素材をつなぎ合わせることで、多様な発声表現を可能にしています。」

モ「なるほど……Siriや初音ミクは、声優さんの声なんですね。で、携帯電話がそのしくみと違うっていうのはどういうことです?」

堀内「携帯電話には、声優がいないんです。携帯電話の声は確かに合成音声だけど、はじめに説明した人間の発声のしくみを応用して、限りなく本人に近い声をつくり出しています。これから、その方法を説明しますね。」

普段、なに気なく発している私達の「声」について、より深く知ることができた人体模型くん。堀内さんによると、一口に合成音声をつくると言ってもいろいろな方法があるようです。

続く後編では、携帯電話で使われている合成音声が一体どのようなしくみなのか、ちょっとマニアック(!?)なしくみを、デジタル知識とともに解説していきます。後編では、堀内さんの相棒”模型くん”も登場! 仲良くなれるかな?

関連リンク

au VoLTE(ボルテ)
KDDI研究所HP
音声合成ソフトウェア「N2」

※掲載されたKDDIの商品・サービスに関する情報は、掲載日現在のものです。商品・サービスの料金、サービスの内容・仕様などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。

関連記事リンク(外部サイト)

【検証】 居酒屋をどこまでIT化できるか?
そもそもの話、爆混みの渋谷で、なぜスマホはしっかりつながる?
次世代通信システム「5G」で、私たちの生活はどう変わるの?

TIME & SPACEの記事一覧をみる ▶
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。

TOP