体験を伝える―『ガジェット通信』の考え方

面白いものを探しにいこう 本物を体験し体感しよう 会いたい人に会いに行こう 見たことのないものを見に行こう そしてそれをやわらかくみんなに伝えよう [→ガジェ通についてもっと詳しく] [→ガジェット通信フロアについて]

しゃべった言葉がそのままテキストに! スゴい音声入力ソフト『AmiVoice SP』を調教する

「百花繚乱」と言ったら、「百科料理」になりました

アドバンスト・メディアは、話すだけでリアルタイムに文字化できる音声認識ソフトの新製品『AmiVoice SP』を7月23日に発売しました。『AmiVoice SP』は、キーボードを使わずともマイクに向かって話すだけで文字入力を行うソフトです。不特定話者対応の音声認識技術『AmiVoice』を搭載しており、使用する前の声の登録が不要なため、だれでも簡単に使うことができます。また、用途に応じた4種類のマスター辞書や、音声認識精度を向上させる学習機能を搭載していることにより高い認識率を実現しているそうです。

その他、mp3などの音声ファイルにも対応しており、ICレコーダーで録音した内容を文字に書き起こすことができます。ただし条件として、口元からマイクの距離が5cm以内で録音した音声で、かつ、はっきりとした音声でなくてはいけません。メモ代わりに外部録音機器に録音して文字化する使い方を想定しており、会議や講演会などマイクの距離が遠いと認識できないそうです。精度があがってくれば、テープ起こしから開放されるのも夢ではない、ということですね。

そもそも、音声認識技術自体は昔から研究されていたテクノロジーのひとつ。ですが、正直、これまでの認識率は低いものでした。しかし、周辺雑音の排除等の技術の進歩と共に音声認識技術は進歩し、人工知能を搭載した機械とのコミュニケーションが取れるレベルまで来ていると言われています。そんな中登場したこの『AmiVoice SP』、果たしてどこまですごいのか? ガジェット通信はこのソフトを使い、色々と実験してみました。

– すごい! だいたいあってる

『AmiVoice』使用例(図上が元文、下が『AmiVoice』による文章)

原文
おはようございます。ガジェット通信の樹堂です。
今日は、『AmiVoice』の実験をします。
私の先輩には、百花繚乱という人がいます。
ニコニコ生放送(通称ニコ生)をしている人で、
巷で話題になっているらしいです。
今日、彼に誘われてニコニコ生放送に出ることになりました。
突然の誘いだったのでびっくりしましたが、
面白そうなので今から楽しみです。
「やーい、おまえんち、お化け屋敷!」
生麦生米生卵生麦生米生卵生麦生米生卵
たあぷぽぽ、たあぷぽぽ、ちりから、ちりから、つったっぽ、 
たっぽたっぽ一丁だこ、落ちたら煮て食お。

AmiVoice
おはようございます。ガジェット通信の樹堂です。
今日は、「 AmiVoice 」の実験をします。
私の先輩には、百花繚乱という人がいます。
ニコニコ生放送(通称に児玉)をしている人で、
ちまたで話題になっているらしいです。
今日、彼に誘われてニコニコ生放送に出ることになりました。
突然のお誘いだったのでびっくりしましたが、
面白そうなので今から楽しみです。
下記からご自愛、お前んち、お化け屋敷!」
生麦生米生卵生麦生米生卵生麦生米生卵
あとところ、カープところ、チリから、チリから、釣った後、 
8本だと1兆だっこ、落ちたら見てくを。

適当に書いた文章を読んでみます。今回は『しゃべりことば』でやってみました。結果は上の通りです。前半は比較的うまく行きましたが、後半は少し失敗。「生麦生米生卵」みたいに、意味の分かる言葉は大丈夫ですが「ちりからちりからつったっぽ」などの日本語の羅列は難しいようです。

実はここまでの記事文章も、全部『AmiVoice SP』で入力してみたものです。入力に要した時間は大体10分。ちなみに間違えた部分も「削除」と命令すれば消せるので、できるだけ音声で修正しながら文章作成してみました。ただし、どうしても変換が出来なかった部分については、キーボードで直しています。

1 2次のページ
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。