音声を自動でテキスト化してくれるAIレコーダー「VOITER」 気になる文字起こしの精度は?

会議の議事録や講演会・インタビュー等の文字起こしなど、音声データのテキスト化は地味に面倒な作業。専門のアウトソーシングサービスもあったりますが、音声を自動でテキスト化してくれるレコーダーがあれば、煩わしい作業の手間を省くサポート役にぴったりだと思いませんか?
そんなAIライティング レコーダー「VOITER」のレビューをお届けします。
AIが文脈を判断して文字起こし

iFLYTEK JAPAN AI SOLUTIONSがクラウドファンディングサービスMakuakeにて先行販売を開始したVOITERは、Wi-Fi接続時やSIMカード(別売、au・docomo・SoftBankの一部に対応)によるネットワーク接続時に、画面上でリアルタイムに文字起こしをおこなってくれるというもの。
日本語と英語の文字起こしに対応し、一度書き間違えた言葉もAIが文脈を判断して自動修正してくれます。

録音モードは、「会議」「講演」「取材」「標準」「メモ」「音楽」の6つを用意。集音距離最大10mの指向性マイクを2つ、360度集音の無指向性マイクを6つ搭載し、不要な雑音を自動的に判断して除去するノイズ処理テクノロジーにより、PCのマイク・スピーカー越しでも高精度な文字起こしが可能としています。
もちろんオフラインで録音後、ネットワーク接続時に文字起こしすることも可能です。

また、800万画素のカメラを搭載し、録画した状態で画面上に文字起こしをリアルタイム表示することも(ネットワーク接続時)。

端末に保存したデータは、メールアドレスへの送信やUSBケーブルを使ってPCへのエクスポートができるほか、クラウドスペース「RECORDER STATION」を利用して管理・編集などが可能です。
端末のサイズは62.26(幅)×125(高さ)×14.8(奥行き)mm。重量は166gで、持ち運びにも困りません。
文字起こしの精度は?

気になる文字起こしの精度ですが、編集部メンバーによるYouTube / TwitterのLIVE配信「ガジェット通信LIVE」の中で、実際にリアルタイムの文字起こしをテストしてみました。一度書き間違えた言葉も即座に修正されていく様子が分かると思います。
https://youtu.be/qEw11aQS5eY?t=1382
ゆっくり、はっきり話すことで、より精度が高まる事例もあわせて紹介しておきます。
https://youtu.be/MUdizdzKpb4
その後も何度か試してみたところ、固有名詞はさすがに難ありといった感じですが、録音した現場に立ち会って文脈を把握している人なら、文字を読みながら会話の内容を思い出すのに十分な精度はありそう、といったところでしょうか。
文字起こしできるスマホアプリなどと比べると、やはりVOITERの方がノイズ除去の面で優位性があるように感じました。

特定の話題にフォーカスして聞き返したいときには、目次のような役割を果たしてくれるので、ゼロベースで文字起こしするよりも効率化が図れるかもしれません。
もちろんこれは「素起こし」としての精度で、必要に応じて「ケバ取り」や「整文」といった作業は避けられませんが、極力手間を減らしたいというニーズには応えてくれそうです。
2年目以降は有料プランの加入が必要に

VOITERの一般販売は5万4780円(税込み)を予定しており、Makuakeでは20%オフの4万3800円コース、15%オフの4万6500円コースを用意。
なお、Makuakeでの応援購入には1年分の文字起こし「使い放題プラン」が含まれていますが、2年目以降は毎月3時間まで無料の「ベーシックプラン」か、それ以上の利用については2180円(税込)/月で時間無制限の「使い放題プラン」への加入が必要となります。
Makuake「VOITER」応援購入ページ:
https://www.makuake.com/project/iflytek-voiter/

- ガジェット通信編集部への情報提供はこちら
- 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。