体験を伝える―『ガジェット通信』の考え方

面白いものを探しにいこう 本物を体験し体感しよう 会いたい人に会いに行こう 見たことのないものを見に行こう そしてそれをやわらかくみんなに伝えよう [→ガジェ通についてもっと詳しく] [→ガジェット通信フロアについて]

【Interview】圧倒的なスピードと抽出力!画期的な文書検索システム「kaidoku」に大接近

医療や法律のように、専門的な用語を扱う現場では、資料作成などの作業で、適切な文書を的確に集める必要がある。しかし、これを人の手で行うと、膨大な時間と手間に追われてしまう。豊富な経験を持つ熟練者でも、それは同じだ。

そうした現場の課題を解決するために誕生したのが、「kaidoku(カイドク)」。多くの資料から、必要な関連情報を素早く特定し、従来のコンピューターデータベースでは分類・分析できなかった非構造化データを扱うことができる、画期的な文書検索システムだ。その圧倒的な抽出力とスピードは、従来業務に大きな変革をもたらすと、目されている。

開発元は、人工知能の研究開発と関連ソリューションを手がけるCogent Labs(コージェントラボ)。リサーチサイエンティストのマックス・フレンゼル博士に、話を聞いた。

・どんな文字データも検索できる!

Q1:まずは、このようなシステムを開発するに至ったきっかけから、お聞かせください。

弊社では、AIの研究開発を行っているため、文章の理解は主要研究の1つでもあります。「Kaidoku」は、その文章理解の研究から生まれた、どんな文字データも検索できる画期的なシステムです。

弊社には、手書き文字を認識してテキストデータにする「Tegaki」というサービスがありますが、「Kaidoku」は、その手書きデータの意味を理解するために利用できるので、商品ラインナップとしても強力です。

Q2:システム構築にあたって最も苦労したのは、どんなところでしょうか。

自然言語に関するさまざまな課題を、AIで処理できるとする論文は、数多く存在します。しかし、その多くは、非常に人工的なデータを使用していたり、単純化されたケースであったりします。今回のような(現実に発生するノイズ入りの多様なデータを処理する)AIを開発するためには、従来のさまざまなアプローチを組み合わせるだけではなく、弊社独自の手法を、作り出す必要がありました。

また、(中略)常に取り組むべき課題として、トレーニングに適したデータの入手があります。幸いなことに私たちは、お客さまやパートナーとよい関係性を築いているため、多彩なリソースが手に入っています。

・業務にかかる時間の短縮とコスト削減を実現

Q3:「Kaidoku」は、ビジネスのどのような場面で活躍するのでしょうか。また、本システム導入によって、ユーザーはどのようなメリットを得られるのでしょうか。

弊社の基本方針の1つに、“人を人らしくする“というミッションがあります。「Kaidoku」を使えば、煩雑な業務にかかる時間を短縮します。さらに、完全に自動化することで、業務効率を高め、コストを削減します。

(医療現場や法曹界などに従事する)専門家は、多くの煩雑な仕事を「Kaidoku」に任せることで、お客さまを深く理解できるようになります。リレーションを構築するなど、付加価値を生み出すための本来業務に、集中することもできます。

Q4:今後の展開について、教えてください。

「Kaidoku」は、さまざまな未知のインサイトを突き止める上で便利ですが、効果的に活用するためには、一定のデータ分析知識のあるユーザーが必要です。将来的には、そのインサイトを見つけ、ユーザーに通知できるようになる予定です。加えて、弊社の他の商品との連携もめざしています。例えば、「Kaidoku」で金融ニュースとアナリストのセンチメントを理解し、金融市場をより高い精度で予測できるような仕組みです。

弊社では、AIは、知覚、理解、および推論の順に、開発が進んでいくと捉えています。(中略)「Kaidoku」を次の段階に進めることで、推論のAI開発に、より一層近づけると、そう考えております。

進化ばかりが取沙汰される人工知能。しかし、人間による研究がなければ、それはあり得ない。改善すべき課題があって、はじめて機能するものだ。「Kaidoku」は、Cogent Labs社の努力の結集。多くの現場で活用されることを願いたい。(取材・文 乾 雅美)

Kaidoku

Techableの記事一覧をみる
  • 誤字を発見した方はこちらからご連絡ください。
  • ガジェット通信編集部への情報提供はこちらから
  • 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。