検索エンジンは妖怪“覚(さとり)”の夢を見るか【前編】
※この原稿は「情報の科学と技術」Vol. 63 (2013) より許諾を得て転載させていただいております。執筆者はガジェット通信の関連企業「未来検索ブラジル」社で検索エンジン開発を行なっている森大二郎です。
「情報の科学と技術」(情報科学技術協会)
http://www.infosta.or.jp/journal/journal.html
検索エンジンの未来 -検索エンジンは妖怪“覚(さとり)”の夢を見るか-【前編】(森大二郎)
1.はじめに
検索エンジンサービスと、それを支える情報ネットワークはこの先どのように変化していくのだろうか。あるいは変化しないのであろうか。WWW検索エンジンの歴史がまだ20年にも満たないことを考えると、未来を予想するなど無謀な試みに過ぎないのはもちろんであるが、本稿ではあえて想像を逞しくして将来を展望してみよう。
今からちょうど20年前の1993年にNCSA Mosaicがリリースされ、WWWが爆発的な成長の兆しを見せはじめると、1年と待たずにいくつもの検索エンジンサービスが次々に設立され、互いに覇権を競い合う時代に突入した。しかし、激しい過当競争は10年程度でほぼ収束してしまう。
その後の10年間でWWWの世界はコンテンツ中心からユーザ中心に徐々にシフトしたが、検索エンジンの勢力図やサービスは(少なくとも表面的には)大きくは変化していない。トップページの中心的な要素は、今も昔も検索文字列の入力フォームであり、検索結果がリスティングによって表示されるというスタイルも大きくは変わっていない。
しかし、だからと言って次の10年も同じスタイルが主流であり続けるとは限らない。これまで検索エンジンが一貫して追及し続けてきた目標のことを思えば、本格的な変化はむしろこれから始まると考えることもできる。近い未来、検索エンジンが人間社会にもたらす劇的な変革から見れば、現在の検索エンジンなどその胎動に過ぎなかったと回想する日がやって来るかも知れない。
2.加速する世界
検索エンジンが目標としているのは、ユーザの情報要求を最も良く満たす情報を、可能な限り高速に提供することである。ここで言う「高速」とは、単に検索エンジンサーバからの応答時間が短いことを指しているのではない。ユーザが何らかの情報要求を心に抱いてから、それを満たす最善の情報を手に入れるまでの時間を最短にするということを意味している。
1)高精度な検索、2)高速な検索処理、3)効率的な入力の支援、4)網羅的な情報収集などは、すべてこの目標を満たすための要素技術だと言える。たとえば、高精度な検索結果を返すことができれば、ユーザは、複数の結果を参照して最適なものを選び出す時間を削減することができる。
ユーザが情報要求を抱いてから、それを満たす情報を得るまでの時間や作業コストを削減することは、ユーザの精神的・経済的利益に直結し、検索エンジンの利用をさらに促進する。検索エンジンは、20年間この目標を追求し続けて来た。ではこれから先、さらなる高速化の余地がどこに残されているのだろうか。
ここで、ユーザと情報端末の間のインタフェースについて目を向けてみよう。ユーザから端末に情報を与える入力インタフェースと、端末からユーザに情報を提供する出力インタフェースについてである。
最初期のコンピュータのインタフェースは、入力・出力ともに非常に低速かつ手間を要する穿孔機やテレタイプなどが使われていたが、出力インタフェースについては、その後著しい発達を遂げ、画像・音声とも人間の感覚器官の弁別分解能に迫る性能を達成している。
一方、入力インタフェースについては、進歩が停滞した状態が長く続いている。最初期のコンピュータより百年近くも前に発明されたモールス信号の単式電鍵では、熟練者であれば既に20~30wpm(英語の場合)、後の複式の自動電鍵ならば50~60wpmでの文字入力が可能であった*1。現在のキーボードの前身と言えるタイプライターは20世紀の初頭には既に入力速度の点では完成の域に達しており、熟練者で100~120wpm程度の速度を達成している。その後も高速化の工夫はいくつも提案されているが、広く普及するには至らず、百年間にも渡って同じインタフェースが使われ続けている。
*1:William G. Pierpont 著「The Art & Skill Of Radio-Telegraphy」
http://www.qsl.net/n9bor/n0hff.htm
こうした中で、近年、パターン認識技術の進歩と計算機性能の向上によって音声認識技術の実用性が高まっている。音声認識を文字入力インタフェースとしてみたとき、現在実用的な精度で入力できる速度は160wpmに達しており、今後さらなる性能向上も期待できる。人間同士の話し言葉によるコミュニケーションでは、通常時で110~160wpm、早口ならば300wpmもの速度で発話している。この速度で音声が認識できるようになれば、検索エンジンの利用に際しても、ユーザが情報を得るまでの時間を大幅に短縮させることができるだろう。
検索エンジンを利用する度に情報端末を取り出していては余計な時間がかかってしまうが、Project Glass*2のように、いつでも視野の中に情報を表示できる端末がその問題を解決するだろう。同プロジェクトは、コンタクトレンズの内側に情報を表示する技術も射程に入れている*3。さらに非可聴つぶやき認識(無音声認識)*4のような優れた技術を合わせれば、まったく人目につくことも、指一本動かすこともなく瞬時に検索サービスを利用できるようになるだろう。
*2:「Project Glass」『Google+』
https://plus.google.com/+projectglass/posts
*3:「Augmented Reality in a Contact Lens」2009年9月『IEEE Spectrum』
http://spectrum.ieee.org/biomedical/bionics/augmented-reality-in-a-contact-lens/0
*4:中島淑貴、et al.:「非可聴つぶやき認識」電子情報通信学会論文誌、2004,vol.J87-D-II,no.9,pp.1757-1764
何か調べたいことが頭に思い浮かんだ時、次の瞬間にはそれを検索エンジンに渡し、即座に結果を得られるようになれば、検索サービスを利用するために必要な作業コストは限りなくゼロに近づく。この段階に至れば、もはや過去の個人的な出来事を思い出す時にも、脳内の記憶をたぐり寄せるより、検索サービスを利用した方が高速かつ正確に結果が得られる場合が多くなるだろう。検索エンジンは、未知の事物を調べるだけでなく、記憶を辿る上でも最も強力な手段となり、これまで以上に、人の思考や意志決定に大きく関与することになるだろう。
これは人間の社会にどんな変化をもたらすだろうか。ヒトを含めた全ての生体システムの営みが、常に認知・判断・行動のサイクルによって成立していることを思えば、判断の助けとなる的確な情報が常に得られることがどれだけ大きなメリットをもたらすかは想像に難くない。しかし、一方で人間の知的活動がそれだけ大きくコンピュータネットワークの力に依存してしまうことに危機感を覚える声もあるだろう。大きなメリットの裏に、予想外のデメリットが隠されていないか不安を感じても不思議ではない。
人間の社会において、このような大規模な情報革命が起こるのは初めてのことではない。古代ギリシャやインドで識字が広く普及した時代に、まさによく似た議論が起こった。ギリシャにおける顛末はつとに知られているが、非常に参考になるので本稿でも触れたいと思う。
紀元前八世紀ごろに古代ギリシャで成立したアルファベットは、きわめて完成度の高い音素文字であり、それまでのどの文字よりも習得が容易で汎用性に優れる、画期的な発明であった。しかし、口承文化を重視したギリシャ人の中には、思想や文学作品を文字として書物に著すことに根強く反発する意見があり、読書の普及にブレーキをかけていた。とりわけソクラテスは、重要な情報は書物ではなく対話によって伝えられるべきであると考えており、読書の習慣が人々の記憶力や思考力を阻害してしまうことに強い危機感を訴えていた。
しかし彼の弟子であるプラトンは、師の懸念を十分理解しながらも結局はその言葉を書物に残す道を選んでいる。さらにその弟子であるアリストテレスは、書物の価値を積極的に認め、世界中の書物を一箇所に集め、知の蓄積と交流を図る必要を説いている。こうしてアリストテレスの教えを受けたプトレマイオス一世が、その思想をアレクサンドリア図書館として結実させるまでには、ソクラテスの没後から百年程度しか要していない。
文字記録は話し言葉と異なり、不変性に優れているため、コミュニケーションにおける空間および時間上の障壁を取り払う。ひとたび文字が普及してみれば、この遠隔伝達性という特質はきわめて強力に作用し、技術をはじめとする知識の累積と進歩を著しく推し進めることになった。また、当初書物は、音声言語を忠実に再生するための記録媒体に過ぎなかったが、中世前後から徐々に普及した「黙読」の習慣は、個人の自立した思想を促すと共に、話し言葉を上回る速度で情報を取得できる媒体へと書物を変貌させた。熟達した読み手は、文字の解読プロセスと、意味を理解するプロセスを脳の別々の領域で並列に実行する能力を身につけ*5、それまでの人類がなし得なかった速度で言語情報を取り入れることができるようになった。
*5:メアリアン・ウルフ著、小松淳子訳「プルーストとイカ-読書は脳をどのように変えるのか?」インターシフト、2008
現代の知識社会は、もはや文字記録なしには存在し得ず、非識字率は絶対貧困率をはかる指標の一つとまでされている。しかしその一方で、文字を必要としない、いわゆる無文字社会が世界中には今なお多く存在しており、文字によって規格化されることのない豊かな口承文化を今に伝えている*6。また、知識社会において、現在までに累積された知識の中でも特に重要なものの多くが、読字障害を持つ人々によって生み出されているという事実も注目に値する。
*6:川田順造著「無文字社会の歴史-西アフリカ・モシ族の事例を中心に」岩波書店、1990
いま検索エンジンと情報ネットワークが生み出そうとしている変革は、人間の記憶とコミュニケーションを人工物によって飛躍的に加速・強化する、人類史上二度目のステップと言えるのかも知れない。今回のステップは、識字の普及と同じように、知識の進歩を推し進め、人間社会に大きな繁栄をもたらすのだろうか。未来の社会では情報ネットワークへのコネクティビティとリテラシーの低さが貧困率を測る指標になっているのだろうか。
今回の変革が、識字の普及と同様の過程を辿ると仮定するならば、――つまり、ひとたびそれが広がり始めると、もはやそこから得られる利便性に抗うことが困難となり、否応なしに殆どの人がその世界に飲み込まれていく可能性を考えるならば――、そもそも検索エンジンには何ができて、何ができないのかよくよく見極め、来たるべき変革の時代に備えておくことが肝要かも知れない。
(【後編】に続く)
関連リンク
「情報の科学と技術」(情報科学技術協会)
http://www.infosta.or.jp/journal/journal.html
未来検索ブラジル
http://razil.jp/
全文検索エンジン「groonga」
http://groonga.org/
全文検索エンジン「Senna」
http://qwik.jp/senna/
プログラマ。有限会社未来検索ブラジル所属。オープンソースソフトウエアの開発に従事。参加作品「全文検索エンジンSenna http://qwik.jp/senna/」「全文検索エンジンgroonga http://groonga.org/」
ウェブサイト: http://groonga.org/
- ガジェット通信編集部への情報提供はこちら
- 記事内の筆者見解は明示のない限りガジェット通信を代表するものではありません。