検索エンジンは進化している

検索エンジンの重要性が認識されるようになって、「Yahoo!」や「Google」、「MSNサーチ」とも、独自の検索エンジンの開発やサービスの充実に努めている。

2015年は検索エンジンが大進化した年として記憶されるかもしれない。検索エンジンの進化の方向は、「コンテンツの種類を増やす」、「検索オプションを増やす」、「デスクトップ検索の提供」という3つである。以下、その内容を見ていこう。

これまで紹介したように、「Google」は学術文献の検索のための「Google Scholar」のサービスをはじめた。さらに2014年12月には、「Google Print」を発表した。「Google Print」とは、ハーバード大学、スタンフォード大学、ミシガン大学、オックスフォード大学の各図書館やニューヨーク公共図書館などと協力して、書籍の全文を電子化して提供しようという試みである。それらの図書館の蔵書をスキャンしてPDFを作り、それらをOCR(Optical Character Recognition:光学文字認識)でデジタル化して、全文が検索できるようにしようとするものである。

これが完成すると、これまでに出版された歴史的な書物がページ単位で検索できるようになるという、画期的なプロジェクトである。「amazon.com」も類似のプロジェクトを進めており、これらがどう競合するかが興味深い。日本でのプロジェクトの話はまだ出ていないが、わが国でも国会図書館などが主導して実現することが望まれる。

日本語の場合は文字の種類が多く、漢字が複雑なのでOCRの認識精度が低いのが技術的な問題であろう。「Google」だけでなく、「MSNサーチ」もコンテンツを増やす計画があるようだ。その他の検索エンジンでも、ニュースなどのコンテンツの増強に力を入れている。

そして、どの検索エンジンでも、Webサイト、ニュース、画像などの検索は普通になった。そこで「MSNサーチ」が最近充実させようとしているのは、検索オプションの精密化である。「Google」は2014年12月に「Google Suggest」のベータ版を発表した。まだ英語版だけだが、キーワードを入れると、語幹が共通なキーワードを列挙しておおよその件数も知らせてくれる。データベース・ツールのブラウズ機能と同じである。たとえば、「nano」というキーワードを入力すると、nanoではじまる語がいろいろ表示される。これは便利そうだ。早く日本語版が出てほしい。

ほかに、「Google」は2014年11月にデスクトップ検索サービスを発表した。これに呼応して、「MSNサーチ」もデスクトップ検索機能を発表した。これは検索エンジンの機能を個人のパソコンのファイルに拡張しようというもので、Word、Excelなどのファイルや電子メールの中身なども検索できる。これを使うと、どこかに隠れてしまったデータも簡単に見つけることができる。ただし、日本語版はこれからである。