検索デスク 視点(10) 1996年11月18日

Infoseekのバージョンアップ
   視点(10) 1996年11月18日

1. バージョンアップ

  ソフトの世界では定期的にバージョンアップが行われています。OSクラスになると1~2年、年賀状用ソフトは1年、ブラウザは1~2ヶ月ですか。昔はバージョンアップすべきかどうか迷ったのですが、最近のようにバージョンアップに慣れてくると、即座にバージョンアップしないと落着かなくなります。毎日、新聞を読むように、毎日、ソフトの新着情報に目を通しています。ところで検索システムもソフトなんですね。バージョンはないですが6ヶ月~1年でバージョンアップしています。

2. Ultraサービスの時代へ

  Infoseekは11月15日にバージョンアップしました。昨年の6月にデビューした時は、無料と有料の2系統のサービスでしたが、情報専門家がレビューし、カテゴリーに分類する価値ある(コストのかかる)情報も有料にできませんでした。情報の急増による処理量の相対的な低下、収集した情報の陳腐化、広告収入によるフリーサービスの増加など検索を取り巻く状況の変化は予測できません。Infoseekは約9ヶ月ごとに大規模なサービスの改装を行っており、現在は第3段階に入ったとみなせます。

Infoseek95年6月ディレクトリ主体。無料と有料サービス。
Guide96年2月ロボット系検索とディレクトリの共存。
Ultra96年11月ロボット系検索とサービスの多様化。

3. データベースの切り替え

  Guide時代に使用していたデータベースの検索力は8月時点でAltaVistaの7分の1の140前後で、Ultraのテスト版がでた8月以降は更新されることなくGuideの検索に使われていました。従って、8月15日から11月15日まではGuide用とUltra用の2種類のデータベースを運用していたことになります。それが今度の改装でGuideがなくなりUltraに1本化され、UltrasmartもUltraseekも同一のデータベースを使っています。最新のUltraの検索力は782でGuideに比べて約6倍です。改装のために11月の始めから更新が止まっていますが、検索力では4強の仲間入りです。

4. 単語の語尾変化

  初期の検索システムの多くは単語の語尾変化があいまいで、marketで検索するとmarketsもmarketingも検索します。Ultraを調べますと、

  market(841,684)、markets(841,684)、marketing(505,232)

  となり、marketとmarketsは同じ結果になります。marketingが入っていないだけ救われますが、marketとmarketsを区別するかしないかは難しい問題です。語尾変化を考慮しない場合に比べて検索力は数%多くなると言えます。なお、この単語処理は従来のGuideでも使われていた機能です。

5. AND/OR検索

  次に、AND/ORが正しく処理されるか調べてみました。初期の検索システムの多くはAND/ORの機能をもっているのですが、実際に調べてみますと処理されてないというか、間違って処理しています。典型的な例はキーAによる検索数をa、キーBによる検索数をbとすると、A AND B = min(a,b)、A OR B = max(a,b)と処理します。学問分野によってはAND/OR処理をmin/max処理する場合がありますが、検索の分野では完全にエラーです。

  キー electronic(886,099)、commerce(288,288)
AND  +electronic +commerce(8,481)
OR  electronic commerce(886,099)
フレーズ "electronic commerce"(29,249)

  となり、(1)OR検索がelectronicと同じ、(2)フレーズ検索がAND検索よりも多い、の2点が納得できません。ただ、AND/OR検索は処理時間がかかるため、処理数の上限を設けているのか知れません。

6. 大文字の処理

  従来は大文字小文字の区別をしないのがよいシステムでしたが、AltaVistaが大文字を使った時にのみ完全一致したものを検索する方法を取りいれました。Ultraもこの先進機能を採用しています。それを調べましたがです。

  electronic(886,099)、Electronic(472,766)、ELECTRONIC(33,056)

7. コマンド検索

  UltraseekのSpecialに(link、host、url、title)の検索画面がありますが、コマンド検索としても利用可能です。まだ、siteとurlの機能が同じなのか異なるのかはっきりしていません!

  +site:bekkoame.or.jp +search(18) ベッコアメにあるsearchを検索
link:~asaisan/(10) 逆リンク(少ない!)
+url:jp +search(337) ドメインが日本にあるsearchを検索
title:"search engine"(9,670) タイトル中のフレーズsearch engine

8. 検索以外のサービスを準備

  検索以外にニュースや生活情報などのメニューをそろえています。

  ultrasmart:12カテゴリーのディレクトリとその検索
ultraseek :コマンド検索などの高度な検索
news center:Your News, Business, World, Sportsなど
smart info:People Finder,Web Calendar,Companies,Maps,Stocksなど