検索デスク 視点(11) 1996年11月24日

HotBot 対 AltaVistaの総合比較
   視点(11) 1996年11月24日

1. はじめに

  11月18日にHotBotの検索機能が強化されました。新たに複雑な検索式処理や表示形式選択が加わり、Expert検索が Date、Location、Media Type に分割されています。そこで、現在最高水準のWeb検索サービスであるHotBotとAltaVistaの検索機能面の相互比較を試みました。

2. この2ヶ月間のデータベースの増加は2%前後

  11月24日に調べた検索力はHotBotが1,785、一方のAltaVistaは1,000です。検索力については9月15日から毎週調べていますが(検索デスク/検索資料/検索力(海外))、この2ヶ月間でデータベースの増加は2%前後です。Web情報は4ヶ月で倍増するとみなされますので、網羅性の観点からWeb検索は危機的な状況にあるといえます

  古い情報を新しいものに置き換えたり、重複データやNot Found情報を削除したり、そして新しい情報を追加したりなどなどの努力はなされています。現状では、データを更新したり削除するのに多大なパワーが割かれており、Web情報収集のブレークスルーが望まれます。

3. 文字処理はAltaVistaの方が優れています

  小文字のキーを入力すると大文字と小文字を検索します。大文字のキーを入力するとHotBotは大文字と小文字を検索しますが、AltaVistaは検索キーに完全一致したものを検索します。 ( )内は検索数。

  Hot  electronic (2,006,734)、Electronic (2,006,734)、ELECTRONIC (2,006,734)
Alta electronic (1,175,199)、Electronic (628,206)、ELECTRONIC (47,365)

4. ともに検索キーに完全一致したものを検索します

  検索システムによっては検索キーの語尾変化を考慮するものがありますが、HotBotとAltaVistaは検索キーそのものだけを検索します。

  Hot  market (1,777,122)、markets (568,173)、marketing (1,252,774)
Alta market (1,122,480)、markets (354,146)、marketing (811,730)

5. ともにAND/OR検索は合格です

  AND/ORが正しく処理されるかどうかの判断は検索数の計算で調べます。

  electronic+commerce=AND検索+OR検索
HotBot electronic (2,006,734)、commerce (706,715)
 AND  electronic AND commerce (181,305)
 OR  electronic OR commerce (2,532,144)
 フレーズ "electronic commerce" (74,040)

  AltaVista electronic (1,175,199)、commerce (435,912)
 AND  +electronic +commerce (105,247)
 OR  electronic commerce (1,505,864)
 フレーズ "electronic commerce" (39,881)

6. ( )を使う複雑な検索式もともにOK

  HotBotは検索画面でBoolean expressionを選択し、検索式を AND/OR/NOT/""/( ) で作成します。検索式の長さは115文字までです。AltaVistaは検索式を +/スペース/-/""/( ) で検索式を作成します。検索式の長さは200文字までです。electronic banking あるいは electronic money を含むページの中に security というキーをもつものを調べました。

  HotBot ("electronic banking" OR "electronic money") AND security (4272)
AltaVista +("electronic banking" "electronic money") +security (2243)

7. 逆リンクはともに検索できます

  HotBotはメニュー画面で links to this URL を選択します。AltaVistaは検索コマンドの link:" " を使います(""で囲まないと、OR検索とみなされます)。

  HotBot   ~asaisan (188)
AltaVista ~asaisan" (193)

8. メディアなどの部分指定はHotBotが優れています

  HotBotは media type にある、Javascript、Java、Audio、Image、Acrobat、Shockwave、VRML、拡張子(gif,txt,...)などから選択します。一方の AltaVista はメディア用コマンドとして applet:(アプレット)と image:(イメージ)を使います。

  HotBot Javaを選択し game (9930)、Imageを選択し greenball (3565)
AltaVista applet:game (43)、image:greenball (46486)

9. HotBotとAltaVistaを使いこなせればプロです

  どうですか。Web検索はすごい!の一言につきます。3,000万から5,000万のWebページの中から自分の欲しい情報が探せたら大満足ですね。しかも、フリーです。現時点で検索力と検索機能面でHotBotがナンバーワンです。asaisanとしては、HotbotとAltaVistaを超おすすめします。

10. さいごに--検索への投資と情報の鮮度

  それにしても、Web検索の将来はどうなるのでしょうか。だれも考えないし動かない。インターネットの投資もハードや情報発信に集中し、検索システムの構築には何万分の1もまわってないようです。Web情報の洪水で検索システムはもうアップアップ寸前なのが分かります。

  検索デスクよりも著名なサイトの中に、まだHotBotやAltaVistaを載せてないところがあります。検索の知識のない人はそちらの方を信用します。困ったことです。インターネットの世界は3ヶ月で実世界の1年位の変化がありますから、ユーザーは数年前のカタログを見てるようなものです。インターネットは本当にこわいですね。Web情報は古いことよりも鮮度が重要です。