検索デスク 調査 2002年

2002年

2002年のデータは、日本語1.9倍、英語2.0倍 2002.12.27


★ 日本の検索エンジン

  昨年末からの1年間の増加の高い順に、Naver 6.3倍、Alltheweb 3.0倍、FresheyeとTOCC 2.3倍、Lycos 2.3倍、Infoseek 1.7倍、Google 1.6倍、goo 1.6倍、AAA!Cafe 1.4倍、AltaVista 1.4倍、で平均1.9倍です。
★ 海外の検索エンジン

  昨年末から1年間の増加の高い順に、Alltheweb 5.2倍、Lycos 4.7倍、Teoma 3.7倍、AOL 2.8倍、Yahoo! 1.8倍、WiseNut 1.8倍、HotBot 1.7倍、Google 1.6倍、AltaVista 1.0倍、で平均2.0倍です。
★ 検索エンジンの検索力

No日 本検索力検索評価検索数.No海 外検索数
1Fresheye100.0 98.391.7.1Openfind100.0
2Google 97.1 97.6 80.5.2Alltheweb 88.4
3goo 93.5100.0 53.4.3Lycos 88.3
4Lycos 87.6 88.6 70.8.4Yahoo! 64.5
5Alltheweb 77.1 68.5100.0.5AOL 55.6
6Naver 63.9 57.1 81.3.6HotBot 35.2
7AltaVista 62.9 63.6 50.8.7WiseNut 34.6
8AAA!Cafe 62.9 61.2 60.0.8AltaVista 33.2
9Infoseek 45.4 47.9 28.5.9Teoma 25.0
......10Google 24.7

楽天Lycosを傘下に、HotBotの大変身 2002.12.21

  日本 Infoseekの検索数は25.7%減少しています。3ヶ月前に90%増加し、2ヶ月前に20%増加してますので、今回減少しても3ヶ月前に比べれば70%増加しています。その他に、Allthewebが4.8%増加しています。検索数と検索力の順位は先週と同じでした。

  年末になって検索サイトの動きがあわただしくなってきました。ショッピングサイトの楽天は米Terra Lycosからの株式譲渡と第三者割当増資を全額引き受けてLycos Japanを子会社化しました。Lycosの新資本金は74億円になり、取得金額12億円で90%の株を得たことになります。楽天は2年前の2000年12月にInfoseekを買収し、その買収金額は85億円ですので、デフレとはいえLycosを安く買ってるように思えます。

  Yahoo! Japanでみますと、2年前の時価総額は8,360億円、月間のPVは44億、時価総額を月間PVで割ると190円です。現在の時価総額6,870億円を月間100億PVで割ると69円です。2年前が190円で現在が69円ですからPVの単価は64%減少して36%になっています。2年前のInfoseekは53円/月間PVでしたのでYahoo!の28%でした。Lycosの月間PVがわかれば有用な情報が得られます。。。

  日本語検索サイトのオープンは、Yahoo! 1996年4月、Infoseek 1996年10月、goo 1997年3月、Excite 1997年7月、AltaVista 1998年4月、FreshEye 1998年6月、Lycos 1998年7月、Google 2000年8月、Alltheweb 2000年8月、Naver 2001年4月、などです。

  Lycosは昨年12月に検索エンジンの自社開発を中止してWiseNutを採用し、今年11月7日にディレクトリの自社開発を中止してLooksmartを採用しています。今後はInfoseekと競合するコンテンツを調整しなければなりませんが、Lycosブランドはいつまでも残しておいてほしいものです。

  海外 Teomaが26.8%増加し、HotBotは16.2%増加しています。その結果、検索数の順位が少し変化しました。

  Inktomi系のHotBotはGoogleのようにシンプルなトップページに変更しました。検索フォームはInktomiだけから、FAST、Google、Inktomi、Teomaの4つからの選択になりました。これはトラフィックの増加を見込んでのことですが、どのような結果になるかわかりません。小さなことで大きな意味をもつのですが、URLが http://hotbot.lycos.com/ から本来の http://www.hotbot,com/ に替わりました。ブランドはHotBotよりもそのURLのhttp://www.htobot.com/にあることを気づいたのかも知れません。

gooの新鮮情報検索エンジン、商品検索Froogle 2002.12.14

  日本 2週間の検索数はFresheyeとTOCCが44%前後増加しました。総合の検索力の順位は先週より数値は下がりましたが順位は同じです。

  12月3日にgooを運営しているNTT-Xから、新鮮情報検索エンジンが発表されました。4ヶ月の予定で実証実験するとのことです。ニュース情報などはリアルタイムに更新しますが、それにあわせてデータベースの更新を試み、最短で15分とのことです。収集対象をニュース以外のWebに拡張したのがねらいです。検索数を調べましたが、本家gooの半分位でした。まだ増加中で、検索評価は次回に行う予定です。

  以前のFresheyeは更新が速いことを売り物にした検索エンジンでした。Webの更新日を確定することは難しく、ロボットの収集日としたり、さらにHTMLファイルの更新日とみなしたりしますが、時々マッチしないのがあります。不完全なHTMLで苦労してるのがブラウザと検索サイトです。真の更新日をソフトで特定することは難しいですが、ユーザーは新鮮な情報を求めていますので、新しい試みは長い目で見ていく必要があります。

  検索動向に書きましたが、12月11日にNaverがリンクをベースにした検索とディレクトリを公開しました。脚光を浴びているリンクに関して、老舗サイトは有利になり、ドメインを変更したサイトや新しいサイトは不利になります。リンクをベースにしたディレクトリは新しい方法ですので一度利用することをお勧めします。

  海外 2週間の検索数増減の主なものを列挙しますと、AOL 15.1%増、Lycos 13.1%増、Alltheweb 9.5%増、Google 5.7%増、と増加するところが多く見られました。

  12月13日にGoogleは商品用検索のFroogleベータ版をオープンしました。検索フォームだけでなく、ディレクトリもありますので本格的です。検索エンジンはWeb全体を対象にWebページを収集しています。Froogleは商品だけを対象としたデータを収集し、索引化し、ディレクトリまでつくって検索サービスします。商品販売サイトのリスト、商品の特徴を表わす商品名、ドル価格表示、商品写真、支払い方法、などでページを特定、あるいは登録などで、商品情報を収集します。gooの場合もそうですが、検索エンジンは情報収集の多様化・専門化の時代に入ったようです。

CNetニュース終了、GoogleのSEOガイド 2002.11.29

  日本 更新は Alltheweb 6.6%減、goo 2.1%減など減少する所が多い週でした。検索数が先月から10%以上増減した Google、Lycos、Alltheweb、AltaVista、Naverについて、検索結果の評価を行いました。上位は、goo、Fresheye、Google、Lycos の順です。3ヶ月間の検索評価の増減をみると、Alltheweb 11.2増、AltaVista 8.1増、Infoseek 6.4増、Fresheye 5.8増、AAA!Cafe 7.7減、Naver 21.1減、になっています。4位は88.6、5位は68.5、ですので、まだトップグループと次のグループとには大きな壁があります。これがリンクを使うか使わないかによるのかは分かりません。

  昨日のニュースにIT関連のニュースサイト、CNET Japanが12月末でサービスを終了するとのことです。CNetのスタートは1997年5月ですので5年半続いたことになります。検索デスクではWeb記事を編集し、その3か月分を公開しています。手元には97年9月前後からのファイルがあり、月単位のファイルは2002年11月で54になっています。それをみると、ZDNetが1997年9月2日、CNetは少し遅れて1997年9月20日が最初の記事です。1年後の1998年9月からIT関連の情報量は増加しています。米CNetは米ZDNetを買収しており、最近は日CNetと日ZDNetとで重複する記事が増えていました。運営しているNTTPCコミュニケーションの発表では今後オリジナルコンテンツを提供するとのことです。

  海外 検索数の更新で増加したのは、Yahoo! 18.3%増、HotBot 17.1%増、Teoma 8.5%増、で一方減少したのは、Lycos 7.2%減、AOL 6.9%減、Alltheweb 3.9%減、などです。それから未更新は2社でした。

  GoogleからSEOに対する見解が公開されました。場所は、米Google > Jobs,Press,Help(All About Google) > For Site Owner > Web Master Info > SEOs http://www.google.com/webmasters/seo.html です。サブタイトルは「SEOと契約する前に知っておくこと」です。善良なSEOに対してでなく、上位ランキングを誇大宣伝したり、アンフェアに操作して検索結果に影響を与える悪徳SEOに注意喚起したものです。

  内容は4節からなっています。第1は、悪徳SEOを見分ける方法として、スパムemailに注意しなさい、誰もランキング1位を保証できない、無関係なページやドメインを使うSEOに注意しなさい、SEOへのリンクをすべきでない、など全部で9項目記しています。第2は、いわゆる"shadow" domains と "doorway" pages に対するものです。第3は、悪徳SEOを見分ける8項目を端的に示しています。最後に、SEOの被害にあったらFTCなどへ届けるようにとのアドバイスです。

  一部のSEOの弊害が目立ってきたもので、弊害が大きくなればSEOのマイナスイメージは避けられません。検索結果の上位に表示したければアドワーズ広告やオーバーチュアなどを使ったほうが確実です。SEOはそのような広告がないときに利用されたもので、今後は広告にシフトするものと思われます。不正な操作でランクが換われば最も被害を受けるのは利用者です。その点を考えると検索エンジン側を応援しなければと思います。

Yahoo!がオーバーチュアとGoogleと提携 2002.11.22

  日本 検索数の更新はgoo 12.0%増、TOCC 3.0%増、Lycos 12.6%減、です。総合の検索力は先週と同じで、変化のない週でした。

  今週のニュースで、Yahoo!がオーバーチュアとGoogleの2社と提携するとの発表がありました。サイト検索はオーバーチュア、ページ検索はGoogleのアドワーズ広告、と分担するようです。それに従来の広告が入りますので木目の細かい広告を作成できます。

  Webの世界はゼロから出発し急成長していますが、それに対応してWeb広告も急展開しています。現在では、テレビで使っているインプレッションベースのもの、クリックベースのもの、そしてアフィリエイトベースのものなどが混在しています。今回のオーバーチュアやアドワーズは検索結果に呼応して広告を提供するもので、クリックベースの進化したものとみなせます。

  広告を出すスポンサー、広告を流す掲載サイト、その間に広告会社があり、自社でまかなう所もあります。スポンサーは大規模な広告予算をもつ大会社、あまり広告予算をもたない中小企業があります。一方、掲載サイトは検索サイトや無料サイトなど大量のトラフィックをもつ大手、トラフィックの少ない中小とがあります。スポンサー、広告会社、掲載サイトにはいろいろな組み合わせがあります。

  最初に採用されたインプレッションタイプは大手スポンサーと大手掲載サイトとを結ぶものです。現実の広告の世界をWebに持ち込んだのですが、広告の基本であるインプレッションに価値をおくかどうかで評価がわかれます。次のクリックタイプやアフィリエイトはどちらかといえば中小スポンサーと中小サイトとを結ぶものです。多数のスポンサーや掲載サイトの管理にコストがかかりますが、中小に門戸を広げた点は評価できます。

  書籍販売で有名なAmazonはスポンサーと広告代理店がAmazon 1社、掲載サイトは大・中小という構図になっています。Googleのアドワーズ広告は、スポンサーは大・中小で、広告代理店と掲載サイトはGoogle 1社となります。そして、オーバーチュアはスポンサーは大・中小、代理店はオーバーチュア、掲載サイトは大手です。中小のスポンサーを対象にした広告会社の出現で、まず既存の中小スポンサーをあつかう広告会社が影響を受け、次に中小の掲載サイトも影響を受けます。あまり喜んでいられない心境です。

  海外 検索数の更新は、HotBot 11.9%増、Yahoo! 7.4%増、Teoma 7.8%減、1%以内が6社でした。

Naverの検索数増減、AltaVistaの更新 2002.11.15

  日本 検索数の更新は、Naver 22.3%増、AltaVista 12.9%増、goo 4.2%増、Fresyeye 3.4%増、など増加するところの多い週でした。大幅に増加したNaverについて、その内容を調べて見ました。

  約22%増加したNaverの更新は調査キーにより大幅な増減がみられました。9月22日に全体で227%と大幅に増加しましたが、今回はその時の増減を調整したものです。例えば、コミックは前回1,182%増加しましたが、今回70%減少しました。以下同様に、ヒントは513%増が62%減へ、文学は413%増が56%減、などです。今回、ドメインが640%増、グルメ 123%増、していますが、その増加が収集データの増加によるのか、日本語索引システムによるのかは判断できません。

  AltaVistaは14日木曜日に調査しましたが、その時には68.6%増加していました。しかし、15日金曜日の調査では12.9%の増加と減少してましたので結果を最新のものに入れ替えました。木曜日にvrmlが大幅に増加してましたので、その原因を調べたところ、日本語の検索がサポートされてなく、世界中のものからの検索で従来の約66倍になっていました。その他に生物や文学が多かったのですが、これも中国語のものが混じっていたようです。日本語のサポートがないということを書いていたのですが、15日金曜日には日本語検索も復活しており一安心しました。

  海外 検索数の増減は、Yahoo! 6.1%増、HotBot 11.1%減、Lycos 3.8%減、AltaVista 3.8%減、などです。AltaVistaは日本語の場合と同様に、14日の調査では19.4%増でしたが15日には3.8%減です。これも英語の検索が世界の検索になっていたためで、正常に検索できるようになりました。

  AltaVistaは11日に検索サイトを更新しました。トップのデザインはシンプルになり、広告表示も制限したものとなっています。トップのWeb検索、image、MP3/Audio、Video、Looksmart提供のDirectory、ニュース検索と6分類しています。トップからは検索センターとして、Shopping、Autos、Travel、Careers、Personal&Dating、そしてPersonal Investingが選択できます。ニュース検索はリアルタイムが重要で、3,000ソースを15分ごとに更新するとのことです。Webの方も更新頻度が速くなっていますので、今後はランキング以外に更新が重要なファクターになるのでは思います。

ブラウザ別シェア、米Google 2002.11.8

  日本 検索数調査では、Alltheweb 4.7%増、Fresheye 4.2%減、TOCC 10.7%減、goo 2.9%減、などです。検索数の指数が毎週変わっていますが、それは一部の検索サイトで検索数が多く、それを調整しているためです。検索数指数50以上が8社ですので、検索数に関してはあまり差がありません。なお、総合の検索力の順位は前回と同じでした。

  7日にLycosディレクトリは自社開発からLooksmartに変更しました。Lycosの検索エンジンはWiseNutで、WiseNutは今年の3月にLooksmartに買収されていますので自然な提携関係です。これでLooksmartの日本語ディレクトリは、MSN、Excite、Biglobe、DION、ODINなどにLycosが加わることになりました。

  ナビバーの開発はブラウザの仕様で苦労しました。そこで検索デスクの昨年10月末と今年10月末とのログを較べてみました。検索したキー別に、"MSIE"は85.2%から90.9%へ、"MSIE 5"は61.4%から34.3%へ、"MSIE 6"は20.5%から55.5%へ、"Mac"は3.1%から2.7%へ、Netscape系は4.7%から4.5%へ、Operaは0%から0.6%へ、などです。主要な検索サイトやISPのYahoo!、MSN、Googleなど9社の合計は2.7%から2.3%へです。

  IEが圧倒的ですのでIEだけを対象に作ればよいのですが、現在、Mac、Netscape、Operaにそれぞれ対応したコンテンツを作っています。NetscapeやOperaはサイドバーやホットリストに外部からコンテンツを簡単に追加できますが、IEの場合は少し制約があります。しかし、それもレジストリの書き換えというウルトラ技で解決し、理想的な検索環境が実現しました。IEではtargetを"_search"とすると検索バーを一時的に利用できますので、Web記事、検索力調査、検索評価などにも大活躍しています。

  海外 検索数調査は、AOL 20.5%増、Alltheweb 6.7%増、Lycos 6.2%増、Yahoo! 3.3%増、Google 3.2%増、HotBot 3.0%増、と増加するところが多い週でした。7月にOpenfindが検索数トップで登場しましたが、トップとの差は徐々に縮まってきました。それでも検索数指数50以上は10社のうち4社です。

  6日からGoogleはWebページ数30億8千万件と表示し、これまでの22億万件から大幅にアップしました。その他に、3.3億のイメージ、8.0億のニュースグループ記事を扱っています。Webページの40%が英語以外の言語で、新たにポーランドと台湾が加わり総計36ドメインをあつかっています。この膨大なデータベースを維持し、優れた検索結果を短時間に出力する検索技術を支えるハードやソフトはまさに現代の怪物です。

ディレクトリの変遷、Teoma更新 2002.11.1

  日本 検索数の更新は、Fresheye 11.2%増、Google 11.1%増で、検索数と検索力の順位に変更のない週でした。Yahoo!に次いでディレクトリの構成と内容が優れているLycosディレクトリが11月上旬に内容を変更するとのアナウンスがありました。米Yahoo!もロボット技術をベースにしたディレクトリ体系へ移行しましたので、どう変身するか興味があります。

  検索デスクでは1996年1月から調査していますが、その当時の検索サイトは、ロボット系4社(TITAN, ODIN, 千里眼, InfoNavigator)、ディレクトリ系9社(NTT Directory, Nippon Search Engine, WWWナビゲーター, Hole-in-One, Japan Search Engine, URL広場, Yahho, CSJインデックス, JOY)、でした。しかし、現在サービスしてるのはディレクトリ系のCSJインデックスとJOYの2社だけです。一例ですが当時の「特許」の検索数でみると、ロボット系のODINは599件、ディレクトリのWWWWナビゲータは10件でした。それが現在、ロボット系Allthewebのページ検索は575,249件、ディレクトリ系Yahoo!のサイト検索は417件です。Web情報の増加で検索サイトを維持できなくなったといっても過言ではありません。

  Webはディレクトリから出発しましたが、まずWeb独自のカテゴリの構築から始めなければなりませんでした。既存の分類法で専門家が開始したところは長続きしませんでした。草創期は過去のことをあまり知らない若い人たちの独断上でした。ディレクトリはカテゴリをサーフするだけでなく、キーワード検索も提供されるようになりました。ロボット系がページをランキングしていたためサイトを探すのは不便でしたから、サイトのみをあつかうディレクトリでも数は少ないですが十分対抗できました。

  情報の増加でディレクトリ系はいろいろな関門を乗り超えなければなりませんでした。第1はカテゴリ数です。カテゴリ数が一定の場合、サイト総数をカテゴリ数で割った値は収集数が多くなると増加していきます。一つのカテゴリに200以上のサイトがあれば探すのは骨の折れることでした。まず、カテゴリ数を増加しなかったところがダウンしました。第2は更新型データベースの構築です。登録された情報を蓄積してるだけのところは新鮮さが失われて行きました。第3は登録型から厳選型への移行です。サイトの少ないときは登録型で広く集めなければなりませんでした。しかし、玉石混交のサイトが増え、ランキングに有効な方法がないため、厳選しなければ維持できなくなりました。ここでは厳選のできる人材確保がネックになりました。

  その他に重要な要因として、Yahoo!躍進の秘密でもあるディレクトリ分類です。ほとんどのディレクトリは階層型でしたが、Yahoo!はネットワーク型を開発しました。それは@を使ってカテゴリ間の関連付けを実現しました。@により延データ数は実データ数の数倍になり、しかも分類しやすくなり、情報が探しやすくなるという一石三鳥以上のメリットをもたらしました。Yahoo!で@を考えた人、GoogleでKWIC紹介文を考えた人、はもっと評価されてよいのではと思います。

  さて、2001年5月からロボット系の検索結果の評価を始めました。そのときにロボット系がページだけでなくサイトも処理していることに気がつきました。そこで、サイト検索でランク結果をしてるところを同様に評価したところロボット系の方がよい結果を得ました。Yahoo!やLycosはカテゴリ順表示でしたので評価できませんでした。ロボット系とディレクトリ系の差はランクに使う情報量によるものとみなせます。

  米Yahoo!の新検索エンジンは情報量を増やしたものからランクしており、ページ検索ではなくWeb検索になっています。今後、サイト検索とページ検索はシームレスに融合していきます。専門家が構築したディレクトリからノウハウを抽出した人工知能的なディレクトリが実用段階に入ってきたようです。

  海外 Teoma 37.6%増、Google 8.7%増、AltaVista 4.6%増、Yahoo! 5.3%減、です。今週からTeomaの検索エンジンが更新しました。検索数の表示は、今年5月までは万単位でしたが、5月26日から100単位になり、11月1日からは1の位まで表示します。例えば、biologyの検索数は、1,470,000から1,778,800へ、それが2,776,179へと正確になっています。

米Googleへの訴訟、利用者志向のWeb制作 2002.10.27

  日本 検索数の更新は、Infoseek 20.2%増、Google 6.8%減、Alltheweb 12.8%減、などです。調査対象10社のうち4社が更新なしでした。月末ですので大きく変化した、goo、Google、Fresheye、Alltheweb、そしてInfoseekの検索結果評価を行いました。goo、Google、Fresheyeの評価は、それぞれ、100.0、99.3、98.8で、ほとんど同じですので、検索力は検索数の順になりました。AllthewebとInfoseekはともに前回よりも10ポイントほど増加しました。

  海外 検索数の主な更新はYahoo! 12.0%増だけで、調査対象10社のうち3社が更新しませんでした。日米とも少しお休みモードかも知れません。

  日本では考えられないような訴訟が米Googleに対してなされています。訴訟しているのはGoogleの検索結果で上位にランクされるようにWebコンテンツ制作のコンサルティングを行っている、いわゆるWebマーケテイング会社です。Googleが9月にランク手法を改善しましたが、それで自社や顧客のランクが不当に下がったというものです。さすが訴訟社会です。ホームぺージが検索サイトに載っていないと抗議する人は少なくなりましたが、ランキングの良し悪しまで文句を言われたら検索サイトはやっていけません。

  検索サイトのランキング手法は絶えず改良しています。リンクにはいろいろな組み合わせがあり、その重み付けも幾種類かあり、検索キーワードとページとの関連性測度も何種類かあり、しきい値を増減したり、収集したページの構成によっても、それに日本語処理によっても、検索結果のランクは異なってきます。この試行錯誤は永遠に続くのではと思っています。

  アクセスアップを図るためにWeb制作のデザインやメタタグなどをどう書いたらよいかということから出発し、最近では検索エンジンの上位にランクされれば広告効果があるということで、上位ランクを目指してWeb制作を引き受ける会社がでてきました。検索エンジンについて有用な情報を発信し常識的なコンサルティングならよいのですが、Googleの上位ランクをめざして、その根幹のリンクにアプローチすれば少しやり過ぎです。6月にも書きましたが、ランク上位に不当なコンテンツが増えれば利用者が一番被害を受けます。各検索サイトは検索結果の上位に載せるキーワード広告を受け付けてますので、そちらを利用した方がお金の流れは自然です。

  Webコンテンツを作る人と検索エンジンの間に立つのが上記のコンサルティング会社ですが、それとは異なり検索エンジンとその利用者の間に立って検索の普及を図っているのが検索デスクの立場です。自動車、パソコン、カメラなどは新製品を紹介する人がいますが、紹介するにあたって事前に情報提供を受けたりしています。検索デスクの場合は、検索サイトの紹介をしていますが、検索サイトからの情報提供ではなく、Webなどに公開されたものと独自の調査・分析によるものをベースにしています。最近開発したナビバーは検索エンジンのランクに不利な側面を持っていることを承知で提供しています。Web制作は検索エンジン志向も大切ですが、利用者志向はもっと大切と思ってるからです。

  なお、1996年以来、毎週日曜日に検索力調査を行っていましたが、次回からは金曜日に変更しますので、よろしくご配慮ください。

今週はお休みします 2002.10.20

  日本 検索数の更新は、goo 8.4%増、Google 5.9%増、Alltheweb 3.8%減、で総合の検索力は1位のFresheyeと2位のGoogleとの差は僅差で、全体の順位の変動はありませんでした。

  海外 検索数の更新は、AOL 4.2%増、HotBot 3.4%増、Yahoo! 3.2%増、で変化の少ない週でした。
*** 今週のレポートは休みます。

検索デスクバー、米Yahoo!新検索エンジン登場 2002.10.13

  日本 検索数調査は、Alltheweb 17.1%増、goo 6.5%増、でした。順位の変動はなく、したがって検索力も前週と同じでした。

  ノーベル賞のダブル受賞は快挙で、久しぶりに明るい話題でした。ノーベル賞クラスの研究は評価されるまでに15年以上かかります。研究内容が明らかにされ興味は尽きないのですが、それと同時に、研究を隠密に評価し推薦した日本のノーベル賞選考委員の活躍に興味が惹かれます。

  先週、一部のブラウザに検索デスクバーを表示しました。全く新しいタイプのコンテンツなのにマニュアルを作ってなく、ご迷惑をかけてしまいました。多くの方からメールをいただき、問題はエクスローラバーの操作法と新規画面の動作にあることがわかりました。表示するブラウザの制限、非表示の登録、そしてQ&Aを作成しましたので、使う前にQ&Aを読むことをおすすめします。見るだけで評価する人もいますが、少なくとも30~50回の検索やWebを表示してから評価しても遅くないのではと思います。

  海外 検索数調査は、Alltheweb 10.3%増、Lycos 9.8%増、AltaVista 4.5%減、HotBot 3.2%減、でした。Yahoo!の検索数調査はずっと継続していましたが、データに載せていませんでした。しかし、以下の理由で今月からリストします。

  Googleとの更新が9月末に切れたYahoo!に結論がでました。9月29日の検索力調査に8月末からテスト中のYahoo!検索について記しましたが、それがパスし、データからの予想通りの展開になっています。もっとも重要なことですが、10月10日頃からYahoo!検索は根本的にリニューアルしました。

  1)5種類の検索がThe Web、Directory、Newsの3種類の検索にダウンしています。ここで注目すべきことは、ページ検索が先、サイト検索は後、と従来のとは逆転したことです。そしてカテゴリー検索はThe WebとCategoryの中に入りました。

  2)The Webは、3件のInside Yahoo!、3件のDirectory Category Matches、20件のWeb Matches、そしてRelated Searchesからなっています。従来のページ検索はGoogleの検索結果をそのまま表示しましたが、今回からはYahoo!のデータとGoogleのデータとをミックスしたものをYahoo!独自のランキング方法で表示しています。紹介文にカテゴリーがあるのがYahoo!の作成したデータです。それから、Powered by Googleの表示が消えてPowered by HPになり、Google表示は一番底にあります。BBCの時と同じようにGoogleは隠れてしまいました。

  3)Directoryは、3件のInside Yahoo!、3件のDirectory Category Matches、20件のDirectory Site Matches、そしてRelated Searchesからなっています。いわゆるサイト検索ですが、カテゴリー順からランキング順に変更し使いやすくなっています。ここでも大幅な改良が行われています。それはサイト処理が人手のサーファからソフト処理へ移行したことです。Webコンテンツを一番よく知ってるのがサーファーといわれる人たちですから、少し残念な気がします。これは時代の流れかも知れません。

  4)Newsは、3件のSponsor Matches、20件のYahoo! News Story Matches、そして3件のPremium News Archive Matchesからなっています。Sponsor MatchesはOvertureの広告です。最後のPremium Newsは有料ニュースで、いずれ中止するようです。

英語キーの検索、速報重視のニュース検索 2002.10.6

  日本 今週の検索数更新は、Fresheye 5.5%増、TOCC 4.5%増、Google 2.3%増、で、検索力の順位も先週と全く同じです。

  今回は検索キーに英語を用いるとどうなるか調べて見ました。検索ロボットはリンクをもとにページを収集しますので、英語のページが混じってきます。収集したページにフィルターをかけるのですが、厳密にしてるところ、少しルーズなところがあります。数個の英語キーで検索し、上位30位までを調べた結果をまとめました。

  (1)90%以上の日本語ページを含む -- AltaVista、AAA!Cafe
ほとんど日本語ページしか検索しません。先々週に調べたデータベースの構成比も両者は全く同じ結果でした。両者の検索エンジンは類似してるとみなせます。

  (2)70~90% -- Google、Alltheweb
検索結果10のうち英語ページを2ケ位含みます。紹介文でわかりますので、あまり気にならないレベルです。共に多言語データベースですので言語分けはしっかりしています。

  (3)30~70% -- Lycos、Naver、goo、Infoseek
検索結果の半分位が英語ページです。紹介文が英語の場合はパスすればよいのですが、少し探し難くなります。

  (4)30%以下 -- Fresheye
英語キーの検索は不得意で、検索結果のほとんどが英語ページで占めます。それから検索結果数は他の検索サイトよりも10~30倍多いようです。この多い分が全部英語ページとみなせます。

  英語キーによる検索結果に英語ページを含めるのが良いのか悪いのかは永遠のテーマかも知れません。

  海外 検索数調査は、Google 4.0%増、HotBot 3.5%減、Lycos 4.6%減、Alltheweb 5.2%減、で減少するところが多い週でした。

  先々週末に、GoogleのNews検索ベータ版がバージョンアップしました。まだ正式版でないですが、ソースは150から4,000へ、更新は時間あたり1~2回から15分おきへとアップしています。検索デスクのニュース検索に以前から載せていますので、一度試してみたら驚きます。日本語でも8月からgooが「最速News」でニュース記事をリアルタイムに収集し、リアルタイムに索引化し、検索提供する「実験」システムを行っています。

  検索デスクには新聞社5社、検索サイト5社の横断検索が可能です。新しいニュースが入ったときにどの検索サイトで速く検索できるのか、半日から1日あとでどれくらいのニュースが検索できるかなどを調べれば、リアルタイム性はチェックできます。Webページとニュース記事とは根本的に異なります。Webページは更新が可能ですが、ニュース記事は更新不可で年月日時分で固定されます。ニュース記事の最初は事実関係が不明な場合が多く、真偽が増幅されるかも知れませんが、やはり速報は最も重要です。

Google検索評価で1位、米Yahoo!の検索結果 2002.9.29

  日本 検索数の更新は、Infoseek 90.5%増、Alltheweb 19.2%増、AAACafe! 18.2%増、になっています。Infoseekは7月から提供していたベータ版を24日に正式版にしました。今年中に1億ページまで収集するとのことです。その他、動画、音声、画像の検索サービスを開始し、検索ボタンも計14個に増えています。Alltehwebは2割程増加し、検索数でトップ、収集数は1億2,000万ページです。

  今回は全検索サイトの検索評価を行いました。検索評価のトップはGoogle 100.0、2位は僅差でgoo 99.4、3位はFresheye 98.0、4位はLycos 92.0 、です。5位はAltaVista 66.5で前回より11.0増加しています。6位はAAACafe! 62.6で前回より減っています。7位はAlltheweb 60.3で検索数を考えると若干不利です。8位はNaver 52.3で、先週データを3倍以上に増やした影響がでています。9位はInfoseek 39.1で、前回と同じです。

  検索評価の4位までと5位以下とは得点で大きな差があります。このラインはリンク情報を使っているのかいないのか、検索エンジンが第3世代か第2世代か、の境界を表わしてるようです。検索評価4と検索数1とした総合指数の検索力は1位Fresheye、2位Google、3位goo、4位Lycos、です。毎週順位が変動しています。

  海外 検索数調査では、Teoma 12.8%増、Yahoo! 12.8増、AltaVista 4.1%減、です。今週の順位は変動しませんでした。

  米Yahoo!の検索は良くなっています。検索は1.Summary, 2.Categories, 3.Web Sites, 4.Web Pages, 5.Newsに分かれています。トップページの検索結果はSumaryを示します。内容はYahoo!ポータルから数件のInside Yahoo!、3件のCategory、20件のWeb Siteを表示します。CategoryやWeb Siteは各20件づつのリストです。Web PageはInside Yahooと20件のPageで、Newsは3件のSponsor、20件のNews、そして3件のPremium Newsです。

  8月末から大きく変わったのはWeb SiteとWeb Pageの検索結果の表示とランキングです。Web Siteはカテゴリ順ではなく独自のランキングで表示します。その内容はタイトル、1行の紹介文、URL、カテゴリの順でカテゴリがトップから最後になっています。次に、Web Pageは"Search Technology Powered by Google"になっています。Yahoo!のデータとGoogleのデータをミックスし、独自のランキング方法で出力しますので、Googleとは若干異なります。内容は2種類あり、Yahoo!のデータはWeb Siteと同じで、Googleのデータはタイトル、1行の紹介文、URL、サイト内検索です。Googleが4月に開放したAPL技術にYahoo!のデータを追加して新検索エンジンとしています。これでYahoo!とGoogleとの提携問題は落着です。

Naver1億4,000万へ、データベース構成の調査 2002.9.22

  日本 検索数の更新はNaverが226.6%増加して先週9位からトップへと大躍進しました。その他、TOCC 29.1%増、Fresheye 26.6%増、Alltheweb 3.5%増、goo 3.8%減、です。検索力はNaverの順位は変わらず、Fresheyeが4位から2位へ上がっています。検索評価は月末の次回に行う予定です。

  9月17日夜のNaverのプレスリリースによると、データベースを7,500万から1億4,000万へ増強しました。現在、Allthewebは1億600万、gooは5,050万ですので、1億を超えるのが2社と日本語も億単位の競争になってきました。ただ、このデータ数はニュースや画像などのデータベースを含めるか含めないかで異なりますので、そのまま比較することはできません。Naverは検索数指数で約3.3倍に増強しましたが、個々の調査キーでみますと、コミック 12.9倍、ヒント 6.1倍、文学 5.1倍が目立ちました。

  検索数調査は15種類の調査キーを使っています。キーにより検索数は異なりますので、一番多いのを100に指数化します。日本語の索引化によっては特定のキーだけ多くなる場合がありますので、その場合には1位の検索数を減らして調整しています。今回、検索サイトのデータベース構成を調べました。まず、各検索サイトの1~5位の上位キー、11~15位の下位キーをピックアップしました。上位キーで多いキーは、イントラネット、時計、マーケット、野球、vrml、一方下位キーで少ないキーは、グルメ、生物、図書館、博物館、文学、で、これらを基準キーとします。

  次に、各検索サイトが上記の基準キーをどれ位持っているか調べました。その結果は、良い順に、goo(5,4,0,0), Google(5,2,0,0), AltaVistaとAAACafe(4,4,1,0), Infoseek(4,3,0,0), Alltheweb(3,2,1,0), Fresheye(2,3,0,2), Lycos(1,3,1,1,), Naver(1,2,0,3), です。()内の数値は、それぞれ、検索サイトの上位キーに含まれる上位基準キーの数、下位キーに含まれる下位基準キーの数、下位に含まれる上位基準キーの数、上位に含まれる下位基準の数、です。

  この結果、(1)検索評価のよいgooとGoogleのデータベース構成はともに上位基準を5個もちバランスがとれている、(2)検索評価のよくない老舗のAltaVistaやInfoseek、そしてAAACafeは同じく4個と次にバランスがとれています。(3)Alltheweb、Fresheye、Lycosは上位基準キーの数が少なくなり、基準キーが反対側に入るのが増えています、(4)増強したばかりのNaverはまだ調整中とみなせます。

  海外 検索数調査で、WiseNutが14.4%増加しました。他は1%以下の微小な変化です。

Webページ構成の難しさ、自動型メタ検索の補足 2002.9.15

  日本 検索数の更新はLycosが27%減少しました。8月18日に75%増加していますので、8月4日からみると28%の増加です。8月4日から較べて、ヒント 350%増、文学 140%増、ドメイン 22%減、時計 21%減、などが目立ち、日本語索引化が変更したようです。検索力は1位 goo、僅差で2位 Google、3位 Lycos、4位 Fresheye、になり、これらの検索サイトが現在のトップグループを形成しています。

  検索サイトはコンテンツ別の検索が可能です。gooは8種類(サイト、ページ、辞書4、ニュース、企業)、Googleは4種類(ウェブ、イメージ、グループ、ディレクトリ)、Lycosは8種類(全て、ディレクトリ、ページ、ニュース、ショッピング、コミュニティ、辞書、百科辞典)、Fresheyeは4種類(ウェブ、ニュース、オーディオ、ビデオ)、Yahoo!は6種類(カテゴリ、サイト、ページ、ニュース、辞書、ショッピング)などです。

  上でいろいろなコンテンツを列挙しましたが、検索サイトのWeb構成の目安を示しているからです。例えば、ニュースの検索ができるところにはニュースは入ってなく、ニュース検索のないところはニュースが入っています。Web検索にニュース、掲示板、ショッピング、英語などがどの程度入っているかは利用者の検索の満足度に影響します。検索キーにより、ニュース記事が多かったり、掲示板が多かったり、ショッピング情報が多かったりしますが、そのとき探しているものにより検索結果が評価されます。

  コンテンツの線引きも難しく、コンテンツを詳細に分けて提供するのが良いのか悪いのか、それにユーザーの習熟度や好みの変化など、検索サイトの情報収集はますます難しくなっています。

  海外 検索数調査ではAOLが21%減、Yahoo!が46%減です。いずれもPowered by Googleです。検索数はOpenfindがトップです。

  先週メタ検索のことを書いた補足ですが、自動型メタ検索に関しては、昨年の11月25日のこの欄で取り上げています。現在は検索エンジンのランキングに優劣が出てきてますので、数ヶ所から10個づつ集めてきた場合に、悪いランキングのデータが入ります。それにメタ検索の収集サイトにロボット型とディレクトリ型が同時に入っています。

  インターネットエクスプローラの最新版の検索ボタンを押すとサイドバーが出てきます。スペースが大きいためいずれツールバーの替わりになることが予想されます。近々、このツールバーについて「検索の視点」を書く予定です。

Archiveの収集、MetaCrawlerがGoogleを利用 2002.9.8

  日本 検索数調査でトップのAllthewebが8.2%減少したため、他の検索数指数は相対的に増加し、検索力の評価にも影響しました。gooとLycosは同率でしたので検索評価のよいgooを1位にしました。また、僅差でGoogleが3位です。その他の更新は、AAACafe 16.4%増、TOCC 5.9%増、Fresheye 2.1%増、です。現在10検索サイト(英語 10社)を調べていますが、更新が大きく変化したのは4社(英語6社)、0.1%に満たないもの3社(2)、全然変化しなかったのが3社(2)です。この1ヶ月間で全数調査したのは平均4社で、英語は6社です。1年前には12社のうち平均6社を調査してましたので、更新頻度が少なくなってきたように思います。

  検索数調査は調査キーを検索して得られる検索数を単純に調べているだけです。患者の体温、脈、血圧などを調べないで病気を診断する医者はいないと思います。検索エンジンにとって検索数は基礎データの一つです。たかが検索数という人がいますが、これを無視して検索エンジンの変化を語れないと思っています。また、検索結果の評価は最も妥当と思われる客観的なルールに基づきデータを収集し定量的に処理したものです。主観的なものが入っていないため、誰が行っても同じ結果になります。

  Webのコンテンツは時とともに陳腐化し消えていきます。米国ではAlexaがWebアーカイブを提供していますが、先日、jpドメインだけのようですが国会図書館がWebコンテンツを収集・保存するとのこと、できるだけ早くスタートして欲しいものです。

  海外 検索数は10社のうち6社が更新しました。Yahoo!が12%減少した以外は2%以内の変化でした。検索サイトで収集検索数を表示しているところが増えてきました。最新のデータは、Openfind 35億ページ、Google 25億ページ、Alltheweb 21億ページ、WiseNut 16億ページ、などです。1ヶ月前に紹介したGigablastは1ヶ月間で2,700万ページ増えて1.1億ページです。

  複数の検索サイトを検索し、その結果を整理して出力する自動型メタ検索があります。米国では生き残りましたが、日本ではほとんど見かけなくなりました。それに対して検索デスクは一つ一つ検索する半自動型メタ検索です。このタイプは日本で見られますが、米国ではあまり見かけません。米国にないものを認めない人もいますし、ガードの固い検索サイトもあります。しかし、最近のブラウザは検索デスクと同じような検索ができるようになっています。従来、自動型メタ検索サイトはGoogleの検索結果を二次利用することができませんでしたが、先日のニュースでメタ検索のMetaCrawlerがGoogleを使用するとのこと、企業の方針が速いテンポで替わっていくことを感じました。それにしても日本の自動型メタ検索が育たなかったのは残念です。

半年間の日米の更新状況、米は倍増 2002.9.1

  日本 検索数の更新は、Alltheweb 32%増、Fresheye "100%"増、AAACafe! 22%増、です。検索評価は前回より大きく変化したLycos、Fresheye、Alltheweb、AAACafe!について行いました。次に更新状況から見た検索エンジンの動向をまとめました。

  検索力トップのLycosの検索評価は92.0とAクラスです。更新は1ヶ月に1回ですが、これはカテゴリの自動作成に時間がかかるためと考えられます。3-5月(春)は6%減少しましたが、6-8月(夏)は71%増加しています。2位のgooの検索評価は100.0のトップです。春は6%増、夏は3%増、と最近のデータ増加は低調です。3位のGoogleの検索評価は95.5で2位です。春は5%減でしたが、夏は17%増で、毎週更新しています。4位のFresheyeの検索評価は92.5の3位です。前回トップでしたが、評価キーの電子政府、Sunday、ニュースの評価が悪くなっています。1週間で倍増したための一時的なものとみなせます。これらの1位から4位まではほとんど差はなく、5位以下を大きく離しています。

  5位のNaverの検索評価は78.2、春は11%増、夏は増減なしです。更新スパンは長く、前回は5月26日、前々回は昨年10月14日、です。6位のAllthewebの検索評価は57.3で、春は324%増、夏は13%減です。この数週間、新しい日本語処理を採用したためかデータを大幅に入れ替えています。しかし、検索評価の劇的な改善は見られませんでした。7位のAAACafe!の検索評価は68.9で、6月23日にオープンしてから43%増加しています。8位のAltaVistaの検索評価は55.5、春は11%減でしたが夏は141%増です。9位のInfoseekの検索評価は41.5、春は11%減、夏は若干の増加です。わずかですが毎週更新を続けています。

  なお、半年間の検索数増減は、Alltheweb 270%増、AltaVista 115%増、Lycos 81%増、Google 11%増、Naver 11%増、goo 9%増、Infoseek 10%減でした。

  海外 検索数の増加はYahoo!が23%増加しています。Yahoo!の検索数指数は97.1でGoogleの5.4倍です。Yahoo!のページ検索結果の上位にめがねマークのついたものがちらほら見られるようになりました。Googleの検索結果をYahoo!流に切り替えて表示しているようです。

  この半年間の検索数の増減を大きい順に記します。Alltheweb 242%増、AOL 225%増、Lycos 210%増、Teoma 114%増、HotBot 55%増、AltaVista 49%増、Google 14%増、WiseNut 0%、となり、平均で114%と倍増しました。

米Yahoo!2.5倍へ、米Yahoo!の検索エンジン更新 2002.8.25

  日本 今週も検索数調査だけ実施しました。先週、大幅に変更のあったAllthewebの検索ですが、調査キー「ドメイン」、「グルメ」、「コミック」の検索は正常に戻っています。しかし、新たに「イントラネット」の検索数が少なくなっています。結局、先々週から見てトータルで40%減になり、検索数指数は2位の79.6です。

  Lycosに関しては今週の更新はありませんでした。Lycosの場合、「グルメ」と「コミック」の検索数は2位よりもそれぞれ2.6倍、4.1倍多くあります。それから「生物」と「文学」の検索数も多いようです。非常にポピュラーな文字が組み合わさった単語ですが、Googleも同じ傾向を示しています。これらの原因が収集先によるものか索引化法によるものかはわかりません。

  海外 検索数は全般に減少するところが多かったのですが、Teoma 8.1%増、HotBot 5.3%増です。注目のYahoo!は149%増加して、約2.5倍になっています。AOLもYahoo!も共にPowered By Googleですが、検索数指数ではGoogle 17.7、AOL 56.4、Yahoo! 79.3、でGoogleに対する割合は、AOL 3.2倍、Yahoo! 4.5倍です。AOLやYahoo!の検索結果をGoogleのと比べると、ところどころで順位が替わるだけで、数百万ページの上位の検索内容は全く同じとみなせます。

  Yahoo!は検索エンジンの開発にタッチせずにディレクトリとポータルに傾注して現在の地位を築きました。ページ検索は提携で補強しています。1995年9月にOpenText、1996年6月にAltaVista、1998年5月にInktomi、そして2000年6月にGoogle、と2年ごとに契約を見直し、更新時に一番強力な検索エンジンと提携しています。Googleとの更新はこの9月で、提携の行方がどうなるかに関心がもたれています。

  現在、一番強力な検索エンジンはGoogleです。それに対抗できるものがあるかどうかがポイントです。Googleキラーと言われた検索エンジンのTeomaは2001年9月にAskJeevesに、WiseNutは2002年3月にLooksmartに買収されています。その他、ボリュームを誇るFastがありますが、米Lycosと提携しています。この数ヶ月間に大きな動きを示した検索エンジンが候補の一つかも知れません。この提携問題は、Googleとの提携を継続する、他と提携する、の二者択一ですが、さらにGoogleとの提携を強化する、の三者択一とみなしています。

LycosとAllthewebの索引化変更、PAXNet終了 2002.8.18

  日本 検索数の調査で、AllthewebとLycosに大きな変化が見られました。検索数でトップのAllthewebは、調査結果をそのままに解釈すれば56.7%減少しました。調査キーの「ドメイン」は1000分の1、「グルメ」と「コミック」は500分の1、と極端に減少し、「ヒント」「生物」「病気」「マーケット」が25%減と続きます。しかし、指数で2位をキープしています。

  一方のLycosは75%増加しました。しかし、その増加はAllthewebと同様にバラツキがみられます。「コミック」300%増、「生物」216%増、「文学」215%増、「野球」120%増、ですが、「イントラネット」「ヒント」「図書館」「博物館」「病気」は数%の増減しかありません。これで検索数指数で2位から1位になり、総合の検索力で僅差で4位からトップです。

  AllthewebとLycosは日本語索引システムを大幅に変更し、まだ処理途中とみなせます。いずれも米国で開発された新しい多言語検索エンジンですが、日本語進出にあたって採用した日本語処理の改善をはかったものです。システムが安定するまでもう少し時間がかかりそうです。その他の検索数では、AAACafe! 17.7%増、AltaVista 9.0%増、の更新がみられました。

  海外 英語検索サイトの検索数調査では、HotBotが60.1%増加しています。この場合は、調査キー15のうち12が39%増から66%増に入っています。これは索引方法に変化はなく、ボリュームをアップしたものとみなせます。日本語で56.7%減少したAllthewebは1.8%減、75.2%増加したWiseNutはほとんど変化してなく、多言語検索システムでも言語別に処理していることがわかります。

  最近始めたサイトランキングで536位のPAXNetが8月30日にサービスを終了するとのことです。投資情報をあつかうコンテンツは定評があり、せっかく育てたサイトが終了するのは残念です。収入源の広告、コンテンツ販売などが振るわなかったのか、費用源のコンテンツ制作費や維持費が高かったのかですが、この問題はWebコンテンツが無料である限り解決しないのかも知れません。

  サイトのランキングをみると官庁などが有用なコンテンツを発信するようになってきたことがわかります。官庁のコンテンツが税金でつくられてるから無料が当然と思っていたら、何か大切なものを失うかも知れませんね。

アドワード・セレクト広告、Gigablast新登場 2002.8.4

  日本 検索数の更新は、Google 6.1%増、Alltheweb 0.9%増、Fresheye 0.1%減、で、低調でした。したがって検索評価は行わず、総合の検索力順位は先週と同じです。

  Googleがトップページで「あなたのサイトをGoogleでアピール」とアドワード・セレクト広告を開始しました。先行のOvertureよりも複雑で、より合理的なシステムです。これは検索キーワードとマッチしたときに、検索結果の右側に表示するテキスト広告です。テキストはタイトル12文字、本文17文字×2行、そしてURLとフォーマットが決まっており、バナー広告よりも容量は少なく、簡単に作成できます。料金はクリック数をもとにしており、表示順序は広告主が決めるクリック単価に利用者が決めるクリック率を乗じたものの大きい順に表示します。クリック単価だけできめるよりはGoogleの収入は増えます。その他、広告費に上限を設けるなど、少額の広告主も参加しやすい広告システムです。

  ページ検索サイトは大量の広告スペースをもっており、広告業者に委託して広告を載せていました。今回のGoogleは中間マージンを排して直接広告主から注文を受けるのと、小口の広告主も参加できることで評価できます。小口の掲載サイトを集めたり、小口の販売店をおいたり、銀行のネット振込みなど、小さなものも何百万と集めれば大きな流れになります。

  海外 検索数の更新は、Openfind 4.8%増、Google 3.9%増、などです。

  次々と新しい検索エンジンが登場しています。英語版のOpenfindはベータ版がオープンし、検索数指数はトップです。新たにGigablastという検索エンジンが登場しました。そのAboutに、2000億ページ収集可能とあり、現在8,600万ページです。現在トップのOpenfindは30億ページですから、それを抜くには29億不足しています。先週から1週間の増加は約500万でしたから、この調子で収集したら10年以上かかってしまいます。20倍の週1億ページ収集しても半年以上かかります。データは蓄積するだけですまず、データが増えれば重複を除く処理、また時間が経てばNot Foundページを除く処理、などが必要になってきます。情報が増えてますます便利になる検索エンジンですが、その裏では過酷な状態が続いています。

Formのコード指定、Sponsor 2002.7.28

  日本 22日にFresheyeは検索エンジンをTOCCに切り替えました。先週の検索数は2.8、今週は40.5ですから、約15倍になっています。従来の速報型検索エンジンはニュース速報などで使われ、8月にはディレクトリ検索サービスも開始するとのことです。その他の更新はGoogleが2.7%増加した以外に変化はありませんでした。

  6月末からの検索数が大きく変化したgoo、Google、Alltheweb、そしてFresheyeについて検索結果の評価を行いました。その結果は、Fresheye、goo、Google、Lycosの順です。TOCCのベータ版は正式版になっています。FresheyeとTOCCの検索総数は異なっていますが、検索評価はほとんど同じです。Googleの場合はGoogleと提携してるExcite、Biglobe、@niftyの検索ボタンを外しましたが、TOCCの場合は逆にFresheyeを残してTOCCを外しました。

  AltaVistaの検索フォームが変更しています。各自のパソコンでコード設定をしないとユニコードとみなされ、文字化けして検索できません。一度検索して文字化けしている検索結果の画面をだし、その右上部にあるSettingsを開きます。そこを設定するのですが、例えば、20 results per page、LanguageはJapanese 日本語、Language TroubleshootingはJapanese(Shift_JIS)に設定します。複数の日本語コードが存在することが検索時の混乱の原因でした。Googleもユニコード対応になっており、ときどきShift_JISとぶつかることがあります。GoogleのFormは入力用と出力用のコードが指定できるようになりました。検索フォームへ入出力用コードを追加することは本来の正しい形ですので、多くの検索エンジンが採用してほしいものです。

  海外 Googleを採用したAOLの検索数は約3倍になっています。その他の更新は少ない週でした。Googleの検索数は19.3、Googleの検索を使うAOLの検索数は58.8、同じくYahoo!の検索数は33.2です。AOLやYahoo!がGoogleよりもなぜ大きいのかその理由はわかりません。

  米国では競争が激しいのでコンテンツを持つところと提携します。検索エンジンを開発してるところはディレクトリを持ってるところと提携し、その逆にディレクトリは検索エンジンと提携します。この提携は永久に続くのではなく、通常2年間の契約です。提携する企業は現在一番よいところと提携しますので提携先はよく変わります。

  現在よく変化するのがSponsor Linksとの提携です。検索結果のコンテンツは、(1)ページ、(2)サイト、(3)ディレクトリやニュース、に加えて(4)Sponsor Links、に分類できます。検索結果を直接有料化できない検索サイトにとって、Sponsor Linksは急成長分野であり重要な柱になっています。

Webサービスの進化、広告の明示 2002.7.21

  日本 Alltheweb 8.9%増、Google 0.4%増、TOCC 2.0%減で、あまり変化のない週でした。検索力は6位と7位が入れ替わっています。英語版がオープンした中国製のOpenfindは多言語型検索エンジンです。日本語検索サービスの出現が待たれます。

  新しいWebサービスが登場しました。Googleが4月にSOAPを使ったAPIを公開しましたが、同様なことを17日にAllthewebの検索結果をユーザーの好みに応じて取り出せる技術を公開しました。さらに、Amazon.comはデータベースの利用技術を開放し、利用者が自由に取り出して使えるサービスを始めました。このようなオープン化が進行する一方で、ディープ・リンクというクローズド化が問題になるのは残念です。

  海外 検索数の更新の主なものはGoogle 10.0%増、Lycos 4.8%増です。オープンしたOpenfindの評価には数ヶ月かかりますが、日本語の検索評価と同様に英語版の検索評価ができれば早く評価できるようになります。

  17日のinternet.comに「全ての広告にデジタルID」の記事があります。これはあらゆる媒体の広告に12桁の独自コードをを割り当て、それに関する情報を広告主、代理店、メディア、サプライヤーに公開するものです。広告の一つ一つにコードを割り当てるのは困難を伴いますが、これが実現すれば新しい世界が出現します。

  少し古くなりますが、7月2日に米連邦取引委員会(FTC)が広告の検索結果に広告の明示を勧告しました。検索結果に広告が入るとランキングが悪くなる恐れがあり、利用者に不利になりますので、検索結果と広告を分離するのは当然です。まだ明示の標準的方法がありませんが、ちなみに現在の表示を示しますと、LycosはSPONSORED SEARCH LISTINGS 、AltaVistaはSponsored Matches、WiseNutはSponsored Listing、HotBotはSPONSORED SEARCH LISTINGSやSEARCH PARTNERS、TeomaはSponsored Results、OvertureはSPONSORED SEARCH LISTINGS、などです。語数の短い言葉で統一できればと思います。なお、日本語の場合はほとんど広告表示がありません。検索結果に埋めこまれたのか、広告自体がないのかは、不明です。

  この広告の明示は利用者が目にするものですが、HTML文を分解する検索エンジンにとっては一般のリンクと広告リンクとを区別することの方がもっと重要です。これに関して問題になってないことの方がむしろ問題のように思えます。この点からも広告のコード化は広告の識別に役立つのではと期待できます。

ディープリンク、Openfindの登場 2002.7.14

  日本 6日から12日まで、息子の挙式でハワイへ旅行しましたので先週の調査はお休みしました。6月末から2週間経ちましたが、9社のうち更新したのは4社です。Googleが5.4%減少していますが、他の変化は見られませんでしたので、検索評価は行ないませんでした。検索力による順位の変動は6位と7位が僅差で逆転しました。

  今週初めにデンマークの裁判所が新聞協会へのディープリンクを禁止する判決を下しました。この判決でデンマークの新聞協会はネット上でさらに発展するのか発展のスピードが落ちるのか、時間が経たないとわかりません。ネットが発展したのはHTMLのコンテンツが作りやすかったのとハイパーリンクがあったためです。ハイパーリンクのよいところはコンテンツに直接ジャンプすることができる点にあります。もし、トップページしかジャンプできないとしたら、現在の数十倍の時間をかけても情報にたどり着けるかどうかわかりません。会社や個人にとって時間は有限であり、コストのかかるものです。利用者の利便性を欠いたサイトはいずれ利用されなくなります。

  海外 新検索エンジンOpenfindがオープンしました。検索数調査はトップです。1位 Openfind 100、2位 Alltheweb 82、3位 Lycos 79、と従来トップのAllthewebよりも検索数で22%多くなっています。したがって、他の検索サイトの検索数指数は低下しました。4位以下はトップの3分の1以下になるという異常な状況になっています。

  Openfindは35億ページ収集しており、ベータ版とのことです。台湾をベースにしており、まだ英語、中国語しか利用できません。いずれ日本語を含めた多言語検索サービスを開始します。検索スピードは超高速です。現在の検索エンジンの主流はリンクを使って検索結果のランキングを向上させています。Openfindもリンクを使っていますが、リンクの使い方はいろいろあり、どのようなタイプのものを利用しているかわかりません。

  現在のロボット検索エンジンの問題点として「指定したキーワードを含まないページも上位に表示される」とあり、Openfindはこの問題点を解消したとあります。この問題点はGoogleの検索システムを指していますが、これは欠点ではなく、検索システムが一段階進歩したものとみなしていますので、逆にリンクの使い方が推定できるかも知れません。

  1ヶ月前に発表したAllthewebの収集ページ数は21億でしたが、現在は10%減の19億位です。OpenfindとAllthewebの検索数指数は100対82ですので、これよりOpenfindは23億となります。公表数値は35億ですので、3分の2位しかありません。目標が35億なのか、3分の2しか索引化してないのか、あるいはGoogleのように未収集のタイトルとそのURLをふくめているのか、はっきりしません。

InfoNavigatorの終了、各言語別データ数 2002.6.30

  日本 検索数調査はGoogle 6.5%増、TOCC 26.6%減、Alltheweb 12.2%、goo 5.2%減でした。この半年間の増減で、増加したのはAlltheweb 216%増、goo 40%増、Google 22%増でした。一方、減少したのはTOCC 40%減、FreshEye 28%減で、現状維持に近いのは、Lycos、AltaVista、Naver、Infoseek、でした。検索評価はgoo、TOCC、Lycos、Googleについて行ないましたが、あまり変化はみられませんでした。

  InfoNavigatorは24日から検索サービスを終了しました。検索デスクを始めた1996年1月にInfoNavigatorはディレクトリ検索サービスをしており、1996年6月末にロボット系検索を始めています。丁度6年で終了したことになります。「グルメ」について6年前のロボット系の検索数は、日本語OpenText 242、ODIN 229、Mondou 167、TITAN 100、千里眼 152 InfoNavigator 73、Netplaza 45、などでした。それが現在では、Alltheweb 1,212,627、Lycos 1,094,618、Google 792,000、goo 645,713、Naver 523,841、AltaVista 319,875、aaa!cafe 291,725、TOCC 264,939、Infoseek 83,235、などです。この6年間のWeb情報の増加をみれば、検索の重要性が理解できます。6年前のロボット系検索エンジンがInfoNavigatorを最後にすべて過去のものになったのは、少しさびしい気がします。永い間、ありがとうございました。

  また、老舗の登録系ディレクトリのURL広場が6月16日を最後に調査できなくなりました。最近のデータを公表してませんが、毎週調査を継続していました。毎年6月末のデータ数の推移をみると、1996年 3,670、1997年 10,161、98年 20,728、99年 25,504、00年 49,344、01年 87,111、02年 113,889でした。URL広場は非営利サイトでしたが、営利とか非営利の区分もあまり意味をもたなくなってきました。

  海外 検索数調査ではGoogleが7.9%増加しました。半年間の増減は、Alltheweb 355%増、Lycos 292%増、Teoma 83%増、一方、減少したのはHotBot 22%減、AOL 12%減で、Google、AltaVista、WiseNutは現状維持とみなせます。

  Allthewebで検索窓に url.all:http:// と入力し、言語をセットすると、各言語別のデータ数が得られます。現時点のデータは、英語 12億1600万、ドイツ 1億2800万、日本 1億1700万、フランス 5900万、韓国 4700万、ロシア 4500万、中国 4400万、スペイン 4000万、イタリア 3600万、ポルトガル 3500万、などです。これを人口で割れば、面白い結果が得られます。
★ 表:検索エンジンの検索力

No日 本検索力検索評価検索数.No海 外検索数
1goo 100.0100.0 60.9.1Alltheweb100.0
2Lycos 97.7 94.871.1.2Lycos 96.7
3Google 96.9 94.4 69.0.3AltaVista 41.5
4TOCC 93.1 97.5 39.0.4WiseNut 40.9
5Naver 78.9 80.9 40.2.5AOL 24.3
6Alltheweb 71.2 57.1100.0.6Google 23.0
7AAA!Cafe 70.9 72.2 38.0.7HotBot 21.3
8AltaVista 62.2 59.2 49.9.8Teoma 18.3
9Infoseek 42.0 43.2 20.5.--- --

TOCCの復活とAAA!Cafeのオープン 2002.6.23

  日本 17日に、Allthewebはデータ数でGoogleを抜いたと発表しました。この増強は6月2日の検索数調査でキャッチしています。そのAllthewebの検索数は先週よりも減少しました。そして日本語データ総数は1億3900万ページから1億2100万ページへと約13%減少しています。これは重複データを削除したからと思われます。検索評価はTOCCが大きく変化したのと、AAA!Cafeが仲間入りしたため、月末に行なう予定の、goo、Google、Allthewebも一緒に検索評価しました。検索力の順位は、goo、Lycos、TOCC、Googleがトップグループを形成しています。これらの検索評価や検索力の差はわずかです。

  TOCCはgooと同じInktomi系で、昨年7月にベータ版をオープンしています。12月末の検索数はgooの4,985に対してTOCCは7,343、検索評価はgoo 100に対してTOCC 90でした。その後今年1月になって、データが25%減少し、検索評価は89.7から60.1へ最近は34.2へと6ヶ月間低迷していました。それが検索評価 98.7の2位へ元の状態に戻っています。

  17日のInternet WatchにAAA!Cafeのオープンのいきさつが詳しく書かれています。昨年12月末に、突然サービスを中止したkensaku.jpの2代目です。Versionは2から4になっています。12月末のkensaku.jpと今回のAAA!Cafeとのデータを比較します。まず、検索数は6,891から3,574へ、検索数指数は76.7から34.2へ、とデータは半減しています。そして検索評価は67.7から71.5へと少しよくなっています。検索数 8位、検索評価 6位、検索力 6位からの再スタートです。レイアウトが変更しており、表示数に20が追加されていますが、機能はほとんど同じです。検索デスクにAAA!Cafeの検索ボタンを追加しました。

  海外 検索数調査では、日本と同様に、米Allthewebと米Lycosが減少しています。3位のAltaVistaの指数が41.6ですから、約2.5倍の差です。データ数ではLycosとGoogleが20億台と張り合っていますが、検索数調査では、Alltheweb 100に対してGoogle 21と5倍の開きがあります。Googleの20億ページは、実際にページを収集し索引化したページ数だけでなく、ページ内のリンク情報から得られる未収集のタイトルとURLのリストを含んでいます。もちろん、後者はタイトル以外にリンク情報をもっていますので検索に利用できます。やはりデータ数などは第3者による認知が必要です。

  1996年に米国の検索エンジン間でデータ数を競うときがありました。その当時の競争は5,000万ページ台でしたが、ページ全文ではなく一部分しか処理してなかったため、ページ当たりの処理量を減らせばページ数を増やせてしまいます。この検索数調査は1996年9月から始めていますが、収集ページ数ではなく、実際に検索できる数の方が指標になると考えて始めたものです。あ~あ、5年以上も飽きもせずに同じことを続けてます!

Alltheweb1億3,900万へ、価格.comの子会社化 2002.6.16

  日本 検索数調査ではトップのAllthewebが24%増加しました。他の検索サイトの増減がなかったため、検索数指数は全般に14位減少しました。それに伴う検索力順位の変化はありませんでした。検索数1位Allthewebの100に対して、2位Lycosは60.3、です。Lycosは昨年12月中旬に7,500万件のデータがあり、現在は少し減少して7,030万位と推定されます。これを基にAllthewebのデータを推定すると1億1,660万ページです。コマンドの"url.all:http:"を日本語に適用すると、1億3,885万9,293ページとなります。日本語検索エンジンもついに1億ページを越える時代を迎えました。

  10日にデジタル・ガレージは価格比較で有名な「価格.com」を子会社化しました。カカクコムは5年前に個人サイトとして出発し、有限会社、株式会社としてネットの成長とともに発展しているネット企業です。トップPVは680万/月、総PVはトップPVの15倍の1億200万/月、ユニークIPアドレスはトップPVの3分の1の226万/月、です。買収金額から割り出した時価総額16億円を1ヶ月当たりの総PVで割ると16円になります。@niftyは83~166円であれば買収が成立していましたが、今回はそれよりも5分の1から10分の1で成立しました。しかし、総PVはメニューや掲示板などを含むか含まないかでその評価は異なります。カカクコムの総PVを半分と査定すれば、単価は倍の32円になります。総PV、トップPV、ユニークIPアドレス、など分野やコンテンツにより定義が異なるため、共通の尺度を見つけるのは難しいです。ちなみに、検索デスクの5月のトップPVは309万/月、総PVはトップPVの1.15倍の356万、1日あたりのユニークIPアドレスはトップPVの7分の3です。検索デスクは2画面方式を採用していますが、1画面方式にすればトップPVはアップします。日本では個人サイトは不利にあつかわれますが、それにめげずにコンテンツで勝負したいと思っています。

  海外 検索数調査ですが、まだAllthewebの増強が続いています。Lycos 4.7%増、Alltheweb 8.6%増、で1位と2位は逆転し、トップはAlltheweb、2位はLycosです。Allthewebのここ数週間の増強はすさまじく、ついにGoogleの公表データ 2,073,418,204 を超えたようです。米国の多言語検索サイトで20億ページを運用するのはGoogleとAllthewebになりました。なお、Allthewebではネット上の.pdfファイルの検索ができるようになりました。

AltaVista倍増、SEOビジネスよりも検索サイトへ 2002.6.9

  日本 検索数調査ではAltaVistaが2倍以上の120%増加しています。先週のAllthewebに続く増加ですが、4月に計画したものが2ヵ月後の6月に実現してるのかも知れません。したがって、検索評価はAltaVistaのみを実施しました。AltaVistaは検索数の増加にもかかわらず検索評価は少しアップし、紹介文などが改善しています。それから検索力の順位は前回と同じでした。

  ディレクトリについてまとめてみました。記号は、(a1)ネットワーク型分類、(a2)階層型分類、(b1)検索できる、(b2)検索できない、(c1)カテゴリあり、(c2)カテゴリなし、(d)大分類数、(e)データ数、を表します。

  Yahoo!(a1、b1、c1、d=14、e=37万)、Lycos(a1、b1、c1、d=16、e=?)、
Google(a2、b1、c1、d=14、e=?万)、Infoseek(a2、b1、c1、d=18、e=?万)、
Looksmart系のMSN、Excite、Biglobe、DION(a2、b1、c1、d=13、e=?万)、
iNETGuide(a2、b1、c1、d=19、e=?万)、JOY(a2、b1、c1、d=42、e=8万)、
goo(a2、b1、c2、d=13、e=?万)、フレッシュアイ(a2、b2、c1、d=16、e=10万)。

  海外 検索数調査はAltaVistaが日本語と同様に125%増加しました。順位が6位から3位へ上がっています。検索力でみると、100がLycosとAlltheweb、40台がAltaVistaとWiseNut、20前後がAOL、HotBot、Google、Teomaと、先週のAllthewebの増強で大きな差が開いています。この大きな差も数ヶ月経てば小さな差になっていき、またどこかが突出するということを繰り返しながら成長しています。

  最近、SEOの記事が増えてきました。SEOに関しては3月1日の検索力調査に紹介し、Web記事の方に毎日数件のSEO関連の英文記事を載せています。また、SEOのソースとしてWeb検索の右下に8種類のSE Newsをリストアップしています。それらに目を通していれば、SEOの動向は把握できます。検索サイトのランキング方法を利用してのSEOビジネスは入学試験と予備校との関係に似ています。ランキング上位に一部のふさわしくないサイトが入れば検索サイトや利用者は時間を浪費することになります。SEOビジネスと検索サイトがタイアップしていれば話は違いますが、SEOビジネスよりも情報を直接提供する検索サイトの方にお金が流れるようにするのが本質です。

Alltheweb倍増、Naverランク向上、@nifty買収額 2002.6.2

  日本 検索数調査でAllthewebが2倍以上の114%増加してトップです。Allthewebの大幅増加で他の検索数指数は相対的に30位減少しました。次に検索評価は前回より変動の大きなAlltheweb、Naver、Infoseekについて行ないました。その結果、Naverが前回の56.1から今回の81.2へと大幅に増加し、4位へアップしました。Naverのランキング・アルゴリズムが改善したものとみなせます。データを倍以上にしたAllthewebは本来なら検索評価指数が減少するところですが、逆に検索評価指数は4.9改善しています。そして、Infoseekも少しよくなっています。

  Allthewebは日本語だけでなく英語も同様に増加しています。これに関してニュースを調べましたが見当たりませんでした。いずれ発表があるかも知れません。5月28日に"FAST Data Search 3.0"というリアルタイム性を重視した検索システムを発表しています。それからFast Search社の検索技術は米国電子政府ポータルのFirstGovにAT&Tを通して採用されています。大規模な情報の検索とHTML以外のデータ形式(PDF、Word、Excel、XMLなど)が処理できることが選考理由でしたので、それが稼動し始めたのかも知れません。検索結果の多い検索ではランキングが重要ですが、検索結果の少ない検索ではデータの多い方が使えます。特徴のある検索システムがいろいろ使えるのが理想的です。

  海外 Alltheweb(Lycos)が日本語と同様に132%増加しています。今までトップでしたので順位の変動はないですが、他の検索サイトの検索数指数は前回の45%位に減少しました。3位のWiseNutが40.5ですので、約2.5倍のデータ量です。

  5月29日にソニーがニフティの買収を断念したと発表しました。ソニーの買収予定額は500~1000億、一方の富士通は1500億で、結局金額的に折り合わなかったものです。最新のNielsen//NetRatingsによると、ISP関連企業ドメインの4月の月間ページビューは、Nifty 6.0億、NEC 3.8億、Sony 2.4億、です。3位のSony-netが1位の@niftyを買収するのですが、買収予定額を月間6億PVで割ると、500億で83円、1000億で167円、1500億で250円です。2000年12月に楽天がInfoseekを買収したときの買収額は月間PVあたり53円、その当時のYahooJは190円でした。現在のYahooJの時価総額は6558億円、4月の月間PVは56.5億、ですので、月間PVあたり116円です。Yahoo!BBの分を差し引けば、これよりも少なくなります。単純にPVだけからみてるのですが、@niftyの買収金額は高いのか安いのか、ソニーの決断が良かったのか悪かったのか、一つの指標を与えてくれます。

Naverの増加、Google 2002.5.26

  日本 検索数調査は、Google 5.6%増、Naver 11.1%増、Infoseek 10.1%減で、検索評価を休みました。総合の検索力はgoo 100.0、Google 99.9、と僅差です。Naverが7ヶ月ぶりに更新し、11%増加しています。紹介文が改善し、読み(探し)やすくなっています。Infoseekが10%減少しています。検索数30万の制限がありますが、一時制限のあった逆リンク検索は回復しています。順位は5位と6位が入れ替わりました。

  Netscape7.0のプレビュー版が公開しました。バージョンが4.7から5.5になったとき、検索窓へ入力した日本語キーワードを認識しなかったのですが、6.0からFIXしています。新しい7.0を少し使いましたが、バグはほとんどなく、速くなっています。リンクのウィンドウを開くときに、右ボタンでタブ型を選択できます。

  海外 検索数調査は、Google 4.5%増、Teoma 41.5%増、です。Ask Jeevesの傘下に入ったTeomaは3月末に続いて今回大幅に増加しました。この2回の増加で約1.84倍になっています。それから検索数の表示が前より詳しくなっています。Yahoo!のページ検索はPowered By Google です。検索数が不安定ということで公表してませんが、調査は継続しており、検索数はトップクラスです。Googleに較べて検索数が多いので、データを追加しているのでは思っていましたが、最近はYahoo!の検索数が正しくて、Googleの方が少なめに表示してるとみなしています。

  22日にGoogleは「Google Labs」を公表しました。これは検索技術に対する新しい試みを公開し、ユーザーからのフィードバックを期待するというものです。技術開発が大規模になっていますので、一部の内部の人によるテストだけでは不十分です。APIやLabsの公開などをみていると、まだまだGoogleが大きく成長する期待を抱かせます。検索技術も大規模になってきましたので、如何に外部の人を取り込んで開発のスピードアップ化をはかるかが課題になってきました。

Unicodeの使用、日本語汎用ドメインの終了 2002.5.19

  日本 検索数調査はgooが0.1%減少した以外はほとんど変化のない、更新の少ない週でした。従って、検索評価はお休みしました。Webの世界は24時間営業で休みがないわけですから、ときどき休まないと長続きしません。

  ネットワークの世界ではIPアドレスを32ビットから128ビットへ拡張する計画が進行しています。一方、文字コードの世界ではすべての言語を16ビットで表現するUnicodeの使用が進行しています。日本語検索エンジンはShift-JISやEUCを独自の識別手法で判定していました。多言語化を進める米国の一部の検索エンジンはUnicode処理を始めています。多言語をそれぞれのコードで処理するよりもコード情報を付加してUnicodeで処理した方が統一できます。日本語コードがShift-JISからUnicodeへと転換するのは案外早いかも知れません。

  海外 検索数調査では、WiseNut 13.5%増以外は少し減少しています。順位は少差で6位と7位が入れ替わりました。米Exciteはロボット検索を中止し、Web、Directory、News、Photoを扱うメタ検索になっています。Web検索の出典はfast、AskJeeves、inktomi、about、looksmart、findwhat、overtureなどです。Directoryは以前からサービスしている自前のもの?です。

  13日にRealNamesのキーワードサービスが6月末で閉鎖するとのニュースが流れました。アドレスバーにhttp://www.で始まるURLを入力する代わりにキーワードを入力するだけでよいサービスです。検索デスクもこのシステムに登録していましたが、4月末の更新をしませんでした。さらに16日には日本語汎用ドメインも一時中止するとのメールがきました。これは一度も使ったことがなく、5月末の更新をしてなかったのでトラブルを避けれました。

  昨年夏に登場したIE6のアドレスバーへの追加機能がRealNamesと競合し一部でトラブルが発生していました。RealNamesは今年6月末のマイクロソフトとのアドレスバー利用契約更新を断念し、頓挫しました。米国企業の進退は迅速なのに驚かされますが、契約を継続するかしないかで大きな影響を受けるのは問題です。

広告部分の索引化、Googleの分身誕生 2002.5.12

  日本 検索数調査はAllthewebが47.9%増加しています。その他の変化はあまり見られませんでした。次に、検索評価は4月21日から大きく変化したLycos、goo、Google、Allthewebについて行ないました。goo 100.0、Google 98.9、Lycos 94.2の上位グループの検索評価は接近しています。一方、中位グループはAltaVista 61.1、Naver 56.1、Alltheweb 53.7、となり、上位グループと中位グループとに大きな壁が存在します。その理由は検索システムにリンク情報を取り入れてるかどうかによると思われますが、はっきりしたことはわかりません。

  広告メールはタイトルに「広告」表示が義務づけられています。しかし、Webコンテンツにはそのような制約はありません。ページ内のテキストやグラフが純粋なコンテンツなのか広告なのか区別のつかないものがあります。この広告に関して人間よりも困っているのが検索エンジンです。広告のテキスト部分を索引化しないよう、さらに広告リンクをリンクに含めないよう、地味な努力が続いています。広告表示のタグがあれば少しは解決するかも知れませんが、まだ発展段階であり次々に問題が発生するのは致しかたないのかも知れません。

  海外 検索数調査ではトップのAllthewebが10%増加したため、他の指数は相対的に減少しています、その他に、Lycos 8.6%増、HotBot 4.7%増、Google 5.2%減、などです。日本語と同様な検索評価を英語検索エンジンに摘要すれば順位は変わりますが、なかなか実施できません。

  BBCの新しい検索エンジンはGoogleの分身でした。5月初めから騒がせていた問題もこれで一件落着しました。しかし、このPowered by Google を載せないのはGoogleの前進であり、政策変更です。従来の提携では、Googleの処理した検索結果に提携先の衣を着けて表示しました。したがって、日本語Googleと提携しているYahoo、Biglobe、Exciteなどの検索は、表示項目は少し異なりますが検索結果は全く同じです。この場合のようにGoogleのランキングと同じという意味でPowered by Google表示が必要だったようです。

  今後はBBCのようなタイプの提携が行なわれます。提携先ごとにフィルターされますので、検索結果のランキングはそれぞれ異なったものになります。Googleとは少し異なるという意味でPowered by Google表示は不必要になります。そもそも検索結果のランキングに絶対なものはありません。リンクを使う検索はその組み合わせ方やしきい(閾)値の取り方でいろいろなランキングが作成できます。そしてそのどれが一番よいかは状況により異なりますし、人により異なります。

  米Yahoo!はこの6月に契約を更新します。Google以外の検索サイトと契約するのか、Googleを採用しBBC流と同様にYahoo流のランキングを採用するのか、これから注目されます。

海外は英語のみ、any 2002.5.5

  日本 4月28日分と5月5日分は検索数だけを調査し、検索評価は行ないませんでした。Lycosが11%増、Googleが13%増した以外は大きな変化はなく、総合の検索力は2位Google、3位Lycos、となっています。

  4月末に、goo.ne.jpとgoo.co.jpのドメイン訴訟でgooが勝利しました。ドメイン、ブランドの確立したドメイン、などは時間の経過とともに考え方が変わっていきます。今後、gooがne.jpをco.jpに変更するかどうか、大変興味深い問題です。

  海外 海外も2週分の検索数調査をしました。複数の人から、世界一のデータをもつGoogleの検索数が少ないのではというコメントをいただきました。そこで調査方法を点検した結果、新しいことが発見できました。

  まず、海外の検索サイトの検索数は基本的に「英語」のみを対象にしています。検索サイトの多言語化はばらばらに行なわれており、多言語化を始めても所有するデータが新しいデータに入れ替わるまでに年月を要します。それに、フォームの内容はよく変更されますので、英語のみの設定も機能してない場合があります。

  先週までの調査において、"english"限定で調査してたのは、Alltheweb、Google、AltaVista、そして"any Language"で検索したのは、Lycos、WiseNut、HotBot、で、AOLとTeomaは多言語化してません。

  そこで、"english"に統一した検索数調査を行ないました。同時に、"any Language"も調査しました。その結果、"any Language"に対する"english"の割合が得られました。Alltheweb 88%、Lycos 90%、WiseNut 88%、Google 25%、HotBot 83%、AltaVista 87%、です。したがって、Lycos、WiseNut、HotBotのデータは12%位少なくなります。LycosがAllthewebを採用していることは知っていましたが、調査データは異なっていました。しかし、今回の調査で、ほとんど一致してることがわかり、残念ですがどちらか一方を調査対象から外さなければならなくなりました。

  Googleの"any Language"はトップですが、"english"は極端に少なく、もし88%位あればトップになります。なぜ25%しかないのか、その理由が知りたいものです。

  これに関連するかも知れませんが、英国のBBCがGoogleに類似の検索エンジンを立ち上げました。米国では、ほとんど"any language"で検索しますので、"english"で検索したものを別種の検索エンジンと思うかも知れません。まだGoogleとBBCとの提携の発表はなく不可解でなりません。

Infoseek検索エンジン開発中、Google 2002.4.21

  日本 検索数調査ではAllthewebが23%増加した以外はあまり変化がみられませんでした。従って、検索評価はAllthewebだけ行ないました。その結果、得点が58.4から57.5へ少し減少しました。全体の順位は前回と同じです。この結果から、Allthewebはデータが増加しただけとみなせます。

  18日の日経BP社IT Proにインフォシークが新型検索エンジンを開発中との記事がありました。8月にベータ版、12月に正式版とのことです。現在の評価は、検索評価は39.3、検索数は35.1、総合検索力は39.1の8位です。8月までにデータを3倍にする計画ですので、単純に計算して、35.1×3=105.3、と検索数はトップクラスになります。もし、ランキング方法に変化がなく、単なるデータの増量だけであれば検索評価は減少しますので、検索力は現在とあまり変わらず、順位も変化しないことになります。従って、ランキング方法のリニューアルは必要ですので、それにより検索評価のアップがどれ位になるのか、楽しみになってきました。

  先日、掲示板上の匿名書き込みに対して著作権を認める判決がありました。活字になったものは、何年たっても残っていますが、Web上にある情報はサーバーから削除されれば何も残らなくなります。例えば、私が20年前に書いたものの出典を示せば、その情報にたどり着けます。しかし、検索デスクにある調査や視点などの著作物はサーバーから除去されれば即時に消滅します。Web上の活動は一瞬にして無になるのではないかと一抹の不安を覚えている今日この頃です。

  海外 検索数調査はたかだか1.5%未満の微小の変化しかみられませんでした。GoogleキラーといわれるWiseNutとTeomaの更新スパンが長いのが気になりますが、恐らくカテゴリーを自動作成しているのが原因ではないかと思われます。

  現在トップの検索エンジンGoogleの話題には事欠きません。19日にGoogleが"Google Answers"のベータ版を開始しました。これはソフトではなく人間が検索に答えるものです。現在のビジネスモデルは仲介が多いのですが、Googleの役割は質問者と回答者との仲介です。さしあたり一定レベルのサーチャーを集めなければならないので、実際に軌道に乗るまでには少し時間がかかりそうです。

ブロードバンドの先陣争い、GoogleのAPI開放 2002.4.14

  日本 検索数調査は更新が認められたのは10社のうち5社で、Google 12.6%減、フレッシュアイ 8.9%増が目立つ程度でした。従って、検索評価は行なわず、検索力順位も変化しませんでした。なお、自然文で検索できるPCWEB Searchが4月3日より休止していますが、ディレクトリは利用可能です。昨年12月の検索数調査は13社が対象でしたが、現在は10社と少なくなっています。

  Biglobeや@niftyなどのISPは、Yahoo!やgooなどのポータルサイトと同様に、トラフィックが多いところです。ポータルサイトはディレクトリから始まりロボット系検索、ニュースなどのコンテンツ、掲示板、ショッピングなどWebの発展に応じて事業を拡大し、先発組が有利に推移しており、最近、事業の見直しが行なわれました。一方のISPはネットの発展に力を注いでいたために、Webコンテンツに関しては後発であり、最近ポータルとしての陣容が整ってきました。これからブロードバンドということで、皆が一斉に先陣争いをしています。ポータルサイトはオープンなシステムで発展してきましたが、ISPはどちらかといえばクローズドなシステムです。今後はどちらが有利に働くか予想がつきません。

  海外 検索数調査ですが、Lycos 38.7%増、Alltheweb 41.1%増、と大幅にデータを増強しました。検索数では1位 Lycos、2位 Alltheweb、3位 WiseNut、です。トップの増加が大きいため、他の検索サイトの検索数指数は相対的に減少しました。

  12日にGoogleが非常に重要な発表をしています。それはGoogle Web APIの開放です。従来、検索エンジンを開発した検索サイトはWebページを収集して索引化し検索サービスするとともに、その処理ソフトをイントラネット用に汎用ソフトとして販売していました。今回のGoogleのAPI開放はLinuxのオープンソフトの流れにそったものです。その特徴は、1)データ収集というわずらわしいことをせずに、Googleが収集・整理したデータを使うことができる。2)Googleが処理しているソフト群を自由に組み合わせてプログラミングし、自分の好きな形に出力できる。現在は無料で、いずれ有料になるにしても、大変、夢のあるものです。力のある人は挑戦してみてはいかがですか。

検索数も検索評価も2分化、gooのサイト検索 2002.4.7

  日本 検索数調査では、Google 9%増、AltaVista 10%減です。Webの世界は拡大していますので、検索サイトのデータ収集数は増えるものと思っていましたが、逆に減少してるところがあります。gooとGoogleは、2001年9月から半年間で、それぞれ、47%と29%、増加しています。一方、減少してるところですが、AltaVistaは2001年10月がピークで51%減、Infoseekは2001年1月がピークで34%減、Allthewebは2002年1月がピークで34%減、です。また、検索力指数80以上が4社、残りは50以下で、差が開いてきたのが少し気になるところです。

  検索評価はAltaVistaだけ再評価しました。ほとんど変化はなく、検索力による移動もありませんでした。この検索評価も指数90以上が3社、60以下が5社と大きな断層のある2つのグループに分けられています。ページだけの情報を使うものは情報量が限られています。ページ周辺のリンクにある情報を取り込んで、ページの情報量を増加させたものをベースにすれば検索はより精度を増します。リンク情報の利用はいろいろな方法があり、どれも決め手を欠いていますので、これからも終わることのないソフト開発競争が続きます。

  4月1日にgooがリニューアルしました。辞書などの専門データベースの検索ボタンが新設され、ワンクリックで利用できるようになりました。検索ではサイト検索が変更しています。従来はサイトのキーワード検索が主体で、検索数指数も6.4とフレッシュアイ3.4よりも多いデータでした。Googleも同様なものをもっていましたが、この1月に純粋なディレクトリ検索へ移行しています。今回のgooのサイト検索はデータは少ないですが厳選タイプのディレクトリ検索への移行です。検索評価ではサイトを集めたものよりもロボットで集めた方がよい結果が得られていましたので、当然な帰結です。現在のロボット検索はページだけでなくサイトもあつかえるほど進歩したとみなせます。

  海外 検索数調査は、AltaVistaが26%減少して4位から7位になっています。その他の変化は少なく1%以下でした。英語検索サイトは検索数指数50以上が8社のうち7社と、日本語8社のうちの4社に較べればポテンシャルの高い状態が続いています。

  5日に「OvertureがGoogleを訴訟」との海外記事が多く見られました。Overtureは検索結果を支払額の多い順にリストすることに関する特許をもっていますが、無料から有料へと移行しようとしている多くの検索会社にとっても、広くは検索サイトの利用者にとっても影響しますので今後の成り行きが注目されます。

ISIZEのリニューアル、ステップアップの楽しみ 2002.3.31

  日本 検索数調査はAllthewebが46%減と約半分になっています。英語も25%減ですので、何か大きな変化があるのかも知れません。2001年12月平均から3月31日までの3ヶ月間の増減は、Lycos 4%増、goo 37%増、Google 3%増、TOCC 7%減、AltaVista 44%減、Alltheweb 31%減、Infoseek 15%増、InfoNavigator 15%増、フレッシュアイ 29%減、などです。今回は、goo、Google、Lycos、Alltheweb、の検索評価を行ないました。Lycosが約6ポイントアップしました。総合の検索力は、2位 Lycos、3位 Googleです。

  3月27日にISIZEがリニューアルしました。ついにトップページから検索ボタンが消えてしまいました。この半年位で、多くの検索サイトが撤退していますので、その流れにそったものかも知れません。トップからの検索はできませんが、主要なコンテンツにいけばそこからサイト内検索は可能になっています。3月末から4月にかけて、goo、エキサイト、フレッシュアイのリニューアルが予定されています。

  海外 検索数調査では、Lycos 23%減、Alltheweb 25%減、Teoma 30%増、です。Ask Jeevesに買収されたTeomaはデータを大幅に増加しています。検索数表示は以前と同様、大きな単位の概数です。例えば、holiday、java、literature、movie、museum、の検索数はすべて2,730,000です。なお、Ask Jeevesの検索結果は、最初にSponsored Linksが5個、そしてTeomaの検索結果が10個と続きます。

  パソコンの進歩と同様に通信の進歩もめざましいものがあります。私が始めてTSS端末を使ったときの通信速度は50bps、これでも感激したものです。300bpsの音響カプラーも体験し、1985年から10年位続いたパソコン通信時代の電話回線用モデムは1,200bps、2,400bps、9,600bps、と買い替え、1995年3月からのインターネット時代は電話回線用の28,800bps、96年9月テレホーダイに加入、98年9月にISDN用ターミナルアダプタの128K、99年12月にCATVインターネット(数Mbps)のHub接続、そして02年2月からブロードバンド・ルータ接続、といろいろ体験しました。お金はかかりますが、ステップアップしていくたびに何回も喜びを味わいました。今はいきなりADSL接続から入れますので、その人たちにとっては光ケーブルへのステップアップしか楽しみがないかも知れません。

コンテンツの有料化、英語検索エンジンの紹介文 2002.3.24

  日本 検索数調査はトップのLycosがアップしたため、他は相対的に減少しました。Googleが8.2%増、フレシュアイ9.2%減以外はあまり動きのない珍しい週でした。したがって、検索評価はお休みです。ODiNは3月5日にハードを更新しましたが、現在トップページへアクセスできません。検索評価も1月末から検索ができないため中止しています。検索評価がよかっただけに残念です。

  先日のWeb記事にコンテンツの有料化の普及は遅れるとの予想記事がありました。Webが始まったときにもコンテンツの有料化を試みたところがありましたが、無料のコンテンツの増殖には勝てず、撤退していきました。その後、Web広告が普及してきて景気がよかったのですが、IT不況の浸透で一部のコンテンツの有料化が始まりました。無料サービスでユーザーを掴んでから有料化するところ、新しい分野にいきなり有料化から始めるところなど、いろいろなケースがあります。有料化はWebが始まった頃よりも現在の方が厳しいかも知れませんが、いつまでも夢を追い続けて欲しいものです。

  海外 検索数は8検索サイトのうち4サイトが更新しましたが、1%前後の変化しかなく、順位の変動はありませんでした。

  同一検索エンジンで英語と日本語をサービスしてるのは、Alltheweb、AltaVista、Google、WiseNut(日本はLycosJ)などがあります。検索の視点で紹介文の作成を調べましたが、英語と日本語とで同じかどうかチェックしました。Allthewebは抄録方式(文章)、AltaVistaは一部がKWIC方式、GoogleはKWIC方式、WiseNutはKWIC方式、です。AltaVistaだけが英語はKWIC方式で日本語は抄録方式です。なお、英語のHotBotと日本語のgooはInktomi系の検索エンジンですが、データベースは別々に作成しており、いずれも紹介文は抄録方式(文章)です。

  英語でKWIC方式を採用してるのは、Google、WiseNut、AltaVistaです。Googleのオープンは1999年9月、WiseNutのオープンは2001年8月、したがってKWIC方式を使ったGoogleは2年間独走したことになります。なお、WiseNutのSnake-a-PeakはLycosJのプレビューでキャッシュと同じです。

紹介文の重要性、LookSmartがWiseNutを買収 2002.3.17

  日本 検索数の増減は、Google 7.2%減、Alltheweb 25.4%増、フレッシュアイ 31.5%減です。大きく変化したAllthewebだけの検索評価を行ないました。しかし、総合検索力の順位は前回と同じでした。なお、Naverが昨年12月9日以来3ヶ月、AltaVistaが2月3日以来1ヵ月半、更新がとまっています。それからgooのサイト検索のデータは2月17日以降更新がとまっていますが、4月からのリニューアルに関連があるようです。

  検索結果にはランキング、紹介文、関連情報、そして検索キーに関連した情報(広告を含む)などがあり、各検索サイトごとに異なっています。検索デスクの検索評価はランキングで示されるURLのみで行なっています。しかし、紹介文は利用者が情報を選択するのに役立ちます。昨年12月23日の検索力調査で「Googleの優れた点はランクだけでなく、紹介文によるところが大きいと思います。」と記しましたが、Googleの評判の半分はこの紹介文によるものと思っています。URLで調べるとGoogleはgooよりも若干悪いのですが、紹介文に関してはGoogleが他よりも圧倒的に優れています。近々、この辺のことを検索の視点にまとめる予定です。

  海外 トップのLycosが10%増加したため、その他の検索数評価は相対的に10%減少しました。その他、Allthewebが25.8%増加しています。日本語も同様に25.4%増加していますので、英語と日本語が同時に同じ位増加したことになります。なお、英語版のWiseNutは昨年9月23日から更新されてませんが、日本版のLycosは頻繁に更新されています。

  Googleキラーと言われているWiseNutがディレクトリ系のLookSmartに買収されました。今後、LookSmartとWisNutの統合が行なわれますが、日本ではLycosがWiseNutを提供していますので、今に始まったことではありませんが、提携関係は複雑になります。昨年9月に、Ask JeevesがTeomaを買収し、今年1月にAsk.comに統合されたように、LookSmartの統合が数ヶ月で進むものと思われます。

お知らせラッシュ(goo、フレッシュアイ、エキサイト) 2002.3.10

  日本 検索数調査では、TOCC 10.4%増、Alltheweb 6.8%増、goo 6.1%増、フレッシュアイ 28.2%減、でした。従って、検索評価は、Google、goo、TOCC、Allthewebの4検索サイトを調査しました。TOCCですが、検索数は3週間で13.5%増加しましたが、評価は25.2減少して36.2に急減しました。1月初めにも同じようなことがありましたが、一時的な現象のようです。検索力は1位と2位が入れ替わりました。データ増強中のgooがGoogleを抜いてトップです。

  今週はお知らせの多い週でした。まず、gooが4月に行なうモデルチェンジの概要を発表しました。ポータルとして多方面にサービスしていましたが、一部のサービスを終了しサービス分野をフォーカスするとのこと、どのように変化するか楽しみです。それから、フレッシュアイが4月1日に同じ東芝グループのニューズウォッチに吸収合併されます。あまり広告収入に頼らなくてもよいように経営基盤を強化するものです。なお、ブランドのフレッシュアイと検索は継続するとのことです。

  さらに、伊藤忠がエキサイトの実質的なオーナーになりました。それとともに、エキサイトの事業方針が発表され、ポータルとしてトラフィックをベースにするものから、20~34歳の都会派にターゲットを絞ったエンターテイメント、モバイル、コミュニケーション、インフォメーションを重点に変身します。コンテンツ提供がページビュー重視から利益重視へと、Webの世界も新しい時代を迎えつつあります。

  海外 検索数はLycosが23.2%増加し、WiseNutを抜いてトップになりました。その他にAllthewebが7.8%増加しています。英語検索エンジはFast系のLycosとAlltheweb、WiseNut、AltaVista、Inktomi系のHotBotとAOL、GoogleとGoogle系のYahoo!、Teoma、に分かれ互いに競い合っています。

  3月5日にユーザビリティの権威AlertBoxの「直リンクのすすめ」という記事があります。直リンクを薦めるか拒むかはトラフィックに大きく影響します。本を探す場合、1部屋しかない家の玄関から入って探す場合、多数の部屋のあるビルの入り口から入って探す場合、図書館に行って本を探す場合、など条件がいろいろあります。玄関からしか入れないと目的のコンテンツに到達できない恐れもあり、ワンクリックで情報に到達する直リンクに較べて時間を浪費します。トップページしかリンクを許可しないサイト運営者には再考を促したいものです。

サイトの見直し、コンテンツ制作に必要なSEO 2002.3.3

  日本 検索数についてはAllthewebが15%増加した以外はあまり変化のない週でした。従って、検索評価は行いませんでした。総合の検索力は1位と2位が同得点です。なお、昨年12月末から2ヶ月間の検索数増減は、goo 33%増、Google 15%増、Infoseek 11%増、Lycos 9%増、Alltheweb 1%減、TOCC 18%減、AltaVista 44%減、でした。

  不況で広告収入の落ち込みが激しいのか、サイトの見直しや雑誌の休刊が相次いでいます。26日にオークションサイトのeBayが3月末でサービスを終了し日本から撤退すると発表しました。日本市場への進出が遅れたのか、日本語や文化が壁になったのかわかりません。翌27日にリクルートのISIZEが3月末にサイトを再編成すると発表しました。ISIZEはリクルートの発行している複数の情報誌をベースにしたサイトと、提携したサイトとで構成しています。今回は提携サイトから撤退し、情報誌を中心に再構成するものです。なお、インターネット検索の雑誌、リクルートの「あちゃら」とインプレスの「できるインターネット」は3月売りで休刊とのことです。

  次は、撤退と異なり値上げの動きです。21日に楽天は一部の使用料金を固定制から従量制にすると発表しました。28日にはYahoo!オークションが出品者や落札者から落札額に応じて料金を徴収すると発表しました。いずれも大規模なシステム投資コストの負担を軽減するためのものです。インターネットは今まで利用者のコストがゼロという異常な状態で発展してきましたが、今後は妥当で必要なコストを負担する正常な状態になっていくことが予想されます。

  海外 検索数調査では、HotBot 4.0%減、AOL 5.1%、が目立つ程度であまり変化がない、順位の変化のない週でした。

  検索デスクの海外ITコーナーにSENewsを紹介していますが、これは検索エンジンの最新情報をあつかうサイトで、その一部をWeb記事に紹介しています。3月1日はLink PopularityとSEO(Search Engine Optimaization)についての記事が載っています。Link PopularityはGoogleで普及したリンクの人気度に関するもの、SEOはキーワード検索で上位にランクする方法を各検索エンジンごとに調べてコンテンツ制作に役立てようとするもの、です。SEOを学習するには、インターネットの完全な知識、検索エンジンやディレクトリの知識、各検索エンジンのランキング方法の知識、検索サイト間の提携関係の知識、HTMLの完全な知識と経験、サイト統計プログラムの経験、あるいはログファイルの解読、などが必要です。コンテンツ制作には内容に加えてSEOの知識が必要になってきたようです。

Googleとgooの増加、GoogleのAdWords 2002.2.24

  日本 検索数が大幅に増加するところの多い週でした。Google 16.8%増、goo 28.5%増、TOCC 2.7%増、Alltheweb 3.7%増、Infoseek 9.4%増、Infonavigator 15.5%増、フレッシュアイ 4.9%増、です。先週から始めたのですが、各検索サイトの索引方法が異なるために調査キーによってヒット数がばらつきます。したがって、カウントが多いために他の指数に影響する一部の調査キー(グルメ、ヒント、ドメイン、文学)について、ヒット数を微調整しました。

  検索数の変化が大きいGoogle、goo、Infoseekの検索評価を行いましたが、検索評価や検索力の順位には変化はありませんでした。多くの場合、データが増加すると検索評価の得点は悪くなります。検索数の増加と検索評価の減少で検索力のバランスはとれてしまいます。なお、Infoseekの逆リンクは先週まで少数しかヒットしませんでしたが、今週から従来のレベルに回復しています。

  海外 海外の検索数も大幅に増加するところが目立ちました。Lycos 26.1%増、Alltheweb 26.6%増、Google 7.8%増で、一方、HotBot 4.0%減、AOL 4.3%減、です。5位のLycosが2位へ、6位のAllthewebが3位へ、と大幅に順位が入れ替わりました。

  Googleに新しい広告が登場しました。今までは、1)Premium Listingsという無条件で検索結果のトップに表示するもので掲載料金は高目に設定されたもの、2)AdWordsという検索結果の上部に表示した回数(インプレッション)で料金が決まるもの、3)今回新たに追加されたAdWords Selectは2)の発展したもので、掲載希望者の中からGoogleへの貢献が大きい順に掲載するというものです。これはクリックをベースにしており、掲載料金にクリックスルー率を乗じたGoogleの手取りの大きい順に掲載する合理的なものです。広告主は掲載料金だけでなくクリックスルー率も考慮しなければなりませんが、広告オプションが多くなることはよいことです。

  検索の場合は、検索結果に広告が入ったりすると、検索評価は低下します。それからニュース記事などにも広告記事が入ったりしますが、やはり広告であることを明記してほしいものです。Googleの場合は検索ランキング結果とテキスト広告とが分離してますので、その点は安心して使えます。

検索の易しいキーと難しいキー、検索の重要性 2002.2.17

  日本 検索数調査は、TOCC 11.2%増、フレッシュアイ 7.8%増、gooサイト検索 38.0%増、でした。検索評価は大きく変化したTOCCだけを実施しました。TOCCの検索数は11.2%増加で、検索評価は60.0から60.7へ増加しただけで、総合の検索力順位は変化しませんでした。

  最初、TOCCの検索評価が大きく減少しましたので、よく調べてみるとTOCCの一部のコード変換が不具合になっていることを発見しました。それは検索に直接関係のない記号で、シフトJISで作成したページの中にある「~」と「-」をEUCに変換するときに発生しています。先週まではうまく処理してましたので、これは一時的な現象のようです。それからMSNのコードがユニコード(UTF-8)に替わっています。このため、一時、検索デスクでMSNを検索できませんでしたが、現在は検索可能です。このコード問題は、送られた異種のコードは受け手が処理し、送り手は相手のコードに合わさなくてもよいのが原則です。

  新しい調査キーを採用しましたが、索引化の難易で得点が変化します。その高い順は、旅行、グルメ、ニュース、住宅、マネー、一方低い順は、MMF、2005年、生活習慣、再就職、電子政府などです。前者は検索サイトによる差異はあまりないですが、後者は検索サイトにより評価のぶれが大きくなります。

  海外 検索数調査は6検索サイトが更新していました。2位のHotBotが7.1%減少しましたが、全体の順位の変動はありませんでした。

  先日のWeb記事に、ネットサーファーが検索エンジンをあまり使わなくなったという記事がありました。統計でそうなってるかも知れませんが、私などはむしろ検索エンジンを重宝し、それにまだ知らないことの方が多いせいか、何事も検索にかけています。個人的に利用する特殊なサイトはブックマークですみますが、ブックマークも多くなるとそこを探すよりも検索したほうがサイトを速く見つけれます。時が経つにつれて入門者、初心者、中級者、上級者の割合が変化していきますが、まず上級者になることが先決です。Web検索の重要性にできるだけはやく気づいた組織なり個人が大きく飛躍するものと思っています。

ドメインや博物館の索引化、GoogleのPage 2002.2.11

  日本 検索数調査では、Lycos 8.5%増、Alltheweb 21.2%減、そしてFreshEyeが43.6%増です。これらの増減は15調査キーの平均ですので、個々のキーの増減の大きいものをピックアップしました。
Lycos  ヒント 274%増、ドメイン102%増、、、野球 41%減、博物館 42%減。
Alltheweb 文学 10%増、博物館 4%増、、、時計 26%減、ドメイン54%減。
AltaVista 生物 27%減、博物館 27%減、、、コミック 55%減、ドメイン 63%減。
FreshEye ドメイン 108%増、イントラネット 53%増、、、野球 10%増、マーケット8%増、
です。Lycosだけが増減幅が大きく、索引方法を変更中のようです。

  このリストには、ドメイン 4回、博物館 3回、野球 2回とぶれの大きいキーがあります。これらのキーはフレーズ的に使われる場合が多いため、その索引化は難しく、どの検索サイトも大変苦労しているものです。

  次に、検索評価ですが、LycosとAllthewebのを行いました。全体に得点は下がりましたが、今回データ数の変更が多かったLycosは5.4減、Allthewebは5.0%減と他よりも減少しています。検索力は、1位 Google、2位 goo、3位 Lycos、です。なお、1ヶ月前に較べて、TOCC 27%減、Alltheweb 20%減、AltaVista 44%、減です。この趨勢が何を意味するかがわかれば先が読めることになります。

  海外 6サイトの検索数調査を行いました。ほとんどが2~5%増減しており、3位~5位が入れ替わりました。

  2月7日のWeb記事に"Understanding and Building Google PageRank"という英文の解説記事があります。ページランクはInternal Linking と External Linking を使っているとのことです。私が十数年前にリファレーション(Referations = References + Document + Citations)を使った文献検索技術を研究していましたが、まだDocumentの部分が含んでないように思います。いろいろな測度を計算するのに、データ数が多く、しかもSparse行列を解くのは不可能です。この難解な測度を非常に簡単なアルゴリズムで求める方法を十数年前に開発しています。それにしてもGoogleの躍進でリンクが脚光を浴びてきたことは大変望ましい状況です。

AltaVista:3分の2へ、伊藤忠商事:エキサイト買収 2002.2.3

  日本 7サイトの検索数調査を行いました。AltaVistaが44.0%減少しています。英語の方も33.6%減少しており、さらに逆リンクを調べましたがここも半分位に減少しています。大きく増加する場合は発表がありますが、減少する場合は発表がないので、何が原因かはわかりません。しかし、運営方針が変更したことをデータは示しています。

  したがって、今週の検索評価はAltaVistaだけ行いました。AltaVistaの得点は56.7から60.9へ増加しましたが、検索数が60から36になったため検索力の順位は変わりませんでした。検索力をみると3位までは検索力96以上、4位以下は検索力68以下と3位と4位の差は大きく、2つのグループに分かれてしまいました。なお、ODiNはまだアクセスが重いため調査できませんでした。

  土曜日の朝に伊藤忠商事が米エキサイト@ホームからエキサイトJapanの65%の株を20億円で買収したとのニュースが入りました。これを100%にすると30億円です。ページ検索をGoogleに移行したことを考慮しても、月間推定8~9億PVですので、月間PVあたり4円です。2000年11月に楽天がInfoseekを買収したときは85億円、月間ページビューあたり53円、Yahooの190円に較べて3割でした。ちなみに現在の日本ヤフーの時価総額は5,500億円、月間61億PVですので、月間PVあたり90円、これをYahoo!BBと折半すれば45円位になります。Exciteの4円はYahooの1割位ですので相当安く買収したものとみなせます。

  海外 検索数の調査では、AltaVistaは33.6%減少し、1位から5位にランクを落としました。トップはWiseNutですが、昨年9月23日以降4ヶ月以上更新されてないのが気がかりです。その他、Lycos 7.1%増、Teoma 6.9%減です。

  検索窓にキーを入力して検索しますが、情報源別に複数の検索サービスが利用できるところを調べてみました。Googleはウエブ、イメージ、グループ、ディレクトリ、AltaVistaはウェブ、イメージ、ビデオ、MP3、ニュース、Allthewebはウェブ、ニュース、イメージ、ビデオ、MP3、FTP、そしてYahoo!はカテゴリ、ウェブサイト、ウェブページ、ニュース、リサーチペーパー、と各社様々です。

検索評価キーの変更、米Yahooの有料記事検索 2002.1.27

  日本 検索数調査では13サイトのうち7サイトを調べました。TOCCが大幅に減少し23.6%減、Googleは5.4%増です。ODiNは先週からですが検索が重く調査できまませんでした。goo検索のデフォルトがサイト検索からページ検索に戻っています。Googleのディレクトリ検索はサイト検索ではなくカテゴリ検索してるようで、従来のような検索はできませんでした。落ち着くまで少し時間がかかりそうです。

  検索評価の調査キーは50ありますが、そのうちの20を入れ替えました。その内訳は2字漢字 15、3字漢字 6、4字漢字 6、カタカナ 10、ひらがな 3、英字 5、その他 5、です。従来は2字漢字とカタカナが主でしたが、今回はバラエティに富んだキー構成にしました。ほとんど全数調査しましたので、検索数調査と検索評価調査とで今回は700回位の検索をしたことになります。

  調査キーを変更したのですが、検索評価の得点はあまり変化しませんでした。1位はgoo、2位はGoogle 96.2から96.4へ増加、3位はLycos 93.0から90.9へ減少、4位はAlltheweb 74.3から64.7へ減少、5位はTOCC 91.1から60.1へ減少、です。TOCCは検索数と検索評価が大きく減少しました。総合の検索力は、1位 Google 100.0、2位 Lycos 99.5、3位 goo 98.2、とほとんど同レベルで、4位のAlltheweb 67.6 以下を大きく離してしまいました。

  海外 検索数調査では、Google 5.6%増、Lycos 5.1%減、Alltheweb 4.8%減で、順位の変更はありませんでした。毎週ごとの変化は少ないですが、3ヶ月前と較べますと、Teoma 37.5%増、AltaVista 23.1%増、AOL 21.3%増、HotBot 20.9%増、Google 17.7%増、Alltheweb 0.3%増、WiseNut 0%、Lycos 3.8%減、平均20.0%の増加です。

  Northern LightがWeb検索を撤退しましたが、平行してサービスしていた有料の記事検索サービスはdivine Inc.に買収されました。それと同時に、『Yahoo! Premium Document Search』として再出発することが発表されました。アーカイブタイプの記事データベースがYahoo!の強力な流通ルートに乗るわけですから、従来よりは利用されるものと思われます。市販のデータベースも独自の流通ルートを開拓していますが、トラフィックの多いところと提携して販路を拡大するのも一つの手です。大規模なデータベースとして、Web系、速報ニュース系、アーカイブ系の3種類がありますが、それぞれのデータの特徴を生かした3種類の検索技術が発展するのが理想的です。

日本語のフレーズ検索、ニュース検索は日付順で 2002.1.20

  日本 検索数の更新は13社のうち9社、ほとんど1%未満の変動です。今回は、Google、TOCC、Infoseekの検索評価を行いました。先週、評価を大幅に下げたTOCCは元の評価に戻りました。検索評価の順位は替わりませんでしたが、総合の検索力順位は入れ替わりました。1位 Lycos、2位 Google、3位 goo、4位 TOCC、です。

  英語の場合、単語はスペースで区切りますが、日本語にはスペースがありません。したがって、各検索サイトは単語を識別するために大変苦労を重ねています。いつも使う事例ですが、「情報」、「検索」、「情報 OR 検索」、「情報 AND 検索」、「情報検索」、の検索数を調べ、各項目の比率を求めて比較します。なお、最後の「情報検索」は情報と検索とを合成したもので英語のフレーズとみなせます。このフレーズ検索はAND検索よりも少なくなります。

  goo、TOCC、Alltheweb、はAND検索、OR検索、フレーズ検索を正しく行う検索サイトとみなせます。以下、コメントを記します。1) AND検索: Lycosの結果は他の100分の1位、Googleは2~3倍というか検索数が大きいと少なく表示されるようです。AltaVistaは現在日本語コードでのAND検索はできません。2)OR検索: LycosとNaverが処理できません。3)フレーズ検索: Lycosは""で囲むことが必要で、しかもその結果は他よりも5分の1から10分の1位少ないようです。日本語ではフレーズ検索を意識せずに使っていますので、検索ランクに影響するかも知れません。

  海外 更新は8社のうち6社です。Teomaが6.9%増加した以外はあまり変化のない週でした。16日にNorthern Lightの無料のページ検索は閉鎖しましたが、ニュース検索は続行しています。

  現在のロボット系検索エンジンはページやサイトの区別を解消しつつあります。ページやサイトの混成したデータを同じ土俵でランキングできるようになったからですが、検索エンジンにはランキングをあまり意識しなくてもよい分野があります。それは新聞記事、雑誌記事、掲示板の発言などのニュース検索です。その特徴は年月日表示があり、原則としてコンテンツは変更しないものです。この場合の検索は、情報をできるだけ速く入力し、ランキングではなく新しい日付順に表示することが重要になります。まだニュース検索などでランキング表示するところがありますが日付順表示にしてほしいものです。

TOCCの検索評価が悪化、Northern 2002.1.13

  日本 検索数調査の対象検索エンジンは昨年末に較べて2つ減り11種類になりました。それに以前から調査しているサイト検索系のGoogleとgooを含めると13種類になります。今回はその中の7つが更新し、Allthewebは5.6%増加しています。次に検索評価ですが、閉鎖したkensaku.jpとExcite(Googleを採用)を除きました。それから評価データの作成時にTOCCとODiNを除外していましたが、今回からそれらを追加し9検索エンジンをベースにしました。評価方法と調査キーは従来と同じです。

  検索評価の結果は、1位 goo 100.0、2位 Google 92.0、3位 ODiN 88.9、4位 Lycos 86.4、5位 Alltheweb 68.7、になりました。評価に加わり有利になったODiNが評点をアップしています。それからAllthewebとGoogleも得点が増加しています。今回の評価でTOCCが前回の3位から8位へと超大幅に評点を下げています。ランキングのアルゴリズムが変更したのか、URLの処理方法が変更したのかわかりませんが、これは一時的なものと考えられます。

  現在、Google系、Inktomi系、WiseNut系があります。Inktomi系のgooとTOCCは基本ソフトは同じですが日本語処理や収集データが異なるため、検索結果は異なっています。しかし、Google系の場合は、検索結果を較べればすぐ分かりますが、Google、Yahoo、Excite、Biglobe、@nigty、は全く同じです。収集データが同じでも、パラメータの値を変えたり、関連性測度を変えるだけで異なったランク結果が求まります。Google系もやがてYahoo流、Excite流などと異なった検索結果を表示するようになるかも知れません。ランクは一種類ではなく複数考えられますので、ユーザーが複数のランク結果の中から選択できれば検索の場が広がります。

  海外 海外検索エンジンの検索数調査ですが、12月末にExciteが検索数表示をしなくなり、さらにこの16日からNorthern Lightが無料のWeb検索サービスを中止(有料版は継続)するとのことです。従って、従来よりも2社減り、8社の調査になります。更新は5社ですが大きな変化はなく、4位 AOL、5位 Lycosの順位が変動しました。

  今まで記してきたように12月から1月にかけて日本のLycos、kensaku.jp、Excite、米国のNorthern Lightなどの検索エンジンの開発が中止されました。撤退となれば製品であれば工場などがなくなるのですが、検索エンジンの場合はせいぜい数部屋にあるコンピュータや通信設備、それにソフトやデータの廃棄になります。投入する資源が少ないことから社会への直接の影響は少ないですが、もし検索エンジンがなければと考えると、ここ数年間の貢献は大きかったと思います。長い間検索エンジンの開発に携わってきた人々に感謝いたします。