2002年6月30日
 InfoNavigatorの終了、各言語別データ数

日本 検索数調査はGoogle 6.5%増、TOCC 26.6%減、Alltheweb 12.2%、goo 5.2%減でした。この半年間の増減で、増加したのはAlltheweb 216%増、goo 40%増、Google 22%増でした。一方、減少したのはTOCC 40%減、FreshEye 28%減で、現状維持に近いのは、Lycos、AltaVista、Naver、Infoseek、でした。検索評価はgoo、TOCC、Lycos、Googleについて行ないましたが、あまり変化はみられませんでした。
.
InfoNavigatorは24日から検索サービスを終了しました。検索デスクを始めた1996年1月にInfoNavigatorはディレクトリ検索サービスをしており、1996年6月末にロボット系検索を始めています。丁度6年で終了したことになります。「グルメ」について6年前のロボット系の検索数は、日本語OpenText 242、ODIN 229、Mondou 167、TITAN 100、千里眼 152 InfoNavigator 73、Netplaza 45、などでした。それが現在では、Alltheweb 1,212,627、Lycos 1,094,618、Google 792,000、goo 645,713、Naver 523,841、AltaVista 319,875、aaa!cafe 291,725、TOCC 264,939、Infoseek 83,235、などです。この6年間のWeb情報の増加をみれば、検索の重要性が理解できます。6年前のロボット系検索エンジンがInfoNavigatorを最後にすべて過去のものになったのは、少しさびしい気がします。永い間、ありがとうございました。
.
また、老舗の登録系ディレクトリのURL広場が6月16日を最後に調査できなくなりました。最近のデータを公表してませんが、毎週調査を継続していました。毎年6月末のデータ数の推移をみると、1996年 3,670、1997年 10,161、98年 20,728、99年 25,504、00年 49,344、01年 87,111、02年 113,889でした。URL広場は非営利サイトでしたが、営利とか非営利の区分もあまり意味をもたなくなってきました。
.
海外 検索数調査ではGoogleが7.9%増加しました。半年間の増減は、Alltheweb 355%増、Lycos 292%増、Teoma 83%増、一方、減少したのはHotBot 22%減、AOL 12%減で、Google、AltaVista、WiseNutは現状維持とみなせます。
.
Allthewebで検索窓に url.all:http:// と入力し、言語をセットすると、各言語別のデータ数が得られます。現時点のデータは、英語 12億1600万、ドイツ 1億2800万、日本 1億1700万、フランス 5900万、韓国 4700万、ロシア 4500万、中国 4400万、スペイン 4000万、イタリア 3600万、ポルトガル 3500万、などです。これを人口で割れば、面白い結果が得られます。
.

◆表:検索エンジンの検索力

No日 本検索力検索評価検索数.No海 外検索数
1goo 100.0100.0 60.9.1Alltheweb100.0
2Lycos 97.7 94.871.1.2Lycos 96.7
3Google 96.9 94.4 69.0.3AltaVista 41.5
4TOCC 93.1 97.5 39.0.4WiseNut 40.9
5Naver 78.9 80.9 40.2.5AOL 24.3
6Alltheweb 71.2 57.1100.0.6Google 23.0
7AAA!Cafe 70.9 72.2 38.0.7HotBot 21.3
8AltaVista 62.2 59.2 49.9.8Teoma 18.3
9Infoseek 42.0 43.2 20.5.--- --

 2002年6月23日
 TOCCの復活とAAA!Cafeのオープン

日本 17日に、Allthewebはデータ数でGoogleを抜いたと発表しました。この増強は6月2日の検索数調査でキャッチしています。そのAllthewebの検索数は先週よりも減少しました。そして日本語データ総数は1億3900万ページから1億2100万ページへと約13%減少しています。これは重複データを削除したからと思われます。検索評価はTOCCが大きく変化したのと、AAA!Cafeが仲間入りしたため、月末に行なう予定の、goo、Google、Allthewebも一緒に検索評価しました。検索力の順位は、goo、Lycos、TOCC、Googleがトップグループを形成しています。これらの検索評価や検索力の差はわずかです。
.
TOCCはgooと同じInktomi系で、昨年7月にベータ版をオープンしています。12月末の検索数はgooの4,985に対してTOCCは7,343、検索評価はgoo 100に対してTOCC 90でした。その後今年1月になって、データが25%減少し、検索評価は89.7から60.1へ最近は34.2へと6ヶ月間低迷していました。それが検索評価 98.7の2位へ元の状態に戻っています。
.
17日のInternet WatchにAAA!Cafeのオープンのいきさつが詳しく書かれています。昨年12月末に、突然サービスを中止したkensaku.jpの2代目です。Versionは2から4になっています。12月末のkensaku.jpと今回のAAA!Cafeとのデータを比較します。まず、検索数は6,891から3,574へ、検索数指数は76.7から34.2へ、とデータは半減しています。そして検索評価は67.7から71.5へと少しよくなっています。検索数 8位、検索評価 6位、検索力 6位からの再スタートです。レイアウトが変更しており、表示数に20が追加されていますが、機能はほとんど同じです。検索デスクにAAA!Cafeの検索ボタンを追加しました。
.
海外 検索数調査では、日本と同様に、米Allthewebと米Lycosが減少しています。3位のAltaVistaの指数が41.6ですから、約2.5倍の差です。データ数ではLycosとGoogleが20億台と張り合っていますが、検索数調査では、Alltheweb 100に対してGoogle 21と5倍の開きがあります。Googleの20億ページは、実際にページを収集し索引化したページ数だけでなく、ページ内のリンク情報から得られる未収集のタイトルとURLのリストを含んでいます。もちろん、後者はタイトル以外にリンク情報をもっていますので検索に利用できます。やはりデータ数などは第3者による認知が必要です。
.
1996年に米国の検索エンジン間でデータ数を競うときがありました。その当時の競争は5,000万ページ台でしたが、ページ全文ではなく一部分しか処理してなかったため、ページ当たりの処理量を減らせばページ数を増やせてしまいます。この検索数調査は1996年9月から始めていますが、収集ページ数ではなく、実際に検索できる数の方が指標になると考えて始めたものです。あ〜あ、5年以上も飽きもせずに同じことを続けてます!
.

 2002年6月16日
 Alltheweb1億3,900万へ、価格.comの子会社化

日本 検索数調査ではトップのAllthewebが24%増加しました。他の検索サイトの増減がなかったため、検索数指数は全般に14位減少しました。それに伴う検索力順位の変化はありませんでした。検索数1位Allthewebの100に対して、2位Lycosは60.3、です。Lycosは昨年12月中旬に7,500万件のデータがあり、現在は少し減少して7,030万位と推定されます。これを基にAllthewebのデータを推定すると1億1,660万ページです。コマンドの"url.all:http:"を日本語に適用すると、1億3,885万9,293ページとなります。日本語検索エンジンもついに1億ページを越える時代を迎えました。
.
10日にデジタル・ガレージは価格比較で有名な「価格.com」を子会社化しました。カカクコムは5年前に個人サイトとして出発し、有限会社、株式会社としてネットの成長とともに発展しているネット企業です。トップPVは680万/月、総PVはトップPVの15倍の1億200万/月、ユニークIPアドレスはトップPVの3分の1の226万/月、です。買収金額から割り出した時価総額16億円を1ヶ月当たりの総PVで割ると16円になります。@niftyは83〜166円であれば買収が成立していましたが、今回はそれよりも5分の1から10分の1で成立しました。しかし、総PVはメニューや掲示板などを含むか含まないかでその評価は異なります。カカクコムの総PVを半分と査定すれば、単価は倍の32円になります。総PV、トップPV、ユニークIPアドレス、など分野やコンテンツにより定義が異なるため、共通の尺度を見つけるのは難しいです。ちなみに、検索デスクの5月のトップPVは309万/月、総PVはトップPVの1.15倍の356万、1日あたりのユニークIPアドレスはトップPVの7分の3です。検索デスクは2画面方式を採用していますが、1画面方式にすればトップPVはアップします。日本では個人サイトは不利にあつかわれますが、それにめげずにコンテンツで勝負したいと思っています。
.
海外 検索数調査ですが、まだAllthewebの増強が続いています。Lycos 4.7%増、Alltheweb 8.6%増、で1位と2位は逆転し、トップはAlltheweb、2位はLycosです。Allthewebのここ数週間の増強はすさまじく、ついにGoogleの公表データ 2,073,418,204 を超えたようです。米国の多言語検索サイトで20億ページを運用するのはGoogleとAllthewebになりました。なお、Allthewebではネット上の.pdfファイルの検索ができるようになりました。
.

 2002年6月9日
 AltaVista倍増、SEOビジネスよりも検索サイトへ

日本 検索数調査ではAltaVistaが2倍以上の120%増加しています。先週のAllthewebに続く増加ですが、4月に計画したものが2ヵ月後の6月に実現してるのかも知れません。したがって、検索評価はAltaVistaのみを実施しました。AltaVistaは検索数の増加にもかかわらず検索評価は少しアップし、紹介文などが改善しています。それから検索力の順位は前回と同じでした。
.
ディレクトリについてまとめてみました。記号は、(a1)ネットワーク型分類、(a2)階層型分類、(b1)検索できる、(b2)検索できない、(c1)カテゴリあり、(c2)カテゴリなし、(d)大分類数、(e)データ数、を表します。
.
Yahoo!(a1、b1、c1、d=14、e=37万)、Lycos(a1、b1、c1、d=16、e=?)、
Google(a2、b1、c1、d=14、e=?万)、Infoseek(a2、b1、c1、d=18、e=?万)、
Looksmart系のMSN、Excite、Biglobe、DION(a2、b1、c1、d=13、e=?万)、
iNETGuide(a2、b1、c1、d=19、e=?万)、JOY(a2、b1、c1、d=42、e=8万)、
goo(a2、b1、c2、d=13、e=?万)、フレッシュアイ(a2、b2、c1、d=16、e=10万)。
.
海外 検索数調査はAltaVistaが日本語と同様に125%増加しました。順位が6位から3位へ上がっています。検索力でみると、100がLycosとAlltheweb、40台がAltaVistaとWiseNut、20前後がAOL、HotBot、Google、Teomaと、先週のAllthewebの増強で大きな差が開いています。この大きな差も数ヶ月経てば小さな差になっていき、またどこかが突出するということを繰り返しながら成長しています。
.
最近、SEOの記事が増えてきました。SEOに関しては3月1日の検索力調査に紹介し、Web記事の方に毎日数件のSEO関連の英文記事を載せています。また、SEOのソースとしてWeb検索の右下に8種類のSE Newsをリストアップしています。それらに目を通していれば、SEOの動向は把握できます。検索サイトのランキング方法を利用してのSEOビジネスは入学試験と予備校との関係に似ています。ランキング上位に一部のふさわしくないサイトが入れば検索サイトや利用者は時間を浪費することになります。SEOビジネスと検索サイトがタイアップしていれば話は違いますが、SEOビジネスよりも情報を直接提供する検索サイトの方にお金が流れるようにするのが本質です。
.

 2002年6月2日
 Alltheweb倍増、Naverランク向上、@nifty買収額

日本 検索数調査でAllthewebが2倍以上の114%増加してトップです。Allthewebの大幅増加で他の検索数指数は相対的に30位減少しました。次に検索評価は前回より変動の大きなAlltheweb、Naver、Infoseekについて行ないました。その結果、Naverが前回の56.1から今回の81.2へと大幅に増加し、4位へアップしました。Naverのランキング・アルゴリズムが改善したものとみなせます。データを倍以上にしたAllthewebは本来なら検索評価指数が減少するところですが、逆に検索評価指数は4.9改善しています。そして、Infoseekも少しよくなっています。
.
Allthewebは日本語だけでなく英語も同様に増加しています。これに関してニュースを調べましたが見当たりませんでした。いずれ発表があるかも知れません。5月28日に"FAST Data Search 3.0"というリアルタイム性を重視した検索システムを発表しています。それからFast Search社の検索技術は米国電子政府ポータルのFirstGovにAT&Tを通して採用されています。大規模な情報の検索とHTML以外のデータ形式(PDF、Word、Excel、XMLなど)が処理できることが選考理由でしたので、それが稼動し始めたのかも知れません。検索結果の多い検索ではランキングが重要ですが、検索結果の少ない検索ではデータの多い方が使えます。特徴のある検索システムがいろいろ使えるのが理想的です。
.
海外 Alltheweb(Lycos)が日本語と同様に132%増加しています。今までトップでしたので順位の変動はないですが、他の検索サイトの検索数指数は前回の45%位に減少しました。3位のWiseNutが40.5ですので、約2.5倍のデータ量です。
.
5月29日にソニーがニフティの買収を断念したと発表しました。ソニーの買収予定額は500〜1000億、一方の富士通は1500億で、結局金額的に折り合わなかったものです。最新のNielsen//NetRatingsによると、ISP関連企業ドメインの4月の月間ページビューは、Nifty 6.0億、NEC 3.8億、Sony 2.4億、です。3位のSony-netが1位の@niftyを買収するのですが、買収予定額を月間6億PVで割ると、500億で83円、1000億で167円、1500億で250円です。2000年12月に楽天がInfoseekを買収したときの買収額は月間PVあたり53円、その当時のYahooJは190円でした。現在のYahooJの時価総額は6558億円、4月の月間PVは56.5億、ですので、月間PVあたり116円です。Yahoo!BBの分を差し引けば、これよりも少なくなります。単純にPVだけからみてるのですが、@niftyの買収金額は高いのか安いのか、ソニーの決断が良かったのか悪かったのか、一つの指標を与えてくれます。
.

 2002年5月26日
 Naverの増加、Google Labsについて

日本 検索数調査は、Google 5.6%増、Naver 11.1%増、Infoseek 10.1%減で、検索評価を休みました。総合の検索力はgoo 100.0、Google 99.9、と僅差です。Naverが7ヶ月ぶりに更新し、11%増加しています。紹介文が改善し、読み(探し)やすくなっています。Infoseekが10%減少しています。検索数30万の制限がありますが、一時制限のあった逆リンク検索は回復しています。順位は5位と6位が入れ替わりました。
.
Netscape7.0のプレビュー版が公開しました。バージョンが4.7から5.5になったとき、検索窓へ入力した日本語キーワードを認識しなかったのですが、6.0からFIXしています。新しい7.0を少し使いましたが、バグはほとんどなく、速くなっています。リンクのウィンドウを開くときに、右ボタンでタブ型を選択できます。
.
海外 検索数調査は、Google 4.5%増、Teoma 41.5%増、です。Ask Jeevesの傘下に入ったTeomaは3月末に続いて今回大幅に増加しました。この2回の増加で約1.84倍になっています。それから検索数の表示が前より詳しくなっています。Yahoo!のページ検索はPowered By Google です。検索数が不安定ということで公表してませんが、調査は継続しており、検索数はトップクラスです。Googleに較べて検索数が多いので、データを追加しているのでは思っていましたが、最近はYahoo!の検索数が正しくて、Googleの方が少なめに表示してるとみなしています。
.
22日にGoogleは「Google Labs」を公表しました。これは検索技術に対する新しい試みを公開し、ユーザーからのフィードバックを期待するというものです。技術開発が大規模になっていますので、一部の内部の人によるテストだけでは不十分です。APIやLabsの公開などをみていると、まだまだGoogleが大きく成長する期待を抱かせます。検索技術も大規模になってきましたので、如何に外部の人を取り込んで開発のスピードアップ化をはかるかが課題になってきました。
.

 2002年5月19日
 Unicodeの使用、日本語汎用ドメインの終了

日本 検索数調査はgooが0.1%減少した以外はほとんど変化のない、更新の少ない週でした。従って、検索評価はお休みしました。Webの世界は24時間営業で休みがないわけですから、ときどき休まないと長続きしません。
.
ネットワークの世界ではIPアドレスを32ビットから128ビットへ拡張する計画が進行しています。一方、文字コードの世界ではすべての言語を16ビットで表現するUnicodeの使用が進行しています。日本語検索エンジンはShift-JISやEUCを独自の識別手法で判定していました。多言語化を進める米国の一部の検索エンジンはUnicode処理を始めています。多言語をそれぞれのコードで処理するよりもコード情報を付加してUnicodeで処理した方が統一できます。日本語コードがShift-JISからUnicodeへと転換するのは案外早いかも知れません。
.
海外 検索数調査では、WiseNut 13.5%増以外は少し減少しています。順位は少差で6位と7位が入れ替わりました。米Exciteはロボット検索を中止し、Web、Directory、News、Photoを扱うメタ検索になっています。Web検索の出典はfast、AskJeeves、inktomi、about、looksmart、findwhat、overtureなどです。Directoryは以前からサービスしている自前のもの?です。
.
13日にRealNamesのキーワードサービスが6月末で閉鎖するとのニュースが流れました。アドレスバーにhttp://www.で始まるURLを入力する代わりにキーワードを入力するだけでよいサービスです。検索デスクもこのシステムに登録していましたが、4月末の更新をしませんでした。さらに16日には日本語汎用ドメインも一時中止するとのメールがきました。これは一度も使ったことがなく、5月末の更新をしてなかったのでトラブルを避けれました。
.
昨年夏に登場したIE6のアドレスバーへの追加機能がRealNamesと競合し一部でトラブルが発生していました。RealNamesは今年6月末のマイクロソフトとのアドレスバー利用契約更新を断念し、頓挫しました。米国企業の進退は迅速なのに驚かされますが、契約を継続するかしないかで大きな影響を受けるのは問題です。
.

 2002年5月12日
 広告部分の索引化、Googleの分身誕生

日本 検索数調査はAllthewebが47.9%増加しています。その他の変化はあまり見られませんでした。次に、検索評価は4月21日から大きく変化したLycos、goo、Google、Allthewebについて行ないました。goo 100.0、Google 98.9、Lycos 94.2の上位グループの検索評価は接近しています。一方、中位グループはAltaVista 61.1、Naver 56.1、Alltheweb 53.7、となり、上位グループと中位グループとに大きな壁が存在します。その理由は検索システムにリンク情報を取り入れてるかどうかによると思われますが、はっきりしたことはわかりません。
.
広告メールはタイトルに「広告」表示が義務づけられています。しかし、Webコンテンツにはそのような制約はありません。ページ内のテキストやグラフが純粋なコンテンツなのか広告なのか区別のつかないものがあります。この広告に関して人間よりも困っているのが検索エンジンです。広告のテキスト部分を索引化しないよう、さらに広告リンクをリンクに含めないよう、地味な努力が続いています。広告表示のタグがあれば少しは解決するかも知れませんが、まだ発展段階であり次々に問題が発生するのは致しかたないのかも知れません。
.
海外 検索数調査ではトップのAllthewebが10%増加したため、他の指数は相対的に減少しています、その他に、Lycos 8.6%増、HotBot 4.7%増、Google 5.2%減、などです。日本語と同様な検索評価を英語検索エンジンに摘要すれば順位は変わりますが、なかなか実施できません。
.
BBCの新しい検索エンジンはGoogleの分身でした。5月初めから騒がせていた問題もこれで一件落着しました。しかし、このPowered by Google を載せないのはGoogleの前進であり、政策変更です。従来の提携では、Googleの処理した検索結果に提携先の衣を着けて表示しました。したがって、日本語Googleと提携しているYahoo、Biglobe、Exciteなどの検索は、表示項目は少し異なりますが検索結果は全く同じです。この場合のようにGoogleのランキングと同じという意味でPowered by Google表示が必要だったようです。
.
今後はBBCのようなタイプの提携が行なわれます。提携先ごとにフィルターされますので、検索結果のランキングはそれぞれ異なったものになります。Googleとは少し異なるという意味でPowered by Google表示は不必要になります。そもそも検索結果のランキングに絶対なものはありません。リンクを使う検索はその組み合わせ方やしきい(閾)値の取り方でいろいろなランキングが作成できます。そしてそのどれが一番よいかは状況により異なりますし、人により異なります。
.
米Yahoo!はこの6月に契約を更新します。Google以外の検索サイトと契約するのか、Googleを採用しBBC流と同様にYahoo流のランキングを採用するのか、これから注目されます。
.

 2002年5月5日
 海外は英語のみ、any languageとenglishの割合

日本 4月28日分と5月5日分は検索数だけを調査し、検索評価は行ないませんでした。Lycosが11%増、Googleが13%増した以外は大きな変化はなく、総合の検索力は2位Google、3位Lycos、となっています。
.
4月末に、goo.ne.jpとgoo.co.jpのドメイン訴訟でgooが勝利しました。ドメイン、ブランドの確立したドメイン、などは時間の経過とともに考え方が変わっていきます。今後、gooがne.jpをco.jpに変更するかどうか、大変興味深い問題です。
.
海外 海外も2週分の検索数調査をしました。複数の人から、世界一のデータをもつGoogleの検索数が少ないのではというコメントをいただきました。そこで調査方法を点検した結果、新しいことが発見できました。
.
まず、海外の検索サイトの検索数は基本的に「英語」のみを対象にしています。検索サイトの多言語化はばらばらに行なわれており、多言語化を始めても所有するデータが新しいデータに入れ替わるまでに年月を要します。それに、フォームの内容はよく変更されますので、英語のみの設定も機能してない場合があります。
.
先週までの調査において、"english"限定で調査してたのは、Alltheweb、Google、AltaVista、そして"any Language"で検索したのは、Lycos、WiseNut、HotBot、で、AOLとTeomaは多言語化してません。
.
そこで、"english"に統一した検索数調査を行ないました。同時に、"any Language"も調査しました。その結果、"any Language"に対する"english"の割合が得られました。Alltheweb 88%、Lycos 90%、WiseNut 88%、Google 25%、HotBot 83%、AltaVista 87%、です。したがって、Lycos、WiseNut、HotBotのデータは12%位少なくなります。LycosがAllthewebを採用していることは知っていましたが、調査データは異なっていました。しかし、今回の調査で、ほとんど一致してることがわかり、残念ですがどちらか一方を調査対象から外さなければならなくなりました。
.
Googleの"any Language"はトップですが、"english"は極端に少なく、もし88%位あればトップになります。なぜ25%しかないのか、その理由が知りたいものです。
.
これに関連するかも知れませんが、英国のBBCがGoogleに類似の検索エンジンを立ち上げました。米国では、ほとんど"any language"で検索しますので、"english"で検索したものを別種の検索エンジンと思うかも知れません。まだGoogleとBBCとの提携の発表はなく不可解でなりません。
.

 2002年4月21日
 Infoseek検索エンジン開発中、Google Answers

日本 検索数調査ではAllthewebが23%増加した以外はあまり変化がみられませんでした。従って、検索評価はAllthewebだけ行ないました。その結果、得点が58.4から57.5へ少し減少しました。全体の順位は前回と同じです。この結果から、Allthewebはデータが増加しただけとみなせます。
.
18日の日経BP社IT Proにインフォシークが新型検索エンジンを開発中との記事がありました。8月にベータ版、12月に正式版とのことです。現在の評価は、検索評価は39.3、検索数は35.1、総合検索力は39.1の8位です。8月までにデータを3倍にする計画ですので、単純に計算して、35.1×3=105.3、と検索数はトップクラスになります。もし、ランキング方法に変化がなく、単なるデータの増量だけであれば検索評価は減少しますので、検索力は現在とあまり変わらず、順位も変化しないことになります。従って、ランキング方法のリニューアルは必要ですので、それにより検索評価のアップがどれ位になるのか、楽しみになってきました。
.
先日、掲示板上の匿名書き込みに対して著作権を認める判決がありました。活字になったものは、何年たっても残っていますが、Web上にある情報はサーバーから削除されれば何も残らなくなります。例えば、私が20年前に書いたものの出典を示せば、その情報にたどり着けます。しかし、検索デスクにある調査や視点などの著作物はサーバーから除去されれば即時に消滅します。Web上の活動は一瞬にして無になるのではないかと一抹の不安を覚えている今日この頃です。
.
海外 検索数調査はたかだか1.5%未満の微小の変化しかみられませんでした。GoogleキラーといわれるWiseNutとTeomaの更新スパンが長いのが気になりますが、恐らくカテゴリーを自動作成しているのが原因ではないかと思われます。
.
現在トップの検索エンジンGoogleの話題には事欠きません。19日にGoogleが"Google Answers"のベータ版を開始しました。これはソフトではなく人間が検索に答えるものです。現在のビジネスモデルは仲介が多いのですが、Googleの役割は質問者と回答者との仲介です。さしあたり一定レベルのサーチャーを集めなければならないので、実際に軌道に乗るまでには少し時間がかかりそうです。
.

 2002年4月14日
 ブロードバンドの先陣争い、GoogleのAPI開放

日本 検索数調査は更新が認められたのは10社のうち5社で、Google 12.6%減、フレッシュアイ 8.9%増が目立つ程度でした。従って、検索評価は行なわず、検索力順位も変化しませんでした。なお、自然文で検索できるPCWEB Searchが4月3日より休止していますが、ディレクトリは利用可能です。昨年12月の検索数調査は13社が対象でしたが、現在は10社と少なくなっています。
.
Biglobeや@niftyなどのISPは、Yahoo!やgooなどのポータルサイトと同様に、トラフィックが多いところです。ポータルサイトはディレクトリから始まりロボット系検索、ニュースなどのコンテンツ、掲示板、ショッピングなどWebの発展に応じて事業を拡大し、先発組が有利に推移しており、最近、事業の見直しが行なわれました。一方のISPはネットの発展に力を注いでいたために、Webコンテンツに関しては後発であり、最近ポータルとしての陣容が整ってきました。これからブロードバンドということで、皆が一斉に先陣争いをしています。ポータルサイトはオープンなシステムで発展してきましたが、ISPはどちらかといえばクローズドなシステムです。今後はどちらが有利に働くか予想がつきません。
.
海外 検索数調査ですが、Lycos 38.7%増、Alltheweb 41.1%増、と大幅にデータを増強しました。検索数では1位 Lycos、2位 Alltheweb、3位 WiseNut、です。トップの増加が大きいため、他の検索サイトの検索数指数は相対的に減少しました。
.
12日にGoogleが非常に重要な発表をしています。それはGoogle Web APIの開放です。従来、検索エンジンを開発した検索サイトはWebページを収集して索引化し検索サービスするとともに、その処理ソフトをイントラネット用に汎用ソフトとして販売していました。今回のGoogleのAPI開放はLinuxのオープンソフトの流れにそったものです。その特徴は、1)データ収集というわずらわしいことをせずに、Googleが収集・整理したデータを使うことができる。2)Googleが処理しているソフト群を自由に組み合わせてプログラミングし、自分の好きな形に出力できる。現在は無料で、いずれ有料になるにしても、大変、夢のあるものです。力のある人は挑戦してみてはいかがですか。
.

 2002年4月7日
 検索数も検索評価も2分化、gooのサイト検索

日本 検索数調査では、Google 9%増、AltaVista 10%減です。Webの世界は拡大していますので、検索サイトのデータ収集数は増えるものと思っていましたが、逆に減少してるところがあります。gooとGoogleは、2001年9月から半年間で、それぞれ、47%と29%、増加しています。一方、減少してるところですが、AltaVistaは2001年10月がピークで51%減、Infoseekは2001年1月がピークで34%減、Allthewebは2002年1月がピークで34%減、です。また、検索力指数80以上が4社、残りは50以下で、差が開いてきたのが少し気になるところです。
.
検索評価はAltaVistaだけ再評価しました。ほとんど変化はなく、検索力による移動もありませんでした。この検索評価も指数90以上が3社、60以下が5社と大きな断層のある2つのグループに分けられています。ページだけの情報を使うものは情報量が限られています。ページ周辺のリンクにある情報を取り込んで、ページの情報量を増加させたものをベースにすれば検索はより精度を増します。リンク情報の利用はいろいろな方法があり、どれも決め手を欠いていますので、これからも終わることのないソフト開発競争が続きます。
.
4月1日にgooがリニューアルしました。辞書などの専門データベースの検索ボタンが新設され、ワンクリックで利用できるようになりました。検索ではサイト検索が変更しています。従来はサイトのキーワード検索が主体で、検索数指数も6.4とフレッシュアイ3.4よりも多いデータでした。Googleも同様なものをもっていましたが、この1月に純粋なディレクトリ検索へ移行しています。今回のgooのサイト検索はデータは少ないですが厳選タイプのディレクトリ検索への移行です。検索評価ではサイトを集めたものよりもロボットで集めた方がよい結果が得られていましたので、当然な帰結です。現在のロボット検索はページだけでなくサイトもあつかえるほど進歩したとみなせます。
.
海外 検索数調査は、AltaVistaが26%減少して4位から7位になっています。その他の変化は少なく1%以下でした。英語検索サイトは検索数指数50以上が8社のうち7社と、日本語8社のうちの4社に較べればポテンシャルの高い状態が続いています。
.
5日に「OvertureがGoogleを訴訟」との海外記事が多く見られました。Overtureは検索結果を支払額の多い順にリストすることに関する特許をもっていますが、無料から有料へと移行しようとしている多くの検索会社にとっても、広くは検索サイトの利用者にとっても影響しますので今後の成り行きが注目されます。
.

 2002年3月31日
 ISIZEのリニューアル、ステップアップの楽しみ

日本 検索数調査はAllthewebが46%減と約半分になっています。英語も25%減ですので、何か大きな変化があるのかも知れません。2001年12月平均から3月31日までの3ヶ月間の増減は、Lycos 4%増、goo 37%増、Google 3%増、TOCC 7%減、AltaVista 44%減、Alltheweb 31%減、Infoseek 15%増、InfoNavigator 15%増、フレッシュアイ 29%減、などです。今回は、goo、Google、Lycos、Alltheweb、の検索評価を行ないました。Lycosが約6ポイントアップしました。総合の検索力は、2位 Lycos、3位 Googleです。
.
3月27日にISIZEがリニューアルしました。ついにトップページから検索ボタンが消えてしまいました。この半年位で、多くの検索サイトが撤退していますので、その流れにそったものかも知れません。トップからの検索はできませんが、主要なコンテンツにいけばそこからサイト内検索は可能になっています。3月末から4月にかけて、goo、エキサイト、フレッシュアイのリニューアルが予定されています。
.
海外 検索数調査では、Lycos 23%減、Alltheweb 25%減、Teoma 30%増、です。Ask Jeevesに買収されたTeomaはデータを大幅に増加しています。検索数表示は以前と同様、大きな単位の概数です。例えば、holiday、java、literature、movie、museum、の検索数はすべて2,730,000です。なお、Ask Jeevesの検索結果は、最初にSponsored Linksが5個、そしてTeomaの検索結果が10個と続きます。
.
パソコンの進歩と同様に通信の進歩もめざましいものがあります。私が始めてTSS端末を使ったときの通信速度は50bps、これでも感激したものです。300bpsの音響カプラーも体験し、1985年から10年位続いたパソコン通信時代の電話回線用モデムは1,200bps、2,400bps、9,600bps、と買い替え、1995年3月からのインターネット時代は電話回線用の28,800bps、96年9月テレホーダイに加入、98年9月にISDN用ターミナルアダプタの128K、99年12月にCATVインターネット(数Mbps)のHub接続、そして02年2月からブロードバンド・ルータ接続、といろいろ体験しました。お金はかかりますが、ステップアップしていくたびに何回も喜びを味わいました。今はいきなりADSL接続から入れますので、その人たちにとっては光ケーブルへのステップアップしか楽しみがないかも知れません。
.

 2002年3月24日
 コンテンツの有料化、英語検索エンジンの紹介文

日本 検索数調査はトップのLycosがアップしたため、他は相対的に減少しました。Googleが8.2%増、フレシュアイ9.2%減以外はあまり動きのない珍しい週でした。したがって、検索評価はお休みです。ODiNは3月5日にハードを更新しましたが、現在トップページへアクセスできません。検索評価も1月末から検索ができないため中止しています。検索評価がよかっただけに残念です。
.
先日のWeb記事にコンテンツの有料化の普及は遅れるとの予想記事がありました。Webが始まったときにもコンテンツの有料化を試みたところがありましたが、無料のコンテンツの増殖には勝てず、撤退していきました。その後、Web広告が普及してきて景気がよかったのですが、IT不況の浸透で一部のコンテンツの有料化が始まりました。無料サービスでユーザーを掴んでから有料化するところ、新しい分野にいきなり有料化から始めるところなど、いろいろなケースがあります。有料化はWebが始まった頃よりも現在の方が厳しいかも知れませんが、いつまでも夢を追い続けて欲しいものです。
.
海外 検索数は8検索サイトのうち4サイトが更新しましたが、1%前後の変化しかなく、順位の変動はありませんでした。
.
同一検索エンジンで英語と日本語をサービスしてるのは、Alltheweb、AltaVista、Google、WiseNut(日本はLycosJ)などがあります。検索の視点で紹介文の作成を調べましたが、英語と日本語とで同じかどうかチェックしました。Allthewebは抄録方式(文章)、AltaVistaは一部がKWIC方式、GoogleはKWIC方式、WiseNutはKWIC方式、です。AltaVistaだけが英語はKWIC方式で日本語は抄録方式です。なお、英語のHotBotと日本語のgooはInktomi系の検索エンジンですが、データベースは別々に作成しており、いずれも紹介文は抄録方式(文章)です。
.
英語でKWIC方式を採用してるのは、Google、WiseNut、AltaVistaです。Googleのオープンは1999年9月、WiseNutのオープンは2001年8月、したがってKWIC方式を使ったGoogleは2年間独走したことになります。なお、WiseNutのSnake-a-PeakはLycosJのプレビューでキャッシュと同じです。
.

 2002年3月17日
 紹介文の重要性、LookSmartがWiseNutを買収

日本 検索数の増減は、Google 7.2%減、Alltheweb 25.4%増、フレッシュアイ 31.5%減です。大きく変化したAllthewebだけの検索評価を行ないました。しかし、総合検索力の順位は前回と同じでした。なお、Naverが昨年12月9日以来3ヶ月、AltaVistaが2月3日以来1ヵ月半、更新がとまっています。それからgooのサイト検索のデータは2月17日以降更新がとまっていますが、4月からのリニューアルに関連があるようです。
.
検索結果にはランキング、紹介文、関連情報、そして検索キーに関連した情報(広告を含む)などがあり、各検索サイトごとに異なっています。検索デスクの検索評価はランキングで示されるURLのみで行なっています。しかし、紹介文は利用者が情報を選択するのに役立ちます。昨年12月23日の検索力調査で「Googleの優れた点はランクだけでなく、紹介文によるところが大きいと思います。」と記しましたが、Googleの評判の半分はこの紹介文によるものと思っています。URLで調べるとGoogleはgooよりも若干悪いのですが、紹介文に関してはGoogleが他よりも圧倒的に優れています。近々、この辺のことを検索の視点にまとめる予定です。
.
海外 トップのLycosが10%増加したため、その他の検索数評価は相対的に10%減少しました。その他、Allthewebが25.8%増加しています。日本語も同様に25.4%増加していますので、英語と日本語が同時に同じ位増加したことになります。なお、英語版のWiseNutは昨年9月23日から更新されてませんが、日本版のLycosは頻繁に更新されています。
.
Googleキラーと言われているWiseNutがディレクトリ系のLookSmartに買収されました。今後、LookSmartとWisNutの統合が行なわれますが、日本ではLycosがWiseNutを提供していますので、今に始まったことではありませんが、提携関係は複雑になります。昨年9月に、Ask JeevesがTeomaを買収し、今年1月にAsk.comに統合されたように、LookSmartの統合が数ヶ月で進むものと思われます。
.

 2002年3月10日
 お知らせラッシュ(goo、フレッシュアイ、エキサイト)

日本 検索数調査では、TOCC 10.4%増、Alltheweb 6.8%増、goo 6.1%増、フレッシュアイ 28.2%減、でした。従って、検索評価は、Google、goo、TOCC、Allthewebの4検索サイトを調査しました。TOCCですが、検索数は3週間で13.5%増加しましたが、評価は25.2減少して36.2に急減しました。1月初めにも同じようなことがありましたが、一時的な現象のようです。検索力は1位と2位が入れ替わりました。データ増強中のgooがGoogleを抜いてトップです。
.
今週はお知らせの多い週でした。まず、gooが4月に行なうモデルチェンジの概要を発表しました。ポータルとして多方面にサービスしていましたが、一部のサービスを終了しサービス分野をフォーカスするとのこと、どのように変化するか楽しみです。それから、フレッシュアイが4月1日に同じ東芝グループのニューズウォッチに吸収合併されます。あまり広告収入に頼らなくてもよいように経営基盤を強化するものです。なお、ブランドのフレッシュアイと検索は継続するとのことです。
.
さらに、伊藤忠がエキサイトの実質的なオーナーになりました。それとともに、エキサイトの事業方針が発表され、ポータルとしてトラフィックをベースにするものから、20〜34歳の都会派にターゲットを絞ったエンターテイメント、モバイル、コミュニケーション、インフォメーションを重点に変身します。コンテンツ提供がページビュー重視から利益重視へと、Webの世界も新しい時代を迎えつつあります。
.
海外 検索数はLycosが23.2%増加し、WiseNutを抜いてトップになりました。その他にAllthewebが7.8%増加しています。英語検索エンジはFast系のLycosとAlltheweb、WiseNut、AltaVista、Inktomi系のHotBotとAOL、GoogleとGoogle系のYahoo!、Teoma、に分かれ互いに競い合っています。
.
3月5日にユーザビリティの権威AlertBoxの「直リンクのすすめ」という記事があります。直リンクを薦めるか拒むかはトラフィックに大きく影響します。本を探す場合、1部屋しかない家の玄関から入って探す場合、多数の部屋のあるビルの入り口から入って探す場合、図書館に行って本を探す場合、など条件がいろいろあります。玄関からしか入れないと目的のコンテンツに到達できない恐れもあり、ワンクリックで情報に到達する直リンクに較べて時間を浪費します。トップページしかリンクを許可しないサイト運営者には再考を促したいものです。
.

 2002年3月3日
 サイトの見直し、コンテンツ制作に必要なSEO

日本 検索数についてはAllthewebが15%増加した以外はあまり変化のない週でした。従って、検索評価は行いませんでした。総合の検索力は1位と2位が同得点です。なお、昨年12月末から2ヶ月間の検索数増減は、goo 33%増、Google 15%増、Infoseek 11%増、Lycos 9%増、Alltheweb 1%減、TOCC 18%減、AltaVista 44%減、でした。
.
不況で広告収入の落ち込みが激しいのか、サイトの見直しや雑誌の休刊が相次いでいます。26日にオークションサイトのeBayが3月末でサービスを終了し日本から撤退すると発表しました。日本市場への進出が遅れたのか、日本語や文化が壁になったのかわかりません。翌27日にリクルートのISIZEが3月末にサイトを再編成すると発表しました。ISIZEはリクルートの発行している複数の情報誌をベースにしたサイトと、提携したサイトとで構成しています。今回は提携サイトから撤退し、情報誌を中心に再構成するものです。なお、インターネット検索の雑誌、リクルートの「あちゃら」とインプレスの「できるインターネット」は3月売りで休刊とのことです。
.
次は、撤退と異なり値上げの動きです。21日に楽天は一部の使用料金を固定制から従量制にすると発表しました。28日にはYahoo!オークションが出品者や落札者から落札額に応じて料金を徴収すると発表しました。いずれも大規模なシステム投資コストの負担を軽減するためのものです。インターネットは今まで利用者のコストがゼロという異常な状態で発展してきましたが、今後は妥当で必要なコストを負担する正常な状態になっていくことが予想されます。
.
海外 検索数調査では、HotBot 4.0%減、AOL 5.1%、が目立つ程度であまり変化がない、順位の変化のない週でした。
.
検索デスクの海外ITコーナーにSENewsを紹介していますが、これは検索エンジンの最新情報をあつかうサイトで、その一部をWeb記事に紹介しています。3月1日はLink PopularityとSEO(Search Engine Optimaization)についての記事が載っています。Link PopularityはGoogleで普及したリンクの人気度に関するもの、SEOはキーワード検索で上位にランクする方法を各検索エンジンごとに調べてコンテンツ制作に役立てようとするもの、です。SEOを学習するには、インターネットの完全な知識、検索エンジンやディレクトリの知識、各検索エンジンのランキング方法の知識、検索サイト間の提携関係の知識、HTMLの完全な知識と経験、サイト統計プログラムの経験、あるいはログファイルの解読、などが必要です。コンテンツ制作には内容に加えてSEOの知識が必要になってきたようです。
.

 2002年2月24日
 Googleとgooの増加、GoogleのAdWords Select

日本 検索数が大幅に増加するところの多い週でした。Google 16.8%増、goo 28.5%増、TOCC 2.7%増、Alltheweb 3.7%増、Infoseek 9.4%増、Infonavigator 15.5%増、フレッシュアイ 4.9%増、です。先週から始めたのですが、各検索サイトの索引方法が異なるために調査キーによってヒット数がばらつきます。したがって、カウントが多いために他の指数に影響する一部の調査キー(グルメ、ヒント、ドメイン、文学)について、ヒット数を微調整しました。
.
検索数の変化が大きいGoogle、goo、Infoseekの検索評価を行いましたが、検索評価や検索力の順位には変化はありませんでした。多くの場合、データが増加すると検索評価の得点は悪くなります。検索数の増加と検索評価の減少で検索力のバランスはとれてしまいます。なお、Infoseekの逆リンクは先週まで少数しかヒットしませんでしたが、今週から従来のレベルに回復しています。
.
海外 海外の検索数も大幅に増加するところが目立ちました。Lycos 26.1%増、Alltheweb 26.6%増、Google 7.8%増で、一方、HotBot 4.0%減、AOL 4.3%減、です。5位のLycosが2位へ、6位のAllthewebが3位へ、と大幅に順位が入れ替わりました。
.
Googleに新しい広告が登場しました。今までは、1)Premium Listingsという無条件で検索結果のトップに表示するもので掲載料金は高目に設定されたもの、2)AdWordsという検索結果の上部に表示した回数(インプレッション)で料金が決まるもの、3)今回新たに追加されたAdWords Selectは2)の発展したもので、掲載希望者の中からGoogleへの貢献が大きい順に掲載するというものです。これはクリックをベースにしており、掲載料金にクリックスルー率を乗じたGoogleの手取りの大きい順に掲載する合理的なものです。広告主は掲載料金だけでなくクリックスルー率も考慮しなければなりませんが、広告オプションが多くなることはよいことです。
.
検索の場合は、検索結果に広告が入ったりすると、検索評価は低下します。それからニュース記事などにも広告記事が入ったりしますが、やはり広告であることを明記してほしいものです。Googleの場合は検索ランキング結果とテキスト広告とが分離してますので、その点は安心して使えます。
.

 2002年2月17日
 検索の易しいキーと難しいキー、検索の重要性

日本 検索数調査は、TOCC 11.2%増、フレッシュアイ 7.8%増、gooサイト検索 38.0%増、でした。検索評価は大きく変化したTOCCだけを実施しました。TOCCの検索数は11.2%増加で、検索評価は60.0から60.7へ増加しただけで、総合の検索力順位は変化しませんでした。
.
最初、TOCCの検索評価が大きく減少しましたので、よく調べてみるとTOCCの一部のコード変換が不具合になっていることを発見しました。それは検索に直接関係のない記号で、シフトJISで作成したページの中にある「〜」と「−」をEUCに変換するときに発生しています。先週まではうまく処理してましたので、これは一時的な現象のようです。それからMSNのコードがユニコード(UTF-8)に替わっています。このため、一時、検索デスクでMSNを検索できませんでしたが、現在は検索可能です。このコード問題は、送られた異種のコードは受け手が処理し、送り手は相手のコードに合わさなくてもよいのが原則です。
.
新しい調査キーを採用しましたが、索引化の難易で得点が変化します。その高い順は、旅行、グルメ、ニュース、住宅、マネー、一方低い順は、MMF、2005年、生活習慣、再就職、電子政府などです。前者は検索サイトによる差異はあまりないですが、後者は検索サイトにより評価のぶれが大きくなります。
.
海外 検索数調査は6検索サイトが更新していました。2位のHotBotが7.1%減少しましたが、全体の順位の変動はありませんでした。
.
先日のWeb記事に、ネットサーファーが検索エンジンをあまり使わなくなったという記事がありました。統計でそうなってるかも知れませんが、私などはむしろ検索エンジンを重宝し、それにまだ知らないことの方が多いせいか、何事も検索にかけています。個人的に利用する特殊なサイトはブックマークですみますが、ブックマークも多くなるとそこを探すよりも検索したほうがサイトを速く見つけれます。時が経つにつれて入門者、初心者、中級者、上級者の割合が変化していきますが、まず上級者になることが先決です。Web検索の重要性にできるだけはやく気づいた組織なり個人が大きく飛躍するものと思っています。
.

 2002年2月11日
 ドメインや博物館の索引化、GoogleのPage Rank

日本 検索数調査では、Lycos 8.5%増、Alltheweb 21.2%減、そしてFreshEyeが43.6%増です。これらの増減は15調査キーの平均ですので、個々のキーの増減の大きいものをピックアップしました。
Lycos  ヒント 274%増、ドメイン102%増、、、野球 41%減、博物館 42%減。
Alltheweb 文学 10%増、博物館 4%増、、、時計 26%減、ドメイン54%減。
AltaVista 生物 27%減、博物館 27%減、、、コミック 55%減、ドメイン 63%減。
FreshEye ドメイン 108%増、イントラネット 53%増、、、野球 10%増、マーケット8%増、
です。Lycosだけが増減幅が大きく、索引方法を変更中のようです。
.
このリストには、ドメイン 4回、博物館 3回、野球 2回とぶれの大きいキーがあります。これらのキーはフレーズ的に使われる場合が多いため、その索引化は難しく、どの検索サイトも大変苦労しているものです。
.
次に、検索評価ですが、LycosとAllthewebのを行いました。全体に得点は下がりましたが、今回データ数の変更が多かったLycosは5.4減、Allthewebは5.0%減と他よりも減少しています。検索力は、1位 Google、2位 goo、3位 Lycos、です。なお、1ヶ月前に較べて、TOCC 27%減、Alltheweb 20%減、AltaVista 44%、減です。この趨勢が何を意味するかがわかれば先が読めることになります。
.
海外 6サイトの検索数調査を行いました。ほとんどが2〜5%増減しており、3位〜5位が入れ替わりました。
.
2月7日のWeb記事に"Understanding and Building Google PageRank"という英文の解説記事があります。ページランクはInternal Linking と External Linking を使っているとのことです。私が十数年前にリファレーション(Referations = References + Document + Citations)を使った文献検索技術を研究していましたが、まだDocumentの部分が含んでないように思います。いろいろな測度を計算するのに、データ数が多く、しかもSparse行列を解くのは不可能です。この難解な測度を非常に簡単なアルゴリズムで求める方法を十数年前に開発しています。それにしてもGoogleの躍進でリンクが脚光を浴びてきたことは大変望ましい状況です。
.

 2002年2月3日
 AltaVista:3分の2へ、伊藤忠商事:エキサイト買収

日本 7サイトの検索数調査を行いました。AltaVistaが44.0%減少しています。英語の方も33.6%減少しており、さらに逆リンクを調べましたがここも半分位に減少しています。大きく増加する場合は発表がありますが、減少する場合は発表がないので、何が原因かはわかりません。しかし、運営方針が変更したことをデータは示しています。
.
したがって、今週の検索評価はAltaVistaだけ行いました。AltaVistaの得点は56.7から60.9へ増加しましたが、検索数が60から36になったため検索力の順位は変わりませんでした。検索力をみると3位までは検索力96以上、4位以下は検索力68以下と3位と4位の差は大きく、2つのグループに分かれてしまいました。なお、ODiNはまだアクセスが重いため調査できませんでした。
.
土曜日の朝に伊藤忠商事が米エキサイト@ホームからエキサイトJapanの65%の株を20億円で買収したとのニュースが入りました。これを100%にすると30億円です。ページ検索をGoogleに移行したことを考慮しても、月間推定8〜9億PVですので、月間PVあたり4円です。2000年11月に楽天がInfoseekを買収したときは85億円、月間ページビューあたり53円、Yahooの190円に較べて3割でした。ちなみに現在の日本ヤフーの時価総額は5,500億円、月間61億PVですので、月間PVあたり90円、これをYahoo!BBと折半すれば45円位になります。Exciteの4円はYahooの1割位ですので相当安く買収したものとみなせます。
.
海外 検索数の調査では、AltaVistaは33.6%減少し、1位から5位にランクを落としました。トップはWiseNutですが、昨年9月23日以降4ヶ月以上更新されてないのが気がかりです。その他、Lycos 7.1%増、Teoma 6.9%減です。
.
検索窓にキーを入力して検索しますが、情報源別に複数の検索サービスが利用できるところを調べてみました。Googleはウエブ、イメージ、グループ、ディレクトリ、AltaVistaはウェブ、イメージ、ビデオ、MP3、ニュース、Allthewebはウェブ、ニュース、イメージ、ビデオ、MP3、FTP、そしてYahoo!はカテゴリ、ウェブサイト、ウェブページ、ニュース、リサーチペーパー、と各社様々です。
.

 2002年1月27日
 検索評価キーの変更、米Yahooの有料記事検索

日本 検索数調査では13サイトのうち7サイトを調べました。TOCCが大幅に減少し23.6%減、Googleは5.4%増です。ODiNは先週からですが検索が重く調査できまませんでした。goo検索のデフォルトがサイト検索からページ検索に戻っています。Googleのディレクトリ検索はサイト検索ではなくカテゴリ検索してるようで、従来のような検索はできませんでした。落ち着くまで少し時間がかかりそうです。
.
検索評価の調査キーは50ありますが、そのうちの20を入れ替えました。その内訳は2字漢字 15、3字漢字 6、4字漢字 6、カタカナ 10、ひらがな 3、英字 5、その他 5、です。従来は2字漢字とカタカナが主でしたが、今回はバラエティに富んだキー構成にしました。ほとんど全数調査しましたので、検索数調査と検索評価調査とで今回は700回位の検索をしたことになります。
.
調査キーを変更したのですが、検索評価の得点はあまり変化しませんでした。1位はgoo、2位はGoogle 96.2から96.4へ増加、3位はLycos 93.0から90.9へ減少、4位はAlltheweb 74.3から64.7へ減少、5位はTOCC 91.1から60.1へ減少、です。TOCCは検索数と検索評価が大きく減少しました。総合の検索力は、1位 Google 100.0、2位 Lycos 99.5、3位 goo 98.2、とほとんど同レベルで、4位のAlltheweb 67.6 以下を大きく離してしまいました。
.
海外 検索数調査では、Google 5.6%増、Lycos 5.1%減、Alltheweb 4.8%減で、順位の変更はありませんでした。毎週ごとの変化は少ないですが、3ヶ月前と較べますと、Teoma 37.5%増、AltaVista 23.1%増、AOL 21.3%増、HotBot 20.9%増、Google 17.7%増、Alltheweb 0.3%増、WiseNut 0%、Lycos 3.8%減、平均20.0%の増加です。
.
Northern LightがWeb検索を撤退しましたが、平行してサービスしていた有料の記事検索サービスはdivine Inc.に買収されました。それと同時に、『Yahoo! Premium Document Search』として再出発することが発表されました。アーカイブタイプの記事データベースがYahoo!の強力な流通ルートに乗るわけですから、従来よりは利用されるものと思われます。市販のデータベースも独自の流通ルートを開拓していますが、トラフィックの多いところと提携して販路を拡大するのも一つの手です。大規模なデータベースとして、Web系、速報ニュース系、アーカイブ系の3種類がありますが、それぞれのデータの特徴を生かした3種類の検索技術が発展するのが理想的です。
.

 2002年1月20日
 日本語のフレーズ検索、ニュース検索は日付順で

日本 検索数の更新は13社のうち9社、ほとんど1%未満の変動です。今回は、Google、TOCC、Infoseekの検索評価を行いました。先週、評価を大幅に下げたTOCCは元の評価に戻りました。検索評価の順位は替わりませんでしたが、総合の検索力順位は入れ替わりました。1位 Lycos、2位 Google、3位 goo、4位 TOCC、です。
.
英語の場合、単語はスペースで区切りますが、日本語にはスペースがありません。したがって、各検索サイトは単語を識別するために大変苦労を重ねています。いつも使う事例ですが、「情報」、「検索」、「情報 OR 検索」、「情報 AND 検索」、「情報検索」、の検索数を調べ、各項目の比率を求めて比較します。なお、最後の「情報検索」は情報と検索とを合成したもので英語のフレーズとみなせます。このフレーズ検索はAND検索よりも少なくなります。
.
goo、TOCC、Alltheweb、はAND検索、OR検索、フレーズ検索を正しく行う検索サイトとみなせます。以下、コメントを記します。1) AND検索: Lycosの結果は他の100分の1位、Googleは2〜3倍というか検索数が大きいと少なく表示されるようです。AltaVistaは現在日本語コードでのAND検索はできません。2)OR検索: LycosとNaverが処理できません。3)フレーズ検索: Lycosは""で囲むことが必要で、しかもその結果は他よりも5分の1から10分の1位少ないようです。日本語ではフレーズ検索を意識せずに使っていますので、検索ランクに影響するかも知れません。
.
海外 更新は8社のうち6社です。Teomaが6.9%増加した以外はあまり変化のない週でした。16日にNorthern Lightの無料のページ検索は閉鎖しましたが、ニュース検索は続行しています。
.
現在のロボット系検索エンジンはページやサイトの区別を解消しつつあります。ページやサイトの混成したデータを同じ土俵でランキングできるようになったからですが、検索エンジンにはランキングをあまり意識しなくてもよい分野があります。それは新聞記事、雑誌記事、掲示板の発言などのニュース検索です。その特徴は年月日表示があり、原則としてコンテンツは変更しないものです。この場合の検索は、情報をできるだけ速く入力し、ランキングではなく新しい日付順に表示することが重要になります。まだニュース検索などでランキング表示するところがありますが日付順表示にしてほしいものです。
.

 2002年1月13日
 TOCCの検索評価が悪化、Northern Light終了

日本 検索数調査の対象検索エンジンは昨年末に較べて2つ減り11種類になりました。それに以前から調査しているサイト検索系のGoogleとgooを含めると13種類になります。今回はその中の7つが更新し、Allthewebは5.6%増加しています。次に検索評価ですが、閉鎖したkensaku.jpとExcite(Googleを採用)を除きました。それから評価データの作成時にTOCCとODiNを除外していましたが、今回からそれらを追加し9検索エンジンをベースにしました。評価方法と調査キーは従来と同じです。
.
検索評価の結果は、1位 goo 100.0、2位 Google 92.0、3位 ODiN 88.9、4位 Lycos 86.4、5位 Alltheweb 68.7、になりました。評価に加わり有利になったODiNが評点をアップしています。それからAllthewebとGoogleも得点が増加しています。今回の評価でTOCCが前回の3位から8位へと超大幅に評点を下げています。ランキングのアルゴリズムが変更したのか、URLの処理方法が変更したのかわかりませんが、これは一時的なものと考えられます。
.
現在、Google系、Inktomi系、WiseNut系があります。Inktomi系のgooとTOCCは基本ソフトは同じですが日本語処理や収集データが異なるため、検索結果は異なっています。しかし、Google系の場合は、検索結果を較べればすぐ分かりますが、Google、Yahoo、Excite、Biglobe、@nigty、は全く同じです。収集データが同じでも、パラメータの値を変えたり、関連性測度を変えるだけで異なったランク結果が求まります。Google系もやがてYahoo流、Excite流などと異なった検索結果を表示するようになるかも知れません。ランクは一種類ではなく複数考えられますので、ユーザーが複数のランク結果の中から選択できれば検索の場が広がります。
.
海外 海外検索エンジンの検索数調査ですが、12月末にExciteが検索数表示をしなくなり、さらにこの16日からNorthern Lightが無料のWeb検索サービスを中止(有料版は継続)するとのことです。従って、従来よりも2社減り、8社の調査になります。更新は5社ですが大きな変化はなく、4位 AOL、5位 Lycosの順位が変動しました。
.
今まで記してきたように12月から1月にかけて日本のLycos、kensaku.jp、Excite、米国のNorthern Lightなどの検索エンジンの開発が中止されました。撤退となれば製品であれば工場などがなくなるのですが、検索エンジンの場合はせいぜい数部屋にあるコンピュータや通信設備、それにソフトやデータの廃棄になります。投入する資源が少ないことから社会への直接の影響は少ないですが、もし検索エンジンがなければと考えると、ここ数年間の貢献は大きかったと思います。長い間検索エンジンの開発に携わってきた人々に感謝いたします。
.
.

◆リンク

◆検索力調査

◆2002年1-6月

InfoNavigatorの終了、各言語別データ数 06/30
TOCCの復活とAAA!Cafeのオープン 06/23
Alltheweb1億3,900万へ、価格.comの子会社化 06/16
AltaVista倍増、SEOビジネスよりも検索サイトへ 06/09
Alltheweb倍増、Naverランク向上、@nifty買収額 06/02
Naverの増加、Google Labsについて 05/26
Unicodeの使用、日本語汎用ドメインの終了 05/19
広告部分の索引化、Googleの分身誕生 05/12
海外は英語のみ、any languageとenglishの割合 05/05
Infoseek検索エンジン開発中、Google Answers 04/21
ブロードバンドの先陣争い、GoogleのAPI開放 04/14
検索数も検索評価も2分化、gooのサイト検索 04/07
ISIZEのリニューアル、ステップアップの楽しみ 03/31
コンテンツの有料化、英語検索エンジンの紹介文 03/24
紹介文の重要性、LookSmartがWiseNutを買収 03/17
お知らせラッシュ(goo、フレッシュアイ、エキサイト) 03/10
サイトの見直し、コンテンツ制作に必要なSEO 03/03
Googleとgooの増加、GoogleのAdWords Select 02/24
検索の易しいキーと難しいキー、検索の重要性 02/17
ドメインや博物館の索引化、GoogleのPage Rank 02/11
AltaVista:3分の2へ、伊藤忠商事:エキサイト買収 02/03
検索評価キーの変更、米Yahooの有料記事検索 01/27
日本語のフレーズ検索、ニュース検索は日付順で 01/20
TOCCの検索評価が悪化、Northern Light終了 01/13