検索デスク 視点(12) 1997年2月20日

日米Yahoo!の( )の相異
   視点(12) 1997年2月20日

1.小さなことか大きなことか

  インターネットのディレクトリ分野で、Yahoo! Japan は初心者に使いやすいこと、雑誌とタイアップしていること、そして日本人のブランド志向などにより人気があります。カテゴリの後の( )の数値が何を表すのか知らなくても利用できますが、少々誤解を招く表示がされていることに気がつきました。

2.Yahoo! Helpでの@と( )の説明文

  1)カテゴリの後ろに付いている "@" マークは、そのカテゴリがYahoo! JAPANデータベースの複数の場所に登録されていることを示します。そのカテゴリをクリックすると、そのカテゴリがメインに登録されている場所にリンクします。

  2)Yahoo!カテゴリに続く( )の中の数字は、そのカテゴリ中にある登録サイトの数を示します。数字にはリンク先の登録サイトは含みません。

3.オープン時から毎週土曜日にデータ収集

  登録数の調査は96年1月から続けています。画面にデータ総数を公表しているところはそのままの数値を、公表してなくても手がかりがあるところは推定し公表しています。

  Yahoo! Japan の場合、96年4月のオープン時から登録数を推定してきました。その方法は、毎週土曜日にYahoo!の大分類である14種類の画面を開き、( )内の数値を全部加算するという単純な方法です。( )の利用は米国Yahoo!と同様なことがヘルプに書いてあったからです。

  Yahoo!のデータ総数は96年4月6日の 13,494 から始まり、97年1月4日の 383,943 まで順調に伸びていましたが、1月11日に 267,597 へと大幅にダウンし、そこから上昇しています。2月8日に4分の1にダウンしましたが、15日には元に戻っています。2月1日、8日、15日 と米国Yahoo!の2月17日のデータをカテゴリ別に次に示します。

4.データ

カテゴリ2月1日2月8日2月15日米国
2月17日
芸術と人文30,5042,96933,14120,084
ビジネスと経済70,17022,50774,624191,330
コンピュータとインターネット36,3203,68838,92118,652
教育4,9971,2295,2224,641
エンターテインメント47,06518,06150,253119,856
政治6793927367,989
健康と医学2,5591,1002,7519,636
メディアとニュース5,1628745,48113,307
趣味とスポーツ28,4075,59030,07937,172
各種資料と情報源20,32111821,5161,868
地域情報37,09614,87039,090309,172
自然科学と技術5,7761,1296,18320,105
社会科学2,6322972,7744,129
生活と文化8,9921,6459,57228,972
合計300,68074,469320,343786,913

5.本家を抜く?日本語の情報が世界の情報よりも多い?

  国ごとに政策、国民性、そして言語処理が異なるために、日本のYahoo!が独自のデータベースを開発するのは当然です。当検索デスクの登録数調査では1年後の登録数予測をしています。日本Yahoo!の成長率はすばらしく、96年12月には、1年後の97年末に1,000万件を突破するなどと予測したことがあります。

  上記のデータより日本Yahoo!の2月15日は32万件、米国Yahoo!の2月17日は79万件です。ずいぶん接近してきました。しかし、よく見ると、芸術や人文、コンピュータとインターネット、教育、そして各種資料と情報源がすでに米国を抜いています。これには唖然としました。何か釈然としません。そこで原因を探してみました。

6.ヘルプの相異:Yahoo!カテゴリに続く( )の中の数字は、そのカテゴリ中にある登録サイトの数を示します。

  ヘルプの説明文のこの部分はよいのですが、次のところが異なります。

  日本 数字にはリンク先の登録サイトは含みます。

  米国 数字にはリンク先の登録サイトは含みません。

  もうお分かりですね。日本語のヘルプの記載が間違っているのか、( )の積算方法が間違っているのか、そのどちらかです。

7.含むと含まないとは大きな差

  日本Yahoo!の( )内の数値はカテゴリを進めたときに@があると、そのリンク先にあるサイト数も加算しています。そのため、同じサイトが何回も加算されることになり、実際のデータより多くなります。

  一方、米国Yahoo!の( )内の数値はカテゴリを進めたときに@があっても、そのリンク先にあるサイト数は加算していません。そのため、同じサイトが何回も加算されることはなく、実データがそのまま反映されます。

8.リンクをつけることで4倍に拡大

  ディレクトリ系だけでなく、検索系サービスに対しても、データ総数がよく問題にされます。検索サービスの一つの目安として誰にも理解しやすいからです。検索系はデータ総数よりも検索力の方が実体を反映すると当検索デスクで採用していますが、ディレクトリ系ではデータ総数は大きな要因になります。

  この総数は車でいえば馬力にあたります。馬力だけで車を購入する人はいませんが、条件が同じなら馬力の大きい方を選択します。検索の場合でも、データ総数が多い方にマウスがいくものです。Yahoo!はサイトの内容により複数のカテゴリに分類しています。それらを含むデータ総数は推測ですが約7.7万です。( )内の総数が約32万ですから、全体で約4倍も多く表示していることになります。これでは実データを公表しているところはたまりません。

9.カテゴリへの配置とリンクの採用

  ディレクトリ系のサービスはカテゴリが最大の武器です。収集した情報をどのカテゴリに配置するのか、非常に困難で知的な仕事です。もしカテゴリの異なったところへ配置すると、ユーザーには不要な情報を伝えることになります。一つの情報をカテゴリに配置する方法は二通りあります。

  第一は、一つの情報を一個所のカテゴリだけに配置する場合です。しかし、情報が複数のカテゴリの内容をもつような場合に一つのカテゴリにしか配置できないのは、選択範囲を狭めることになります。

  第二は、一つの情報を複数のカテゴリに配置する場合です。多くのサービスがこの方法を取り入れています。ただ、配置する割合は平均10%から99%までと、サービス側の方針で異なっています。情報内容によりますし、どれ位がよいかは分かりません。ただ、あまり多くのところへ配置すると情報内容の薄いのが入り込む恐れがありマイナスになります。

  さらに、WWWのリンク特性を活かしてカテゴリから関連するカテゴリにリンクを張る場合があります。これはユーザーにとって大変便利なものです。これをYahoo!が採用し、@マークで表示しています。これはぜひ多くの所で採用してほしい方法です。上記したようにリンクをつけることで数倍の効果があるわけですから。

10.リンク先のサイトを含めないのが正しい表記

  検索デスクでは検索サービスについての正しい知識をもつことが効率のよい検索をもたらすものと考え、事実関係を伝えるよう努力してきました。このたび、数ヶ月間も、情報発信者の情報をベースに誤解をまねく情報を発信していたことにショックを受けています。

  Yahoo!に表示される( )の中身について、次のような事実を知っている人はほとんどいなかったのではないでしょうか。
(1) 日本のYahoo!が採用している( )内の表記はリンク先のサイトを含むもので、実際のデータより数倍も多く表示される。
(2) ヘルプの表記には「リンク先の登録サイトは含みません」とあるが、現状は「リンク先の登録サイトは含みます」である。
(3) 米国Yahoo!はヘルプ通り「リンク先の登録サイトは含みません」であり、日本と米国とはカウント方法が異なっている。

  やはり誤解を招くような形でデータを表示しているのは問題です。Yahoo!の人気の秘密が、この表示によるものではないにしても、大きな利益を得ていたことは確かです。2月8日に従来の4分の1になったことがありますが、それがリンクを含まないカウントだったのではと思います。なぜ2月15日に元に戻したのかわかりません。この一連の動きでなぞが解けました。

  2月8日のようにリンクを含まない表記に直すのは即時に実行できます。インターネットでは証拠が残りませんから、あとから4分の1にダウンした数値を見た人に、検索デスクはデタラメなことを言っていると言われかねません。一個人にとって信用問題ですし、検索サービスの健全な発展を願う立場から、この一文を草した次第です。