1996年6月2日
 健康、ダイエット、療法、フィットネス

今回のねらい 健康でなくてはインターネットはできません。若い女性は美容とダイエットにお金を使います。うらやましい限りです。ダイエットは食べる量を減らせば良いわけで、ここ3日ほど風邪で痩せることを経験しました。というわけでもないのですが、今回は健康に関するキーを選びました。
.
変化してるのを感じませんか 検索数だけを見ていても変化が感じられます。ロボット系に日本語OpenTextが加わりました。InfoNavigatorは索引系でいつもトップをマークしていたのですが、システムのテスト中なのか検索数が急減しています。それに比べて索引系からロボット系へ変身をはたしつつあるNippon Search Engineは1ヶ月位でトップになりました。それから、いつもブービーメーカーだったNETPLAZAは1ヶ月程前にロボット宣言をし、索引系とロボット系の2本立でサービスを開始し、今回の結果は良好です。
.
フィットネス情報の分析 フィットネスで得られた検索結果を分析しました。Nippon SEよりあとの、リンクがはっきりしないNTT DIRECTORYと英語分を除く11種のサービスから総計59の検索結果を得ました。重複分の20(重複2が5種、3が2、4が1、5が2)を除くとフィットネス情報は39になります。9つのサービスは検索数が8以下ですから、全体の2割も満たしません。1〜2割の情報を示されて情報があったとかなかったとか? 自衛手段としては複数のサービスを利用したり(当巡回検索はグー)、ロボット系の検索をすることです。ああ、まだ一杯することがありますね。
.
日本語OpenText もう利用しましたか。まだ、検索結果の表示が100%でないですが、1ヶ月前よりはるかによくなっています。カタカナの処理も大部よくなっています。ときどき検索結果数が大きく示されるのがあるため、まだテスト中かなとも思います。最近、本家のホームページが改装し、シンプルになりました。ただ、残念なことは、当検索デスクから入力して検索する巡回検索が使えません。いろいろテストしているのですがうまくいきません。もう、しばらくお待ち下さい。
.
NETPLAZA Robo ホヤホヤのロボットによるサービスです。まだ、データ数は少ないようです。新聞社・出版社の検索サービスやHotBotなどにある期限オプションがあります。Roboでは手頃な2週間に設定されています。速報性を重視するというか、最新の情報を収集することを意味しますから、データが集まり本格化すれば有用な検索サービスになります。これからの成長が楽しみになってきました。
.
地域発見の追加 6月1日から地方自治体のWeb情報を1個所に集め検索サービスする「地域発見」がオープンしました。ホームページ217件から、約11万頁をキーワード検索できます。検索キーは限定されてるようです。従来の抄録型データベースがWebで利用でき、それに自治体のリンクが張られており、これからこのタイプのものがでてきそうです。巡回検索ができるよう試みていますが、まだOpenTextと同様、上手く動きません。
.
WebdeWの追加(6/11) リクルートのディレクトリサービスがオープンしました。フレームとカラーを使ったデザインになっています。米国のExciteのような感じです。早速、検索数の調査を行い、その結果を追加しました。「マラソン」の検索は「マラン」1件となりました。たくさんの頁がありますが、連絡先がどこにも見あたりません?
.

 1996年5月26日
 新聞、雑誌、TV、ラジオ

今回のねらい Web情報という新しいメディアが登場しても,従来のメディアである新聞,雑誌,TV,ラジオの役割は変わらない。インターネットという新しい流通システムが既存のメディアにどのように影響していくか誰にも分からない。
.
試行錯誤の世界 新聞を例にとっても,試行錯誤の連続であり,絶えず変化している。よいニュースを流しているサイトで毎日見に行っているところも突如閉鎖されたり,つまらない所でもいつしか新しいものよいニュースに変わっている。このようなことはネット上では日常茶飯事なことである。
.
更新の必要性 最高のブックマークをつくっても,3ヶ月もたてば役に立たないことは誰でも経験していることである。そのような点を考えると,3ケ月以上維持管理されていない「リンク情報」は流すべきでなく,ネット上からはずすべきである。特に,アクセスの多いサイトの場合はその責任は重い。何も知らないビギナーが古い情報をベースに検索・索引・リンクの世界をみるとしたらマイナスにしかならない。
.
日本語 OpenText の登場 27日朝に突然発表になり,検索調査のためアクセスを試みたが,全然検索できない状態が続いている。アクセスの予想がはずれたのか,回線が細いのか分からない。昨年6月頃からサービスを始めた OpenText は検索ソフトの優れていることを宣伝するために無料の検索サービスをするカナダのソフト会社である。昨年9月に米国Yahoo!は検索面の遅れを OpenText でカバーすべく提携し,数週間でサービスを始めるとしていたのが,まだはっきりとした形に現れていない。4月に日本ヤフーがサービスを開始し,日本語OpenTextの総販売代理店である日商岩井がサービスを開始した。この4社の関係が今後どう展開するのか興味のある話題である。
.
日本語 OpenText ビギナーには少し取っつきにくい検索画面であるが,その機能は多彩なものを持っている。対象はWeb,URLなどあり,AND/OR/NOTなどの検索オプションも備わっている。3週間ほど前にテスト中の日本語OpenTextの検索調査を試みた。9〜14回までの検索キーについての調査では,比較的収集数も多く,良好な結果を得ている。ロボットによる全文系ということで,ODIN,Mondou,TITAN,千里眼の範疇に入り,検索数だけのランクも試みた。カタカナの検索が極端に悪かったがどの程度改善されているだろうか?
.
その他 InfoNavigatorの検索結果が悪く,毎回ランク1位が10位である。何かシステムの変更をしているからかも知れない。それから,NTT DIRECTORY の検索数の上限がなくなり,検索総数が表示され良くなりました。Thanks。
.

 1996年5月19日
 自治体、振興、地域振興、商工会議所

今回のねらい 自治体のインターネット利用がアツクなってきました。今回は自治体、振興、地域振興、商工会議所をとりあげました。自治体関連の情報が400、500と言われています。組織が流す公式の情報と個人が流す非公式な情報がありますので、情報の把握はますます難しくなってきました。
.
複合語の処理 Webページの中に地域振興を見出した時の処理法は主に2種類あります。(1)地域振興と1単語として処理、(2)地域と振興に分けて2単語として処理。これらの区別は検索してみればわかります。地域振興の検索数と地域と振興をANDで結んだ検索数が異なっていれば前者、同じであれば後者とみなせます。
.
地域振興を調べるには 実際の調査では、地域、振興、地域AND振興、地域OR振興などの検索数を求めました。AND検索の方が単独の地域振興よりも検索数が多いため、AND検索ができる場合にはAND検索の検索数を地域振興の検索数に採用しました。17の検索システムのうち、AND検索ができるのは11、OR検索ができるのは10です。今回はANDができないシステムは幾分不利になっています。
.
情報の中身 商工会議所の検索結果を見ていると、結構重複データが入っています。古くなった広報的な紹介をどう扱うか、ゴミの山を築いているのか宝の山を築いているのか難しい問題を含んでいます。
.
今週は2つの楽しみが Nippon Search Engine と米国の Inktomi が20日(月)に新装開店します。Nippon SE のシステムは3月頃からテスト中で、この5月7日から引越しのため停止していたのものです。Inktomi はサービスしていましたが、データの入力が昨年11月頃から止まっており、新しい情報が入っていなかったので紹介からはずしていました。Alta Vista に匹敵する検索エンジンであることと、大学からベンチャー企業へと転身します。
.
Nippon Search Engine 5月23日追加引っ越しのためサービスを中止していたのですが,再開しました。しかし,現在のサーバーは仮のもので,正式に移行するのは今月末です。当検索デスクのNSEへのリンクは即対応しました。検索数の調査ですが,ロボット収集が全体の4分の3を占めるほどになり,InfoNavigatorに次ぐ実力を持つものに成長しています。検索で気がついた点は複合語は分けてAND検索する事です。「地域振興」は「地域」「振興」とスペースで分けて入力しAND検索を,「商工会議所」は「商工」「会議」「所」と分けてAND検索です。
.

 1996年5月12日
 Java, VRML, RealAudio, Shockwave, JavaScript

今回のねらい 今まで日本語のサービスを対象の調査をしてきましたが、今回は米国を中心とした英語のWebサービスを始めて調査しました。検索キーは第9回の調査と同じで、最新の技術情報に関するものです。従って、この調査が各データベースの全体像を表すものでないことをお断りしておきます。今後、1ヶ月に1回位Web調査をする予定です。
.
Web検索サービス(1) いろいろな検索エンジンが紹介されていますが、その実力はあまり知られていません。ナンバー・ワンの Alta Vista は2位 Lycos の約10倍の検索数があります。改めて Alta Vista の実力が浮かび上がりました。2位の Lycos は検索結果が充実し、利用しやすいデータベース作りがなされています。3位のMagellanは一部のサイトを従来のデータベース作りと同じようにレーティングするなどして結構面倒なことをしていますが、最近のように量の競争から質の競争へ移ってきたときに威力を発揮します。それに着実にデータ数を伸ばしています。
.
Web検索サービス(2) 4位のinfoseekは索引系から出発していますが、ロボット収集にも力を入れており、この6月から Alta Vista と互角に争える Ultaraseek が稼動しますので面白くなってきました。5位の NlightN はほとんど取り上げられていないのですが、やはり相当な実力を持っています。単にWeb情報だけでなくニュースや雑誌の情報も検索できますので重宝です。ただ、ShockwaveとJavaScriptの検索数が少ないのは、データの最終更新が昨年末で、今年のデータが入っていないからと思われます。Exciteだけ検索総数の表示がなく、ランクできませんでしたが、実力があるわけですから公開しないと不利になります
.
Webと日本を比較 ついでに日本のロボット系の検索数も調べテーブルに載せました。日本語のデータがWebの総量に対してどれくらいかわかりませんが、Webの3.3%で30分の1、5%で20分の1になります。Lycosを基準にすれば、総数で3,100〜4,600となります。ODINやMondouはまだ誕生して間がないので、日本語のデータの半分位しか集めてないように思われます。千里眼の最終更新日は1月5日ですが、ShckwaveやJavaScriptの検索数が極端に少ないことからもわかります。
.
Web索引サービス 索引系はロボットによる検索系に比べると、検索数は約50分の1となり、完全に差がついてしまいました。日本では、検索系も索引系も一緒に扱っていますが、やはり区別して扱うことが必要です。索引系は逆に50倍の価値のある情報を伝えなければ生き残っていけないかも知れません。その中でもYahoo!は頑張っています。新顔として、New Rider's Yellow Pages や LinkStar が上位に入ってきました。各サービスは互いに抜きつ抜かれつのデットヒートを繰りひろげています。現時点の新鮮な情報を伝えることが必要であることを痛感しました。
.

 1996年4月21日
 野球、サッカー、相撲、マラソン

今回のねらい あなたはスポーツして楽しむ方ですか、それともスポーツを観る方ですか。今回は集団競技の野球とサッカー、個人競技の相撲とマラソンをとりあげました。個人主義が横行する欧米で少しは集団で行動をと考え出されたのが野球やサッカーなどの集団で行うスポーツ。一方、集団主義が横行する日本で少しは個人で行動をと日本古来の相撲や武道などがあります。昔は剣道が好きで2段の腕前です。今は週に2〜3Km泳いでいます。
.
2種類の検索画面 検索サービスの利用状況を調査する必要があります。ビギナーが続々参入してますから検索サービスの利用法を啓蒙することは必要です。カメラでも素人用とプロ用があるように、検索画面もビギナー用とプロ用が必要です。ビギナー用はキーワードを入力するだけで検索でき、プロ用はいろいろな検索オプションを使った検索ができます。サービス側がいくら良いシステムを提供しても、その使い方を教える場がなく、優れていますが複雑な方法の利用は少ないのが現状です。また、キーワード1つだけの検索とオプション付きの検索の2系統で処理した方がシステムの負荷は少ないため、索引サービスでは2種類の検索画面があります。
.
データ総数について 今年の1月から各サービスの毎週末のデータ総数を調べ、「日本の検索」画面や各サービスのデータ総数を新しいのに更新しています。データ総数を公表している所はその数値を、索引などで概数が求まる所は電卓でカウントしたりと、最新のデータを維持するのに結構時間がかかっています。そこで昨日、電卓でカウントする所のソフトを作りました。来週から少しは楽になりそうです。以下に、データ総数に関する各サービスの現況をまとめました。
.
  • データ総数をホームページで公表するところ(8) ODIN、WWWナビゲーター、CSJインデックス、Yahho、NETPLAZA、JOY、日本企業URLディレクトリ、WWWホームサーバーガイド。−−Thanks。
  • 索引の分類項目にある数をカウントして得られるところ(5) Hole-in-One、Yahoo! JAPAN、URL広場、URLの広場、日本のインターネット一覧。
  • 公表されたままでデータが古いところ(5) 千里眼、TITAN、NTT DIRECTORY、Nippon SE、Japan SE。
  • 公表がなく手がかりがないところ(5) Mondou、InfoNavigator、WAVE Search、日本ネット、WWWファインダー。

.
ロボットと登録の併用型 Nippon Search Engineは併用型の新システムに移行しており、データベースも整理されつつあります。今回の検索数調査でそれがはっきりしてきました。今までの情報収集はロボットか登録かということで2つに分かれていましたが、今後は第3の併用型へ移行するものが多くなってきそうです。InfoNavigatorはデータベースの構築が他の所と異なっていると思っていましたが、やはりロボットとの併用型のようです。Yohoo! JAPANも併用型を打ち出してきましたので、もうこの流れは止めれません。
.
Yohoo! JAPAN、今度は少々減少 見切り発車したせいか先週データが倍増しました。この1週間はデータを見直したのか、珍しいことですが、少々減少しました。情報を提供する以上、古い情報やリンクのない所を紹介しないよう気を付けるのは当然といえば当然ですが、情報の信頼性を保つ努力をしていることがうかがえます。今回の検索数調査からランクが上がってきました。
.

 1996年4月14日
 セキュリティ、認証、電子決済、電子キャッシュ

今回のねらい 今話題の電子マネーに関するキーを調べてみました。紙媒体の新聞や雑誌などでは情報の伝達は速いのですが、Webの世界はどうなっているのでしょうか。また、今回は電子決済、電子キャッシュ(電子マネー、電子商取引も調査)など先頭に電子がくる複合語を使いました。あまり良い結果が得られませんでしたが、定点観測ということで採用しました。
.
日本語Webの処理 日本語Webは漢字、カタカナ、ひらがな、英文字、数字やカンマなどの特殊文字、全角と半角文字、HTMLのタグ、リンク情報、画像情報などから構成されています。この中から重要なキーを探し出し、データベースを作成しています。英語処理とは異なる日本語処理技術と、Web処理技術の両方が必要になります。これから急速に発展する分野で、楽しみです。
.
「電子決済」を調べるには 電子決済を検索する場合、システムにより次のような異なった方法が存在します。
.
  • 自動分割しAND検索
      TITAN、Mondou −− 「電子決済」を入力すると、「電子」and「決済」と自動的に変換し検索する優れものです。
  • AND検索
      千里眼、InfoNavigator、WAVE Search、Nippon SE、NTT DIRECTORY、Japan SE、Hole-in-One、Yahoo! JAPAN、URL広場、NETPLAZA −− 電子と決済をスペースで区切って入力し、検索条件のANDを選択し検索します。この場合でも、1単語の電子決済で検索した結果と2単語に分けAND検索した結果が同じになるのとならないのとに分かれます。
  • AND/OR検索がない
      ODIN(OR検索)、WWWナビゲーター、CSJインデックス、Yahho、日本ネット −− 電子決済だけしか使えませんので、検索数が少なめです。

.
カタカナの処理 英語は漢字で表せる場合は漢字で、そうでない場合はカタカナで表します。今回の電子キャッシュはエレクトロニック・キャッシュとかデジタル・キャッシュとも言いますので前回にも少し触れましたが、電子の入力でエレクトロニックやデジタルも検索できればユーザーには便利になります。すべての単語を翻訳できなくても、よく使用するものだけでも十分ですから、これもお願いします。
.
Yohoo! JAPAN のデータが1週間で倍増 検索サービスを利用する場合、データの構成を知ることはユーザーにとって必要なことです。他の所もそうですが、Yahoo! JAPANもデータを良心的に公開しています。驚くべきことに、この1週間でデータは倍増(13,500→29,000=2.15倍)しました。主なものを列挙しますと、ビジネスの人名録(0→3,645)、企業(3,106→4,719)、製品およびサービス(466→1,689)、インターネット(546→577)、大学(0→842)、個人(1,849→1,914)、リファレンス一覧(2→3,647)、世界の国々(2,124→2,281)などです。まだ流動的ですが、従来とは異なった新しいタイプのデータベースを構築しているようです。
.

 1996年4月7日
 音楽、ミュージック、music、サウンド

今回のねらい 音楽情報の集まっている所を調べるために、音楽に関連したキーワードを用いて検索を試みました。まだ、いろいろと分からないこと不明瞭なところがでてきます。検索サービスごとに検索の仕組みが微妙に異なっていることを知るだけでも一歩前進です。
.
分類項目に音楽を含む場合の処理 分類項目の中に「音楽」が含まれる場合があります。そのような時に音楽をキーに検索すると、分類項目にあるものを検索する/しないにより検索数が異なってきます。検索に分類項目を含めるべきか/べきでないかは一概に言えませんが、含める方が広範囲の結果が得られます。オプションで含む/含まないが選択できればよいのですが、一般ユーザーには複雑なものと感じられるかも知れません。その判断は難しい所です。
.
アーチストとCD 検索数を表すデータから、サウンドの検索数に比べてmusicの検索数が多いものとしてJapan SE、Yahho、CSJインデックスがあります。これらの検索結果を見ますとアーチストごとの紹介や音楽CDのレーベルごとの紹介が含まれています。これらの検索サービスは音楽情報に強いところとみなせます。
.
海外のWeb情報の処理 Japan SEの検索数が非常に多いのは海外のWeb情報を含んでいるからです。こちら側でカウントし直すことができないためそのまま載せました。検索は日本語だけに限定するのか日本語と英語のハイブリッド型にするのかも大きな問題です。少なくとも海外のWeb情報を含む場合、TITANやNippon SEのようにオプションで選択できるのが望ましい形です。
.
日本語翻訳処理について 前回の英字の処理で大文字・小文字だけでなく全角の英字も同時に検索できたら使いやすいということを記しましたが、ここでは翻訳検索についての提案をまとめてみました。今回は「音楽」、「ミュージック」、「music」を調べましたが、この中のどれか1つを指定すればその他の2つが同時に検索されORした結果が返ってくるのが理想的です。すなわち、「music」を検索すると「音楽」も「ミュージック」も検索され、そのORしたものが表示されるということです。もちろん、「ミュージック」とすれば、「音楽」と「music」が検索されます。現在、TITANとNippon SE(準備中)は翻訳検索では一歩先んじており、「music」で検索すると「音楽」を、「音楽」で検索すると「music」を自動的に検索します。これをさらに推し進め「ミュージック」までできないかと無理な難題ですがお願いします。
.
新設Yohoo! JAPAN の索引について 分類の構成は米国と同じです。ここでは、ヤフー的なところを紹介します。日本ヤフーは13,400ページの情報量でスタートしました。しかし、カテゴリーの中のビジネスと経済/企業(3106)、エンターテインメント/個人(1849)、地域情報/世界の国々(2125)の合計7080が未分類?の状態で入っています。従って、分類済みの情報は13400-7080=6320となり、中規模からのスタートとみなせます。登録用のフォームからも分かりますが、企業のホームページはビジネスと経済へ、個人のホームページはエンターテインメント/個人へ、政府や地方公共団体などの特定地域に関するホームページは地域情報へと、新着情報は主体により、3種類のカテゴリーに分けて登録します。それを専門家が分類整理して提供するようです。分類は6320ですが、検索は13400のデータを対象にしますので、やはり大きなデータベースからの出発です。
.

 1996年3月31日
 花、フラワー、桜、ガーデン

今回のねらい 春です。桜の季節です。桜の名所の近くに住んでいます。昨日の雨で桜のつぼみも膨らんできました。これからの1〜2週間はとても陽気な時期です。というわけで、花、フラワー、桜、ガーデンというポピュラーなキーを選びました。その他に、庭園や花見なども調べました。
.
行事のインターネット化 初日の出、桜の名所、花火大会、お祭り、クリスマスなどの行事がスポーツ中継と共にインターネットで流されるようになってきました。そのような何かを探したい場合には検索サービスを使いなさいと自信を持って人に進めれたらと思います。そのためには、新しい情報をできるだけ速くデータベース化することが大事なように思います。
.
英文字のあつかい 日本語のWeb情報は英語の単語も含んでいます。英単語を検索するときに問題になるのが大文字と小文字の区別です。検索サービスごとに微妙に異なっています。第9回の検索調査では英単語だけをあつかいましたが、その時に気付いたことも含めてまとめてみました。
.
  • 大文字は大文字、小文字は小文字としてあつかう
      検索サービス(1) −− Japan SE −− コメント −− 少数派になりました。例えば、Javaを調べるには、Java、java、JAVAなどのOR検索が必要で、ユーザーには使い難いと思います。ほとんどの検索サービスが次の2へ引っ越しました。
  • 半角の大文字と小文字を同じとみなす
      検索サービス(10) −− ODIN、TITAN、千里眼、WAVE Search、WWWナビゲーター、Nippon SE、NTT DIRECTORY、Hole-in-One、CSJインデックス、日本ネット −− コメント −− Javaで検索すると、javaもJAVAも検索されますので、ユーザーには大変便利です。
  • 上記の1と2がオプション選択できるもの
      検索サービス(1) −− Yahho −− コメント −− 英語のWeb検索では case sensitive と case insensitive のオプションがあります。それと同じように上記の1と2はオプションで選択できるのが望ましい形です。
  • 半角の大文字と小文字、全角の大文字と小文字をすべて同じとみなす
      検索サービス(4) −− Mondou、InfoNavigator、URL広場、NETPLAZA −− コメント −− 上記2が全角の場合に拡張したものです。JavaやJava(全角)で検索すると、半角のJava、java、JAVAや全角のJava、java、JAVAを検索します。日本語をあつかう以上、この全角の処理は必要です。半角の英字だけからなる検索にはその全角も調べ、結果をORして出力すればよいわけですから上記2からの移行は容易だと思います。
  • 上記の1と4がオプションで選択できるもの
      検索サービス(0) −− なし −− コメント −− 一番良い形です。これから情報量も増えてきますので、このような方法も必要になってきます。

.
NTT DIRECTORY の海外サイト検索 日本語版と同じスタイルのメニューです。まだ、情報量は少ないようです。今後重要になるアジアの情報が一覧できるのは有用です。メニューの下部は、アジアの国別にサイトが選択できるようになっています。表示は日本語で、内容は英語です。
.
新設Yohoo! JAPAN の追加 3日の午後から検索サービスを開始しました。早速、従来通りの方法で検索数を調べてランキングしました。今回は「花」関連のテーマで全体の評価を示すものではありません。データはロボットでも収集しますので、今後データ数の急増が見込まれます。(4月3日)
.

 1996年3月24日
 ショッピング、通信販売、商店街、モール

今回のねらい インターネットを使って商売を始めようとしている人が多いようです。そのような場合に、まずショッピングに関する情報が必要ということで、ショッピング、通信販売、商店街、モールなどをキーにした検索を試みました。
.
全体からみた得意・不得意分野の調査の必要性 みなさんも気付いておられると思いますが、収集しているWeb情報は各検索サービスごとに異なっています。すなわち、データベース化しているものに得意・不得手があるということです。先週のブラウザ周辺の技術と今回のショッピングではランキングが大きく変化しています。その意味でこのような検索調査を積み重ね、全体から見た各検索サービスごとの得意・不得意分野を明らかにしていくことは必要なことです。
.
ランキングのルール 毎週、検索結果をベースにリストの順番を変えることにしました。そこで次のようなルールをつくりました。
.
各キーごとに、検索数の大きい順に順位を求める。4種類のキーによる順位の和を基にした順位を求める。上記5種類の和を基に順位を求める。同順位の場合は検索数合計が多い順とする。
.
このような操作はExcelなどが得意とするものです。データを入れたらすぐに順番がわかります。あなたもマクロで作ってみませんか。
.
Nippon Search Engine 2.0β版 検索本体のみで、登録やその他については順次リリースしていくとのことです。カラフルな画面です。検索画面もすっきりし、検索語入力と検索オプション指定(OR,AND,NOT)だけで、従来行っていた和英翻訳機能は準備中です。内部処理の問題かと思いますが、データベースが3系統あります。国内(マジックマウス社による紹介文)、国外DB、登録紹介文です。それぞれ#M、#W、#Uと検索結果は別々に表示されます。例えば、db#M/11: [1] / db#U/1: [1] / などと表示しますので、[1]の所をクリックすると該当するDBの結果が得られます。検索数の全部を一度に出力しますが、最近の出力傾向の10から20単位での出力表示(本来はスコア順の出力に使用するのですがスコア順でなくても有効)の方が負荷が少ないのでは思います。
.
ショッピング情報 ショッピングは製品の宣伝や広告の場です。NTTの新着情報などにも、XX製品を特売中というようなチラシのようなものまで入っています。そのようなデータは扱わないという所もありますが、広告データは期限つきで、期限が過ぎたらはずさなければゴミが蓄積されます。今後、この種のWeb情報は急増しますので、それを扱うガイドラインを作成することが必要です。
.

 1996年3月17日
 Java, VRML, Shockwave, RealAudio

今回のねらい 日本語のWeb情報を集めた検索や索引には日本語しか使えないと思っている人が多いようです。日本語の文章、特にWeb情報は漢字、カタカナ、英単語から構成されています。そこで今回は英単語だけを使いました。インターネットの最先端技術を表すキーワードばかりです。しかし、このような調査からでも新しいことが発見できます。
.
最新の情報は入っているのか 15日発売の日経マルチメディアの特集「進化するWeb」で、Java、VRML、Shockwaveが話題になっています。最新の技術を表すこれらのキーワードにRealAudioを追加して調査しました。最近、JavaScriptに興味をもっていますが、注目をあびているのはJavaのFAQをあつかうサイトです。このFAQの紹介がなされていたのは15のうち4つでした。
.
Java用FAQ情報を持っているか これから考えられることはデータベースには新しいデータがまだ入っていないのではないかという疑問です。もし新しいデータが入っていれば、たとえスコア順の表示でも検索されます。Java用FAQの情報をもっていたのは、全文検索系ではデータベースの新しいODINとMondouに、また紹介文索引系ではHole-in-OneとYahhoでした。
.
1〜2ケ月の遅れは致命傷 この2ケ月でWeb情報は4割増加しています。従って、2ケ月前までのデータしか持っていないとすると、71%(1/1.4)からの検索になります。陳腐化のことを考えると、新しいものを含まない50%位からの検索ということになります。これはWeb情報が急拡大しているためであり、1〜2ヶ月の空白は検索結果に重大な影響を与えます。Webデータベースは情報を蓄積するのではなく、如何に新しい情報に更新するかが価値を決めるポイントになります。
.
Alta Vistaの検索 今日、Alta Vistaで "asaisan"を検索したところ72件検索できました。今度のODINと同じ出力表示で、入力した年月日が一緒に出力されます。大体1月後半から3月始め迄の日付のものが多く、私のホームページには2月25日に訪れています。Thanksが多数見つかりました。また、Alta Vistaの訪問アルゴリズムを推測しましたが、ホームページ作りには欠かせない情報です。正確な情報が分かればお知らせします。
.
技術情報からみたランキング 今回調査した技術情報だけからのランキングを試みました。第1の基準はJavaのFAQ情報を含むかどうかです。第2の基準は新しいShockwaveのウエイトを2倍にした検索数の合計です。全文検索系、紹介文系の上位グループ、同じく下位グループと3グループに分けて見ました。
.

 1996年3月10日
 美術館、博物館、水族館、旅館

今回のねらい 「館」が付く漢字ということで、美術館、博物館、水族館、そして旅館を調べました。美術館や博物館の案内だけでなく、インターネットとマルチメディア技術を通して、遠くに離れた人に情報を伝えることができるようになりました。今日のTV番組に「いま博物館が面白い!」がありました。
.
検索サービス別の得意分野と不得意分野 美術館と旅館というちょっと異分野のキーワードからデータベースの特徴が浮かんでくるかも知れません。そこで、美術館の検索数を旅館の検索数で割り、その値の小さい順に並べて見ました。
.
Yahho(1.2) NETPLAZA(1.6) CSJインデックス(1.9) InfoNavigator(1.9) ODIN(3.1) WAVE Search(3.4) NTT DIRECTORY(4.0) WWWナビゲーター(4.7) Mondou(6.8) JapanSE(8.7) URL広場(10.5) 千里眼(10.5) NipponSE(11.2) Hole-in-One(13.0)
.
この結果から次の3つのグループに分けることができます。
.
  1. Yahho、NETPLAZA、CSJインデックス、InfoNavigator −− 美術館の数と旅館の数が接近。美術館が少ないか、旅館が多い。
  2. ODIN、WAVE Search、NTT DIRECTORY、WWWナビゲーター、Mondou、JapanSE −− バランスがとれているとみなす。
  3. Hole-in-One、NipponSE、千里眼、URL広場 −− 美術館の数が旅館の数よりも極端に多い。美術館が多いか旅館が少ない。

本来は、美術館/総数を求めるのですが、みなさんも、机の引き出しから電卓を取り出して(そうそう、Windowsの電卓が使えますよ)計算してみませんか。きっと、何か発見できますよ。
.
新装開店のODIN 順調な滑り出しです。検索結果の出力は前のも気に入っていましたが、スコア順表示には勝てません。出力は洗練されていてとても見やすいです。
.

 1996年3月3日
 医学、薬害、競馬、占い

今回のねらい 「東洋医学」で AND の調査をと思ったのですが、検索数が少なくあきらめました。失敗することを考慮して6種類のキーを調査しています。今回はバラバラになってしまいました。毎週の調査も大部慣れてきましたが、それでも15カ所を調査するのに2時間半以上かかります。それを整理して、HTMLのファイルを作成しなければなりません。それにしても大変な調査を始めたものです。
.
あなたは"AND"派、それとも"OR"派 検索の80%位は一つのキーワード入力で行われています。しかし、検索によっては複数キーの検索がほしいときがあります。このため、ラジオボタンで「AND」や「OR」のどちらかが選択できるようになっており、どちらかがデフォルト(黒丸)になっています。以下に示しますが、いろいろなパターンがあって困りませんか。「AND」の方が多いようです。
.
  • TITAN ●通常モード(OR) ○絞り込みモード(AND)。 自動分割処理する。
  • ODIN 自動分割:●ON ○OFF。 AND/ORは直接指定する。
  • 千里眼 英文の 'A B'は A and B。日本語はなし。
  • Mondou 複数単語はAND条件とみなす。関連語が示されるので後で絞り込める。
  • InfoNavigator ●すべての言葉を含む(AND) ○いずれかの言葉を含む(OR)
  • NTT DIRECTORY ●AND条件 ○OR条件
  • WWWナビゲーター なし
  • Wave Search ●AND条件 ○OR条件
  • Nippon SE ●Or検索 ○And検索
  • Hole-in-One ●いずれかの言葉を含む ○全ての言葉を含む
  • Yahho なし
  • Japan SE ○少なくともひとつ(OR検索) ●全てのキーワード(AND検索)
  • NETPLAZA ●全てのキーワードを含む(AND) ○いずれかのキーワードを含む(OR)
  • CSJインデックス なし
  • URL広場 なし
  • JOY なし

.
TITAN 複雑な日本語処理のため「占い」では検索できず「占」で検索しました。
.
JOY 個人のWeb情報を収集する JOY の Searcher の方が休憩中で検索調査はお休みです。なお、活動開始予定は未定とのことです。
.
Wave Searchの追加 これまで検索デスクから Wave Search をはずしていた理由は3つあります。第1はNTTの新着情報をデータベース化している所がNTT DIRECTORY, WWWナビゲーター, そしてWave Searchと3ケ所あり、前2者が新着情報以外の情報も扱っており、同じものはいらないと思ったこと、第2は現在は行っていませんが新着情報をgrepで検索していたため必要なかったこと、第3はデータの陳腐化を考えると93年12月からの蓄積はマイナスにしか写らなかったこと、などがあります。しかし、Wave Searchの検索調査結果はすばらしく、データベースの最も重要な要因である更新が毎日行われ最新の情報が得られます。
.

 1996年2月25日
 旅、旅行、トラベル、ペット

今回のねらい もうすぐ春です。旅行を計画している人にホットな情報がどれだけ探せるかということで、旅を中心に調査しました。観光や温泉などをキーにしたほうがよい結果が得られます。実はここでは、「旅」と「旅行」を中心に検索システムのクセを調べることがねらいです。
.
「旅」と「旅行」の区別 「旅行」の中に「旅」という文字が含まれています。テーブルから15の中の10のサービスが「旅」の方が「旅行」よりもヒット数が多いことがわかります。しかし、それとは反対に「旅行」の方が「旅」よりも多いのがあります。ODIN、Mondou、InfoNavigator、それからランク順の表示をするTITANやNTT DIRECTORYなどです。これはどう解釈すればよいのでしょうか。「旅」と「旅行」を区別できる日本語処理システムを採用しているからです。特に、全文タイプのものに多いのですが、情報量が多いため、しっかりした構文解析が必要のようです。
.
MondouとNETPLAZAの追加 前回の18日の調査でM?で登場した全文タイプの検索エンジンMondouと20日に索引サービスから検索を開始したNETPLAZAを新たに加えました。MondouはODINにあるサーバー紹介や19日付きのInternet Watchに紹介されましたので、正式に採用しました。テスト中ということですが、他のサービスも全部テスト中とみなせますし、インターネットは試行錯誤の世界ですから刺激がある方が楽しいですよ。
.
リストの配置替え 第1回から第6回までの検索数をベースにしました。検索結果に重複のあるものや、検索エンジンや検索結果の質などは今回とりあげませんでした。最新の情報を提供する立場から、配置替えを頻繁に行う予定です。
.

 1996年2月18日
 求人、就職、新卒、人材

今回のねらい インターネットを使った求人・求職活動が盛んになってきました。企業の人事部の人、大学の就職担当の人、就職希望の学生が検索サービスを利用できるかどうか調べました。すでに多数の情報が入っていることが分かります。検索を出発点にすれば幅の広い情報が得られ、それだけ出会いが多くなることになります。
.
キーワード入力 フォーム内の日本語入力問題は解決しました。ナビゲーター利用者は、2.0日本語b6a(Win用)へのVupを薦めます。しかし、実際問題として、Vupへの対応ができる人は少ないのではと危惧しています。よいブラウザを使わなければ、日本語の入力が難しく検索はできません。検索サービスの普及にはブラウザの向上とともにユーザー側の対応能力(DLとセットアップ)が必要です。
.
M?(準備中) まだ正式に公開されていませんが、全文タイプの検索エンジンがテスト中です。参考にするために、ヒット数を調べて最後の欄に載せました。まだデータ量は少ないですが、比較的新しいデータが入っています。相当実力を持っており、発展性の高いデータベースが構築されています。できるだけ早い公開が待たれます。
.
NETPLAZA(新設) 索引サービスだけでしたが、新たに検索コーナーができましたので、早速検索数を調べ、追加しました(2/20)。週末に移動の予定です。さて、どこかな???
.

 1996年2月11日
 著作権、特許、知的所有権、intellectual

今回のねらい ビジネスでどの程度使えるのかという問い合わせが多いため、特許情報にしぼりました。数が少ないかも知れませんが、全文検索はもう処理出来ないほどの情報量です。
.
キーワード入力 「ブラウザ」のところで取り上げたEmigrantを使用したため、日本語の問題はすべての検索で正常になりました。(Win95、Netscape2.0(英語版)を使用)
.
紹介文の長さ URL広場の総数は1800、Yahhoの総数は6400。その差は3.5倍。だからといって、検索数は3.5倍の開きになっていない。検索するのは紹介文やキーワードであるから、単純に(総数×紹介文の平均文字数)が影響する。このことから1文書あたりURL広場はYahhoの数倍の紹介文を処理しているといえる。
.
インターネットに情報があるのかないのか 検索数が少ないため、インターネットは使えないと判断するのは間違いですよ。1年後には2〜4倍に、2年後には6〜12倍(?)になります。2〜3年後の世界を頭に描いて判断して欲しいですね。
.

 1996年2月4日
 インターネット、商用インターネット、internet

キーワード入力 千里眼の日本語の入力文字表示も出力表示も正常になりました。
.
検索結果の総数表示 出力の最初の所に欲しいものです。出力数の上限が設定されてない場合は特に問題です。CGIで1〜2行つけ加えれば解決しませんか。
.
商用インターネット 「商用インターネット」か、「商用」and「インターネット」か。一つのキーワードしかあつかえないものもあります。
.
Japan Search Engine 出力数を制限なしにすると検索できず、200にしたら検索できました。
.
NTT DIRECTORY "internet"は5件、"Internet"は40件。大文字と小文字を区別しています。
.
WWWナビゲーター 「インターネット」と「商用インターネット」の結果は得られませんでした。使えないキーワード?
.

 1996年1月28日
 プロバイダー、プロバイダ、provider、福祉

ODIN 自動分割OFFは使用できない。従って、プロバイダーは"プロ"and"バイ"and"ダー"で検索し、プロバイダは"プロ"and"バイ"and"ダ"で検索する。
.
NTT DIRECTORY 「プロバイダー」は「プロバイダ−」で検索する。最後の文字「ー」が「−」に注意。キーボードの[P]右上の「ー」ではなく、数字キーの[+]上の「−」を使用する。
.
Yahho "provider"は0件、"Provider"は61件。要するに大文字と小文字を区別する。→[更新] 大文字と小文字の区別ができるようになりました(2/2)。
.

 1996年1月21日
 検索、search、姫路

...
.
.
前へ | −−

◆リンク

◆検索力調査

前へ | −−

◆1996年1-6月

健康、ダイエット、療法、フィットネス 06/02
新聞、雑誌、TV、ラジオ 05/26
自治体、振興、地域振興、商工会議所 05/19
Java, VRML, RealAudio, Shockwave, JavaScript 05/12
野球、サッカー、相撲、マラソン 04/21
セキュリティ、認証、電子決済、電子キャッシュ 04/14
音楽、ミュージック、music、サウンド 04/07
花、フラワー、桜、ガーデン 03/31
ショッピング、通信販売、商店街、モール 03/24
Java, VRML, Shockwave, RealAudio 03/17
美術館、博物館、水族館、旅館 03/10
医学、薬害、競馬、占い 03/03
旅、旅行、トラベル、ペット 02/25
求人、就職、新卒、人材 02/18
著作権、特許、知的所有権、intellectual 02/11
インターネット、商用インターネット、internet 02/04
プロバイダー、プロバイダ、provider、福祉 01/28
検索、search、姫路 01/21