検索デスク 視点(25) 2004年9月1日

科学技術文献のオンライン検索JDreamPetit
   視点(25) 2004年9月1日

1.個人向けオンライン検索サービス

  日常生活でWeb検索はなくてはならないものになっています。しかし、Webで検索できるのはこの10年位の情報です。Web以前にも、特定分野の情報に関するコンピュータ処理可能なデータベースが作られ、オンライン検索サービスされ、現在も続いています。

  その中でも日本で最大なのは科学技術振興機構(JST)の科学技術文献データベースです。企業や大学を対象にしたジェイドリームがありますが、この8月2日からジェイドリームプチという個人向け検索サービスを開始しました。

  有料検索ですが、9月30日までサービス周知期間として無料で提供されます。Web以前の情報に触れるまたとない機会ですので、無料検索を試みることをお勧めします。ここでは、Web検索と対比させてオンライン検索を紹介します。

2.検索方法からみた時代区分

  情報検索にコンピュータを使うのか使わないのか、データベースが複数の属性を持つのか持たないのか、などで時代を分けると、表1のように、Web検索、オンライン検索、そして手動検索になります。

  表1。検索方法からみた時代区分

検索方法コンピュータ処理データベースの属性年代
Web検索する1994年以降
オンライン検索する複数1970年以降
手動検索しない複数1970年以前から

  オンライン検索の開始はMEDLINEが検索サービスを始めた1970年としました。丸善主催の初期のDIALOG講習会に参加しましたが、検索結果はディスプレイではなくタイプライター、通信速度は数十メガボーではなく数百ボーでした。Web検索のように、毎日数十回、気軽に検索するのではなく、数ヶ月に1~2回、緊張した検索でしたが、十分刺激的でした。

  属性が異なるために分野ごとにデータベースが作られ、そのデータベースごとにソフトウェアが開発され、したがってデータベースごとに検索コマンドが異なるという状況でした。データベースを直接統合するのでなく、よく利用する検索コマンドを統一し簡素化したのがDIALOGでした。

  オンライン検索は専用回線を使っていましたが、1997年頃からインターネットを利用しています。Web検索は無料のため、Webコンテンツと類似の有料オンライン検索は撤退しました。Web検索の急成長でオンライン検索の影は薄くなっていますが、オンライン検索がなければ医学、生物、科学技術の発展はなく、今後も必要不可欠なものです。

3.データベースの特徴

  Web検索とオンライン検索であつかうデータベースの特徴を表2にまとめました。

  表2。Web検索とオンライン検索のデータベースの特徴

検索分野属性対象維持管理収集件数処理方法収集コスト
Web検索全分野全文更新・削除・追加数十億件ソフト0円/件
オンライン検索分野ごと複数書誌追加(蓄積)数千万件人手1,000円/件

  Webの場合は、属性を考えず、全分野のコンテンツを一つのデータベースに統合します。Web検索が始まった頃に、Webという一つのデータベースに複数の検索エンジンを開発するのはムダとみなす人がいましたが、これはオンライン検索のデータベース観からWebを見ていたからです。

  オンライン検索の場合は、分野ごとに属性が異なるため数百種類のデータベースが作成されます。20年以上前のDIALOGの講習会で渡されたバインダーには、125種類のデータベースの特徴や属性が記されていました。データベースの更新や追加で、毎月、水色のページを差し替えたことを思い出しました。

  全文で数十億ページ処理するWeb検索が無料で、書誌事項だけを数千万件しか処理しないオンライン検索が有料になるのを理解できない人がいます。しかし。両者の収集&作成コストが異なることを理解すれば納得します。

  Webはドメインやリンクをもとに電子化データを無料で収集できます。一方、科学技術文献の場合、雑誌を購入し、電子化する文献を選択し、それから書誌事項を作成します。そこには抄録の作成や翻訳が入ります。全項目が埋まり入力して電子化は完成しますので時間や費用がかかってしまいます。

4.データベースの選択

  最近のWeb検索は、Webやサイト以外に、ニュース、画像、辞書、ショッピングなどのデータベースを選択できるようになりました。検索エンジンごとにデータベースが異なるため、検索目的により検索サイトを選んだり、専門検索サイトを選びます。オンライン検索は発足当初からデータベースの選択が検索の第一歩でした。

  JDreamPetitがあつかう3種類のデータベースを表3に示します。JSTは2種類のデータベースからなっていますが、1981年に属性を変更したからです。これを見ても、電子化は1975年以降であり、それ以前の科学技術文献は検索できません。1976年にサービスを開始したときは1年分しかなく、1981年JOIS-IIになったときは6年分になり、感動しました。それが現在は29年分検索でき、初期の頃に比べて夢のような世界です。

  表3。JDreamPetitの3種類のデータベース

データベース名内容年代更新件数
JSTPlus科学技術1981~4回/月1,400万
JST7580科学技術1975~1980更新なし220万件
JMEDPlus医学1981~2回/月290万件

  経済的な制約のため、毎年蓄積するデータは約60万件です。毎年数百万件の文献が発表されることを考えると、網羅性は十数%です。Webの場合も同じですが、検索結果が全てのデータを反映してません。しかし、数百億円かけたデータベースを安い費用で利用できることだけは確かです。

5.検索時のオプション

  Web検索においては、一つの検索窓にキーワードを入力する方法が普及しています。これはWebコンテンツが属性を考えなかったことにもよりますが、検索方法の教育は行われず、何も理解せずに検索を始めた人が多かったことにもよります。

  初心者があまりにも多いため、サービス提供側がすばらしい検索オプションを準備しても利用者は少なく、検索技術への努力はそがれました。しかし、Web検索も10年近く経ち、毎日1回以上検索する人、1日に数十回検索する人、が増加するにつれて、利用者と検索提供側が互いに刺激しあって進展していく関係が訪れています。

  一方のオンライン検索はWeb検索以前よりあったのですが、検索時にコストがかかるため、Web検索ほど普及していません。属性を反映したメニュー形式の検索オプションがきめ細かく用意されていますので、それを理解すれば検索は楽しくなります。しかし、分野独自の用語をあまり知らなくても検索可能です。

  JDreamPetitの場合、検索項目として、キーワード、シソーラス用語、整理番号、和文表題、英文表題、機関名、著者名、資料名、ISSN/ISBN/CODEN、JST資料番号、会議名/回次/開催地、日化辞ID、CASレジストリNo.、分類コード、などが選択できます。また、検索範囲の絞り込み方法として、検索範囲、発行年、言語、記事区分、発行国、巻号・ページなどが指定できます。

  この検索項目と検索範囲の絞り込み内容は属性リストとみなせ、データベースの内容と質を表しています。検索画面をみただけで検索を止める人がいますが、ほとんどの検索は2~3の方法を使うだけで十分です。

6.検索結果の表示

  Web検索の検索結果は、タイトル、紹介文、URLなどからなるリストをキーワードに関連の高い順に表示します。検索者はそれをブラウズし、めぼしいところをクリックして探しているページへたどり着き、目的を達成します。

  JDreamPetitの検索は文献の所在情報を得るところまでです。2つのステップを取ります。1)検索結果は、タイトルと出典情報(雑誌名、巻号、ページ)などからなる一覧リストを収集年月の降順に表示します。
2)タイトルなどから探したい情報をチェックして、原文収集の手がかりになる抄録を含むより詳細な情報を表示します。

  詳細情報は抄録を中心にすべてのデータを表示します。整理番号、和文表題、英文表題、著者名、資料名、JST資料番号、ISSN、CODEN、巻号ページ(発行年月日)、写図表参、資料種別、記事区分、発行国、言語、抄録、分類コード、シソーラス用語、準シソーラス用語、物質索引、などから構成されています。

  各データは厳格な規則のもとで作られていますので信頼性の高いデータです。すべてのデータが揃うまで待つと入力が遅くなるため、新たに到着した文献は書誌情報だけ入力して速報性を高め、索引や抄録は後から入力します。このような場合は、一覧リストに<未索引><未抄録>と表示されます。検索のヒット数が多いと結果を表示しないので、絞り込み検索するか、別のキーワードで再検索します。

7.原文へのアクセス

  Web検索は検索結果から直接原文を得ることができるのに対して、JDreamPetitは検索結果は所在情報だけで、原文を得るには複写(コピー)を頼むことになります。抄録表示画面から原文のコピーを申し込めます。コピーは日時とコストがかかりますので、検索時に完結してほしいものです。

  3種類のコピー料金を記します。Pはページ数です。
1)郵送(2~3日) - 9.45×P+879.9円。
2)FAX(1日) --- 30.45×P+1,550.85円。
3)電子メール(PDF)(即時) - a)50頁未満 - 4,021.5円。
                     b)50頁以上 - 73.5×P+346.5円。
なお、外部手配料や著作権料を追加される場合があります。

  コピー10頁の場合、郵送 964円、FAX 1,855円、電子メール 4,021円、となり、
コピー20頁の場合、郵送 1,068円、FAX 2,159円、電子メール 4,021円、です。
検索で満足しても、この原文収集で経済的なストレスを感じるのではと思います。

8.オンライン検索の料金構成

  一般的なオンライン検索の料金構成を記します。
1)ログインからログオフまでの従量時間に課金 - オンライン検索が始まった頃には、この課金は一般的でした。例えば、1分間100円とか高いのになると300円とかしていました。通信料金を含みますが、現在、課金するところは少なくなっています。
2)検索結果のタイトルを表示する件数に課金 - データベースにより単価はまちまちで1件あたり10円~50円としても、表示数が多いとコストは高くなります。これも単価ゼロに向かっています。
3)抄録などの詳細表示に課金 - ここが一番高く、1件当たり50円~300円です。これも安くなってきています。

  この料金体系も、時代とともに変遷しています。データベースの性格から、従量時間の単価を高くして情報表示を安くしたり、その反対に従量時間を無料にして情報表示でカバーするなどです。無料のWeb検索の出現で有料のオンライン検索は大きな影響を受けており、通信費は無料、検索料金も安くなる方向にあります。

  所在情報を1回検索すると、3,000円~5,000円かかっていました。検索のプロのサーチャーが5分で検索できるのを研究者が30分かけても探せないとなると、経費がいくらあっても足りません。今でも医薬系企業や電気系企業の研究開発部門や知的財産部門にはサーチャーが配属されています。これは検索コストが高いのと検索オプションが複雑で高度な検索技術が必要だからです。

9.テーマからの検索

  Webのディレクトリのように、JDreamPetitには専門家が厳密に分類したタイトルリストを表示できます。自分の探すテーマがあれば、検索しなくてすみますから便利です。カテゴリは10種類、テーマは113種類あります。カテゴリとテーマを付録にリストしました。テーマが見つかればラッキーです。なお、9月末までの周知期間はタイトルをリストしますが、詳細情報は見られないようです。

10.利用のすすめ

  JDreamPetitを利用する手順を以下に示します。
1)JDreamPetitのトップページにアクセスする。
2)トップページのログインをクリックする。
3)JDreamPetitの無料公開サービス利用規約を読み、同意するをクリックする。
4)3種類のデータベースの選択で、例えば、JSTPlusをクリックする。
5)キーワード、著者名、資料名、機関名などを選択し、検索窓にキーワードを入力し検索ボタンを押す。
6)検索結果の一覧リストから、抄録などの詳細情報を得たい文献にチェックを入れ、下部にあるチェックした記事の詳細を表示をクリックする。
7)抄録などを読んで、原文のコピーがほしい場合はコピーを注文しますをクリックします。
8)必ずログオフをクリックして検索を終了します。

  9月末まではコピー注文以外は無料です。10月からの有料料金の支払いはクレジットのみです。抄録表示は一度に5件表示し、1回のログインで15件まで表示できます。1回の検索は200円(税込み)、検索回数や抄録表示に制限のない検索し放題の月極め料金は3,000円(税込み)です。なお、テーマを一覧する場合は、上記6)の一覧リストから始まり、詳細情報を表示するときに料金が発生します。

  1975年以降の2,000万件以上の医学・科学技術文献の検索が個人ユーザーに開放されました。これは有意義なことです。今までアクセスしたくてもできなかった人に知的な場が提供され、科学技術の層が広がります。今までの30年以上の努力がきっと報われるものと確信しています。情報の質はWebと少し異なります。何か宝物でも発見してください。

  URL: ジェイドリームプチのトップページ
URL: 検索デスクのJDreamPetit紹介ページ

付録.JDreamPetitのカテゴリとテーマ

カテゴリテーマ
医療と生活先端医療、再生医療、ゲノム創薬、児童虐待、自閉症児、メンタルヘルス、EBM、クリニカルパス・クリティカルパス、医療事故と医療過誤、院内感染、QOL、終末医療、ターミナルケア、ホスピス、ペインコントロール、ペインクリニック、ADHD、注意欠陥性障害、転倒・転落、生活習慣病、アルツハイマー病、骨粗鬆症、睡眠時無呼吸症候群、アトピー性疾患、ピロリ菌、SARS、C型肝炎、インフルエンザ、鳥インフルエンザ、ウシ海綿状脳症、狂牛病、代替療法、電子カルテ、救急医療、花粉症、サルモネラ菌、イヌ、ネコの病気
食と暮らし病原性大腸菌O-157、食の安全、遺伝子組み換え食品、健康食品、機能性食品、特定保健用食品、ダイエットとサプリメント、大豆とイソフラボン、茶
ライフサイエンスプロバイオティクスと乳酸菌、メタボローム、メタボロミクス、トランスクリプトーム・トランスクリプトミクス、グライコーム、グライコミクス、分子認識
情報通信アドホックネットワーク、ICタグとICカード、UWB(超広帯域)、ネットを利用した、映像・音楽配信、個人情報保護と情報の安全、グリッドコンピューティング、データマイニング、セマンティックWeb、新しい電話サービス(次世代・携帯・IP電話)、デジタル放送、量子テレポーテーション、量子もつれ、量子コンピューター、特許、著作権
環境環境ホルモン(内分泌攪乱物質)、水資源と水循環、ゼロエミッション、地球温暖化、ER流体・MR流体、ハザードマップ、持続可能性(環境調和、環境保全)、リサイクル・資源再生
ナノテクノロジー・材料フォトニック結晶、マイクロチップ、ナノバブルおよびマイクロバブルの発生と応用、耐熱・高温材料、TiO2光触媒、複合材料の特性、チタン酸バリウム(BaTiO3)、鉛フリー、MEMS(マイクロマシン)、電子ペーパー、スピントロニクス、EUVリソグラフィ、テラヘルツ波、有機EL、自己組織化膜、キラル触媒、遷移金属触媒、イオン性液体(常温溶融塩)、超臨界二酸化炭素、メソ多孔体、光センサーと光センシング、デンドリマ、酸化セリウム(セリア)、バイオミメティクス、バイオインスパイアード、ロタキサン
エネルギーバイオマス、エネルギーシステム、水素エネルギー、太陽光発電、風力発電、色素増感太陽電池(光化学電池)
製造技術建設廃棄物の再資源化・縮減、単結晶の製造、リソグラフィ技術、汚泥減量化技術、射出成形、グリーンケミストリー
社会基盤ヒートアイランド対策、構造物の免制震、コンクリートの耐久性、GIS(地理情報システム)による都市・地域情報の電子化、産学官連携、地震災害と地震予知
フロンティア微小重力、衛星測位システム(GPS)とその利用、地球観測衛星