検索エンジン

インターネット・コミュニティの歩き方

結城浩

今回は、検索エンジンを利用するお話です。

コアラくんがコンピュータの前で悩んでいます。

コアラ: ねえ結城さん。Windows XPで環境変数の設定をしたいんだけれど、どうすればいいんですか?

結城: 環境変数の設定? ええと、確かコントロールパネルでうにゃうにゃすれば…。

コアラ: うにゃうにゃ?

結城: スタート→設定→コントロールパネルでうにゃうにゃ…。

コアラ: うにゃうにゃ? すみませんけど、よくわかんないですう(ユーカリの葉っぱをさっと出してかじりはじめる)。

結城: ほらまたかじかじしてる。うーん、そうだ、詳しく知りたかったらね、検索エンジンを使って調べるとよいね。

コアラ: (かじるのをやめる)検索エンジン?

結城: そう、検索エンジン。ブラウザで グーグルにつないで「Windows XPで環境変数を設定するには」って入力してごらんよ。

コアラ: するとグーグルが環境変数の設定方法を教えてくれるの?

結城: いや、グーグルが教えてくれるというよりも、グーグルがそのキーワードに関連したインターネットのWebページを指し示してくれるんだよ。

コアラ: ボクの知りたいページをそんなにうまく教えてくれるのかなあ。そもそも、そんな都合のいいページがインターネットにあるのかなあ…(検索してみる)…あっ、たくさんある…すごいですね。

結城: ね。上から順にリンクをたどって、わかりやすそうなページを読むといいよ。

コアラ: (読んでいる)あっ、このページなんて、画面の様子までわかりやすく書いている。

結城: そうなんですよ。「こんなこと書かれたページなんてないよなあ」と思うような内容でも、検索エンジンを使えばけっこう見つかるものなんです。さっきは「Windows XPで環境変数を設定するには」って文章風に入力しましたよね。うまく見つからなかったら、「Windows XP 環境変数」のように知りたい単語を並べるだけでもいいですよ。

コアラ: (まだ、読んでいる)あっ、このページなんて、個人の方がWindowsの使い方を解説しているみたいです。

結城: そうそう。企業のページもあるけれど、親切な人たちがいろんな情報をインターネットで公開してくれているんですね。こういう情報はありがたく利用したいものですね。

☆     ☆     ☆

ペンギンちゃんがやってきます。

ペンギン: 結城さん、コアラくん。こんにちはです。今日は検索エンジンのお話なんですか。

コアラ: そう! ペンギンちゃん。検索エンジンで、自分の知りたい情報が書かれているページがすぐに見つかるよ。すごいよ。

ペンギン: 検索エンジンでこれだけ情報がすぐに手に入るなら、学校のレポートなんか、あちこちのページからお借りすればすぐに書けそうですわね。

結城: おっと、でもね、著作権というものを忘れちゃいけない。インターネットで公開されている情報の利用には注意が必要だよ。たとえば、環境変数の設定方法を調べたいなら、それを読んで自分で設定すれば終わりだからあまり問題は起きない。けれど、人の書いた文章をそのまま自分の文章として利用してはいけない。たとえば人の文章を自分のWebページで公開したり、出版物に利用したりしてはいけない。引用するときには出典を適切に明記しなければならない。詳しくは検索エンジンで「著作権」などを探してみてください。

ペンギン: 無料ですぐに見られるからといって、自分のものにしちゃいけないんですわね。

結城: そうだね。情報の利用にあたって特別なルールを設けている人もいるから、検索エンジンで見つかったページだけを見るのではなく、その近辺のページもあわせて見るといいね。

コアラ: そのほかに検索エンジンを使うときの注意点はありませんか。

結城: 見つかったページの正当性の問題があるね。見つかったページが本当に正しいかどうか判断は自分で行わなければならない。

ペンギン: わざわざウソを書いたページが見つかるかもしれないからですの?

結城: というよりも、必ずしも内容が正確とは限らないということだね。ページが古い場合もある。

ペンギン: どうやったら正しいってわかるんでしょう。だって今から調べようとしているのに、内容が正しいかどうかの判断なんてできませんわ。

結城: たとえば、そこがオフィシャルサイトならば正しい可能性が高い。たとえばWindowsについて調べたかったら、Microsoftのサイトに書かれていることは正しい可能性が高い。わかりやすいかどうかは別としてね。また、ジオシティーズなどの無料で公開できるWebページの場合にはオフィシャルサイトである可能性は低い。でも、無料のWebページが悪いわけというわけじゃない。そういうページには貴重な情報が書かれていることもある。その判断はとても難しいこともある。

☆     ☆     ☆

コアラ: ねえ結城さん。そもそも、検索エンジンってどんな仕組みで動いているんですか。

結城: 図に描いてみました。検索エンジンはロボット型ディレクトリ型に大きく分かれるけれど、この図はロボット型を書いています。

検索エンジン

ペンギン: ロボットってアトムみたいなものですの?

結城: (にっこり)違いますね。ロボットといっても普通のソフトウェア。ちょうどみんながリンクをたどってWebページを見てまわるように、ロボットと呼ばれるソフトウェアは自動的にリンクをたどってあちこちのWebページのデータを収集する。

コアラ: ロボット型というから、メカニックなものを考えちゃいました。

結城: 検索エンジンのロボットは、Webページの情報をデータベースに蓄えていく。ユーザがキーワードを入力すると、検索エンジンのサイトは、データベースの中から適切なページを見つけ出し、そのページ一覧を表示するということになるね。

ペンギン: (考え込む)でも…ネットにあるWebページってとてもたくさんありますわね。検索エンジンのデータベースってものすごく巨大なものではありませんでしょうか?

結城: その通り。グーグルで検索すると、世界中30億以上のページから検索しますね。

ペンギン: (びっくりして目をくるくるする)

結城: びっくりしちゃうよね。

ペンギン: ディレクトリ型というのはどういうものですの?。

結城: Webページを誰かが登録するタイプだね。ロボット型のほうは、ソフトウェアが勝手に情報を収集していくけれど、ディレクトリ型はURLの登録という作業を行う。手間がかかるけれど、Webページのジャンルがわかりやすかったり、その検索エンジンの「おすすめ」がわかったりするよさもある。

コアラ: さっき環境変数の設定を調べたけれど、たくさんのページからどうやって「適切なページ」を探せるんですか。

結城: それはとてもいい質問だ。検索エンジンの最重要ポイントだね。グーグルの場合にはPageRankという仕組みを使っているらしい。簡単に言えば、「有益なサイトからリンクされているサイトは有益である可能性が高い」という考え方で、各ページをランキングづけする。そしてランキング順位が高いものから順番に表示するんだ。詳しくは http://www.google.co.jp/intl/ja/why_use.htmlをみてね。

ペンギン: ということは、数多くのサイトからリンクされるということは、Webページにとって重要なことなんですね。

結城: そのほうが検索エンジンで上位にくるからね。でも、リンクの数だけが問題ではない。グーグルの場合には、ランキングが高いところからリンクされることも大事なんだ。

コアラ: 検索エンジンで自分のサイトが見つかるかどうかは、インターネットでショップを運営している人にとっては、死活問題ですよね。

結城: そうだね。検索エンジンに自分のサイトを見つけてもらう。見つけてもらうだけではなく、できるだけ上位にランキングしてもらう。その方法のことは検索エンジン最適化(Search Engine Optimization; SEO)というよ。

ペンギン: でも、お友達だけに見てほしい個人ページなどでは、検索エンジンで探してほしくない、という場合もありそうですわ。

コアラ: URLを友達にだけ知らせておけばいいんじゃない?

結城: そういう場合にはrobots.txtというファイルの設置や、ロボットに対する指示をHTMLページ中に埋め込むことで対処することになる。詳しくは「robots.txt」を検索してみよう。でも、絶対に特定の人にだけ見てほしいというなら、ページの認証という仕組みを導入するしかないね。URLを秘密にしておくだけでは駄目です。

☆     ☆     ☆

ペンギン: 検索エンジンってグーグルだけですの?

結城: いや、たくさんあるよ。 Yahoo!JAPANは有名だね。 gooインフォシークなどは定番と言えるでしょう。

コアラ: 面白い検索エンジンはありませんか

結城: たとえば フレッシュアイは新しいページを探すのに便利。それから検索エンジンとはちょっと違うけれど、タイムマシンのように時間をさかのぼってWebページを閲覧できるサイト、 Wayback Machineもあるよ。

ペンギン: 検索エンジンって面白いですわね。

結城: 最近注目されているのは、グーグルがやっている Google Web APIですね。 これはプログラムからGoogleの機能を使うものです。 それから自分のWebサイトにグーグルの検索機能をつける方法については、 http://www.google.co.jp/intl/ja/searchcode.htmlを見てください。 私のページもあります( http://www.hyuki.com/netserv/google.html)。

コアラ: 検索エンジンのこと、もっといろいろ知りたいな。

結城: そういうときはね…検索エンジンで検索エンジンを探すんですよ。検索エンジンの情報がたくさん見つかりますよ。

コアラ: あっ、なるほど!そうか!「検索エンジンで探す」という発想ってとっても大事なんですね。今回はボクがまとめるよ。

コアラくんのまとめノート

ぜひ、感想をお送りください

あなたのご意見・感想をお送りください。 あなたの一言が大きなはげみとなりますので、どんなことでもどうぞ。

あなたの名前: メール:
学年・職業など: 年齢: 男性女性
(上の情報は、いずれも未記入でかまいません)

お手数ですが、以下の問いに答えてから送信してください(迷惑書き込み防止のため)。
今年は西暦何年ですか?

何かの理由でうまく送れない場合にはメールhyuki dot mail at hyuki dot comあてにお願いします。

(このページは、 日経ソフトウェア誌への連載記事を元に再構成したものです。 Webでの公開を快諾してくださった編集部に感謝します)

豊かな人生のための四つの法則