Google検索

Google検索は、授業で習うような「キーワードのAND検索・OR検索・NOT検索」と、より賢い「意図をくむ検索」の、ほぼ中間に位置する検索サービスです。例えば「出口」を検索すればトップに Yahoo! JAPAN が出るのはどういう意図かといったことがよく話題になります。これからはさらにAIを使って意図をくむ方向に寄せていくものと思われます。

また、検索結果の上の方には、検索語に関連する広告が、あたかも検索結果のように出てくることがあります。これはGoogleが広告を主な収入源とする会社であることから、しかたがないことですが、よくまぎらわしいサイトが公式サイトより上に出てくるので、注意を要します。

Google検索に使える演算子の一覧で、一番信頼のおけそうなものは、Googleの Daniel M. Russell がまとめている Advanced Search Operators というページだと思います。Daniel M. Russelは The Joy of Search: A Google Insider's Guide to Going Beyond the Basics という本も書いています。これ以外に Google Search Operators: The Complete List というページなどがあります。

Russelのリストには OR という演算子はあるけれども AND はありません。スペースで区切ればAND検索になるので、AND は不要だからです。例えば foo AND bar と書かなくても foo bar で foo と bar がどちらも含まれるページを探します。特に本文に foo と bar が含まれるページを探したければ allintext: foo bar という書き方もあるようです(Russell自身は allin〜: はほぼ使わないとのことですが)。なお、OR のつもりで or と書いてもうまくいきません。

NOT(否定)の演算子は - です。foo -bar と書けば foo は含まれるが bar は含まれないページを探します。

演算子の優先順位は括弧で変えられます。例えば foo (bar OR baz) のようにできます。

"foo bar" のようにダブルクオートで囲めば foo bar に完全一致する文字列を探します。特にスペースの入った文字列に有効ですが、一つの単語の場合にも "foo" のようにクオートすれば、類義語で置き換えたりせず完全一致になります。また、日本語はスペースを入れないで書いても文節ごとにスペースで区切った検索になることが多いので、そうしてほしくなければクオートします。

こういった演算子をフルに活用して、隠れた情報を見つける方法は、Google Dorks と呼ばれ、OSINT(オシント、Open Source Intelligence)の技法の一つとされています。

これ以外の便利な例をいくつか挙げておきます。

site: はドメイン名を指定します。例えば site:jpsite:ac.jpsite:okumuralab.org などのように使います。今は site: を省略しても大丈夫なようです。

filetype: はファイルの種類(拡張子)を指定します。否定の演算子と組み合わせて -filetype:pdf とすればPDF以外のページを探します。MP3やCSVはこれでは探せなくなりました。

before:2011-03-11after:2011-03-11 で日付が指定できます。

cache:link: はもう使えないようです。