Google検索
Google検索は、授業で習うような「キーワードのAND検索・OR検索・NOT検索」と、より賢い「意図をくむ検索」の、ほぼ中間に位置する検索サービスです。例えば「出口」を検索すればトップに Yahoo! JAPAN が出るのはどういう意図かといったことがよく話題になります。これからはさらにAIを使って意図をくむ方向に寄せていくものと思われます。
また、検索結果の上の方には、検索語に関連する広告が、あたかも検索結果のように出てくることがあります。これはGoogleが広告を主な収入源とする会社であることから、しかたがないことですが、よくまぎらわしいサイトが公式サイトより上に出てくるので、注意を要します。
Google検索に使える演算子の一覧で、一番信頼のおけそうなものは、Googleの Daniel M. Russell がまとめている Advanced Search Operators というページだと思います。Daniel M. Russelは The Joy of Search: A Google Insider's Guide to Going Beyond the Basics という本も書いています。これ以外に Google Search Operators: The Complete List というページなどがあります。
Russelのリストには OR
という演算子はあるけれども AND
はありません。スペースで区切ればAND検索になるので、AND
は不要だからです。例えば foo AND bar
と書かなくても foo bar
で foo と bar がどちらも含まれるページを探します。特に本文に foo と bar が含まれるページを探したければ allintext: foo bar
という書き方もあるようです(Russell自身は allin〜:
はほぼ使わないとのことですが)。なお、OR
のつもりで or
と書いてもうまくいきません。
NOT(否定)の演算子は -
です。foo -bar
と書けば foo は含まれるが bar は含まれないページを探します。
演算子の優先順位は括弧で変えられます。例えば foo (bar OR baz)
のようにできます。
"foo bar"
のようにダブルクオートで囲めば foo bar に完全一致する文字列を探します。特にスペースの入った文字列に有効ですが、一つの単語の場合にも "foo"
のようにクオートすれば、類義語で置き換えたりせず完全一致になります。また、日本語はスペースを入れないで書いても文節ごとにスペースで区切った検索になることが多いので、そうしてほしくなければクオートします。
こういった演算子をフルに活用して、隠れた情報を見つける方法は、Google Dorks と呼ばれ、OSINT(オシント、Open Source Intelligence)の技法の一つとされています。
これ以外の便利な例をいくつか挙げておきます。
site:
はドメイン名を指定します。例えば site:jp
、site:ac.jp
、site:okumuralab.org
などのように使います。今は site:
を省略しても大丈夫なようです。
filetype:
はファイルの種類(拡張子)を指定します。否定の演算子と組み合わせて -filetype:pdf
とすればPDF以外のページを探します。MP3やCSVはこれでは探せなくなりました。
before:2011-03-11
や after:2011-03-11
で日付が指定できます。
cache:
や link:
はもう使えないようです。