GoogleでGoogleの論文を検索してみる。その上でGoogle Scholar考察。
Google共同創設者Larry Pageが、ページランクのアルゴリズムを概説した最初の論文が受理されなかったという事実確認。
一九九八年初めにペイジは、ページランクのアルゴリズムを概説した最初の論文をコンピュータ機器協会検索同好会に提出したが、論文は受理されなかった。同じ分野の専門家の意見としては、「プレゼンテーションが全体的に混乱している…。ウェブの分析よりは情報検索の問題に焦点を当てる必要あり」とあった。ペイジは反論せず、最終的に論文はスタンフォードデジタルライブラリーの企画の一環として出版された。
それからしばらくしてペイジとブリンは、グーグルそのものについて論文を発表した。「大規模なハイパーテキスト的ウェブ検索エンジンの分析」と題されたそれは、検索関係の文献として、世界中で一番引用されている。
ザ・サーチ グーグルが世界を変えた(一二一〜一二二頁)
その論文を探すのは、これがいいかな?
Googleでは様々な研究がされていますが、その中で発表された論文を見ることができます。
ということへGoogle Researchへ。
検索ボックスに「Larry Page」を入力してSearchボタンをクリック。
一番上の検索結果ページをクリックすると、見つかりました(当然か)。
前者が受理されなかったもの。後者が一番引用されてるもの。
http://research.google.com/people/page/:image=http://research.google.com/people/page/page.jpg
The Anatomy of a Large-Scale Hypertextual Web Search Engine
Sergey Brin and Lawrence Page
The PageRank Citation Ranking: Bringing Order to the Web
Lawrence Page, Sergey Brin, Rajeev Motwani, and Terry Winograd
Google Scholarではどう表示されるんだろうかと試してみる。
http://scholar.google.com/:image=http://scholar.google.com/intl/en/images/scholar_logo.gif
例えば最初の論文「The Anatomy of a Large-Scale Hypertextual Web Search Engine」。
記事のタイトルで検索するにはどうすればよいですか。
記事のタイトルを引用符で囲みます。 たとえば、「"A History of the China Sea"」のように入力します。 指定したタイトルの記事と、その記事について言及している他の記事が自動的に検索されます。
…というガイドに従い検索。
しかし…:-(
Google Researchの検索結果からは論文のPDFファイルがダウンロード可能なスタンフォード大学のページへすぐ導いてくれたが、Google ScholarはScienceDirectでお金を払ってPDFをダウンロードしてね、と云う。
因みに普通にGoogleで検索したら、やっぱりスタンフォード大学をご案内。今度はPDFヴューワーさえ起動しなくてもいいぞ。さすが本家☆
http://www.google.com/:image=http://www.google.com/intl/en_ALL/images/logo.gif
The Anatomy of a Large-Scale Hypertextual Web Search Engine
The definitive paper by Sergey Brin and Lawrence Page describing PageRank, the algorithm that was later incorporated into the Google search engine.
infolab.stanford.edu/~backrub/google.html - 73k - Cached - Similar pages - Note this
ところでやっぱり僕にはGoogle Scholarがとっても気になる存在なので「Google Scholar について」をよーく見てみる。
Google Scholar について
膨大な学術資料を簡単に検索できます。 分野や発行元を問わず、学術出版社、専門学会、プレプリント管理機関、大学、およびその他の学術団体の学術専門誌、論文、書籍、要約、記事を検索できます。
そっか…てっきりGoogle Scholarってのは学術論文(プレプリント含む)ばっかりだと思っていたけど、会議資料や雑誌記事など多種多様なのね、ってことに今更気づく。。:-(
で、出版社ではないが「Google Scholar 出版社向けサポート」を読んでみて独り言を云ってみる。
論文の掲載順位はどのように決まりますか。
Google Scholar では、 Google ウェブ検索と同様、最も関連性の高い情報がページの上部に表示されます。 Google のランキング技術では、それぞれの記事の全文、著者、記事が掲載された出版物、他の学術資料に引用された回数が考慮されます。
まぁそうだよね。想定内。
でも矛盾も感じたりして…。:-<
だって、引用された回数が考慮されるならば、新規性や意外性あるユニークな論文は上位に表示されないってことでしょ?
ってことはそういう世の中をガラリと変えてしまう可能性ある超大作候補がスルーされる可能性大。。
それって冒頭のLarry Pageの処女作が受け入れられなかったことを学習していないではないか!と小声で訴えてみる。
勿論、そんなことは承知できちんとアルゴリズム組んでるんだろう。
ならば、そんな新規性を持ち合わせる若者(とは限らないけど)に可能性を抱かせる台詞が欲しい…と欲張ったりして。。
大学の学位論文や技術レポートをインデックスに登録できますか。
はい、できます。ただし、Google のロボットがオンラインでクロールできるようにする必要があります。
ok ;-)
myopenarchive.org頑張ろう☆
しかし、Googleの中で唯一アクセスするのに敷居の高いのがこのGoogle Scholarなんじゃないかなぁってつくづく思ふ。
顕著な理由は電子ジャーナルの認証の壁。
IPアドレス設定しなきゃならなかったり、リアルな図書館でしか閲覧出来なかったり、既存の権威をしっかり尊重してユーザを困惑させる。
でも、さすがGoogleと思わせる。
書籍のスキャンやニュース集積のように業界を敵に廻すことはせず、論文出版社とは友好的に行こう、というスタンスが垣間見られる。
図書館に対してもそんな感じかな。
プログラムの仕組み
このプログラムに参加している学校の構内ネットワークからアクセスするユーザーには、Google Scholar の検索結果に学校の図書館の資料へのリンクが追加で表示されます。
Googleには珍しく「限定」だもんね。
でもやはり論文出版社や図書館を優遇?するのはGoogleならではって感じで、こここそ意を決してMicrosoftとかが障壁を打開してくれると面白い展開になるし、Googleとて闘いに挑んで、結果として(論文出版社は痛手を被るけど)ユーザにはメリット生じるからね。こんな展開をちょっとは期待もしてみたい。;-)