ページランク

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

ページランク (PageRank) は、ウェブページ重要じゅうよう決定けっていするためのアルゴリズムであり、検索けんさくエンジンGoogleにおいて、検索けんさくたいする適切てきせつ結果けっかるためにもちいられている中心ちゅうしんてき技術ぎじゅつ。Googleの創設そうせつしゃのうちラリー・ペイジセルゲイ・ブリンによって1998ねん発明はつめいされた[1][2]名称めいしょう由来ゆらいは、ウェブページの"ページ"とラリー・ペイジのせいをかけたものである。

PageRankはGoogleの商標しょうひょうであり、またPageRankの処理しょり特許とっきょ取得しゅとくされている[3]。ただし、特許とっきょはGoogleではなくスタンフォード大学だいがく帰属きぞくしており、Googleはスタンフォード大学だいがくからどう特許とっきょ権利けんり独占どくせんてきにライセンスされている。なお、どう大学だいがく特許とっきょ使用しようけん交換こうかんにGoogleから180まんかぶ譲渡ゆずりわたされているが、その株式かぶしきは2005ねんに3おく3,600まんドルで売却ばいきゃくされた[4][5]

概要がいよう[編集へんしゅう]

発想はっそう[編集へんしゅう]

PageRankの動作どうさ概念がいねん

PageRank アルゴリズムの発想はっそうは、引用いんようもとづく学術がくじゅつ論文ろんぶん評価ひょうかている。

  1. 学術がくじゅつ論文ろんぶん重要じゅうようせいはか指標しひょうとしては、引用いんようすうがよく使つかわれる。重要じゅうよう論文ろんぶんはたくさんのひとによって引用いんようされるので、引用いんようすうおおくなるとかんがえられる。同様どうように、注目ちゅうもくあたいする重要じゅうようなウェブページはたくさんのページからリンクされるとかんがえられる。
  2. さらに、引用いんようすうもちいるかんがかたくわえて、「引用いんようすうおお論文ろんぶんから引用いんようされている論文ろんぶんは、重要じゅうようたかい」とするかんがかた以前いぜんから存在そんざいした。ウェブページの場合ばあい同様どうように、重要じゅうようなページからのリンクは価値かちたかいとかんがえられる。
  3. ただし、乱発らんぱつされたリンクにはあまり価値かちがないとかんがえられる。リンクしゅうのように、とにかくたくさんリンクすることを目的もくてきとしている場合ばあいには、リンクさきのウェブページにつよ注目ちゅうもくしているとはがたい。

この発想はっそうを、すうおくすうじゅうおくページにのぼるウェブページのリンク関係かんけいにも適用てきようしたのが PageRank である(PageRank の登場とうじょうまで、このようなだい規模きぼなリンク関係かんけい適用てきようするのはむずかしかった)。

この方法ほうほう適用てきようすることにより、仲間なかまないでリンクしっているだけのサイトの重要じゅうようがりにくくなり、リンクしゅうのようなおおくのリンクをっているだけのサイトからのリンクの重要じゅうようせい相対そうたいてきらす効果こうかがある。

方法ほうほう[編集へんしゅう]

以上いじょうすこ単純たんじゅんして数学すうがくてきあらわすと、つぎのような方法ほうほうかんがえられる。

  1. かくページは、固有こゆう得点とくてんっている。
    かくリンクもまた、固有こゆう得点とくてんっている。
  2. あるページ X にたいして、
    • X の得点とくてんを P とする。
    • のページから X にたいしてられているリンクの得点とくてんをそれぞれ とする。
    • X からのページにられているリンクの得点とくてんをそれぞれ とする。
  3. このとき、つぎつものとする。

すなわち、かくページに「ながむ」リンクの得点とくてん総和そうわと、かくページから「ながす」リンクの得点とくてん総和そうわひとしくなるようにして、その総和そうわをそのページの得点とくてんかんがえるのである。 この得点とくてんたかいほど、そのページは重要じゅうようであるとかんがえられる。

全体ぜんたいにわたって矛盾むじゅんしょうじないようにうまく得点とくてん必要ひつようがあるが、これは一種いっしゅフロー問題もんだいであり、この問題もんだい解法かいほうについては様々さまざま理論りろんかんがされている。

グラフ理論りろん[編集へんしゅう]

グラフ理論りろん言葉ことば使つかうなら、つぎのようなことである。

  1. WWWじょうかくページをノードとなし、リンクをエッジとなした有向ゆうこうグラフかんがえる。
  2. この有向ゆうこうグラフの隣接りんせつ行列ぎょうれつ転置てんちしたものを A =(aij) とし、行列ぎょうれつ B = (bij) を 定義ていぎする。
  3. B の最大さいだい固有値こゆうちぞくする固有こゆうベクトルもとめる。固有こゆうベクトルのかく要素ようそが、もとめるべきかくページの得点とくてんである。

補足ほそくすると、うえ定義ていぎにおいて、B は A のかく要素ようそをそのれつれい要素ようそかずったものである。 したがって、B のかくれつは 1 になっている。

B は推移すいいかくりつ行列ぎょうれつばれ、あるページからあるページへリンクによってジャンプするかくりつあらわしているものとかんがえられる。

べつ定義ていぎしき[編集へんしゅう]

Brin & Page (1998)によれば、あるページAのページランクPR(A)は、つぎしき定義ていぎされる[6]

  • :ページAにリンクしているページのページランク。かりにページAにたいして3つのページがリンクしているとした場合ばあいからまでのかくページをあらわす。
  • :ページふくまれるほかページ(Aでもでもないページ)へのリンクの総数そうすう。(ちゅう:『ページ』に内部ないぶリンクがふくまれるのかかについてはstub)
  • d:ダンピング・ファクター。通常つうじょう0.85に設定せっていされるが、作為さくいてきにページランクをげようとするものたいしては、よりちいさい設定せっていされる。(つね

rel="nofollow"[編集へんしゅう]

リンクに属性ぞくせい rel="nofollow"くわえることで、どうリンクをページランクの計算けいさん対象たいしょうから除外じょがいすることが可能かのうとなっている。これは、ブログにおけるコメントスパムへの対策たいさくなどをおも目的もくてきとして、2005ねんのはじめにGoogleにより提案ていあんされたものである。たとえばページAからページBにリンクする場合ばあい、ページBのURLをかりにhttp://ja.wikipedia.org/とするならば、<a href="http://ja.wikipedia.org/" rel="nofollow"></a>とすることで、ページBがページAからる(便宜べんぎてき表現ひょうげん)ページランクはとなる。

なお、WikipediaふくMediaWiki外部がいぶリンクにはすべてこの属性ぞくせいたせている。これは、Wikipedia(MediaWiki)が宣伝せんでん道具どうぐ利用りようされるのをふせぐためである。

Buzzurl、del.icio.usといったソーシャルブックマークにおいても、ブックマークスパム対策たいさくとして、この属性ぞくせい使つかわれる傾向けいこうにある。

脚注きゃくちゅう[編集へんしゅう]

  1. ^ Langville & Meyer 2011, Glossary - PageRank.
  2. ^ Brin & Page 1998.
  3. ^ アメリカ合衆国あめりかがっしゅうこく特許とっきょだい 6,285,999ごう
  4. ^ Lisa M. Krieger (2005ねん12月1にち). “Stanford Earns $336 Million Off Google Stock”. San Jose Mercury News, cited by redOrbit. 2009ねん2がつ25にち閲覧えつらん
  5. ^ Richard Brandt. “Starting Up. How Google got its groove”. Stanford magazine. 2009ねん2がつ25にち閲覧えつらん
  6. ^ Brin & Page 1998, 2.2.1 Description of PageRank Calculation.

参考さんこう文献ぶんけん[編集へんしゅう]

  • Brin, S.; Page, L. (1998), The Anatomy of a Large-Scale Hypertextual Web Search Engine, http://ilpubs.stanford.edu:8090/361/ 
  • Langville, Amy N.; Meyer, Carl D. (2011) [2006]. Google's PageRank and Beyond. Princeton University Press. ISBN 140083032X. https://books.google.com/books?id=KsHTl_2Pfl8C 
    • 邦訳ほうやく Langville, Amy N.、Meyer, Carl D. ちょ岩野いわの和生かずお, 黒川くろかわ利明としあき, 黒川くろかわひろし やく『Google PageRankの数理すうり共立きょうりつ出版しゅっぱん、2009ねんISBN 9784320122390 
  • Page, L.; Brin, S.; Motwani, Rajeev; Winograd, Terry (1999), The PageRank Citation Ranking: Bringing Order to the Web, http://ilpubs.stanford.edu:8090/422/ 

関連かんれん項目こうもく[編集へんしゅう]

外部がいぶリンク[編集へんしゅう]