(Translated by https://www.hiragana.jp/)
DBペディア - Wikipedia コンテンツにスキップ

DBペディア

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
DBpediaから転送てんそう
DBペディア
DBpediaのロゴ
開発元かいはつもと ライプツィヒ大学だいがくベルリン自由じゆう大学だいがく, オープンリンク・ソフトウェア
初版しょはん 2007ねん1がつ23にち
最新さいしんばん
DBpedia 3.8 / 2012ねん8がつ6にち[1]
リポジトリ ウィキデータを編集
プログラミング
言語げんご
ScalaJavaVSP
対応たいおうOS ヴィルトゥオーソ・ユニバーサル・サーバ
種別しゅべつ セマンティック・ウェブリンクト・データ
ライセンス GPL
公式こうしきサイト dbpedia.org
テンプレートを表示ひょうじ

DBペディアえい: DBpedia)は、ウィキペディアからの構造こうぞうコンテント抽出ちゅうしゅつ目的もくてきとするプロジェクトである。抽出ちゅうしゅつされた構造こうぞう情報じょうほうは、World Wide Webうえ利用りよう可能かのうとなる[2]。DBペディアを利用りようすると、ウィキペディアのリソースおよび外部がいぶ関連かんれんするデータセットへのリンクから、関係かんけいやプロパティをわせることができる[3]ティム・バーナーズ=リーは、DBペディアはリンクト・データ・プロジェクトのなか有名ゆうめいなものの1つだ、とべている[4]
ウィキペディア日本語にほんごばん記事きじ利用りようしたDBpedia Japaneseは、国立こくりつ情報じょうほうがく研究所けんきゅうじょによって2012ねん5がつ9にち公開こうかいされた[5]

背景はいけい

[編集へんしゅう]

このプロジェクトはオープン・リンク・ソフトウェアとの協力きょうりょくしたベルリン自由じゆう大学だいがくライプツィヒ大学だいがくのメンバーによって開始かいしされ[6]、2007ねん最初さいしょ公開こうかいようデータセットが公開こうかいされた。データセットはフリー・ライセンス提供ていきょうされ、さい利用りようすることができる。

ウィキペディアの記事きじおおむねフリー・テキストから構成こうせいされているが、「インフォボックス」(infobox) テーブル、カテゴリ情報じょうほう画像がぞう地理ちり座標ざひょう外部がいぶウェブページへのリンク、といった構造こうぞう情報じょうほう記事きじまれている。これらの構造こうぞう情報じょうほう抽出ちゅうしゅつされ、わせ可能かのう統一とういつデータセットのなか保存ほぞんされる。

データセット

[編集へんしゅう]

2011ねん9がつ (2011-09)現在げんざい、DBペディアのデータセットは364まんけん以上いじょう事物じぶつあつかい、うち183まんけん一貫いっかんしたオントロジー分類ぶんるいされている。そこには人物じんぶつ416,000けん地理ちり526,000けん音楽おんがくアルバム106,000けん映画えいが60,000けん、ビデオ・ゲーム17,500けん, 組織そしき団体だんたい169,000けん生物せいぶつしゅ183,000けん、そして病気びょうき.5,400けんふくまれている。DBペディア・データセットは、これら364まんけん事物じぶつ名前なまえ概要がいよう最大さいだい97言語げんご提供ていきょうするほか、2,724,000けん画像がぞうへのリンクと6,300,000けん外部がいぶウェブ・ページへのリンク、6,200,000けんべつのRDFデータセットへの外部がいぶリンク、740,000けんのウィキペディアのカテゴリ、そして2,900,000けんYAGO2のカテゴリも提供ていきょうする。このデータセットから、複数ふくすうページに分散ぶんさんする情報じょうほう抽出ちゅうしゅつすることができる。たとえば、ある著作ちょさくしゃ作品さくひんかんするページやその著作ちょさくしゃ自身じしんかんするページをまとめげることができる。

DBペディア・プロジェクトは、RDF (Resource Description Framework) を使用しようして情報じょうほう抽出ちゅうしゅつする。2011ねん9がつ (2011-09)現在げんざい、DBペディア・データセットは10おくけん以上いじょう情報じょうほう(RDFトリプル)から構成こうせいされ、うち3おく8500まんけん英語えいごばんウィキペディアから、6おく6500まんけん言語げんごばんからそれぞれ抽出ちゅうしゅつされたものである[7]

ウィキペディアから情報じょうほう抽出ちゅうしゅつするさい問題もんだいの1つは、たとえば「出身しゅっしん」と「出生しゅっしょう」のように、どういち概念がいねん複数ふくすうのテンプレートでことなるプロパティとして表現ひょうげんされる、ということである。このため、あるひと生誕せいたんした場所ばしょわせる場合ばあい、より完全かんぜん結果けっかるためには、それら両方りょうほうのプロパティを検索けんさくする必要ひつようがある。このため、これらのプロパティとオントロジーとのマッピングをおこな同義語どうぎごかずらすために、DBペディア・マッピング言語げんご (DBpedia Mapping Language) が開発かいはつされた。ウィキペディアで使用しようされているインフォボックスやプロパティは非常ひじょう多様たようであるため、だれでも参加さんかできるように開発かいはつとマッピング改善かいぜんのプロセスは公開こうかいされている[8]

DBペディアはウィキペディアのページから情報じょうほう抽出ちゅうしゅつする。利用りようしゃは、多数たすうのウィキペディアの記事きじ分散ぶんさんしている情報じょうほうたいしてわせをおこなうことができる。データへのアクセスは、SPARQLというRDFようSQLライクなわせ言語げんごおこなう。たとえば、日本にっぽん少女しょうじょ漫画まんがシリーズの東京とうきょうミュウミュウ興味きょうみがあり、そのイラストレーターによる作品さくひんつけたい場合ばあい、DBペディアはウィキペディアの東京とうきょうミュウミュウ、せいうみ、そしてスーパードール★リカちゃんこいきゅー♥といった作品さくひんかんする項目こうもくから情報じょうほう抽出ちゅうしゅつし、1つにまとめる。DBペディアは情報じょうほう単一たんいつデータベースに正規せいきするため、どの項目こうもくがどの情報じょうほうっているか正確せいかくらなくても、以下いかクエリーわせし、関連かんれん情報じょうほう一覧いちらんることができる。

 PREFIX dbprop: <http://dbpedia.org/property/>
 PREFIX db: <http://dbpedia.org/resource/>
 SELECT ?who ?work ?genre WHERE { 
  db:Tokyo_Mew_Mew dbprop:illustrator ?who .
  ?work  dbprop:author ?who .
  OPTIONAL { ?work dbprop:genre ?genre } .
 }

用途ようと

[編集へんしゅう]

DBペディアは人類じんるい知識ちしき広範こうはん領域りょういきをカバーするため、そのコンセプトにリンク可能かのう外部がいぶデータセットをむすけるハブとなる[9]。DBペディア・データセットは、ウェブに存在そんざいするほか様々さまざまオープン・データ・データセットと、RDFレベルでインターリンクされている。2011ねん1がつ (2011-01)現在げんざい、DBペディアとつぎのような外部がいぶデータセットとのあいだに650まんけん以上いじょうのインターリンクが存在そんざいしている:FreebaseOpenCycUMBELGeoNamesMusicbrainzCIAワールド・ファクト・ブックDBLPプロジェクト・グーテンベルク、DBtune JamendoユーロスタットUniprotBio2RDFアメリカ合衆国あめりかがっしゅうこく国勢調査こくせいちょうさ(US Census)のデータ[10][11]トムソン・ロイター・イニシアティブ・オープン・クラリスニューヨーク・タイムズのリンクド・オープン・データ・プロジェクト、Zemanta API、そしてDBペディア・スポットライトもまた、DBペディアへのリンクをっている[12][13][14]BBCは、DBペディアで自社じしゃコンテンツの体系たいけいおこなっている[15][16]Favikiは、DBペディアをセマンティック・タギングのために使用しようしている[17]

Amazonは、Amazon Web Servicesアプリケーションとの統合とうごう可能かのうな「パブリック・データ・セット」をDBペディアに提供ていきょうしている[18]

脚注きゃくちゅう

[編集へんしゅう]
  1. ^ DBpedia 3.8 released, including enlarged Ontology and additional localized Versions”. DBpedia Blog (August 06, 2012). 2012ねん10がつ31にち閲覧えつらん
  2. ^ Bizer, Christian; Lehmann, Jens; Kobilarov, Georgi; Auer, Soren; Becker, Christian; Cyganiak, Richard; Hellmann, Sebastian (September 2009). “DBpedia - A crystallization point for the Web of Data”. Web Semantics: Science, Services and Agents on the World Wide Web 7 (3): 154–165. ISSN 1570-8268. http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/research/publications/Bizer-etal-DBpedia-CrystallizationPoint-JWS-Preprint.pdf. 
  3. ^ Komplett verlinkt - Linked Data” (German). 3sat (2009ねん6がつ19にち). 2009ねん11がつ10日とおか閲覧えつらん
  4. ^ Sir Tim Berners-Lee Talks with Talis about the Semantic Web”. Talis (7 February 2008). 2012ねん10がつ31にち閲覧えつらん
  5. ^ DBpedia Japanese”. 2013ねん6がつ5にち閲覧えつらん
  6. ^ , http://wiki.dbpedia.org/Team+2009ねん11月23にち閲覧えつらん 
  7. ^ DBpedia dataset”. DBpedia. 2008ねん9がつ26にち閲覧えつらん
  8. ^ DBpedia Mappings”. mappings.dbpedia.org. 2010ねん4がつ3にち閲覧えつらん
  9. ^ E. Curry, A. Freitas, and S. O’Riáin, “The Role of Community-Driven Data Curation for Enterprises,” in Linking Enterprise Data, D. Wood, Ed. Boston, MA: Springer US, 2010, pp. 25-47.
  10. ^ “Statistics on links between Data sets”, SWEO Community Project: Linking Open Data on the Semantic Web (W3C), http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/LinkStatistics 2009ねん11月24にち閲覧えつらん 
  11. ^ “Statistics on Data sets”, SWEO Community Project: Linking Open Data on the Semantic Web (W3C), http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/Statistics 2009ねん11月24にち閲覧えつらん 
  12. ^ “First 5,000 Tags Released to the Linked Data Cloud”. open.blogs.nytimes.com. (2009ねん10がつ29にち). http://open.blogs.nytimes.com/2009/10/29/first-5000-tags-released-to-the-linked-data-cloud/ 2009ねん11がつ10日とおか閲覧えつらん 
  13. ^ Life in the Linked Data Cloud”. www.opencalais.com. 2009ねん11がつ10日とおか閲覧えつらん。 “Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format.”
  14. ^ Zemanta talks Linked Data with SDK and commercial API”. blogs.zdnet.com. 2009ねん11がつ10日とおか閲覧えつらん。 “Zemanta fully supports the Linking Open Data initiative. It is the first API that returns disambiguated entities linked to dbPedia, Freebase, MusicBrainz, and Semantic Crunchbase.”
  15. ^ European Semantic Web Conference 2009 - Georgi Kobilarov, Tom Scott, Yves Raimond, Silver Oliver, Chris Sizemore, Michael Smethurst, Christian Bizer and Robert Lee. Media meets Semantic Web - How the BBC uses DBpedia and Linked Data to make Connections”. www.eswc2009.org. 2009ねん11がつ10日とおか閲覧えつらん[リンク]
  16. ^ BBC Learning - Open Lab - Reference”. bbc.co.uk. 2009ねん11がつ10日とおか閲覧えつらん。 “Dbpedia is a database version of Wikipedia. It's used in a lot of projects for a wide range of different reasons. At the BBC we are using it for tagging content.”[リンク]
  17. ^ Semantic Tagging with Faviki”. www.readwriteweb.com. 2012ねん10がつ31にち閲覧えつらん
  18. ^ Amazon Web Services Developer Community : DBpedia”. developer.amazonwebservices.com. 2009ねん11がつ10日とおか閲覧えつらん

関連かんれん項目こうもく

[編集へんしゅう]

外部がいぶリンク

[編集へんしゅう]