(Translated by https://www.hiragana.jp/)
Sitemaps - Wikipedia コンテンツにスキップ

Sitemaps

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

これはこのページの過去かこはんです。Chqaz (会話かいわ | 投稿とうこう記録きろく) による 2023ねん11月28にち (火) 01:47個人こじん設定せってい設定せっていならUTC時点じてんはん (曖昧あいまい回避かいひページヤフーへのリンクを解消かいしょう、リンクさきYahoo!変更へんこう(DisamAssist使用しよう))であり、現在げんざいはんとはおおきくことなる場合ばあいがあります。

Sitemaps(サイトマップ)標準ひょうじゅんは、ウェブマスターサーチエンジンに、サイトないクロールすべきURLおしえるための方式ほうしき規定きていするものである。サイトマップは、当該とうがいサイトにおけるURLすべてをリストした、XMLファイルとして提供ていきょうし、ウェブサイト運営うんえいしゃかくURLに付加ふかてき情報じょうほうとして、最終さいしゅう更新こうしん日時にちじ更新こうしん頻度ひんどのURLとの相対そうたいてき重要じゅうようくわえたりできる。Sitemapsに対応たいおうしたサーチエンジンでは、この情報じょうほう使つかって、サイトのクロールをより効率こうりつてきおこなえるようになる。サイトマップはサーチエンジンへのURL追加ついか規約きやくであり、URL排除はいじょ規約きやくであるrobots.txt補完ほかんするものである。

サイトマップがウェブサイトにおいてとく役立やくだてん以下いかてんである:

  • ブラウザにたいするインタフェースをつうじてたどりけないようなサイトない箇所かしょしめすことができる。
  • ウェブサイトが、AjaxSilverlightFlashといったリッチなコンテンツを使つかっているような場合ばあい、サーチエンジンでは通常つうじょう処理しょりできないため、この部分ぶぶんのコンテンツ内容ないよう誘導ゆうどうできる。

ウェブマスターは、サイトないぜんURLをふくむようなサイトマップを作成さくせいし、それをサーチエンジンに登録とうろくする。現在げんざい、Google, Bing, Yahoo, Askといったサーチエンジンがサイトマップ標準ひょうじゅん対応たいおうしているため、サイトマップに対応たいおうすれば、事実じじつじょう主要しゅようなサーチエンジンぐん更新こうしんページ情報じょうほうつたえることができる。

サイトマップは通常つうじょうのクロールによるページURL発見はっけんのメカニズムを補完ほかんするだけで、完全かんぜんえるものではない。また、この標準ひょうじゅん対応たいおうしたからといって、サーチエンジンにそのページが登録とうろくされることを保証ほしょうしておらず、また、検索けんさく結果けっかにおけるランキングでのあつかいにも影響えいきょうあたえるものでもない。

歴史れきし

2005ねん6がつGoogleサーチエンジンが、ウェブ開発かいはつしゃがサイトないのリンクリストを発行はっこうできるツールとして、Sitemaps 0.84を最初さいしょ導入どうにゅうしたSitemaps 0.84。2006ねん11月には、グーグル、MSNYahooの3しゃがサイトマッププロトコルの共通きょうつう対応たいおう発表はっぴょうした[1]。スキーマバージョンは「Sitemaps 0.90」と変更へんこうされたが、内容ないようめんでの変更へんこうはされなかった。

2007ねん4がつ、Ask.comとIBMもサイトマップ対応たいおう発表はっぴょうした[2]。くわえて、Google, Yahoo, MSの3しゃがrobots.txtからのサイトマップファイルの自動じどう検出けんしゅつのための方式ほうしき発表はっぴょうした。2007ねん5がつ、アリゾナしゅう、カリフォルニアしゅう、ユタしゅう、バージニアしゅうしゅう政府せいふ各州かくしゅう政府せいふサイトでサイトマップ利用りようおこなうと発表はっぴょうした。

サイトマッププロトコルは「Crawler-friendly Web Servers」論文ろんぶん[1]におけるアイデアにもとづいている[2]

ファイル形式けいしき

サイトマッププロトコル形式けいしきはXML文書ぶんしょにより提供ていきょうされる。ファイルの文字もじコードはUTF-8符号ふごうしなければならない。サイトマップはまた単純たんじゅんなURLをリストしたテキストファイルとしても構成こうせいされる場合ばあいがある。また、これらのファイルは.gz形式けいしき圧縮あっしゅくされたものとして提供ていきょうされる場合ばあいがある。

以下いかに、単一たんいつURLとオプション要素ようそふくむサイトマップのれいしめす:

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
	xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
			    http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
	<url>
		<loc>http://example.com/</loc>
		<lastmod>2006-11-18</lastmod>
		<changefreq>daily</changefreq>
		<priority>0.8</priority>
	</url>
</urlset>

要素ようそ定義ていぎ

サイトマッププロトコルにおいてつかわれるXML要素ようそ定義ていぎ以下いかしめ[3]:

要素ようそめい 必須ひっす要素ようそか? 説明せつめい
<urlset> 必須ひっす サイトマップ文書ぶんしょ全体ぜんたいしめ要素ようそ。'<?xml version>'につづくXML文書ぶんしょはこの要素ようそないかれる必要ひつようがある。
<url> 必須ひっす かくページエントリを表現ひょうげんする要素ようそのこりの要素ようそはこの要素ようそとなる。
<loc> 必須ひっす ページの絶対ぜったいURLをしめす。URLにはプロトコルめい(http, ftpなど)をふくむスキーマのこりのパスめいなどをふくむ。URLのながさは2048文字もじ以内いないでなければならない。
<lastmod> オプション ISO 8601によるファイルの最終さいしゅう更新こうしん。YYYY-MM-DD形式けいしきのような日付ひづけ形式けいしきまたは時刻じこくきの日時にちじ表記ひょうきとなる。
<changefreq> オプション ページの更新こうしん頻度ひんどしめす:
  • always (つね更新こうしん
  • hourly (一時いちじあいだ単位たんい更新こうしん
  • daily (いちにちいちかい更新こうしん
  • weekly (しゅういちかい更新こうしん
  • monthly (つきいちかい更新こうしん
  • yearly (としいちかい更新こうしん
  • never (更新こうしんされない)

'Always'(つねに)の場合ばあい、アクセスのたびに情報じょうほう更新こうしんされることをしめす。 'Never'(更新こうしんされない)場合ばあい、アーカイブとうのURLで、ファイルが変化へんかしないことをしめす。

クローラーがわでの補助ほじょてき指針ししん使つかわれだけで、てい頻度ひんど更新こうしんのコンテンツはインデックスしないといったことを決定けっていするわけではないことに注意ちゅうい

<priority> オプション このURLのサイトないでの相対そうたいてき重要じゅうようしめす。ウェブマスターがわからクローラーにたいして、どのページが重要じゅうようとみなしているかをつたえるためのもの。

0.0から1.0の範囲はんいをとり、1.0がさい重要じゅうようであることをしめす。デフォルトは 0.5 となる。

サイトないのすべてのページにたか重要じゅうようてたとしても、検索けんさく結果けっかには影響えいきょうあたえることはできず、サイトないほかのページにくらべての重要じゅうようをクローラにつたえるだけのものである。

必須ひっす要素ようそ以外いがいのものにたいする対応たいおうじょうきょうはまちまちで、サーチエンジンごとにことなる[3]

サイトマップ・インデックス

サイトマップXMLプロトコルを拡張かくちょうして、「サイトマップ・インデックス」ファイルをつうじて複数ふくすうのサイトマップファイルを提供ていきょうする方法ほうほうもある。サイトマップファイルの最大さいだいサイズは10MBまたは5まんURLとされており、これよりも巨大きょだいなサイトに対応たいおうするため、サイトマップ・インデックスが必要ひつようとなった。サイトマップはサイトマップ・インデックスと同一どういつのディレクトリにかれる必要ひつようがある。サイトマップインデックスは、複数ふくすうのサブドメインからなるようなウェブサイトぐんたいしてもちいることができ、かくサブドメインのサイトマップをサイトマップインデックスにまとめ、robots.txtから参照さんしょうしておくというような使つかかたができる。

その形式けいしき

テキストファイル

サイトマッププロトコルでは、たんなるURLリストをテキストファイルにつらねたものをサイトマップとしてあつかうこともできる。XMLによるサイトマップファイルの仕様しようがテキストファイルにも適用てきようされ、UTF-8文字もじコードや10MBまたは50,000 URLをえられないといった制限せいげんはそのままであるが、gzip形式けいしきでの圧縮あっしゅく可能かのうとなる[3]

フィード配信はいしん

フィード配信はいしん追加ついかURLをクローラーにつたえるひとつの方法ほうほうであり、フィード配信はいしんにすでに対応たいおうしているサイトにはあつかいやすい方法ほうほうでもある。この場合ばあい欠点けってんは、フィード配信はいしんではクローラーには最近さいきん作成さくせいしたURLしかつたえられず、のこりのURLは通常つうじょうのクローリング方法ほうほうたよ必要ひつようがある [3]

サーチエンジンへの登録とうろく

サイトマップをサーチエンジンに直接ちょくせつPing経由けいゆ更新こうしん情報じょうほう通知つうちする方法ほうほうもあるが、この場合ばあい、サーチエンジンがわからはステータス情報じょうほうとエラー情報じょうほうかえってくる。この直接ちょくせつ登録とうろく方式ほうしきのやりかたはサーチエンジンごとにことなる。サイトマップの所在しょざい以下いかのようにrobots.txtファイルちゅう指定していされる:

Sitemap: <sitemap_location>

<sitemap_location>はサイトマップを取得しゅとくできるURLをす(たとえば、http://www.example.org/sitemap.xmlなど)。この指定していは、ユーザーエージェントごとの設定せっていとは独立どくりつあつかわれ、ファイルないのどこにかれてもかまわない。もしもウェブサイトが複数ふくすうのサイトマップを場合ばあいには、URL指定していではそれらをまとめたサイトマップインデックスファイルひとつが指定していされることとなる。

以下いかひょうに、いくつかの主要しゅようサーチエンジンにおけるサイトマップ登録とうろくURLをしめす:


サーチエンジン 登録とうろくURL ヘルプページ
Google https://www.google.com/webmasters/tools/ping?sitemap= Submitting a Sitemap
Yahoo! http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=SitemapWriter&url= Does Yahoo! support Sitemaps?
Ask.com http://submissions.ask.com/ping?sitemap= Q: Does Ask.com support sitemaps?
Bing (Live Search) http://www.bing.com/webmaster/ping.aspx?siteMap= Bing Webmaster Tools
Yandex  ? Sitemaps files

サイトマップ登録とうろくページをつうじてサイトマップをおく場合ばあい、サイトマップのURLはパーセントエンコーディングみでなければならず、:%3A に、/%2F などにそれぞれ変換へんかんする必要ひつようがある。

サイトマップの制限せいげん

サイトマップファイルには、1ファイルあたり50,000 URLかつ10MBまでという制限せいげんがある。サイトマップは gzip 圧縮あっしゅくにより、帯域たいいき消費しょうひらすことができる。サイトマップインデックスを入口いりくちとして提供ていきょうすることにより、複数ふくすうのサイトマップファイルにも対応たいおうさせることができる。サイトマップインデックスファイルもまた50,000サイトマップURLかつ10MBをえてならないという制限せいげんがあり、圧縮あっしゅくすることでファイルサイズをらすことも可能かのうである。サイトマップインデックスファイルはさらに多重たじゅうでき、複数ふくすうのサイトマップインデックスファイルをつこともできる[3]

サイトマップはXMLファイルによるため、URLをふくむデータちゅう以下いか文字もじはエスケープする必要ひつようがある: アンパサンド(&)、シングルクオート(')、ダブルクオート(")、不等号ふとうごう(<, >)。

関連かんれん項目こうもく

参照さんしょう文献ぶんけん

  1. ^ O. Brandman, J. Cho, Hector Garcia-Molina, and Narayanan Shivakumar (2000). "Crawler-friendly web servers". Proceedings of ACM SIGMETRICS Performance Evaluation Review, Volume 28, Issue 2. doi:10.1145/362883.362894
  2. ^ M.L. Nelson, J.A. Smith, del Campo, H. Van de Sompel, X. Liu (2006). "Efficient, Automated Web Resource Harvesting" (PDF). WIDM'06.
  3. ^ a b c d e Official protocol for XML Sitemaps

外部がいぶリンク