(Translated by https://www.hiragana.jp/)
Q&A - ウェブ魚拓

Q&A

2024.5に改訂かいていしました。運用うんようわせた変更へんこう追加ついかし、また重要じゅうよう変更へんこう打消うちけせん変更へんこうさせていただいております。

目次もくじ

ウェブ魚拓ぎょたくってなにですか?

ウェブページがされ、評価ひょうか議論ぎろん不可能ふかのうになったという経験けいけんはありませんか?

ウェブ魚拓ぎょたく

・ウェブページを簡単かんたん記録きろくして

・ブログなどからリンクをって利用りようできる

というサービスです。

引用いんようってなにですか?

引用いんようとは、著作ちょさくぶつ利用りよう形態けいたいひとつであり、著作ちょさくけんほうだいさんじゅうじょう定義ていぎされています。

引用いんようにおいては、著作ちょさく権利けんりしゃ許諾きょだくがなくても著作ちょさくぶつ利用りようすることができます。

参考さんこう

- 著作ちょさくけんほうだいさんじゅうじょう http://www.cric.or.jp/db/article/a1.html#2_3e

- 引用いんよう要件ようけん http://ja.wikipedia.org/wiki/%E5%BC%95%E7%94%A8#.E8.A6.81.E4.BB.B6

表示ひょうじちゅうのページを簡単かんたん取得しゅとくする機能きのうはありますか?

URLバーの先頭せんとうにgyo.tc/と入力にゅうりょくください。取得しゅとく確認かくにんページにびます。

必要ひつよう動作どうさ環境かんきょうおしえてください

主要しゅようなウェブブラウザかつ最新さいしんちかいバージョンに対応たいおうしています。

JavaScriptが有効ゆうこうになっている必要ひつようがあります。

リファラの送信そうしん有効ゆうこうになっている必要ひつようがあります。

魚拓ぎょたく期待きたいどおりに取得しゅとく表示ひょうじできません(スクリーンショットふくむ)

よくあるれいげます。
とくにストリーミングをともな動画どうが。こちらは今後こんご対応たいおうです。
・ログインが必要ひつようなウェブページ。
人間にんげんによるアクセスとなされないような要求ようきゅう拒否きょひするウェブページ。
・フレームのなか。こちらはフレームのなかのページを保存ほぞんしてください。
広告こうこく表示ひょうじ必須ひっすである警告けいこくがでるウェブページ
    - これはむずかしいところですが、広告こうこくには資料しりょう無関係むかんけい資料しりょうです。「広告こうこく表示ひょうじして取得しゅとく」のご要望ようぼうがあれば実装じっそうする予定よていです。
・スクリーンショットしかれない
    - コンテンツ全体ぜんたい、あるいはコンテンツの一部いちぶ非常ひじょうおおきいファイル(圧縮あっしゅくとうこころみるまで猶予ゆうよがありますが、無料むりょうばんやく30-90MBです)
    - コンテンツ全体ぜんたいわせてとても回数かいすうおおい(3けた後半こうはんとう)のリダイレクト。
    - その、レンダリングのエラー。
・スクリーンショットの文字もじ
    - スクリーンショットが正式せいしき対応たいおうしている言語げんご現状げんじょう日本語にほんご英語えいごのみとなります
一部いちぶ画像がぞうとうれない
    - スクロールによる遅延ちえんみがスクロール探索たんさくの20000pxをえても存在そんざい
    - レンダリングがむずかしいHTML(確認かくにんができているなかでは、一部いちぶ要素ようそ背景はいけい画像がぞうとうです)
    - 途中とちゅう前述ぜんじゅつのファイルサイズの上限じょうげんえた場合ばあい
一時いちじてき障害しょうがい
魚拓ぎょたくのアクセスがブロックされているウェブページ
取得しゅとくブラックリスト
    - 日本にっぽんにおいて配信はいしん不能ふのうであるコンテンツがおもとなっているウェブサイトのページ
    - 過去かこ、SEOなどへ目的もくてきとして利用りようされた可能かのうせいきわめてたかいと判断はんだんされるウェブサイトのページ
・その、HTMLのレンダリングが困難こんなん技術ぎじゅつてき取得しゅとくできないサイト
修正しゅうせいをご希望きぼうほうはURLをえて意見いけんなどにご連絡れんらくくださいますとさいわいです。

なんらかの理由りゆう魚拓ぎょたく削除さくじょするには?

該当がいとうのページ「削除さくじょ」ボタンより削除さくじょをご依頼いらいください。
理由りゆう複雑ふくざつであること、別途べっと弁護士べんごしさまとうつうじご連絡れんらくいただく場合ばあいなどは、直接ちょくせつ下記かきよりご連絡れんらくいただくことも可能かのうです。
詳細しょうさいなおわせはまでおねがいたします。

削除さくじょしたい

(事件じけんとうとして処理しょりする場合ばあいとうによる資料しりょう請求せいきゅうこちら参照さんしょうください)

ウェブ魚拓ぎょたく削除さくじょ審査しんさにはさだめられた期間きかんちゅう削除さくじょにおいて処理しょりする義務ぎむがあるため、経緯けいいとう考慮こうりょむずかしいケースがほとんどです。
リンクをるだけであっても経緯けいいによっては、名誉めいよ棄損きそん侮辱ぶじょくたる可能かのうせいもあります。
しかし条件じょうけんにより削除さくじょしをおこなうことができます。
複雑ふくざつ手続てつづきになりますが以下いかでURLや経緯けいい可能かのうかぎくわしくご説明せつめいください。
基本きほんてき現在進行形げんざいしんこうけい議論ぎろんかぎります。なお、削除さくじょ要望ようぼうおこなったほうはその責任せきにんうこととなります。

削除さくじょされた魚拓ぎょたく内容ないよう照会しょうかいしたい

ウェブページのリンクをえて、よりご連絡れんらくねがいたします。 基本きほんてき法的ほうてき判断はんだん必要ひつよう場合ばあいかぎります。弁護士べんごしさま裁判所さいばんしょからの要請ようせい前提ぜんていとしています。

キャッシュの取得しゅとく禁止きんしするにはどうすればいいですか?

以下いか方法ほうほうのどれかをおこなうことでキャッシュの取得しゅとく禁止きんしできます。

(1) 以下いかのMETAタグをHEADタグない

meta name="robots" content="noarchive">

(2) ルートディレクトリにrobots.txtを設置せっちして、"Megalodon"が取得しゅとく不可能ふかのうなパスを指定していする

なお、robots.txtはキャッシュしておりますので、変更へんこう反映はんえいされるまでながくて3にちかかります。

大変たいへんもうわけありませんが、これらについての技術ぎじゅつてき質問しつもんはおけしておりません。

2024.05 robotsによるnoarchive指定してい取得しゅとく禁止きんししていましたが、取得しゅとくさいわたしはロボットではありません」を設置せっちしたことにより 人間にんげんによる取得しゅとくであるかどうかの判定はんていこう精度せいど可能かのうとしましたため、禁止きんしはされなくなりました。

「robots.txtによって(中略ちゅうりゃく取得しゅとくできません」という表示ひょうじます

そのサイトはキャッシュを禁止きんしする意思いし表示ひょうじおこなっているため、取得しゅとくはできません。

平成へいせい26ねん最終さいしゅう改訂かいていされている著作ちょさくけんほうだいななしょうだいよんじょうよつで、

「robots.txtで情報じょうほう収集しゅうしゅう拒否きょひするページの情報じょうほう収集しゅうしゅう禁止きんし」がさだめられています。

ウェブ魚拓ぎょたくでは海外かいがい判例はんれい参考さんこう禁止きんししてきましたが、日本にっぽんこくでも正式せいしき禁止きんしされるはこびとなりました。

2024.05 robotsによるnoarchive指定してい取得しゅとく禁止きんししていましたが、取得しゅとくさいわたしはロボットではありません」を設置せっちしたことにより 人間にんげんによる取得しゅとくであるかどうかの判定はんていこう精度せいど可能かのうとしましたため、この表示ひょうじ廃止はいしします。

HTMLコンテンツのSHA256確認かくにん仕方しかたは?

たとえばwindowsの場合ばあい具体ぐたいてきにはPowerShellで以下いかのスクリプトを実行じっこうしてください。

                
# ファイルパスを指定してい
$filePath = "ここをファイルパスにえる"

# ファイルの内容ないようをUTF-8エンコーディングでむ
$fileContent = [System.IO.File]::ReadAllText($filePath, [System.Text.Encoding]::UTF8)

# <!--CHECKSUM START-->と<!--CHECKSUM END-->のあいだのコンテンツを抽出ちゅうしゅつ
$startPattern = "<!--CHECKSUM START-->"
$endPattern = "<!--CHECKSUM END-->"
$regexPattern = "(?s)$startPattern(.*?)$endPattern"

if ($fileContent -match $regexPattern) {
    $extractedContent = $matches[1].Trim()
} else {
    Write-Error "Specified patterns not found in the file."
    exit
}

# 抽出ちゅうしゅつされたコンテンツをUTF-8でバイト配列はいれつ変換へんかん
$utf8Bytes = [System.Text.Encoding]::UTF8.GetBytes($extractedContent)

# SHA256ハッシュを計算けいさん
$sha256 = [System.Security.Cryptography.SHA256]::Create()
$hashBytes = $sha256.ComputeHash($utf8Bytes)
$hashString = -join ($hashBytes | ForEach-Object { "{0:x2}" -f $_ })

# ハッシュを表示ひょうじ
Write-Output "Extracted Hash:"
Write-Output $hashString