この
記事 きじ には
複数 ふくすう の問題 もんだい があります。
改善 かいぜん や
ノートページ での
議論 ぎろん にご
協力 きょうりょく ください。
初期 しょき のCAPTCHAの例 れい 。人間 にんげん はこれを「HTKEHS」と認識 にんしき できるが、機械 きかい にとっては困難 こんなん である。
CAPTCHA ( キャプチャ ) はチャレンジ/レスポンス型 がた テスト (英語 えいご 版 ばん ) の一種 いっしゅ で、応答 おうとう 者 しゃ がコンピュータ ではなく生身 なまみ の人間 にんげん であることを確認 かくにん するために使 つか われる。
ウィキペディア においても、ログイン していない状態 じょうたい のユーザ (IPユーザー)が外部 がいぶ リンク を追加 ついか する際 さい 、スパム (メール) の防止 ぼうし のためこの種 たね の認証 にんしょう が用 もち いられる。外部 がいぶ リンク を追加 ついか しない場合 ばあい にも濫用 らんよう される。
この用語 ようご はカーネギーメロン大学 だいがく のルイス・フォン・アン 、マヌエル・ブラム 、ニコラス・J・ホッパー、IBM のジョン・ラングフォードによって2000年 ねん に造 つく られた。CAPTCHA という語 かたり は「completely automated public Turing test to tell computers and humans apart 」(コンピュータ と人間 にんげん を区別 くべつ する完全 かんぜん に自動 じどう 化 か された公開 こうかい チューリングテスト )の人為 じんい 的 てき 頭字 かしらじ 語 ご である。
認知 にんち ソフトウェア に対抗 たいこう するために難 なん 化 か が繰 く り返 かえ された結果 けっか 、既 すで に人間 にんげん の認識 にんしき が困難 こんなん になるほど難 なん 化 か しており、本来 ほんらい の目的 もくてき を果 は たせていない場合 ばあい がある(「過剰 かじょう な難 なん 化 か 」の節 ふし を参照 さんしょう )。
もっとも一般 いっぱん 的 てき な画像 がぞう によるCAPTCHAの場合 ばあい 、次 つぎ のように画像 がぞう に記 しる されている文字 もじ や数字 すうじ を読 よ み取 と ることができるか否 ひ かによって人間 にんげん と機械 きかい を判別 はんべつ する。
CAPTCHA システムは、ランダムな文字 もじ や数字 すうじ の列 れつ を画面 がめん に表示 ひょうじ する。表示 ひょうじ される文字 もじ は歪 いが んでいたり一部 いちぶ が覆 おお い隠 かく されていたりして、機械 きかい が自動的 じどうてき に読 よ み取 と ることは難 むずか しい。
ユーザーは画面 がめん に描 えが かれている文字 もじ の列 れつ を読 よ み取 と り、同 おな じ文字 もじ 列 れつ をシステムに入力 にゅうりょく する。
システムが表示 ひょうじ した文字 もじ 列 れつ とユーザーが打 う ち込 こ んだ文字 もじ 列 れつ が一致 いっち していれば、ユーザーは歪 いが んだ画像 がぞう を認識 にんしき する能力 のうりょく を持 も っていると考 かんが えられる。システムはそのユーザーが人間 にんげん であると推測 すいそく する。
システムにアクセスできる人間 にんげん を日本語 にほんご 使用 しよう 者 しゃ に限定 げんてい したい場合 ばあい 、画像 がぞう の文字種 もじしゅ をひらがな ・カタカナ に限定 げんてい する。
応用 おうよう として、画像 がぞう の文字種 もじしゅ でアラビア数字 すうじ のみを入力 にゅうりょく させる場合 ばあい 、アラビア数字 すうじ そのものではなく読 よ み方 かた をひらがな・カタカナで表示 ひょうじ する (例 れい :123456 → イチ に サン よん ご ロク)。
アラビア数字 すうじ だと、言語 げんご を問 と わずほとんどの人間 にんげん が読 よ めるが、ひらがな・カタカナまで読 よ める日本 にっぽん 国外 こくがい 人口 じんこう はそれほど多 おお くないため、日本 にっぽん 国外 こくがい からのアクセスを大幅 おおはば に抑制 よくせい できる。
コンピュータがテストを監督 かんとく することから、人間 にんげん が監督 かんとく する標準 ひょうじゅん 的 てき なチューリングテスト との対比 たいひ として、CAPTCHA はときに逆 ぎゃく チューリングテスト とも呼 よ ばれる。
また、複数 ふくすう の画像 がぞう の中 なか から指定 してい された画像 がぞう を全 すべ て選 えら ぶ「私 わたし はロボットではありません 」と呼 よ ばれるものも存在 そんざい する[1] 。
CAPTCHA は日本語 にほんご では「画像 がぞう 認証 にんしょう 」とも呼 よ ばれている。
CAPTCHA はもともと、1997年 ねん にAltaVista のアンドレイ・ブローダーとその同僚 どうりょう たちによって、ボット が彼 かれ らの検索 けんさく エンジン にURL を追加 ついか するのを防 ふせ ぐために開発 かいはつ された。彼 かれ らは画像 がぞう をOCR による攻撃 こうげき に耐 た えられるようにする方法 ほうほう を探 さが していた。ブラザ ぶらざ ー工業 こうぎょう のスキャナ の取扱 とりあつかい 説明 せつめい 書 しょ には、OCRの結果 けっか を改善 かいぜん するためには均質 きんしつ な活字 かつじ 面 めん 、無地 むじ の背景 はいけい を用 もち いるよう薦 すす められていた。そこで彼 かれ らは取扱 とりあつかい 説明 せつめい 書 しょ に「OCR認識 にんしき の結果 けっか を悪 わる くする」と書 か いてある条件 じょうけん を真似 まね て最初 さいしょ の CAPTCHA を作 つく り出 だ した。ブローダーによれば、CAPTCHA は検索 けんさく エンジンへのスパム追加 ついか を95%削減 さくげん できたという。
CAPTCHA はボット が種々 しゅじゅ のコンピュータのサービスを使 つか うのを防 ふせ ぐために使 つか われる。 応用 おうよう 用途 ようと として挙 あ げられることとして、ボットがオンライン投票 とうひょう に参加 さんか したり、(後 うしろ でスパム を送 おく るために使 つか われるかもしれない)無料 むりょう メールやサービスのアカウントに登録 とうろく (一人 ひとり が複数 ふくすう のアカウントに登録 とうろく )するのを防 ふせ ぐことなどがある。さらに最近 さいきん では、ボットが生成 せいせい するスパムを防 ふせ ぐために、メールメッセージが配達 はいたつ される前 まえ に(未 み 承認 しょうにん の)送 おく り主 ぬし が CAPTCHA テストの通過 つうか を要求 ようきゅう することなどがある。
また、CAPTCHA は人間 にんげん のリソースを使 つか うこととなるが、この労力 ろうりょく を「人間 にんげん であることの確認 かくにん 」以外 いがい にも文書 ぶんしょ の電子 でんし 化 か に使 つか うという reCAPTCHA プロジェクトも行 おこな われている。
定義 ていぎ より、CAPTCHA は以下 いか の特徴 とくちょう を持 も っている:
CAPTCHA は自動 じどう 化 か されている。テストを管理 かんり 運用 うんよう するにあたって人間 にんげん の介在 かいざい をほとんど、あるいは全 まった く必要 ひつよう としない。これはテストにおける人間 にんげん の管理 かんり や介入 かいにゅう の必要 ひつよう 性 せい を避 さ けることができ、コストや信頼 しんらい 性 せい においても明 あき らかに有益 ゆうえき である。
使用 しよう されるアルゴリズム は多 おお くの場合 ばあい 公開 こうかい される。ただし、特許 とっきょ によって妨 さまた げられるかもしれない。これが規定 きてい されているのは、CAPTCHA の突破 とっぱ には、リバースエンジニアリング などの手法 しゅほう を用 もち いて達成 たっせい できるような単 たん なる(秘密 ひみつ の)アルゴリズムの発見 はっけん よりも、人工 じんこう 知能 ちのう の分野 ぶんや における難問 なんもん の解決 かいけつ 法 ほう を要求 ようきゅう する、ということが必要 ひつよう なためである。
視覚 しかく 認識 にんしき の問題 もんだい に基 もと づく CAPTCHA は、視覚 しかく 障害 しょうがい を持 も ったユーザが保護 ほご されたリソースにアクセスする際 さい の妨 さまた げとなる。CAPTCHA は機械 きかい 可読 かどく ではないように設計 せっけい されているので、スクリーンリーダ のような支援 しえん ツールでも解釈 かいしゃく できない。
しかし、CAPTCHA が視覚 しかく 的 てき である必要 ひつよう はない。 例 たと えば音声 おんせい 認識 にんしき のように、人工 じんこう 知能 ちのう によって解 と くのが困難 こんなん な問題 もんだい であれば、CAPTCHA として使 つか うことができる。ユーザが音声 おんせい 認識 にんしき 問題 もんだい を選択 せんたく できるような CAPTCHA の実装 じっそう もある。しかしながら、音声 おんせい (聴覚 ちょうかく )CAPTCHA の開発 かいはつ は画像 がぞう (視覚 しかく )CAPTCHA よりも後 おく れを取 と っており、あまり普及 ふきゅう はしていない。また、テキストの意味 いみ を理解 りかい させるような問題 もんだい も CAPTCHA として用 もち いることができる。例 たと えば、論理 ろんり パズル や常識 じょうしき ・計算 けいさん 問題 もんだい などである。
W3C による論文 ろんぶん [2] では CAPTCHA のアクセシビリティ上 じょう の問題 もんだい 点 てん がいくつか示 しめ されている。
CAPTCHA を回避 かいひ するために、囮 おとり ウェブサイトでユーザを集 あつ め、彼 かれ らを騙 だま して CAPTCHA の問題 もんだい を解 と かせるという手法 しゅほう がとられることがある。
ユーザがスパマーの開設 かいせつ した囮 おとり ウェブサイトを訪 おとず れると、スパマーのサーバーは攻撃 こうげき 対象 たいしょう のサーバーにアクセスし、アカウント取得 しゅとく 等 とう の処理 しょり を開始 かいし する。そして攻撃 こうげき 対象 たいしょう の CAPTCHA をダウンロードし、囮 おとり ウェブサイトにアクセスするための CAPTCHA としてユーザに提示 ていじ する。ユーザは、CAPTCHA が再 さい 利用 りよう されるとは知 し らずに、正 ただ しい回答 かいとう を提供 ていきょう する。そしてスパマーはその回答 かいとう を利用 りよう し、攻撃 こうげき 対象 たいしょう の CAPTCHA を突破 とっぱ することができる。
また、大量 たいりょう の人員 じんいん を雇 やと い、彼 かれ らに解 と かせるという手法 しゅほう もある。W3Cの論文 ろんぶん [2] には、「そのようなオペレータは一時 いちじ 間 あいだ に数 すう 百 ひゃく の CAPTCHA を解読 かいどく できる」とある。一方 いっぽう 、この手法 しゅほう は経済 けいざい 的 てき に実行 じっこう 不能 ふのう であるとする指摘 してき もある[3] 。
MoriらはIEEE CVPR'03において、最 もっと も有名 ゆうめい な CAPTCHA の一 ひと つであるEZ-Gimpyを突破 とっぱ する手法 しゅほう を詳述 しょうじゅつ した論文 ろんぶん [4] を発表 はっぴょう し、その手法 しゅほう は92%の確 かく 率 りつ で突破 とっぱ 可能 かのう であると検証 けんしょう された。また、より複雑 ふくざつ であまり広 ひろ く普及 ふきゅう していないGimpyプログラムが、同 おな じ手法 しゅほう により33%の確 かく 率 りつ で突破 とっぱ された。しかし、彼 かれ らのアルゴリズムが実際 じっさい に実装 じっそう され、利用 りよう されているかどうかについては、現時点 げんじてん でははっきりしていない。
機械 きかい による解読 かいどく も巧妙 こうみょう になってきている。PWNtchaのようなプロジェクトによって、広 ひろ く普及 ふきゅう していた CAPTCHA の解読 かいどく 精度 せいど が目覚 めざ ましく進歩 しんぽ し、結果 けっか として CAPTCHA を過剰 かじょう に難 なん 化 か させることとなった。
文字 もじ 認識 にんしき 技術 ぎじゅつ や囮 おとり ウェブサイトによらず、既知 きち の CAPTCHA 画像 がぞう のセッションIDを再 さい 利用 りよう するという手法 しゅほう もある[5] 。
この節 ふし には独自 どくじ 研究 けんきゅう が含 ふく まれているおそれがあります。 問題 もんだい 箇所 かしょ を検証 けんしょう し出典 しゅってん を追加 ついか して、記事 きじ の改善 かいぜん にご協力 きょうりょく ください。議論 ぎろん はノート を参照 さんしょう してください。(2020年 ねん 5月 がつ )
視力 しりょく に問題 もんだい のない人 ひと にとってさえ、知能 ちのう 化 か が進 すす む認知 にんち ソフトウェアに対抗 たいこう して設計 せっけい された新 しん 世代 せだい の CAPTCHA は解 と くことが著 いちじる しく困難 こんなん である。すでに無視 むし できないほどの人数 にんずう の認識 にんしき 能力 のうりょく を上回 うわまわ っており、結果 けっか として人間 にんげん の応答 おうとう すら遮断 しゃだん してしまっている。
CAPTCHA を認識 にんしき できなかった人々 ひとびと は応答 おうとう を諦 あきら めているものと考 かんが えられ、そのような人々 ひとびと にとって過剰 かじょう に難 なん 化 か した CAPTCHA は単 たん なる障害 しょうがい でしかない。
他 た 、正 ただ しい文字 もじ を入力 にゅうりょく しても、弾 ひ かれることがある。
この節 ふし の外部 がいぶ リンクはウィキペディアの方針 ほうしん やガイドライン に違反 いはん しているおそれがあります。 過度 かど または不適切 ふてきせつ な外部 がいぶ リンクを整理 せいり し、有用 ゆうよう なリンク を脚注 きゃくちゅう で参照 さんしょう するよう記事 きじ の改善 かいぜん にご協力 きょうりょく ください。
ウィキメディア・コモンズには、
CAPTCHA に
関連 かんれん するカテゴリがあります。
CAPTCHA の実装 じっそう [ 編集 へんしゅう ]
CAPTCHA 突破 とっぱ [ 編集 へんしゅう ]