検索けんさくエンジンスパム

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

検索けんさくエンジンスパム(けんさくエンジンスパム、えい:spamdexing)とは、Google検索けんさくやYahoo! 検索けんさくとう検索けんさくエンジン自身じしんウェブサイト検索けんさく結果けっか上位じょうい表示ひょうじさせるように、なんらかの仕掛しかけをすること、およびほどこされたウェブページをいう。こと検索けんさくエンジンから所定しょていサイトへ、不適切ふてきせつ誘導ゆうどうされたケースにおいてこのように表現ひょうげんされる。なお、ランチョンミートスパム(SPAM)とは大文字おおもじ小文字こもじつづりの相違そうい

概要がいよう[編集へんしゅう]

ウェブサイトに仕掛しかけをすることで、検索けんさくサイトでのウェブ検索けんさく経由けいゆで、特定とくていのウェブサイトやウェブページへおおくのアクセスが見込みこめる一方いっぽうで、検索けんさく結果けっか無関係むかんけい条件じょうけんまで表示ひょうじされるようにすることはネチケット一種いっしゅマナーないし道徳どうとく公序良俗こうじょりょうぞく)にはんする行為こういとされる。

検索けんさくエンジンがわでも利用りようしゃのぞ情報じょうほうへのリンク提供ていきょうするために、関係かんけい内容ないようのウェブページは除外じょがいする仕組しくみを開発かいはつして導入どうにゅうすすめている。この場合ばあい検索けんさくエンジン提供ていきょうがわ信用しんようにもかかわり、こと検索けんさくサイトが利用りようしゃ信用しんようされ利用りようしゃすうばすことで収益しゅうえきげる関係かんけいじょう、その仕組しくみをやぶ検索けんさくエンジンスパムは営業えいぎょう妨害ぼうがいとなるためである。しかしそういった検索けんさくエンジンスパムを除外じょがいする機能きのう回避かいひすることをこころみるものもおり、いたちごっこつづいている。詳細しょうさい対策たいさく参照さんしょう

出会であけいサイト通信つうしん販売はんばいアフィリエイト関係かんけいなどの業者ぎょうしゃのほか、個人こじんのウェブサイトでも閲覧えつらんすうやそうとして導入どうにゅうするものがいるが、こと目的もくてきがいのサイトへ誘導ゆうどうされたウェブサイト閲覧えつらんしゃからは不当ふとう誘導ゆうどうだとみなされる一方いっぽうで、検索けんさくサイトがわからは、こういった仕組しくみを多用たようしすぎているとみなしたサイトにたいして、検索けんさくエンジンスパムとしてグーグルはちふんなど強制きょうせいてき検索けんさく結果けっかから除外じょがいすることもある。

れい[編集へんしゅう]

以下いかれいは、あくまでも可能かのうせいがあるということをいているものであり、実際じっさい検索けんさく結果けっか反映はんえいさせたものではない。

文章ぶんしょうによるもの[編集へんしゅう]

検索けんさくさいもちいられるキーワードには特定とくてい方向ほうこうせいがあり、ある人気にんき商品しょうひん商品しょうひんめいタレントアイドル芸能人げいのうじん名前なまえなどは関連かんれんニュースがほうじられるたび検索けんさく頻度ひんどがる傾向けいこうられる。また日常にちじょう生活せいかつ必要ひつようとされる各種かくしゅ情報じょうほうから言葉ことば検索けんさくさいおおもちいられる。

インターネットでは関心かんしんのある事象じしょうを、それこそ公式こうしきサイトや専門せんもん情報じょうほうサイトから、もないうわさレベルまでもが、検索けんさくサイトの機能きのうつうじてることが可能かのうであるが、これら検索けんさくキーワードをおおふく文章ぶんしょうは、それだけ様々さまざまひとから閲覧えつらんされる可能かのうせいてくる。とくにトップページ(→ホームページ)やindex.htmlにそれらキーワードがてくる場合ばあいなどには、検索けんさくエンジンがわで「その情報じょうほうせんもんあつかっているサイト」として集計しゅうけいポイントをおおあたえるなどの傾向けいこうり、このポイントすうおおいサイトほど検索けんさく上位じょうい表示ひょうじするところられる。

検索けんさくエンジンスパム行為こういでは、このような「よく検索けんさくされるであろうキーワード」を文章ぶんしょうちゅうにちりばめたり、意味いみ陳列ちんれつさせることで、検索けんさく上位じょういいこもうとする。極端きょくたんれいでは、著名ちょめいじん有名人ゆうめいじん名前なまえ列記れっきしただけのページをトップページにってきて、ひらいた途端とたんべつのページへと自動的じどうてき誘導ゆうどうしたりする(後述こうじゅつ1ページサイト)。そこまでかなくとも、トップページに長々ながなが文章ぶんしょうつづられているサイトでは、様々さまざまなキーワードが幾度いくどてくることになり、検索けんさくサイトがわのクローラには「該当がいとうキーワードのおおふくまれる関係かんけいする情報じょうほうおおそうなページ」に集計しゅうけいされやすくなる(通常つうじょう文章ぶんしょうちゅうに、特定とくていのキーワードがかえてくることは、かえって普通ふつうでもあるため、スパム行為こういになるかどうかの境界きょうかいはあいまいである)。

なお商業しょうぎょうサイトによっては、これら行為こうい検索けんさくエンジンマーケティング(Search Engine Marketing:SEM)としょうしており、またこれら行為こういとく違法いほうでもいために大々的だいだいてきおこなわれる傾向けいこうがあることすらいなめない。しかし一般いっぱんインターネット利用りようしゃがわかられば、とくなにかをうつもりもいのに商用しょうようサイトへと誘導ゆうどうされれば、それなりに不快ふかいかんあたえかねない。このためちゅうにはこの手法しゅほう利用りようしていることさとられないように隠蔽いんぺいしたりするケースもられる。

なおこの問題もんだい検索けんさくサイトがわのシステムを逆手さかてった行為こういではるものの、違法いほうではないうえ積極せっきょくてきかつ差別さべつにメッセージを送信そうしんする迷惑めいわくメール行為こういほどにはインターネット利用りようしゃ不快ふかいかんあふらない・もしくはその存在そんざいられていないため、どう行為こういをインターネット・コミュニティうえ忌避きひされる行為こういとはらずに、もしくは「問題もんだい手法しゅほうだ」といいはっておこなきもられ、一般いっぱん利用りようしゃと、どう行為こういおこながわ軋轢あつれきんでいる。

ソースコードによる方法ほうほう[編集へんしゅう]

文章ぶんしょうによるものとはべつに、一見いっけんなにいページにえるが、HTMLなどのソースコード細工ざいくほどこことで、検索けんさくエンジンへのはたらけをおこなうケースもある。

上記じょうきトイレットトレーニングをれいとすると、背景はいけいまったおなしょく検索けんさくキーワードを「かくしテキスト」として記述きじゅつする(そのままえないが、文字もじ反転はんてんさせたりソースコードをればかる)方法ほうほうや、非常ひじょうちいさな画像がぞう説明せつめいぶんむ・検索けんさくエンジンが目安めやすとするmetaタグないにキーワードを方法ほうほうなどがある。

以下いかにそのれい一部いちぶげる。本来ほんらいなら検索けんさくキーワードにれるワードをふくまず、関係かんけいないものを意図いとてき検索けんさくさせており、悪質あくしつである。

metaタグによるもの[編集へんしゅう]

metaタグ検索けんさくエンジンが参照さんしょうし、その内容ないよう評価ひょうかするのに利用りようする。

<html>
<head>
<title>まるちーずのぺーじ</title>
<meta name="robots" content="(ここは検索けんさくエンジンで表示ひょうじするので意図いとてきはぶいてある)">
<meta name="keywords" content=",そだて,保育ほいく,トイレ,トレ,おねむ
,1さい,2さい,3さい,4さい,子育こそだて,(などの文字もじれつ)">
</head>
|本文ほんぶん
</html>

またうえげた文章ぶんしょうによるものにも関連かんれんするが、検索けんさくエンジンにはたらけやすい文章ぶんしょうを、ひとにはませないようにかくす(検索けんさくエンジンスパムによる不快ふかいかんあたえないようにする)行為こういられる。

かくしテキストによるもの[編集へんしゅう]

文字もじ背景はいけいおなしょくにする。

<html>
<head>
<title> はむのぺーじ</title>
</head>
<body bgcolor="white">
<font color="white">
,そだて,保育ほいく,トイレ,トレ,おねむ
,1さい,2さい,3さい,4さい,(など大量たいりょう文字もじれつ)"
</font>(ここまでが検索けんさくエンジンようキーワード)
<font color="blue">
|本文ほんぶん
</html>

文字もじ極端きょくたんちいさくする。

<html>
<head>
<title>はむのぺーじ</title>
</head>
<body bgcolor="white">
<div style="font-size:1px">
,そだて,保育ほいく,トイレ,トレ,おねむ
,1さい,2さい,3さい,4さい,(など大量たいりょう文字もじれつ</div>(ここまでが検索けんさくエンジンようキーワード)
<font size="3">
|本文ほんぶん
</html>

このほかにも、画像がぞう説明せつめいちゅう検索けんさくキーワードを意識いしきした文章ぶんしょうかく方法ほうほうもある。

<html>
<head>
<title>はむのぺーじ</title>
</head>
<body bgcolor="white">
<img src="xxxxxx.jpg" height=1 width=1 border="0" 
alt=" ハムスター,はむ,ペット,,そだて,保育ほいく,トイレ,トレ
,1さい,2さい,3さい,4さい,(など大量たいりょう文字もじれつ)">
<font color="blue">
|本文ほんぶん
</html>

ほかにもスタイルシート使用しようした方法ほうほうなどがある。

リンクページの大量たいりょう生産せいさん[編集へんしゅう]

ある特定とくていのキーワードをふくむページからリンクされているサイトは、検索けんさくサイトの集計しゅうけいポイントじょうで「参考さんこうになる情報じょうほうがあるために、様々さまざまなページからリンクされているサイト」と認識にんしきされやすい。これを逆手さかてにとって、無料むりょうのホームページスペースを大量たいりょう取得しゅとくして、サイトへとリンクをものがいる。

これは本格ほんかくてきなスパマー(迷惑めいわくメール送信そうしんしゃ:spammer)にられた手口てぐち(SEOスパム)であるが、これらでは自動じどうされた無料むりょうホームページスペースのアカウント取得しゅとくスクリプトもちいて複数ふくすうホームページを作成さくせい、これらにかたぱしからおなじページを1まいだけアップロードして、サイトへと集中しゅうちゅうてきにリンクをらせる。このような方法ほうほうでは、かつて防止ぼうしさくかったころには、すうひゃくからすうせんった単位たんいでこの1ページサイトが乱立らんりつしていたという。

現在げんざい、このような1ページサイトはスパマーの迷惑めいわく行為こうい防止ぼうしてんで「自動じどうできないように、ホームページスペース取得しゅとく手順てじゅん画像がぞうかれた文字もじ記号きごうませて承認しょうにんする」という方法ほうほう導入どうにゅうする一方いっぽう差別さべつつくられたとかんがえられるようなサイトをさがして、または利用りようしゃからの報告ほうこくけてはアカウントごと削除さくじょする活動かつどうつづけられている。また、検索けんさくエンジンがわでもこのようなサイトをドメインごと検索けんさくっかからないようにするといった対策たいさくおこなわれている。

コンテンツファーム・コンテンツミル[編集へんしゅう]

SEO(検索けんさくエンジン最適さいてき目的もくてき価値かちひくいコンテンツを安価あんか量産りょうさんしているWebサイトをコンテンツミル(英語えいご: Content Mill)、このようなてい品質ひんしつなコンテンツをコンテンツファーム英語えいごばん英語えいご: content farm)という。アメリカのDemand Mediaは、独自どくじのアルゴリズムでユーザーの「需要じゅよう」を解析かいせきし、それに記事きじ動画どうがをフリーランサーに大量たいりょうつくらせ、検索けんさくエンジンでの露出ろしゅつ最大さいだいし、ウェブ広告こうこく収入しゅうにゅうるというビジネスをおこなった。これらのコンテンツのしつひくかったが、「記事きじ自体じたい検索けんさくされやすいキーフレーズをもちいていたり、検索けんさくエンジンに評価ひょうかされやすい仕組しくみをそなえている」ため、Googleの検索けんさく上位じょういめ、Googleはユーザーから、検索けんさくしち関連かんれんせい低下ていかしていると指摘してきされるようになった。Googleはてい品質ひんしつ記事きじへの対策たいさくとして、パンダアップデート(Google Panda)を実施じっしした[1]

日本にっぽんではDeNAのヘルスケア情報じょうほうキュレーションサイト(まとめサイト)「WELQ」(ウェルク)において、不正確ふせいかく内容ないよう著作ちょさくけん侵害しんがいのおそれのある医療いりょう記事きじ大量たいりょう存在そんざいするという問題もんだいはしはっし、DeNAのほかのキュレーションサイトでも、無断むだん転用てんよう・リライトの懸念けねんもある大量たいりょうのコンテンツを外注がいちゅうすることで、てい品質ひんしつ内容ないよう問題もんだいのあるコンテンツが検索けんさく上位じょういめているという問題もんだいあきらかになった。これはDeNAだけでなく、リクルートホールディングスサイバーエージェントなども同様どうよう問題もんだいがあり、自社じしゃのまとめサイトの一部いちぶ記事きじ公開こうかい停止ていしした[2]。SEMリサーチの渡辺わたなべ隆広たかひろは、Googleの検索けんさくはDeNAがキュレーションサイトでおこなったような、クラウドソーシングを活用かつようして記事きじ乱造らんぞうするというスパムてき手法しゅほうにひどくよわく、クラウドソーシングがスパムをささえる構造こうぞうになっていると指摘してきしている[3]

記事きじクラウドソーシング外注がいちゅうされており、2016ねん12月に、クラウドソーシング事業じぎょうおこなランサーズクラウドワークスは、企業きぎょうがライターに依頼いらいするさいに、記事きじ無断むだん転用てんようやリライトを禁止きんしする指針ししん公表こうひょうした[4]

一連いちれんのキュレーションサイトの騒動そうどうでは、このような問題もんだいおおいメディアに広告こうこくしていた企業きぎょう広告こうこく代理だいりてん問題もんだいされている[5]

対策たいさく[編集へんしゅう]

検索けんさくエンジン運営うんえいしゃ[編集へんしゅう]

このようなページはグーグルはちふんとされ、特定とくていのウェブサイトが検索けんさくようのインデックスから完全かんぜん削除さくじょされてしまい、GoogleやYahoo!などにおいて一切いっさい検索けんさく結果けっかからなくなる。しかし、文章ぶんしょうによる方法ほうほうではどれが検索けんさくエンジンスパムなのかの区別くべつきにくく、いたとしてもGoogleやYahoo!などにおいてもすべてを把握はあくするのは困難こんなんであり完全かんぜん対策たいさく出来できていない。

しかしなかには違法いほうせいのある商品しょうひん・サービスを提供ていきょうするサイトなどがこの手法しゅほう導入どうにゅうすることで検索けんさくサイトにはたらけるケースもあることから、さきげたグーグルはちふんのみならず、検索けんさくサイトでも定期ていきてき問題もんだいのあるサイトのキャッシュ検索けんさくサイトがわ検索けんさく情報じょうほう)を検索けんさくして削除さくじょする活動かつどうおこなわれている。

過去かこにはGoogleで「(東京とうきょう)○×歴史れきし」と検索けんさくすると23何処どこめい検索けんさくしてもポルノサイトが上位じょうい事態じたい発生はっせいし、2004ねん5がつ12にち警視庁けいしちょうより連絡れんらくけたGoogleがこれを強制きょうせいてき排除はいじょしている[6]

また、MSNでは2004ねん11月8にちばくだん製造せいぞう方法ほうほう自殺じさつけいサイトのキャッシュを携帯けいたい電話でんわけのサービスから除外じょがいするなど、従来じゅうらいでは検索けんさく品質ひんしつ情報じょうほう精度せいど以外いがいには責任せきにんたなかったロボット検索けんさくエンジンでも、その検索けんさく結果けっか内容ないよう責任せきにんってあたる傾向けいこうまれている。

検索けんさくエンジン利用りようしゃ[編集へんしゅう]

検索けんさくさいして検索けんさくキーワードを工夫くふうする(除外じょがいキーワードの利用りようなど)。たとえばGoogleやYahoo!などの主要しゅよう検索けんさくサイトでは“-”記号きごうハイフン)につづけてキーワードを入力にゅうりょくすると、そのキーワードをふくむページを除外じょがいして検索けんさくしてくれる。年齢ねんれい住所じゅうしょなどアラビア数字すうじふくむキーワードの場合ばあいはキーワードが分解ぶんかいれい:「20さい」→「20」と「とし」に分解ぶんかい)してしまうので、半角はんかく“""”記号きごうなかにキーワードをれることによってフレーズとして分解ぶんかい阻止そしさせることも出来できる。

検索けんさくサイトでも、「検索けんさくオプション」などから複数ふくすうのキーワード入力にゅうりょくらんに、それぞれ「ふくまれる」・「ふくまれない」・「双方そうほうふくまれる」とうこまかい指定していおこなこと可能かのうとなっており、そのような仕組しくみを利用りようすることがすすめられる。

Google Chrome拡張かくちょう機能きのう[編集へんしゅう]

以上いじょうのように利用りようしゃにとってれる具体ぐたいてき対策たいさくは、検索けんさくに、利用りようしゃ不適切ふてきせつかんがえる発信はっしんもとサイトについて「-(マイナス)」、「-site:」とう検索けんさく演算えんざん利用りようするとったことがせいぜい可能かのうなことであり、のち利用りようしゃ判断はんだんりょくまかされているのが現状げんじょうであった。

Googleは2011ねん、コンテンツファーム対策たいさく一環いっかんとして、Google Chromeじょうでの検索けんさく結果けっかから、個別こべつのユーザーが不適切ふてきせつかんがえる検索けんさく結果けっかをドメイン単位たんい排除はいじょできる拡張かくちょう機能きのう「Personal Blocklist(by Google)」をリリースしたことがある[7][8][9]。ただし2021ねん現在げんざいでは公開こうかい終了しゅうりょうしており、使用しようすることはできなくなっている。

この機能きのうはPCじょうのGoogle Chromeだけで動作どうさする。スマートフォンはんは2017ねん現在げんざいもリリースされていない。

脚注きゃくちゅう[編集へんしゅう]

出典しゅってん[編集へんしゅう]

  1. ^ 渡辺わたなべ隆広たかひろ (2011ねん1がつ31にち). “Googleが指摘してきする"コンテンツファーム"とは? Demand Mediaのコンテンツミル問題もんだい中編ちゅうへん”. SEMリサーチ. 2016ねん12がつ10日とおか閲覧えつらん
  2. ^ 福田ふくだ直之なおゆき 藤崎ふじさき麻里まり (2016ねん12月6にち). “まとめサイト閉鎖へいさ大手おおて 背景はいけい収益しゅうえき優先ゆうせん構図こうず”. 朝日新聞あさひしんぶん. 2016ねん12がつ10日とおか閲覧えつらん
  3. ^ 渡辺わたなべ隆広たかひろ (2016ねん12月1にち). “DeNA WELQ と検索けんさく技術ぎじゅつ課題かだい”. SEMリサーチ. 2016ねん12がつ10日とおか閲覧えつらん
  4. ^ 藤崎ふじさき麻里まり (2016ねん12月8にち). “DeNA問題もんだいでクラウドソーシング大手おおてしん指針ししん”. 朝日新聞あさひしんぶん. 2016ねん12がつ10日とおか閲覧えつらん
  5. ^ よっぴー (2016ねん12月9にち). “炎上えんじょうちゅうのDeNAにサイバーエージェント、その根底こんていながれるモラルきDNAとは”. Yahoo!ニュース 個人こじん. 2016ねん12がつ10日とおか閲覧えつらん
  6. ^ “Googleがエロサイトによる地名ちめい使つかったインデックス汚染おせん対処たいしょ. スラド. (2004ねん5がつ14にち). https://it.srad.jp/story/04/05/14/054215/ 
  7. ^ “Google検索けんさく結果けっか悪質あくしつなサイトを表示ひょうじ通報つうほう検索けんさく品質ひんしつアップに貢献こうけんできるGoogle公式こうしきChrome拡張かくちょう機能きのう「Personal Blocklist」”. Gigazine. (2016ねん11月29にち). http://gigazine.net/news/20161129-personal-blocklist-by-google/ 
  8. ^ “New: Block Sites From Google Results Using Chrome’s “Personal Blocklist”” (英語えいご). Search Engine Land. (2011ねん2がつ14にち). http://searchengineland.com/googles-personal-blocklist-delete-google-search-results-on-chrome-64757 
  9. ^ “New Chrome extension: block sites from Google’s web search results” (英語えいご). (2011ねん2がつ14にち). https://googleblog.blogspot.com/2011/02/new-chrome-extension-block-sites-from.html 

関連かんれん項目こうもく[編集へんしゅう]