コンセンサス配列はいれつ

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

分子生物学ぶんしせいぶつがくバイオインフォマティクスにおいて、コンセンサス配列はいれつえい: consensus sequence)もしくはカノニカル配列はいれつえい: canonical sequence)とは、シーケンスアラインメントかく位置いちにおけるもっとこう頻度ひんどざんもとヌクレオチドアミノ酸あみのさんなど)が計算けいさんされた配列はいれつである。関連かんれんのある配列はいれつ比較ひかくされ、類似るいじ配列はいれつモチーフについて多重たじゅう配列はいれつアラインメントがなされた結果けっかあらわしている。このような情報じょうほうは、RNAポリメラーゼのような配列はいれつ依存いぞんせい酵素こうそについて考慮こうりょする場合ばあい重要じゅうようである[1]

生物せいぶつがくてき重要じゅうようせい[編集へんしゅう]

コンセンサス配列はいれつあらわされるタンパク質たんぱくしつ結合けつごう部位ぶいは、ゲノムなかなんあらわれるヌクレオチドのみじか配列はいれつであり、ことなる位置いちであってもおな役割やくわりたすとかんがえられている。たとえばおおくの転写てんしゃ因子いんしは、調節ちょうせつする遺伝子いでんしプロモーター領域りょういきなか特定とくていのパターンを認識にんしきする。同様どうように、制限せいげん酵素こうそおおくの場合ばあいパリンドロミックなコンセンサス配列はいれつち、その部位ぶいDNA切断せつだんする。トランスポゾンは、転位てんいのための標的ひょうてき配列はいれつ同定どうていにおいてほとんどおなじようにう。そして、スプライシング部位ぶいエクソンイントロン境界きょうかい直前ちょくぜん直後ちょくご配列はいれつ)についてもコンセンサス配列はいれつかんがえることができる。

このように、コンセンサス配列はいれつは、推定すいていされるDNA結合けつごう部位ぶいのモデルである。特定とくてい認識にんしき部位ぶいについて既知きちれいをすべてアラインメントすることによってられる、かく位置いちにおいて優勢ゆうせい塩基えんきあらわされた、理想りそうされた配列はいれつとして定義ていぎされる。すべての実例じつれいが、いくつかの置換ちかんという以上いじょうにコンセンサスからことなっていてはならないが、ミスマッチのかずかぞえるという方法ほうほうはコンセンサス配列はいれつ計算けいさんするさいかならずしも適切てきせつであるとはえない[2]

コアプロモーター配列はいれつにおいて、コンセンサス配列はいれつちかくなるようなヌクレオチドの変異へんいup mutationとしてられる。一般いっぱんてきにこのたね変異へんいはプロモーターを強化きょうかし、RNAポリメラーゼは転写てんしゃしようとするDNAとよりつよ結合けつごう形成けいせいするために、転写てんしゃ上昇じょうしょうする。反対はんたいに、コンセンサス配列はいれつにおいて保存ほぞんされているヌクレオチドを破壊はかいする変異へんいdown mutationとしてられる。このたね変異へんいは、もはやRNAポリメラーゼがコアプロモーター配列はいれつ強固きょうこ結合けつごうできなくなるため、転写てんしゃ低下ていかする。

配列はいれつ解析かいせき[編集へんしゅう]

パターン認識にんしきのためのソフトウェア開発かいはつは、遺伝いでんがく分子生物学ぶんしせいぶつがく、そしてバイオインフォマティクスにおいて主要しゅようなトピックである。特定とくてい配列はいれつモチーフは、なま合成ごうせいをコントロールする制御せいぎょ配列はいれつとして、もしくは細胞さいぼうない特定とくてい位置いち分子ぶんしけたり、分子ぶんし成熟せいじゅく調節ちょうせつするようなシグナル配列はいれつとして機能きのうする。これらの配列はいれつ制御せいぎょ機能きのう重要じゅうようであるため、進化しんかなが過程かていにわたって保存ほぞんされているとかんがえられている。いくつかの場合ばあいにおいては、進化しんかてき関連かんれんせいがこれらの部位ぶい保存ほぞんせい程度ていどから推定すいていされる。

表記ひょうきほう[編集へんしゅう]

保存ほぞんされた配列はいれつモチーフはコンセンサス配列はいれつばれ、どのざんもと保存ほぞんされ、どのざんもと変化へんかしやすいものであるかをしめしている。つぎのようなDNA配列はいれつれいについてかんがえてみよう。

A[CT]N{A}YR

この表記ひょうきでは、左端ひだりはしAつねにこの位置いちにAがつかることを意味いみしている。[CT]はこの位置いちにCまたはTがつかること、Nはこの位置いちにすべての塩基えんきはいりうること、{A}は A 以外いがい塩基えんきYピリミジン塩基えんき(pYrimidine)、Rプリン塩基えんき(puRine)をそれぞれ意味いみしている。

シーケンスロゴであらわされたLexAタンパク質たんぱくしつのDNA結合けつごうモチーフ

このれいでの[CT]という表記ひょうきにはその位置いちにおけるCとTの相対そうたいてき頻度ひんどについてなに情報じょうほうしめされていない。コンセンサス配列はいれつ表現ひょうげんするべつ方法ほうほうとして、シーケンスロゴ英語えいごばんもちいられる。シーケンスロゴはコンセンサス配列はいれつ画像がぞうてき表現ひょうげんであり、特定とくてい位置いちにおけるヌクレオチド(もしくはアミノ酸あみのさん)の頻度ひんどがそのシンボルのサイズによって表現ひょうげんされる。よりおお保存ほぞんされているざんもとは、よりおおきなシンボルでえがかれ、頻度ひんどひくいものはちいさなシンボルでえがかれる。シーケンスロゴはWebLogoGestalt Workbenchもちいることで生成せいせいすることができる[2]

ソフトウェア[編集へんしゅう]

バイオインフォマティクスのツールでコンセンサス配列はいれつ計算けいさん視覚しかくすることができる。JalViewやUGENEなどのツールがある。

出典しゅってん[編集へんしゅう]

  1. ^ Pierce, Benjamin A. 2002. Genetics : A Conceptual Approach. 1st ed. New York: W.H. Freeman and Co.
  2. ^ a b Schneider TD (2002). “Consensus Sequence Zen”. Appl Bioinform 1 (3): 111–119. PMC 1852464. PMID 15130839. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1852464/. 

関連かんれん項目こうもく[編集へんしゅう]