タンパク質たんぱくしつ構造こうぞう予測よそく

構成こうせいアミノ酸あみのさんを分析ぶんせきして、タンパク質たんぱくしつの二に次じ、三さん次じ、四よん次じ構造こうぞうを予測よそくすることができる。

タンパク質たんぱくしつ構造こうぞう予測よそく （たんぱくしつこうぞうよそく、英えい: protein structure prediction）は、タンパク質たんぱくしつについてそのアミノ酸あみのさん配列はいれつをもとに3次元じげん構造こうぞう（立体りったい配はい座ざ）を推定すいていすることであり、バイオインフォマティクスおよび計算けいさん化学かがくにおける研究けんきゅう分野ぶんやの一ひとつである。専門せんもん的てきな言葉ことばでは「タンパク質たんぱくしつの一いち次じ構造こうぞうをもとに二に次じ構造こうぞうや三さん次じ構造こうぞうを予測よそくすること」と表現ひょうげんできる。構造こうぞう予測よそくは、逆ぎゃく問題もんだいであるタンパク質たんぱくしつ設計せっけいとは異ことなる。タンパク質たんぱくしつのアミノ酸あみのさん配列はいれつは一いち次じ構造こうぞうと呼よばれる。タンパク質たんぱくしつのアミノ酸あみのさん配列はいれつは、その遺伝子いでんしが記録きろくされたDNAの塩基えんき配列はいれつから、遺伝いでんコード（コドン）の対応たいおう表ひょうに基もとづいて、導出どうしゅつすることができる。生体せいたい内ないにおいて、ほとんどのタンパク質たんぱくしつの一いち次じ構造こうぞうは一意的いちいてきに3次元じげん構造こうぞう（三さん次じ構造こうぞう、コンフォメーション）を形成けいせいする。これをタンパク質たんぱくしつが折おりたたまれる（フォールディング）という。タンパク質たんぱくしつの3次元じげん構造こうぞうを知しることは、そのタンパク質たんぱくしつの機能きのうを理解りかいする上じょうで有力ゆうりょくな手てがかりとなる。医学いがく（例れい：医薬品いやくひん設計せっけい）や、バイオテクノロジー（例れい：新あたらしい酵素こうその設計せっけい）において重要じゅうような役割やくわりを果はたしている。

タンパク質たんぱくしつ構造こうぞう予測よそくにおいては多おおくの手法しゅほうが考案こうあんされている。それぞれの手法しゅほうの性能せいのうは、2年ねんごとにCASP実験じっけんが行おこなわれ、評価ひょうかされている。タンパク質たんぱくしつ構造こうぞう予測よそくウェブサーバの継続けいぞく的てきな評価ひょうかは、コミュニティプロジェクトCAMEO3D（英語えいご版ばん）によって行おこなわれている。

概要がいよう[編集へんしゅう]

現在げんざいではタンパク質たんぱくしつ構造こうぞう予測よそくが果はたす役割やくわりは、これまで以上いじょうに重要じゅうようになっている。近年きんねん、ヒトゲノム計画けいかくなどDNAの塩基えんき配列はいれつを解読かいどくする大だい規模きぼなプロジェクトが盛さかんに行おこなわれるようになってきている。こうしたプロジェクトの成果せいかであるDNA塩基えんき配列はいれつのデータから、遺伝いでんコードの対応たいおう表ひょうに基もとづいて、非常ひじょうに多おおくのタンパク質たんぱくしつのアミノ酸あみのさん配列はいれつのデータを導出どうしゅつすることができる。公共こうきょうの配列はいれつデータベース（GenBankやSwiss-Protなど）に蓄積ちくせきされるアミノ酸あみのさん配列はいれつのデータは急速きゅうそくに増大ぞうだいしているが、現在げんざいのところ、実験じっけんによる方法ほうほうで決定けっていされたタンパク質たんぱくしつ構造こうぞうデータの増加ぞうかペースはあまり高たかくない。実験じっけんによる方法ほうほうでタンパク質たんぱくしつ構造こうぞうを決定けっていする作業さぎょうでは、X線せん回折かいせつや核かく磁気じき共鳴きょうめい（NMR）のような時間じかんがかかり費用ひようを要ようする手法しゅほうを使つかうことが多おおい。そのため、この項目こうもくで説明せつめいする予測よそくによる方法ほうほうでタンパク質たんぱくしつ構造こうぞうを解明かいめいすることが多おおく行おこなわれている。

しかしタンパク質たんぱくしつ構造こうぞうの予測よそくは非常ひじょうに難むずかしい。その背景はいけいには、次つぎに述のべるような多おおくの要因よういんがある。

タンパク質たんぱくしつがとる可能かのう性せいがある構造こうぞうの数かずは、膨大ぼうだいである（レヴィンタールのパラドックス）。
タンパク質たんぱくしつ構造こうぞうの安定あんてい性せいに関かんする物理ぶつり学がく的てきな基盤きばんが、あまり理解りかいされていない。
一部いちぶのタンパク質たんぱくしつでは、その一いち次じ構造こうぞうのみで三さん次じ構造こうぞうを決定けっていできないことがある。例たとえば、シャペロンという名前なまえで知しられる一群いちぐんのタンパク質たんぱくしつは、別べつのタンパク質たんぱくしつが正まさしく折おりたたむ（三さん次じ構造こうぞうをとる）のを助たすける。
分子ぶんし動力どうりょく学がく法ほう（MD法ほう）のような手法しゅほうでタンパク質たんぱくしつの折おりたたみを直接ちょくせつシミュレートすることは、実際じっさい的てきな理由りゆうおよび理論りろん的てきな理由りゆうから、一般いっぱん的てきには扱あつかいにくい。

このような困難こんなんはあるが、タンパク質たんぱくしつ構造こうぞう予測よそくに関心かんしんを持もつ多おおくの研究けんきゅうグループにより、数すう多おおくの進歩しんぽがなされてきている。小ちいさなタンパク質たんぱくしつの構造こうぞう予測よそくについては、現在げんざいでは手法しゅほうが確立かくりつしている。さまざまな手法しゅほうでタンパク質たんぱくしつの構造こうぞう予測よそくが日常にちじょう的てきに行おこなわれるようになっている。タンパク質たんぱくしつ構造こうぞう予測よそくの手法しゅほうは、de novoモデリングと比較ひかくモデリングの2つに大おおきく分類ぶんるいすることができる。

タンパク質たんぱくしつの構造こうぞうと用語ようご[編集へんしゅう]

タンパク質たんぱくしつは、アミノ酸あみのさんがペプチド結合けつごうでつながった鎖くさりである。この鎖くさりは、各かくαあるふぁ炭素たんそ原子げんし（Cαあるふぁ原子げんし）を中心ちゅうしんに回転かいてんするため、多おおくのコンフォメーション（立体りったい構造こうぞう）が可能かのうである。タンパク質たんぱくしつの三さん次元じげん構造こうぞうの違ちがいは、このようなコンフォメーション変化へんかによるものである。鎖くさり内ないの各かくアミノ酸あみのさんは極性きょくせいを持もっている。つまり、正せいと負まけの電荷でんかを持もつ領域りょういきが分わかれており、水素すいそ結合けつごうのアクセプターとなる遊離ゆうりカルボニル基もとと、水素すいそ結合けつごうのドナーとなるNH基もとを持もっている。そのため、これらの基もとはタンパク質たんぱくしつの構造こうぞうの中なかで相互そうご作用さようすることができる。20種類しゅるいのアミノ酸あみのさんは^[どれ?]、構造こうぞう的てきにも重要じゅうような役割やくわりを果はたす側がわ鎖くさりの化学かがく的てき性質せいしつによって分類ぶんるいできる。グリシンは、最もっとも小ちいさい側がわ鎖くさりを持もち、水素すいそ原子げんしが1つしかないため、タンパク質たんぱくしつ構造こうぞうの局所きょくしょ的てきな柔軟じゅうなん性せいを高たかめることができるという特別とくべつな立場たちばにある。一方いっぽう、システインは別べつのシステイン残ざん基もとと反応はんのうして構造こうぞう全体ぜんたいを安定あんてい化かさせる架橋かきょうを形成けいせいすることができる^{[要よう出典しゅってん]}。

タンパク質たんぱくしつの構造こうぞうは、αあるふぁヘリックスやβべーたシートなどの二に次じ構造こうぞう的てき要素ようその並ならびと考かんがえることができ、これらの要素ようそが組くみ合あわさってタンパク質たんぱくしつ鎖くさりの全体ぜんたい的てきな立体りったい構造こうぞうを構成こうせいしている。このような二に次じ構造こうぞうでは、隣接りんせつするアミノ酸あみのさん間あいだで水素すいそ結合けつごうの規則きそく的てきパターンが形成けいせいされ、アミノ酸あみのさんのΦふぁい角かくとΨぷさい角かく^{[要よう説明せつめい]}は類似るいじしている^{[要よう出典しゅってん]}。

これらの構造こうぞうの形成けいせいは、各かくアミノ酸あみのさんの極性きょくせい基もとを中和ちゅうわする。二に次じ構造こうぞうは、疎水そすい性せい環境かんきょうのタンパク質たんぱくしつコアにしっかりと詰つめ込こまれている。各かくアミノ酸あみのさん側がわ鎖くさりが占有せんゆうする体積たいせきは限かぎられており、近ちかくにある他ほかの側がわ鎖くさりとの相互そうご作用さようの数かずも限かぎられているため、分子ぶんしモデリングやアライメントの際さいにはこの状況じょうきょうを考慮こうりょする必要ひつようがある^[1]。

αあるふぁヘリックス[編集へんしゅう]

詳細しょうさいは「αあるふぁヘリックス」を参照さんしょう

αあるふぁヘリックスは、タンパク質たんぱくしつの二に次じ構造こうぞうの中なかで最もっとも多おおく存在そんざいするタイプである。αあるふぁヘリックスは、1ターンあたり3.6個このアミノ酸あみのさんを持もち、4番目ばんめの残ざん基もとごとに水素すいそ結合けつごうが形成けいせいされている。平均へいきん的てきな長ながさは10アミノ酸あみのさん（3ターン）または10Åだが、5～40（1.5～11ターン）とばらつきがある。水素すいそ結合けつごうが整列せいれつすることで、ヘリックスに双極そうきょく子こモーメントが生しょうじ、その結果けっか、ヘリックスのアミノ末端まったんに部分ぶぶん的てきな正せい電荷でんかが生しょうじる。この領域りょういきには遊離ゆうりNH2基もとがあるため、リン酸さん塩しおなどの負まけの電荷でんかを持もつ基もとと相互そうご作用さようする。αあるふぁヘリックスは、タンパク質たんぱくしつコアの表面ひょうめんに最もっとも多おおく存在そんざいし、そこは水性すいせい環境かんきょうとの界面かいめんとなっている。らせんの内側うちがわに面めんする側がわは疎水そすい性せいアミノ酸あみのさんが、外側そとがわに面めんする側がわは親水しんすい性せいアミノ酸あみのさんが存在そんざいする傾向けいこうがある。このように、4つのアミノ酸あみのさんのうち3分ぶんの1ずつが疎水そすい性せいになる傾向けいこうがあり、このパターンは容易よういに見みつけることができる。ロイシンジッパーモチーフでは、隣接りんせつする2つのヘリックスの向むかい合あう面めんにあるロイシンの繰くり返かえしパターンがモチーフの予測よそくに大おおきく影響えいきょうしている。ヘリカルホイール（英語えいご版ばん）プロットを使用しようして、この繰くり返かえしパターンを示しめすことができる。タンパク質たんぱくしつコアや細胞さいぼう膜まくに埋うずもれている他ほかのαあるふぁヘリックスは、疎水そすい性せいアミノ酸あみのさんの分布ぶんぷがより高たかく、規則きそく的てきであり、そのような構造こうぞうの予測よそくが可能かのうである。表面ひょうめんに露出ろしゅつしたヘリックスは、疎水そすい性せいアミノ酸あみのさんの割合わりあいが低ひくい。アミノ酸あみのさんの含有がんゆう量りょうは、αあるふぁヘリックス領域りょういきを予測よそくすることができる。アラニン(A)、グルタミン酸ぐるたみんさん(E)、ロイシン(L)、メチオニン(M)に富とみ、プロリン(P)、グリシン(G)、チロシン(Y)、セリン(S)に乏とぼしい領域りょういきは、αあるふぁヘリックスを形成けいせいさせる傾向けいこうがある。プロリンは、αあるふぁヘリックスを不安定ふあんていにしたり破壊はかいしたりするが、より長ながいヘリックスに存在そんざいし、屈曲くっきょく部ぶを形成けいせいすることもある。

βべーたシート[編集へんしゅう]

詳細しょうさいは「βべーたシート」を参照さんしょう

βべーたシートは、鎖くさりの一部分いちぶぶんにある平均へいきん5～10個この連続れんぞくしたアミノ酸あみのさんと、その先さきにある別べつの5～10個このアミノ酸あみのさんとの間あいだの水素すいそ結合けつごうによって形成けいせいされる。相互そうご作用さようする領域りょういきは、隣接りんせつしていて間あいだに短みじかいループがある場合ばあいもあれば、離はなれていてその間あいだに他たの構造こうぞうが存在そんざいする場合ばあいもある。すべての鎖くさりが同おなじ方向ほうこうに走はしって平行へいこうシートを形成けいせいしたり、他たのすべての鎖くさりが化学かがく的てきに逆ぎゃく方向ほうこうに走はしって反はん平行へいこうシートを形成けいせいしたり、または鎖くさりが平行へいこうおよび反はん平行へいこうに走はしって混合こんごうシートを形成けいせいしてもよい。平行へいこう型がたと反はん平行へいこう型がたでは、水素すいそ結合けつごうのパターンは異ことなっている。シートの内部ないぶストランドの各かくアミノ酸あみのさんは隣接りんせつするアミノ酸あみのさんと2つの水素すいそ結合けつごうを形成けいせいするのに対たいし、外部がいぶストランドの各かくアミノ酸あみのさんは内部ないぶストランドと1つの結合けつごうしか形成けいせいしない。ストランドに対たいして直角ちょっかくにシートを横切よこぎって見みたとき、より離はなれたストランドがわずかに反はん時計とけい回まわりに回転かいてんして、左巻ひだりまきのねじれを形成けいせいしている。Cαあるふぁ原子げんしはプリーツ構造こうぞうのシートの上下じょうげに交互こうごに配置はいちされ、アミノ酸あみのさんのR側がわ基もとはプリーツの上下じょうげに交互こうごに配置はいちされる。シート中ちゅうのアミノ酸あみのさんのΦふぁい角かくとΨぷさい角かくは、ラマチャンドランプロットの1つの領域りょういきで大おおきく変化へんかする。βべーたシートの位置いちを予測よそくすることは、αあるふぁへリックスよりも困難こんなんである。多重たじゅう整列せいれつにおけるアミノ酸あみのさんのバリエーションを考慮こうりょすると、状況じょうきょうは多少たしょう改善かいぜんされる。

ループ[編集へんしゅう]

タンパク質たんぱくしつの一部いちぶは固定こていした立体りったい構造こうぞうを持もっているが、規則きそく的てきな構造こうぞうは形成けいせいしていない。これらを、タンパク質たんぱくしつの無秩序むちつじょな部分ぶぶんや折おりたたまれていない部分ぶぶん、あるいはランダムコイル（固定こていされた三さん次元じげん構造こうぞうを持もたない折おりたたまれていないポリペプチド鎖くさり）と混同こんどうしてはならない。これらの部分ぶぶんは、βべーたシートとαあるふぁへリックスをつなぐことから、しばしば「ループ」と呼よばれている。ループは通常つうじょう、タンパク質たんぱくしつの表面ひょうめんに位置いちしているため、その残ざん基もとは容易よういに突然変異とつぜんへんいが許ゆるされる。配列はいれつアライメントの特定とくていの領域りょういきで、置換ちかん、挿入そうにゅう、削除さくじょの数かずが多おおいことは、ループの兆候ちょうこうである可能かのう性せいがある。ゲノムDNA上じょうのイントロンの位置いちは、コード化かされたタンパク質たんぱくしつのループの位置いちと相関そうかんしている可能かのう性せいがある^{[要よう出典しゅってん]}。ループはまた、荷電かでんアミノ酸あみのさんと極性きょくせいアミノ酸あみのさんを持もつ傾向けいこうがあり、しばしば活性かっせい部位ぶいの構成こうせい要素ようそとなる。

タンパク質たんぱくしつの分類ぶんるい[編集へんしゅう]

タンパク質たんぱくしつは、構造こうぞう的てき類似るいじ性せいと配列はいれつ類似るいじ性せいの両方りょうほうに従したがって分類ぶんるいできる。構造こうぞう分類ぶんるいでは、上述じょうじゅつの二に次じ構造こうぞうの大おおきさや空間くうかん的てき配置はいちを、既知きちの三さん次元じげん構造こうぞうの中なかで比較ひかくする。歴史れきし的てきには、配列はいれつの類似るいじ性せいに基もとづく分類ぶんるいが最初さいしょに使用しようされた。最初さいしょに、全ぜん配列はいれつのアライメントに基もとづく類似るいじ性せいによる分類ぶんるいが実施じっしされた。その後ご、保存ほぞんアミノ酸あみのさんパターンの出現しゅつげんに基もとづいてタンパク質たんぱくしつが分類ぶんるいされた。これらの方式ほうしきでタンパク質たんぱくしつを分類ぶんるいしたデータベースが利用りようできる。タンパク質たんぱくしつの分類ぶんるい方法ほうほうを検討けんとうする際さいには、いくつかの点てんに留意りゅういする必要ひつようがある。第だい一いちに、異ことなる進化しんかの起源きげんからの全まったく異ことなるタンパク質たんぱくしつ配列はいれつは、同おなじような構造こうぞうに折おりたたまれる可能かのう性せいがある。逆ぎゃくに、特定とくていの構造こうぞうを持もつ古代こだい遺伝子いでんしの配列はいれつは、同おなじ基本きほん的てきな構造こうぞう的てき特徴とくちょうを維持いじしながらも、異ことなる種たねで大おおきく分岐ぶんきしている可能かのう性せいがある。このような場合ばあい、残のこっている配列はいれつの類似るいじ性せいを認識にんしきすることは、非常ひじょうに困難こんなんな作業さぎょうとなる可能かのう性せいがある。第だい二にに、互たがいにあるいは第だい3の配列はいれつとかなりの程度ていどで配列はいれつ類似るいじ性せいを共有きょうゆうする2つのタンパク質たんぱくしつも、進化しんか的てき起源きげんを共有きょうゆうし、いくつかの構造こうぞう的てき特徴とくちょうも共有きょうゆうしていると考かんがえられている。しかし、進化しんかの過程かていで遺伝子いでんし重複じゅうふくや遺伝子いでんし再さい編成へんせいが起おこると、新あたらしい遺伝子いでんしのコピーが生うまれ、それが新あたらしい機能きのうや構造こうぞうを持もつタンパク質たんぱくしつに進化しんかすることがある^[1]。

タンパク質たんぱくしつの構造こうぞうや配列はいれつを分類ぶんるいするための用語ようご[編集へんしゅう]

タンパク質たんぱくしつ間あいだの進化しんかと構造こうぞうの関係かんけいについてより一般いっぱん的てきに使用しようされる用語ようごを以下いかに示しめす。この他ほかにも、タンパク質たんぱくしつのさまざまな種類しゅるいの構造こうぞう上じょうの特徴とくちょうを表あらわす、多おおくの追加ついか用語ようごが使つかいられる。このような用語ようごの説明せつめいは、CATH Webサイト、タンパク質たんぱくしつ立体りったい構造こうぞう分類ぶんるいデータベース（SCOP）Webサイト、スイスのバイオインフォマティクスExpasy Webサイトに掲載けいさいされているグラクソ・ウエルカムチュートリアルなどに掲載けいさいされている。

活性かっせい部位ぶい: 化学かがく的てきに特異とくい的てきな基質きしつと相互そうご作用さようすることができ、タンパク質たんぱくしつに生物せいぶつ学がく的てき活性かっせいを与あたえる、三さん次じ構造こうぞう（三さん次元じげん）または四よん次じ構造こうぞう（タンパク質たんぱくしつサブユニット）内ないのアミノ酸あみのさん側がわ鎖くさりの局所きょくしょ的てきな組くみ合あわせのこと。全まったく異ことなるアミノ酸あみのさん配列はいれつのタンパク質たんぱくしつは、同おなじ活性かっせい部位ぶいを持もつ構造こうぞうに折おりたたまれることがある。
アーキテクチャ: 三さん次元じげん構造こうぞうにおける二に次じ構造こうぞうの相対そうたい的てきな向むきであり、類似るいじのループ構造こうぞうを共有きょうゆうしているかどうかに関かかわらず表あらわしたもの。
折おりたたみ（トポロジー）: 保存ほぞんループ構造こうぞうを持もつアーキテクチャの一種いっしゅ。
ブロック: タンパク質たんぱくしつファミリーの保存ほぞんアミノ酸あみのさん配列はいれつパターン。そのパターンには、表現ひょうげんされた配列はいれつ上じょうの各かく位置いちにマッチする可能かのう性せいのある一連いちれんのものが含ふくまれているが、パターンにも配列はいれつにも挿入そうにゅうや削除さくじょの位置いちはない。対照たいしょう的てきに、配列はいれつプロファイルは、挿入そうにゅうや削除さくじょを含ふくむ類似るいじのパターンの集あつまりを表あらわすスコアリングマトリックスの一種いっしゅである。
クラス（英語えいご版ばん）: タンパク質たんぱくしつドメインを、二に次じ構造こうぞうの内容ないようや構成こうせいに応おうじて分類ぶんるいするための用語ようご。LevittとChothia (1976)によって4つのクラス（英語えいご版ばん）が最初さいしょに認識にんしきされ、他ほかにもいくつかのクラスがSCOPデータベースに追加ついかされている。CATHデータベースでは、All-αあるふぁ、All-βべーた、αあるふぁ-βべーたの3つのクラスがあり、αあるふぁ-βべーたクラスには交互こうご型がたのαあるふぁ/βべーた構造こうぞうと分離ぶんり型がたのαあるふぁ+βべーた構造こうぞうの両方りょうほうが含ふくまれる。
コア: 折おりたたまれたタンパク質たんぱくしつ分子ぶんしのうち、αあるふぁヘリックスとβべーたシートの疎水そすい性せい内部ないぶを構成こうせいする部分ぶぶん。コンパクトな構造こうぞうにより、アミノ酸あみのさんの側がわ鎖くさりが十分じゅうぶんに接近せっきんしているため、相互そうご作用さようすることができる。SCOPデータベースのようにタンパク質たんぱくしつ構造こうぞうを比較ひかくする場合ばあい、コアとは、共通きょうつうのフォールドを持もつ、または同おなじスーパーファミリーにあるほとんどの構造こうぞうに共通きょうつうする領域りょういきである。構造こうぞう予測よそくでは、進化しんかの過程かていで保存ほぞんされる可能かのう性せいの高たかい二に次じ構造こうぞうの配列はいれつをコアと定義ていぎすることがある。
ドメイン（配列はいれつの文脈ぶんみゃく）: ポリペプチド鎖くさり上じょうの他ほかのセグメントの存在そんざいにかかわらず、三さん次元じげん構造こうぞうに折おりたたむことができるポリペプチド鎖くさりのセグメント。あるタンパク質たんぱくしつの別個べっこのドメインは、広範囲こうはんいに渡わたって相互そうご作用さようすることもあれば、ポリペプチド鎖くさりの長ながさのみで結合けつごうすることもある。複数ふくすうのドメインを持もつタンパク質たんぱくしつは、異ことなる分子ぶんしとの機能きのう的てきな相互そうご作用さようのために、これらのドメインを使用しようする場合ばあいがある。
ファミリー（配列はいれつの文脈ぶんみゃく）: 整列せいれつさせたときに50％以上いじょうの同一どういつ性せいがある生化学せいかがく的てき機能きのうが類似るいじしたタンパク質たんぱくしつのグループ。この判断はんだん基準きじゅんは、現在げんざいもタンパク質たんぱくしつ情報じょうほう資源しげん（英語えいご版ばん）（PIR）で使用しようされている。タンパク質たんぱくしつファミリーは、異ことなる生物せいぶつで同おなじ機能きのうを持もつタンパク質たんぱくしつ（オーソロガス配列はいれつ）で構成こうせいされているが、遺伝子いでんしの重複じゅうふくや再さい配列はいれつに由来ゆらいする同どう一いち生物せいぶつのタンパク質たんぱくしつ（パラロガス配列はいれつ）が含ふくまれる場合ばあいもある。あるタンパク質たんぱくしつファミリーの多重たじゅう整列せいれつの結果けっか、タンパク質たんぱくしつの長ながさ全体ぜんたいで共通きょうつうレベルの類似るいじ性せいが見みられる場合ばあい、PIRはそのファミリーを相あい同どうファミリーと呼よんでいる。整列せいれつした領域りょういきは相あい同どうドメインと呼よばれ、この領域りょういきは他たのファミリーと共有きょうゆうされるいくつかの小ちいさな相あい同どうドメインから構成こうせいされている場合ばあいがある。ファミリーは、配列はいれつ類似るいじ性せいの高こうレベルまたは低ていレベルに基もとづいて、さらにサブファミリーに細分さいぶん化かされたり、スーパーファミリーにグループ化かされる。SCOPデータベースでは1296ファミリーが、CATHデータベース（バージョン1.7ベータ版ばん）では1846ファミリーが報告ほうこくされている。:同おなじ機能きのうを持もつタンパク質たんぱくしつの配列はいれつを詳くわしく調しらべると、類似るいじ性せいが高たかい配列はいれつを共有きょうゆうしているものがある。上記じょうきの基準きじゅんでは、これらは明あきらかに同おなじファミリーの一員いちいんである。しかし、他たのファミリーメンバーとの配列はいれつの類似るいじ性せいがほとんどないか、あるいはわずかであるものも見みられる。このような場合ばあい、2つの遠縁とおえんのファミリーメンバーAとCの間あいだのファミリー関係かんけいは、AとCの両方りょうほうに有意ゆういな類似るいじ性せいを共有きょうゆうする追加ついかのファミリーメンバーBを見みつけることによって説明せつめいされることがよくある。このように、BはAとCの間あいだをつなぐ役割やくわりを果はたす。もう一ひとつの方法ほうほうは、遠とおくのアライメントを調しらべて、保存ほぞん度どが高たかい一致いっちを探さがすことである。; 同一どういつ性せいレベルが50％の場合ばあい、タンパク質たんぱくしつは同おなじ三さん次元じげん構造こうぞうを持もつ可能かのう性せいが高たかく、配列はいれつアライメントの同一どういつの原子げんしは構造こうぞうモデルにおいても約やく1Åの範囲はんいで重かさなり合あう。このように、あるファミリーで1つ目めのメンバーの構造こうぞうがわかっていれば、そのファミリーの別べつのメンバーについても信頼しんらい性せいの高たかい立体りったい構造こうぞうを予測よそくできる可能かのう性せいがあり、同一どういつ性せいレベルが高たかいほど、その予測よそくの信頼しんらい性せいは高たかくなる。タンパク質たんぱくしつの構造こうぞうモデリングは、アミノ酸あみのさんの置換ちかんが三さん次元じげん構造こうぞうのコアにどれだけ適合てきごうするかを調しらべることで行おこなうことができる。
ファミリー（構造こうぞうの文脈ぶんみゃく）: FSSPデータベース（構造こうぞう類似るいじタンパク質たんぱくしつファミリーのデータベース）やDALI/FSSP Webサイトで使用しようされているように、構造こうぞう的てきに有意ゆういなレベルで類似るいじしているが、必かならずしも有意ゆういな配列はいれつの類似るいじ性せいを持もたない2つの構造こうぞう。
折おりたたみ（フォールディング）: 構造こうぞうモチーフと同様どうようで、同おなじ構成こうせいの二に次じ構造こうぞう単位たんいのより大おおきな組くみ合あわせを含ふくむ。このように、同おなじ折おりたたみを持もつタンパク質たんぱくしつは、二に次じ構造こうぞうの組くみ合あわせが同おなじで、同おなじようなループで結むすばれている。例たとえば、いくつかの交互こうごαあるふぁヘリックスと平行へいこうβべーた-ストランドからなるロスマンフォールドがあげられる。SCOP、CATH、FSSPのデータベースでは、既知きちのタンパク質たんぱくしつ構造こうぞうが、構造こうぞうの複雑ふくざつさに応おうじて階層かいそう的てきに分類ぶんるいされていて、その基本きほんレベルは「フォールド（折おりたたみ）」が用もちいられている。
相あい同どうドメイン（配列はいれつの文脈ぶんみゃく）: 一般いっぱん的てきに配列はいれつアラインメント法ほうによって見出みいだされる拡張かくちょう配列はいれつパターン。これは、整列せいれつされた配列はいれつ間あいだにおける共通きょうつうの進化しんか的てき起源きげんを示しめす。相あい同どうドメインは一般いっぱん的てきにモチーフよりも長ながい。ドメインは、与あたえられたタンパク質たんぱくしつ配列はいれつのすべてを含ふくむこともあれば、配列はいれつの一部いちぶのみを含ふくむ場合ばあいもある。ドメインの中なかには複雑ふくざつなものもあり、進化しんかの過程かていでいくつかの小ちいさな相あい同どうドメインが結合けつごうして大おおきなドメインになったものもある。配列はいれつ全体ぜんたいをカバーするドメインは、PIR（タンパク質たんぱくしつ情報じょうほう資源しげん（英語えいご版ばん））によって相あい同どうドメインと呼よばれている。
モジュール: 1つまたは複数ふくすうのモチーフからなる保存ほぞんアミノ酸あみのさんパターンの領域りょういきで、構造こうぞうまたは機能きのうの基本きほん単位たんいと考かんがえられているもの。モジュールの存在そんざいは、タンパク質たんぱくしつをファミリーに分類ぶんるいするのにも使用しようされている。
モチーフ（配列はいれつの文脈ぶんみゃく）: 2つ以上いじょうのタンパク質たんぱくしつに見みられる、保存ほぞんアミノ酸あみのさんパターン。Prositeカタログ（英語えいご版ばん）では、モチーフとは、生化学せいかがく的てきに同おなじような活性かっせいを持もつタンパク質たんぱくしつのグループに見みられるアミノ酸あみのさんパターンで、多おおくの場合ばあい、タンパク質たんぱくしつの活性かっせい部位ぶいの近ちかくにある。配列はいれつモチーフデータベースの例れいとしては、PrositeカタログやStanford Motifs Databaseなどがある^[2]。
モチーフ（構造こうぞうの文脈ぶんみゃく）: ポリペプチド鎖くさりの隣接りんせつする部分ぶぶんが特定とくていの三さん次元じげん構造こうぞうに折おりたたまれることによって生しょうじる、いくつかの二に次じ構造こうぞう要素ようその組くみ合あわせである。たとえば、ヘリックス-ループ-ヘリックスのモチーフがある。構造こうぞうモチーフは、超ちょう二に次じ構造こうぞうや超ちょう二に次じフォールドとも呼よばれる。
位置いち特異とくい的てきスコアリングマトリックス（英語えいご版ばん）（配列はいれつの文脈ぶんみゃく）: ギャップのない多重たじゅう整列せいれつにおける保存ほぞん領域りょういきを表あらわす。マトリックスの各かく列れつは、多重たじゅう整列せいれつの1列れつに見みられるバリエーションを表あらわす。ウェイトマトリックスまたはスコアリングマトリックスとも呼よばれる。
位置いち特異とくい的てきスコアリングマトリックス-3D （構造こうぞうの文脈ぶんみゃく）: 同おなじ構造こうぞうクラスに分類ぶんるいされるタンパク質たんぱくしつのアライメントに見みられるアミノ酸あみのさんのバリエーションを表あらわす。マトリックスの列れつは、整列せいれつした構造こうぞう体たいの1つのアミノ酸あみのさん位置いちで見みつかったアミノ酸あみのさんのバリエーションを表あらわしている。
プロファイル（英語えいご版ばん）（配列はいれつの文脈ぶんみゃく）: タンパク質たんぱくしつファミリーの多重たじゅう整列せいれつを表あらわすスコアリングマトリックス。プロファイルは、通常つうじょう、多重たじゅう整列せいれつの中なかで「よく保存ほぞんされた領域りょういき」から取得しゅとくされる。プロファイルはマトリックスの形式けいしきで、各かく列れつはアライメント内ないの位置いちを表あらわし、各行かくこうはアミノ酸あみのさんの1つを表あらわす。マトリックスの値ねは、各かくアミノ酸あみのさんがアライメントの対応たいおうする位置いちにある可能かのう性せいを示しめす。プロファイルはターゲット配列はいれつに沿そって移動いどうされ、動的どうてき計画けいかく法ほうアルゴリズムによって最良さいりょうのスコアリング領域りょういきを見みつだす。マッチング時じのギャップは許容きょようされており、このケースにはアミノ酸あみのさんがマッチしなかった場合ばあいの負まけのスコアであるギャップペナルティが含ふくまれる。配列はいれつプロファイルは、隠かくれマルコフモデルで表あらわすこともでき、プロファイルHMMと呼よばれる。
プロファイル（構造こうぞうの文脈ぶんみゃく）: 既知きちのタンパク質たんぱくしつ構造こうぞうの連続れんぞくした位置いちに、どのアミノ酸あみのさんがうまく適合てきごうし、どのアミノ酸あみのさんがうまく適合てきごうしないのかを表あらわすスコアリングマトリックス。プロファイルの列れつは構造こうぞう内ないの連続れんぞくした位置いちを表あらわし、プロファイルの行くだりは20個このアミノ酸あみのさんを表あらわしている。配列はいれつプロファイルと同様どうように、構造こうぞうプロファイルもターゲット配列はいれつに沿そって移動いどうされ、動的どうてき計画けいかく法ほうアルゴリズムにより、可能かのうな限かぎり高たかいアライメントスコアを見みつだす。ギャップが含ふくまれ、ペナルティを受うける場合ばあいがある。得えられたスコアは、対象たいしょうとなるタンパク質たんぱくしつがそのような構造こうぞうをとる可能かのう性せいを示しめすものである。
一いち次じ構造こうぞう: タンパク質たんぱくしつの直ちょく鎖くさり状じょうのアミノ酸あみのさん配列はいれつのこと。化学かがく的てきには、アミノ酸あみのさんがペプチド結合けつごうで結合けつごうしたポリペプチド鎖くさりである。
二に次じ構造こうぞう: ポリペプチド鎖くさりを構成こうせいするアミノ酸あみのさんのC、O、NH基もと間あいだの相互そうご作用さようにより、αあるふぁヘリックス、βべーたシート、ターン、ループ、およびその他たの形態けいたいが形成けいせいされ、三さん次元じげん構造こうぞうへの折おりたたみが促進そくしんされること。
三さん次じ構造こうぞう: 三さん次じ構造こうぞうとは、ポリペプチド鎖くさりの二に次じ構造こうぞうが折おり重かさなってできた立体りったい的てきな構造こうぞうまたは球状きゅうじょうの構造こうぞうのこと^[1]。
四よん次じ構造こうぞう: 複数ふくすうの独立どくりつしたポリペプチド鎖くさりからなるタンパク質たんぱくしつ分子ぶんしの三さん次元じげん構造こうぞう。
スーパーファミリー: 遠とおく離はなれていても検出けんしゅつ可能かのうな配列はいれつ類似るいじ性せいによって関連かんれんしている、同おなじまたは異ことなる長ながさのタンパク質たんぱくしつファミリーのグループ。このように、あるスーパーファミリーのメンバーは、共通きょうつうの進化しんか的てき起源きげんを持もっている。もともとはDayhoffが、スーパーファミリーであることの判断はんだん基準きじゅんを、アライメントスコアに基もとづいて、配列はいれつが関連かんれんしていない可能かのう性せいが10 6であると定義ていぎした(Dayhoff et al. 1978)。配列はいれつアライメントの同一どういつ性せいが低ひくいタンパク質たんぱくしつでも、納得なっとくのゆく共通きょうつうの数かずの構造こうぞう的てきおよび機能きのう的てきな特徴とくちょうを持もっていれば、同おなじスーパーファミリーに分類ぶんるいされる。スーパーファミリータンパク質たんぱくしつは、三さん次元じげん構造こうぞうのレベルでは共通きょうつうの折おりたたみなどの構造こうぞう的てき特徴とくちょうを共有きょうゆうするが、二に次じ構造こうぞうの数かずや配置はいちが異ことなる場合ばあいもある。 PIRリソースでは、同相どうしょうスーパーファミリー（homeomorphic superfamily）という言葉ことばを使用しようして、配列はいれつの端はしから端はしまでを揃そろえることができ、単一たんいつの配列はいれつ相しょう同性どうせいドメイン（配列はいれつ全体ぜんたいに広ひろがる類似るいじ性せいのある領域りょういき）を共有きょうゆうしているスーパーファミリーのことを指さす。このドメインは、他たのタンパク質たんぱくしつファミリーやスーパーファミリーと共有きょうゆうされる、より小ちいさな相あい同性どうせいドメインから構成こうせいされている可能かのう性せいもある。あるタンパク質たんぱくしつの配列はいれつには、複数ふくすうのスーパーファミリーに属ぞくするドメインが含ふくまれている可能かのう性せいがあり、複雑ふくざつな進化しんかの歴史れきしを示しめしているが、多重たじゅう整列せいれつ全体ぜんたいの類似るいじ性せいが認みとめられれば、配列はいれつは1つの同相どうしょうスーパーファミリーにのみ割わり当あてられる。また、スーパーファミリーのアライメントには、アライメント内うちまたはアライメントの両りょう端はしで整列せいれつしない領域りょういきが含ふくまれる場合ばあいがある。対照たいしょう的てきに、同おなじファミリーの配列はいれつは、アラインメント全体ぜんたいを等ひとしてうまく整列せいれつする。

二に次じ構造こうぞうの予測よそく[編集へんしゅう]

詳細しょうさいは「:en:List of protein secondary structure prediction programs」を参照さんしょう

二に次じ構造こうぞう予測よそくとは、タンパク質たんぱくしつのアミノ酸あみのさん配列はいれつの知識ちしきのみに基もとづいて、タンパク質たんぱくしつの局所きょくしょ的てきな二に次じ構造こうぞうを予測よそくすることを目的もくてきとしたバイオインフォマティクスの一連いちれんの技術ぎじゅつである。タンパク質たんぱくしつの場合ばあい、予測よそくは、アミノ酸あみのさん配列はいれつの領域りょういきを、適当てきとうなαあるふぁヘリックス、βべーたストランド（しばしば「拡張かくちょう」コンフォメーションと呼よばれる）、ターンのいずれかに割わり当あてることで構成こうせいされる。予測よそくの成功せいこうは、タンパク質たんぱくしつの結晶けっしょう構造こうぞうに適用てきようされたDSSPアルゴリズム（または同様どうよう。例れい：STRIDE）の結果けっかと比較ひかくして判断はんだんされる。タンパク質たんぱくしつの膜まく貫通かんつうヘリックス（英語えいご版ばん）やコイルドコイルなど、明確めいかくに定義ていぎされた特定とくていのパターンを検出けんしゅつするために、特殊とくしゅなアルゴリズムが開発かいはつされている^[1]。

タンパク質たんぱくしつの二に次じ構造こうぞうを予測よそくする現代げんだいの最良さいりょうの方法ほうほうでは、機械きかい学習がくしゅうと配列はいれつアライメントを使用しようした後のち、80％の精度せいどに達たっすると主張しゅちょうされている^[3]。この高たかい精度せいどにより、予測よそく手法しゅほうは、折おりたたみ認識にんしき法ほうやde novo（ab initio）タンパク質たんぱくしつ構造こうぞう予測よそく、構造こうぞうモチーフの分類ぶんるい、および配列はいれつアライメントの精密せいみつ化かのための改善かいぜん機能きのうとして使用しようすることができる。現在げんざいのタンパク質たんぱくしつ二に次じ構造こうぞう予測よそく手法しゅほうの精度せいどは、LiveBench（英語えいご版ばん）やEVA（英語えいご版ばん）などのベンチマークで毎週まいしゅう評価ひょうかされている。

背景はいけい[編集へんしゅう]

1960年代ねんだいから1970年代ねんだい初頭しょとうに導入どうにゅうされた初期しょきの二に次じ構造こうぞう予測よそく法ほうは^[4]^[5]^[6]^[7]^[8]、可能かのう性せいの高たかいαあるふぁヘリックスを特定とくていすることに重点じゅうてんが置おかれ、主おもにらせん-コイル遷移せんいモデル（英語えいご版ばん）に基もとづいていた^[9]。1970年代ねんだいに登場とうじょうしたβべーたシートを含ふくむ、大幅おおはばに精度せいどの高たかい予測よそくは、既知きちの解明かいめい済ずみの構造こうぞうから得えられた確かく率りつパラメータに基もとづく統計とうけい的てき評価ひょうかに依存いぞんしていた。これらの手法しゅほうを1つの配列はいれつに適用てきようした場合ばあい、一般いっぱん的てきにはせいぜい60～65％程度ていどの精度せいどで、βべーたシートを過小かしょう評価ひょうかすることが多おおい^[1]。二に次じ構造こうぞうの進化しんか的てき保存ほぞんは、多重たじゅう整列せいれつで多数たすうの相あい同どう配列はいれつ（英語えいご版ばん）を同時どうじに評価ひょうかし、整列せいれつされたアミノ酸あみのさんの列れつの正味しょうみの二に次じ構造こうぞう傾向けいこうを計算けいさんすることで開発かいはつできる。既知きちのタンパク質たんぱくしつ構造こうぞうの大だい規模きぼなデータベースと、ニューラルネットやサポートベクターマシンなどの最新さいしんの機械きかい学習がくしゅう手法しゅほうを併用へいようすることで、これらの手法しゅほうは球状きゅうじょうタンパク質たんぱくしつにおいて総合そうごう的てきに80%の精度せいどを達成たっせいできる^[10]。精度せいどの理論りろん的てきな上限じょうげんは約やく90%であるが^[10]、これは二に次じ構造こうぞうの末端まったん付近ふきんでDSSPの割わり当あてが特異とくいになることが原因げんいんの一ひとつである。二に次じ構造こうぞうの末端まったん付近ふきんでは、ネイティブな状態じょうたいでは局所きょくしょ的てきな立体りったい構造こうぞうが変化へんかするが、結晶けっしょう中ちゅうではパッキングの制約せいやくにより単一たんいつの立体りったい構造こうぞうを取とることを余儀よぎなくされる場合ばあいがある。さらに、典型てんけい的てきな二に次じ構造こうぞう予測よそく法ほうでは、二に次じ構造こうぞうの形成けいせいに対たいする三さん次じ構造こうぞうの影響えいきょうを考慮こうりょしていない。たとえば、ヘリックスと予測よそくされた配列はいれつであっても、タンパク質たんぱくしつのβべーたシート領域りょういき内ないに位置いちし、その側がわ鎖くさりが隣接りんせつするものとうまく結合けつごうしていれば、βべーたストランド構造こうぞうをとることができる可能かのう性せいがある。また、タンパク質たんぱくしつの機能きのうや環境かんきょうに起因きいんする劇的げきてきな構造こうぞう変化へんかによっても、局所きょくしょ的てきな二に次じ構造こうぞうが変化へんかすることがある。

歴史れきし的てき展望てんぼう[編集へんしゅう]

現在げんざいまでに20種類しゅるい以上いじょうの二に次じ構造こうぞう予測よそく法ほうが開発かいはつされている。最初さいしょのアルゴリズムの1つはChou-Fasman法ほう（英語えいご版ばん）で、これは主おもに二に次じ構造こうぞうの種類しゅるいごとに各かくアミノ酸あみのさんが出現しゅつげんする相対そうたい的てきな頻度ひんどから決定けっていされる確かく率りつパラメータに依存いぞんしている^[11]。1970年代ねんだい半なかばに解析かいせきされた構造こうぞうの小ちいさなサンプルから決定けっていされたオリジナルのChou-Fasmanパラメータは、最初さいしょの発表はっぴょうからパラメータが更新こうしんされたものの、現代げんだいの手法しゅほうと比較ひかくして不十分ふじゅうぶんな結果けっかとなっている。Chou-Fasman法ほうは、二に次じ構造こうぞうの予測よそくにおいて、およそ50～60％の精度せいどである^[1]。

次つぎに注目ちゅうもくすべきは、情報じょうほう理論りろんに基もとづいたGOR法ほう（英語えいご版ばん）というプログラムである。これは、より強力きょうりょくな確かく率りつ的てき手法しゅほうであるベイズ推定すいていを使用しようする^[12]。GOR法ほうでは、各かくアミノ酸あみのさんが特定とくていの二に次じ構造こうぞうを持もつ確かく率りつだけでなく、隣接りんせつするアミノ酸あみのさんの寄与きよを考慮こうりょした上うえで、各かく構造こうぞうを持もつアミノ酸あみのさんの条件じょうけん付つき確かく率りつも考慮こうりょする（隣接りんせつするアミノ酸あみのさんが同おなじ構造こうぞうを持もつことは想定そうていされていない）。アミノ酸あみのさんの構造こうぞう的てき傾向けいこうは、プロリンやグリシンなどの少数しょうすうのアミノ酸あみのさんに対たいしてのみ強つよく現あらわれるため、このアプローチはChou-Fasmanのアプローチよりも感度かんどが高たかく、精度せいども高たかい。多おおくの隣接りんせつアミノ酸あみのさんのそれぞれからの弱よわい寄与きよが、全体ぜんたいとして強つよい効果こうかをもたらす可能かのう性せいがある。オリジナルのGOR法ほうの精度せいどは約やく65%で、βべーたシートよりもαあるふぁヘリックスの予測よそくで劇的げきてきな成功せいこうをおさめたが、βべーたシートはループや無秩序むちつじょな領域りょういきとしばしば誤認ごにんされた^[1]。

もう一ひとつの大おおきな進歩しんぽは、機械きかい学習がくしゅうの手法しゅほうを用もちいたことである。最初さいしょに人工じんこうニューラルネットワークの手法しゅほうが使つかわれた。トレーニングセットとして解明かいめいされた構造こうぞうを使用しようし、二に次じ構造こうぞうの特定とくていの配置はいちに関連かんれんする共通きょうつうの配列はいれつモチーフを識別しきべつする。これらの手法しゅほうは70％以上いじょうの精度せいどで予測よそくすることができるが、完全かんぜんなβべーたシートの配置はいちに必要ひつような拡張かくちょうコンフォメーション形成けいせいを助たすける水素すいそ結合けつごうパターンを評価ひょうかするための三さん次元じげん構造こうぞう情報じょうほうがないため、βべーたストランドの予測よそくが不十分ふじゅうぶんになることが多おおい。ニューラルネットワークを用もちいたタンパク質たんぱくしつの二に次じ構造こうぞう予測よそくプログラムとしては、PSIPRED（英語えいご版ばん）やJPRED（英語えいご版ばん）などが知しられている^[1]。次つぎに、サポートベクターマシン（SVM）は、統計とうけい的てき手法しゅほうでは特定とくていが困難こんなんなターンの位置いちを予測よそくするのに特とくに有効ゆうこうであることがわかっている^[13]^[14]。

機械きかい学習がくしゅう技術ぎじゅつを拡張かくちょうして、未み割わり当あて領域りょういきの主しゅ鎖くさりの二に面めん角かくなど、タンパク質たんぱくしつのよりきめ細こまかい局所きょくしょ的てき特性とくせいの予測よそくが試こころみられている。この問題もんだいには、SVM^[15]とニューラルネットワーク^[16]の両方りょうほうが適用てきようされている^[13]。最近さいきんでは、SPINE-Xを使つかって実じつ数値すうちのねじれ角かくを正確せいかくに予測よそくし、ab initio構造こうぞう予測よそくに用もちいることに成功せいこうしている^[17]。

その他たの改善かいぜん[編集へんしゅう]

二に次じ構造こうぞうの形成けいせいは、タンパク質たんぱくしつの配列はいれつに加くわえて、他たの要因よういんにも左右さゆうされることが報告ほうこくされている。たとえば、二に次じ構造こうぞうの傾向けいこうは、局所きょくしょ的てきな環境かんきょう^[18]、残ざん基もとの溶媒ようばいへのアクセス性せい^[19]、タンパク質たんぱくしつの構造こうぞうクラス^[20]、さらにはタンパク質たんぱくしつの由来ゆらいとなる生物せいぶつにも依存いぞんすることが報告ほうこくされている^[21]。このような考察こうさつに基もとづいて、タンパク質たんぱくしつの構造こうぞうクラス^[22]、残ざん基もとのアクセス可能かのうな表面積ひょうめんせき^[23]^[24]、さらには接触せっしょく数すう（英語えいご版ばん）の情報じょうほうを加くわえることで、二に次じ構造こうぞう予測よそくを改善かいぜんできることがいくつかの研究けんきゅうで示しめされている^[25]。

三さん次じ構造こうぞうの予測よそく[編集へんしゅう]

詳細しょうさいは「:en:homology modeling」および「:en:Threading (protein sequence)」を参照さんしょう

タンパク質たんぱくしつ構造こうぞう予測よそくの実用じつよう的てきな役割やくわりは、これまで以上いじょうに重要じゅうようになっている^[26]。ヒトゲノム計画けいかくなどの大だい規模きぼなDNA塩基えんき配列はいれつ解析かいせきにより、膨大ぼうだいな量りょうのタンパク質たんぱくしつ配列はいれつデータが作成さくせいされている。構造こうぞうゲノミクスにおけるコミュニティ全体ぜんたいの取とり組くみにもかかわらず、実験じっけん的てきに決定けっていされたタンパク質たんぱくしつの構造こうぞうは、通常つうじょう、時間じかんと費用ひようのかかるX線せん結晶けっしょう構造こうぞう解析かいせきやNMR分光ぶんこう法ほうによって得えられるものであり、タンパク質たんぱくしつの塩基えんき配列はいれつから得えられるものに比くらべてはるかに遅おくれているのが現状げんじょうである。

タンパク質たんぱくしつ構造こうぞう予測よそくは非常ひじょうに難むずかしく、未み解決かいけつの課題かだいである。主おもな問題もんだいは、タンパク質たんぱくしつの自由じゆうエネルギーの計算けいさんと、このエネルギーの全体ぜんたい的てきな最小さいしょう値ちを見みつける（英語えいご版ばん）ことの2つである。タンパク質たんぱくしつ構造こうぞう予測よそく法ほうは、天文学てんもんがく的てきに巨大きょだいなタンパク質たんぱくしつ構造こうぞうの可能かのう性せいのある空間くうかんを探索たんさくする必要ひつようがある。このような問題もんだいは、比較ひかくモデリングまたはホモロジーモデリング（英語えいご版ばん）と呼よばれるモデリングや折おりたたみ認識にんしき法ほうでは、部分ぶぶん的てきに回避かいひすることができる。この方法ほうほうでは、問題もんだいのタンパク質たんぱくしつが、別べつの相あい同どうタンパク質たんぱくしつの実験じっけん的てきに決定けっていされた構造こうぞうに近ちかい構造こうぞうを採用さいようしているという仮定かていで、探索たんさく空間くうかんが刈かり取とられる。一方いっぽう、de novoタンパク質たんぱくしつ構造こうぞう予測よそく手法しゅほうでは、これらの問題もんだいを明示めいじ的てきに解決かいけつする必要ひつようがある。タンパク質たんぱくしつ構造こうぞう予測よそくの進歩しんぽと課題かだいについては、Zhangによってレビューされている^[27]。

モデリング前ぜんステップ[編集へんしゅう]

Rosettaをはじめとするほとんどの三さん次じ構造こうぞうモデリング手法しゅほうは、単一たんいつのタンパク質たんぱくしつドメインの三さん次じ構造こうぞうをモデリングするために最適さいてき化かされている。タンパク質たんぱくしつを潜在せんざい的てきな構造こうぞうドメインに分割ぶんかつするために、通常つうじょう、ドメイン解析かいせきまたはドメイン境界きょうかい予測よそくと呼よばれるステップが最初さいしょに行おこなわれる。三さん次じ構造こうぞう予測よそくの他ほかの部分ぶぶんと同様どうように、これは既知きちの構造こうぞうから比較ひかくして行おこなうことも^[28]、配列はいれつのみを用もちいてab initio的てきに行おこなうこともできる（通常つうじょうは共きょう分散ぶんさんを利用りようした機械きかい学習がくしゅうによって行おこなう）^[29]。個々ここのドメインの構造こうぞうは、ドメインアセンブリと呼よばれるプロセスでドッキングされ、最終さいしゅう的てきな三さん次じ構造こうぞうを形成けいせいする^[30]^[31]。

タンパク質たんぱくしつのde novoモデリング[編集へんしゅう]

詳細しょうさいは「De novoタンパク質たんぱくしつ構造こうぞう予測よそく」を参照さんしょう

エネルギーベースおよびフラグメントベースの手法しゅほう[編集へんしゅう]

de novoまたはab initioのタンパク質たんぱくしつモデリング手法しゅほうは、「最初さいしょから」、つまり過去かこに解明かいめいされた構造こうぞうではなく（直接ちょくせつ）物理ぶつり的てきな原理げんりに基もとづいて、三さん次元じげんのタンパク質たんぱくしつモデルを構築こうちくすることを目的もくてきとしている。タンパク質たんぱくしつフォールディングを模倣もほうする方法ほうほうや、確かく率りつ的てき（英語えいご版ばん）手法しゅほうを用もちいて可能かのう性せいが高たかい解かいを探索たんさくする方法ほうほう（適切てきせつなエネルギー関数かんすうの大域たいいき的てき最適さいてき化か（英語えいご版ばん）など）など、さまざまな方法ほうほうが考案こうあんされている。これらの方法ほうほうは膨大ぼうだいなコンピュータ資源しげんを必要ひつようとするため、これまでは小ちいさなタンパク質たんぱくしつに対たいしてしか行おこなわれていなかった。大だい規模きぼなタンパク質たんぱくしつの構造こうぞうを新あらたに予測よそくするには、より優すぐれたアルゴリズムと、強力きょうりょくなスーパーコンピュータ（IBM Blue Gene、NEC SX、MDGRAPE-3など）や分散ぶんさん型がたコンピューティング（Folding@home、Rosetta@Home、ヒトプロテオーム・フォールディング・プロジェクト（英語えいご版ばん）など）が提供ていきょうする大だい規模きぼな計算けいさん資源しげんが必要ひつようになる。これらの計算けいさん上じょうの障壁しょうへきは広大こうだいなものであるが、構造こうぞうゲノミクスの潜在せんざい的てきな利益りえきのために（予測よそく法ほうまたは実験じっけん法ほうによる）、de novo（ab initio）構造こうぞう予測よそくは活発かっぱつな研究けんきゅう分野ぶんやとなっている^[27]。

2009年ねんの時点じてんで、50残ざん基もとのタンパク質たんぱくしつをスーパーコンピュータ上じょうで1ミリ秒びょうの間あいだ、原子げんしごとにシミュレートすることができる^[32]。2012年ねんの時点じてんでは、新あたらしいグラフィックカードとより洗練せんれんされたアルゴリズムを備そなえた標準ひょうじゅん的てきなデスクトップコンピュータで、同等どうとうの安定あんてい状態じょうたいのサンプリングが可能かのうである^[33]。粗あら視し化かモデリング（英語えいご版ばん）を使用しようすると、はるかに大おおきなシミュレーションのタイムスケールを得えることができる^[34]^[35]。

進化しんか的てき共きょう分散ぶんさんによる三さん次元じげん接触せっしょくの予測よそく[編集へんしゅう]

1990年代ねんだいにシークエンシングが一般いっぱん的てきになると、いくつかのグループがタンパク質たんぱくしつの配列はいれつアライメントを利用りようして相関そうかん突然変異とつぜんへんいを予測よそくし、これらの共きょう進化しんか残ざん基もとを利用りようして三さん次じ構造こうぞうを予測よそくできるのではないかと期待きたいされた（NMRなどの実験じっけん的てき手法しゅほうによる距離きょり制約せいやくとの類似るいじ性せいを利用りよう）。この仮定かていは、単一たんいつ残ざん基もとの突然変異とつぜんへんいがわずかに有害ゆうがいである場合ばあい、残ざん基もと-残ざん基もと間あいだの相互そうご作用さようを回復かいふくさせるために代償だいしょう性せい突然変異とつぜんへんいが起おこる可能かのう性せいがあるとするものである。この初期しょきの研究けんきゅうでは、タンパク質たんぱくしつの配列はいれつから相関そうかん突然変異とつぜんへんいを計算けいさんするために、いわゆる個別こべつメソッドを用もちいていたが、各かく残ざん基もとのペアを他たのすべてのペアから独立どくりつしたものとして扱あつかうことから生しょうじる間接かんせつ的てきな偽にせ相関そうかんに悩なやまされていた^[36]^[37]^[38]。

2011年ねんには、これまでとは異ことなるグローバルな統計とうけい的てきアプローチにより、十分じゅうぶんな配列はいれつがあれば（1,000以上いじょうの相あい同どう配列はいれつが必要ひつよう）、共きょう進化しんか残ざん基もとを予測よそくするだけでタンパク質たんぱくしつの3Dフォールドを予測よそくできることが実証じっしょうされた^[39]。このEVfold法ほうは、相あい同性どうせいモデリング、スレッディング、3D構造こうぞうフラグメントを使用しようせず、数すう百ひゃく残ざん基もとのタンパク質たんぱくしつに対たいしても標準ひょうじゅん的てきなパーソナルコンピュータで実行じっこうすることができる。この手法しゅほうや関連かんれんするアプローチを用もちいて予測よそくされた接触せっしょくの精度せいどは、実験じっけん的てきに未み解明かいめいの膜まく貫通かんつうタンパク質たんぱくしつの予測よそくを含ふくめ、多おおくの既知きちの構造こうぞうやコンタクトマップ（英語えいご版ばん）で実証じっしょうされている^[40]^[41]^[42]^[43]。

タンパク質たんぱくしつの比較ひかくモデリング[編集へんしゅう]

タンパク質たんぱくしつの比較ひかくモデリングでは、最初さいしょに構造こうぞうモデリングの出発しゅっぱつ点てんとして、既すでに解明かいめいされているタンパク質たんぱくしつ構造こうぞうもしくはテンプレート（鋳型いがた）を使つかう。この方法ほうほうが有効ゆうこうである理由りゆうは、タンパク質たんぱくしつの種類しゅるいは膨大ぼうだいであるが、タンパク質たんぱくしつの多おおくがもつ三さん次じ構造こうぞうの構造こうぞうモチーフの種類しゅるいは少すくないとみられているからである。現在げんざい、実際じっさいに存在そんざいするタンパク質たんぱくしつフォールディングのパターンは2000種類しゅるい程度ていどと考かんがえられている^{[要よう出典しゅってん]}。タンパク質たんぱくしつの比較ひかくモデリングは、構造こうぞう予測よそくにおける進化しんか的てき共きょう分散ぶんさんと組くみ合あわせることができる^[44]。

比較ひかくモデリングの手法しゅほうは次つぎの2種類しゅるいに分類ぶんるいすることができる。^[27]。

相あい同性どうせいモデリング（英語えいご版ばん）は、相あい同性どうせいの高たかい2つのタンパク質たんぱくしつは非常ひじょうに似通にかよった構造こうぞうをもっているという合理ごうり的てきな前提ぜんていに基もとづいている。タンパク質たんぱくしつのフォールディングはアミノ酸あみのさん配列はいれつよりも進化しんか的てきに保存ほぞんされているため、配列はいれつアライメントによってターゲット（構造こうぞうが未知みちのタンパク質たんぱくしつ）とテンプレートの関係かんけいが識別しきべつできる場合ばあいには、非常ひじょうに遠とおい関係かんけいにあるテンプレート上じょうでターゲット配列はいれつを合理ごうり的てきな精度せいどでモデル化かすることができる。比較ひかくモデリングの主おもなボトルネックは、既知きちの良好りょうこうなアライメントによる構造こうぞう予測よそくのエラーではなく、アライメントの難むずかしさから生しょうじると考かんがえられている^[45]。当然とうぜんのことながら、相あい同性どうせいモデリングは、ターゲットとテンプレートの配列はいれつが類似るいじしている場合ばあいに最もっとも正確せいかくになる。
タンパク質たんぱくしつスレッディング^[46]は、未知みちの構造こうぞうのアミノ酸あみのさん配列はいれつを、解明かいめい済ずみの構造こうぞうのデータベースに対たいして検索けんさくするものである。いずれの場合ばあいも、スコアリング関数かんすうを用もちいて、配列はいれつと構造こうぞうの適合てきごう性せいを評価ひょうかし、可能かのう性せいが高たかい三さん次元じげんモデルを作成さくせいする。この種たねの手法しゅほうは、三さん次元じげん構造こうぞうと直線ちょくせん的てきなタンパク質たんぱくしつ配列はいれつの間あいだの適合てきごう性せい解析かいせきであることから、「3D-1Dフォールド認識にんしき法ほう」とも呼よばれている。さらにまた、与あたえられた構造こうぞうと大だい規模きぼな配列はいれつのデータベースとの適合てきごう性せいを評価ひょうかすることで、どの配列はいれつが与あたえられたフォールディングを生うみ出だす可能かのう性せいがあるかを予測よそくし、「逆ぎゃくフォールディング検索けんさく」を行おこなう方法ほうほうも生うみ出だした。

側がわ鎖くさりコンフォメーションのモデリング[編集へんしゅう]

アミノ酸あみのさんの側がわ鎖くさりを正確せいかくにパッキングすることは、タンパク質たんぱくしつ構造こうぞう予測よそくにおける別べつの問題もんだいである。側がわ鎖くさりの形状けいじょうを予測よそくする問題もんだいに特とく化かした手法しゅほうとしては、デッドエンド除去じょきょ法ほう（英語えいご版ばん）や自己じこ無む撞着どうちゃく型がた平均へいきん場じょう法ほう（英語えいご版ばん）などがある。低ていエネルギーの側がわ鎖くさりコンフォメーションは、通常つうじょう、剛性ごうせいの高たかいポリペプチド主ぬし鎖くさり上じょうで、「回転かいてん異性いせい体たい（ロータマー）」と呼よばれる個別こべつの側がわ鎖くさりコンフォメーションの集あつまりを用もちいて決定けっていされる。この手法しゅほうでは、モデルの全体ぜんたい的てきなエネルギーを最小さいしょう化かする一連いちれんのロータマーを特定とくていしようとする。

これらの方法ほうほうでは、タンパク質たんぱくしつの各かく残ざん基もとタイプに適てきしたコンフォメーションのコレクションである回転かいてん異性いせい体たいライブラリを使用しようする。回転かいてん異性いせい体たいライブラリには、コンフォメーション、その頻度ひんど、平均へいきん二に面めん角かくに関かんする標準ひょうじゅん偏差へんさなどの情報じょうほうが含ふくまれていることがあり、サンプリングに利用りようできる^[47]。回転かいてん異性いせい体たいライブラリは、構造こうぞうバイオインフォマティクスや、タンパク質たんぱくしつの既知きちの実験じっけん的てき構造こうぞうにおける側がわ鎖くさりコンフォメーションを統計とうけい的てきに分析ぶんせきして導みちびき出だしたものである。例たとえば、四よん面体めんてい炭素たんその観測かんそくされたコンフォメーションをスタガー値ち（60°, 180°, -60°のように位相いそうをずらした値ね）の近辺きんぺんにクラスタリングすることで得えられる。

回転かいてん異性いせい体たいライブラリには、主しゅ鎖くさりに依存いぞんしないもの、二に次じ構造こうぞうに依存いぞんするもの、主しゅ鎖くさりに依存いぞんするものがある。主しゅ鎖くさりに依存いぞんしない回転かいてん異性いせい体たいライブラリは、主しゅ鎖くさりのコンフォメーションを考慮こうりょせず、特定とくていのタイプの利用りよう可能かのうなすべての側がわ鎖くさりから計算けいさんされる（例たとえば、1987年ねんにイェール大学だいがくのPonderとRichardsが行おこなった回転かいてん異性いせい体たいライブラリの最初さいしょの例れいがある）^[48]。二に次じ構造こうぞうに依存いぞんしたライブラリは、αあるふぁヘリックス、βべーたシート、またはコイルの二に次じ構造こうぞうに対たいして、異ことなる二に面めん角かくや回転かいてん異性いせい体たいの頻度ひんどを示しめす^[49]。主しゅ鎖くさりに依存いぞんする回転かいてん異性いせい体たいライブラリは、二に次じ構造こうぞうに関係かんけいなく、主しゅ鎖くさり二に面めん角かくφふぁいおよびψぷさいによって定義ていぎされる局所きょくしょ的てき主しゅ鎖くさりのコンフォメーションに依存いぞんした立体りったい構造こうぞうおよび/または頻度ひんどを示しめす^[50]。

ほとんどのソフトウェアで使用しようされているこれらのライブラリの最新さいしんバージョンは、確率かくりつまたは頻度ひんどの多次元たじげん分布ぶんぷとして表示ひょうじされ、ピークはリスト内ないの個々ここの回転かいてん異性いせい体たいとして見みなされる二に面めん角かくのコンフォメーションに対応たいおうする。一部いちぶのバージョンは非常ひじょうに注意深ちゅういぶかく精査せいさされたデータに基もとづいており、主おもに構造こうぞう検証けんしょうに使用しようされるが^[51]、別べつのバージョンは、はるかに大だい規模きぼなデータセットにおける相対そうたい的てき頻度ひんどを重視じゅうししており、Dunbrack回転かいてん異性いせい体たいライブラリのように主おもに構造こうぞう予測よそくに使用しようされる形かたちである^[52]。

側がわ鎖くさり充填じゅうてん法ほうは、側がわ鎖くさりがより密みつに充填じゅうてんされているタンパク質たんぱくしつの疎水そすい性せいコアを分析ぶんせきするのに最もっとも有効ゆうこうである。一方いっぽう、1つの回転かいてん異性いせい体たいコンフォメーションではなく、複数ふくすうの回転かいてん異性いせいコンフォメーションをとることが多おおい表面ひょうめん残ざん基もとのより緩ゆるい制約せいやくと高たかい柔軟じゅうなん性せいを扱あつかうのは難むずかしい^[53]^[54]。

四よん次じ構造こうぞうの予測よそく[編集へんしゅう]

詳細しょうさいは「:en:Protein–protein interaction prediction」を参照さんしょう

複数ふくすうのタンパク質たんぱくしつが結合けつごうしたタンパク質たんぱくしつ複ふく合体がったい（四よん次じ構造こうぞう、多量たりょう体たい）の構造こうぞう予測よそくにおいては、複ふく合体がったいを構成こうせいする各かくタンパク質たんぱくしつの構造こうぞうがわかっているか高たかい精度せいどで予測よそくできる場合ばあいは、タンパク質たんぱくしつ-タンパク質たんぱくしつドッキング法ほう（英語えいご版ばん）を用もちいて複ふく合体がったいの構造こうぞうを予測よそくすることができる。複ふく合体がったいの親和しんわ性せいに対たいする特定とくていの部位ぶいでの変異へんいが及およぼす影響えいきょうに関かんする情報じょうほうは、複ふく合体がったいの構造こうぞうを理解りかいし、ドッキング手法しゅほうを導出どうしゅつするのに役立やくだつ。

ソフトウェア[編集へんしゅう]

詳細しょうさいは「:en:Protein structure prediction software」を参照さんしょう

タンパク質たんぱくしつ構造こうぞう予測よそくのためのソフトウェアツールは数多かずおおく存在そんざいする。アプローチとしては、ホモロジーモデリング（英語えいご版ばん）、タンパク質たんぱくしつスレッディング、ab initio法ほう、二に次じ構造こうぞう予測よそく、膜まく貫通かんつうヘリックスおよびシグナルペプチド予測よそくなどがある。CASP実験じっけんに基もとづいて最近さいきんの成功せいこうした手法しゅほうには、I-TASSER（英語えいご版ばん）、HHpred（英語えいご版ばん）、AlphaFoldなどがある。完全かんぜんなリストはメイン記事きじ（英語えいご版ばん）を参照さんしょうのこと。

自動じどう構造こうぞう予測よそくサーバの評価ひょうか[編集へんしゅう]

詳細しょうさいは「CASP」を参照さんしょう

CASPは、1994年ねんから2年ねんごとに行おこなわれているタンパク質たんぱくしつ構造こうぞう予測よそくのためのコミュニティ全体ぜんたいでの実験じっけんである。CASPは、利用りよう可能かのうな人間にんげんの非ひ自動じどう化か手法しゅほう（人間にんげんカテゴリー）、およびタンパク質たんぱくしつ構造こうぞう予測よそくのための自動じどう化かサーバー（サーバーカテゴリー、CASP7で導入どうにゅう）の品質ひんしつを評価ひょうかする機会きかいを提供ていきょうしている^[55]。

CAMEO3D（英語えいご版ばん）は、新あたらしく公開こうかいされたタンパク質たんぱくしつ構造こうぞうのブラインド予測よそくを用もちいて、自動じどうタンパク質たんぱくしつ構造こうぞう予測よそくサーバーの評価ひょうかを週しゅう単位たんいで行おこなっている。CAMEOでは、その結果けっかをウェブサイトで公開こうかいしている。

参照さんしょう項目こうもく[編集へんしゅう]

脚注きゃくちゅう[編集へんしゅう]

^ ^a ^b ^c ^d ^e ^f ^g ^h Mount DM (2004). Bioinformatics: Sequence and Genome Analysis. 2. Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-712-9
^ Huang JY, Brutlag DL (January 2001). “The EMOTIF database”. Nucleic Acids Research 29 (1): 202–4. doi:10.1093/nar/29.1.202. PMC 29837. PMID 11125091.
^ Pirovano W, Heringa J (2010). “Protein secondary structure prediction”. Data Mining Techniques for the Life Sciences. Methods in Molecular Biology. 609. pp. 327–48. doi:10.1007/978-1-60327-241-4_19. ISBN 978-1-60327-240-7. PMID 20221928
^ Guzzo AV (November 1965). “The influence of amino-acid sequence on protein structure”. Biophysical Journal 5 (6): 809–22. Bibcode: 1965BpJ.....5..809G. doi:10.1016/S0006-3495(65)86753-4. PMC 1367904. PMID 5884309.
^ Prothero JW (May 1966). “Correlation between the distribution of amino acids and alpha helices”. Biophysical Journal 6 (3): 367–70. Bibcode: 1966BpJ.....6..367P. doi:10.1016/S0006-3495(66)86662-6. PMC 1367951. PMID 5962284.
^ Schiffer M, Edmundson AB (March 1967). “Use of helical wheels to represent the structures of proteins and to identify segments with helical potential”. Biophysical Journal 7 (2): 121–35. Bibcode: 1967BpJ.....7..121S. doi:10.1016/S0006-3495(67)86579-2. PMC 1368002. PMID 6048867.
^ Kotelchuck D, Scheraga HA (January 1969). “The influence of short-range interactions on protein onformation. II. A model for predicting the alpha-helical regions of proteins”. Proceedings of the National Academy of Sciences of the United States of America 62 (1): 14–21. Bibcode: 1969PNAS...62...14K. doi:10.1073/pnas.62.1.14. PMC 285948. PMID 5253650.
^ Lewis PN, Go N, Go M, Kotelchuck D, Scheraga HA (April 1970). “Helix probability profiles of denatured proteins and their correlation with native structures”. Proceedings of the National Academy of Sciences of the United States of America 65 (4): 810–5. Bibcode: 1970PNAS...65..810L. doi:10.1073/pnas.65.4.810. PMC 282987. PMID 5266152.
^ Froimowitz M, Fasman GD (1974). “Prediction of the secondary structure of proteins using the helix-coil transition theory”. Macromolecules 7 (5): 583–9. Bibcode: 1974MaMol...7..583F. doi:10.1021/ma60041a009. PMID 4371089.
^ ^a ^b Dor O, Zhou Y (March 2007). “Achieving 80% ten-fold cross-validated accuracy for secondary structure prediction by large-scale training”. Proteins 66 (4): 838–45. doi:10.1002/prot.21298. PMID 17177203.
^ Chou PY, Fasman GD (January 1974). “Prediction of protein conformation”. Biochemistry 13 (2): 222–45. doi:10.1021/bi00699a002. PMID 4358940.
^ Garnier J, Osguthorpe DJ, Robson B (March 1978). “Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins”. Journal of Molecular Biology 120 (1): 97–120. doi:10.1016/0022-2836(78)90297-8. PMID 642007.
^ ^a ^b Pham TH, Satou K, Ho TB (April 2005). “Support vector machines for prediction and analysis of beta and gamma-turns in proteins”. Journal of Bioinformatics and Computational Biology 3 (2): 343–58. doi:10.1142/S0219720005001089. PMID 15852509.
^ Zhang Q, Yoon S, Welsh WJ (May 2005). “Improved method for predicting beta-turn using support vector machine”. Bioinformatics 21 (10): 2370–4. doi:10.1093/bioinformatics/bti358. PMID 15797917.
^ Zimmermann O, Hansmann UH (December 2006). “Support vector machines for prediction of dihedral angle regions”. Bioinformatics 22 (24): 3009–15. doi:10.1093/bioinformatics/btl489. PMID 17005536.
^ Kuang R, Leslie CS, Yang AS (July 2004). “Protein backbone angle prediction with machine learning approaches”. Bioinformatics 20 (10): 1612–21. doi:10.1093/bioinformatics/bth136. PMID 14988121.
^ Faraggi E, Yang Y, Zhang S, Zhou Y (November 2009). “Predicting continuous local structure and the effect of its substitution for secondary structure in fragment-free protein structure prediction”. Structure 17 (11): 1515–27. doi:10.1016/j.str.2009.09.006. PMC 2778607. PMID 19913486.
^ Zhong L, Johnson WC (May 1992). “Environment affects amino acid preference for secondary structure”. Proceedings of the National Academy of Sciences of the United States of America 89 (10): 4462–5. Bibcode: 1992PNAS...89.4462Z. doi:10.1073/pnas.89.10.4462. PMC 49102. PMID 1584778.
^ Macdonald JR, Johnson WC (June 2001). “Environmental features are important in determining protein secondary structure”. Protein Science 10 (6): 1172–7. doi:10.1110/ps.420101. PMC 2374018. PMID 11369855.
^ Costantini S, Colonna G, Facchiano AM (April 2006). “Amino acid propensities for secondary structures are influenced by the protein structural class”. Biochemical and Biophysical Research Communications 342 (2): 441–51. doi:10.1016/j.bbrc.2006.01.159. PMID 16487481.
^ Marashi SA, Behrouzi R, Pezeshk H (January 2007). “Adaptation of proteins to different environments: a comparison of proteome structural properties in Bacillus subtilis and Escherichia coli”. Journal of Theoretical Biology 244 (1): 127–32. doi:10.1016/j.jtbi.2006.07.021. PMID 16945389.
^ Costantini S, Colonna G, Facchiano AM (October 2007). “PreSSAPro: a software for the prediction of secondary structure by amino acid properties”. Computational Biology and Chemistry 31 (5–6): 389–92. doi:10.1016/j.compbiolchem.2007.08.010. PMID 17888742.
^ Adamczak R, Porollo A, Meller J (May 2005). “Combining prediction of secondary structure and solvent accessibility in proteins”. Proteins 59 (3): 467–75. doi:10.1002/prot.20441. PMID 15768403.
^ Momen-Roknabadi A, Sadeghi M, Pezeshk H, Marashi SA (August 2008). “Impact of residue accessible surface area on the prediction of protein secondary structures”. BMC Bioinformatics 9: 357. doi:10.1186/1471-2105-9-357. PMC 2553345. PMID 18759992.
^ Lakizadeh A, Marashi SA (2009). “Addition of contact number information can improve protein secondary structure prediction by neural networks”. Excli J. 8: 66–73.
^ Dorn, Márcio; e Silva, Mariel Barbachan; Buriol, Luciana S.; Lamb, Luis C. (2014-12-01). “Three-dimensional protein structure prediction: Methods and computational strategies” (英語えいご). Computational Biology and Chemistry 53: 251–276. doi:10.1016/j.compbiolchem.2014.10.001. ISSN 1476-9271. PMID 25462334.
^ ^a ^b ^c Zhang Y (June 2008). “Progress and challenges in protein structure prediction”. Current Opinion in Structural Biology 18 (3): 342–8. doi:10.1016/j.sbi.2008.02.004. PMC 2680823. PMID 18436442.
^ Ovchinnikov S, Kim DE, Wang RY, Liu Y, DiMaio F, Baker D (September 2016). “Improved de novo structure prediction in CASP11 by incorporating coevolution information into Rosetta”. Proteins 84 Suppl 1: 67–75. doi:10.1002/prot.24974. PMC 5490371. PMID 26677056.
^ Hong SH, Joo K, Lee J (November 2018). “ConDo: Protein domain boundary prediction using coevolutionary information”. Bioinformatics 35 (14): 2411–2417. doi:10.1093/bioinformatics/bty973. PMID 30500873.
^ Wollacott AM, Zanghellini A, Murphy P, Baker D (February 2007). “Prediction of structures of multidomain proteins from structures of the individual domains”. Protein Science 16 (2): 165–75. doi:10.1110/ps.062270707. PMC 2203296. PMID 17189483.
^ Xu D, Jaroszewski L, Li Z, Godzik A (July 2015). “AIDA: ab initio domain assembly for automated multi-domain protein structure prediction and domain-domain interaction prediction”. Bioinformatics 31 (13): 2098–105. doi:10.1093/bioinformatics/btv092. PMC 4481839. PMID 25701568.
^ Shaw DE, Dror RO, Salmon JK, Grossman JP, Mackenzie KM, Bank JA, Young C, Deneroff MM, Batson B, Bowers KJ, Chow E (2009). Millisecond-scale molecular dynamics simulations on Anton. Proceedings of the Conference on High Performance Computing Networking, Storage and Analysis - SC '09. p. 1. doi:10.1145/1654059.1654126. ISBN 9781605587448。
^ Pierce LC, Salomon-Ferrer R, de Oliveira CA, McCammon JA, Walker RC (September 2012). “Routine Access to Millisecond Time Scale Events with Accelerated Molecular Dynamics”. Journal of Chemical Theory and Computation 8 (9): 2997–3002. doi:10.1021/ct300284c. PMC 3438784. PMID 22984356.
^ Kmiecik S, Gront D, Kolinski M, Wieteska L, Dawid AE, Kolinski A (July 2016). “Coarse-Grained Protein Models and Their Applications”. Chemical Reviews 116 (14): 7898–936. doi:10.1021/acs.chemrev.6b00163. PMID 27333362.
^ Cheung NJ, Yu W (November 2018). “De novo protein structure prediction using ultra-fast molecular dynamics simulation”. PLOS ONE 13 (11): e0205819. Bibcode: 2018PLoSO..1305819C. doi:10.1371/journal.pone.0205819. PMC 6245515. PMID 30458007.
^ Göbel U, Sander C, Schneider R, Valencia A (April 1994). “Correlated mutations and residue contacts in proteins”. Proteins 18 (4): 309–17. doi:10.1002/prot.340180402. PMID 8208723.
^ Taylor WR, Hatrick K (March 1994). “Compensating changes in protein multiple sequence alignments”. Protein Engineering 7 (3): 341–8. doi:10.1093/protein/7.3.341. PMID 8177883.
^ Neher E (January 1994). “How frequent are correlated changes in families of protein sequences?”. Proceedings of the National Academy of Sciences of the United States of America 91 (1): 98–102. Bibcode: 1994PNAS...91...98N. doi:10.1073/pnas.91.1.98. PMC 42893. PMID 8278414.
^ Marks DS, Colwell LJ, Sheridan R, Hopf TA, Pagnani A, Zecchina R, Sander C (2011). “Protein 3D structure computed from evolutionary sequence variation”. PLOS ONE 6 (12): e28766. Bibcode: 2011PLoSO...628766M. doi:10.1371/journal.pone.0028766. PMC 3233603. PMID 22163331.
^ Burger L, van Nimwegen E (January 2010). “Disentangling direct from indirect co-evolution of residues in protein alignments”. PLOS Computational Biology 6 (1): e1000633. Bibcode: 2010PLSCB...6E0633B. doi:10.1371/journal.pcbi.1000633. PMC 2793430. PMID 20052271.
^ Morcos F, Pagnani A, Lunt B, Bertolino A, Marks DS, Sander C, Zecchina R, Onuchic JN, Hwa T, Weigt M (December 2011). “Direct-coupling analysis of residue coevolution captures native contacts across many protein families”. Proceedings of the National Academy of Sciences of the United States of America 108 (49): E1293-301. arXiv:1110.5223. Bibcode: 2011PNAS..108E1293M. doi:10.1073/pnas.1111471108. PMC 3241805. PMID 22106262.
^ Nugent T, Jones DT (June 2012). “Accurate de novo structure prediction of large transmembrane protein domains using fragment-assembly and correlated mutation analysis”. Proceedings of the National Academy of Sciences of the United States of America 109 (24): E1540-7. Bibcode: 2012PNAS..109E1540N. doi:10.1073/pnas.1120036109. PMC 3386101. PMID 22645369.
^ Hopf TA, Colwell LJ, Sheridan R, Rost B, Sander C, Marks DS (June 2012). “Three-dimensional structures of membrane proteins from genomic sequencing”. Cell 149 (7): 1607–21. doi:10.1016/j.cell.2012.04.012. PMC 3641781. PMID 22579045.
^ Jin, Shikai; Chen, Mingchen; Chen, Xun; Bueno, Carlos; Lu, Wei; Schafer, Nicholas P.; Lin, Xingcheng; Onuchic, José N. et al. (9 June 2020). “Protein Structure Prediction in CASP13 Using AWSEM-Suite”. Journal of Chemical Theory and Computation 16 (6): 3977–3988. doi:10.1021/acs.jctc.0c00188. PMID 32396727.
^ Zhang Y, Skolnick J (January 2005). “The protein structure prediction problem could be solved using the current PDB library”. Proceedings of the National Academy of Sciences of the United States of America 102 (4): 1029–34. Bibcode: 2005PNAS..102.1029Z. doi:10.1073/pnas.0407152101. PMC 545829. PMID 15653774.
^ Bowie JU, Lüthy R, Eisenberg D (July 1991). “A method to identify protein sequences that fold into a known three-dimensional structure”. Science 253 (5016): 164–70. Bibcode: 1991Sci...253..164B. doi:10.1126/science.1853201. PMID 1853201.
^ Dunbrack RL (August 2002). “Rotamer libraries in the 21st century”. Current Opinion in Structural Biology 12 (4): 431–40. doi:10.1016/S0959-440X(02)00344-5. PMID 12163064.
^ Ponder JW, Richards FM (February 1987). “Tertiary templates for proteins. Use of packing criteria in the enumeration of allowed sequences for different structural classes”. Journal of Molecular Biology 193 (4): 775–91. doi:10.1016/0022-2836(87)90358-5. PMID 2441069.
^ Lovell SC, Word JM, Richardson JS, Richardson DC (August 2000). “The penultimate rotamer library”. Proteins 40 (3): 389–408. doi:10.1002/1097-0134(20000815)40:3<389::AID-PROT50>3.0.CO;2-2. PMID 10861930.
^ Shapovalov MV, Dunbrack RL (June 2011). “A smoothed backbone-dependent rotamer library for proteins derived from adaptive kernel density estimates and regressions”. Structure 19 (6): 844–58. doi:10.1016/j.str.2011.03.019. PMC 3118414. PMID 21645855.
^ Chen VB, Arendall WB, Headd JJ, Keedy DA, Immormino RM, Kapral GJ, Murray LW, Richardson JS, Richardson DC (January 2010). “MolProbity: all-atom structure validation for macromolecular crystallography”. Acta Crystallographica. Section D, Biological Crystallography 66 (Pt 1): 12–21. doi:10.1107/S0907444909042073. PMC 2803126. PMID 20057044.
^ Bower MJ, Cohen FE, Dunbrack RL (April 1997). “Prediction of protein side-chain rotamers from a backbone-dependent rotamer library: a new homology modeling tool”. Journal of Molecular Biology 267 (5): 1268–82. doi:10.1006/jmbi.1997.0926. PMID 9150411.
^ Voigt CA, Gordon DB, Mayo SL (June 2000). “Trading accuracy for speed: A quantitative comparison of search algorithms in protein sequence design”. Journal of Molecular Biology 299 (3): 789–803. doi:10.1006/jmbi.2000.3758. PMID 10835284.
^ Krivov GG, Shapovalov MV, Dunbrack RL (December 2009). “Improved prediction of protein side-chain conformations with SCWRL4”. Proteins 77 (4): 778–95. doi:10.1002/prot.22488. PMC 2885146. PMID 19603484.
^ Battey JN, Kopp J, Bordoli L, Read RJ, Clarke ND, Schwede T (2007). “Automated server predictions in CASP7”. Proteins 69 Suppl 8 (Suppl 8): 68–82. doi:10.1002/prot.21761. PMID 17894354.

外部がいぶリンク[編集へんしゅう]

CASP experiments home page
ExPASy Proteomics tools - 予測よそくツールとサーバの一覧いちらん

[Mount-1] ^ ^a ^b ^c ^d ^e ^f ^g ^h Mount DM (2004). Bioinformatics: Sequence and Genome Analysis. 2. Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-712-9

[2] Huang JY, Brutlag DL (January 2001). “The EMOTIF database”. Nucleic Acids Research 29 (1): 202–4. doi:10.1093/nar/29.1.202. PMC 29837. PMID 11125091.

[3] Pirovano W, Heringa J (2010). “Protein secondary structure prediction”. Data Mining Techniques for the Life Sciences. Methods in Molecular Biology. 609. pp. 327–48. doi:10.1007/978-1-60327-241-4_19. ISBN 978-1-60327-240-7. PMID 20221928

[4] Guzzo AV (November 1965). “The influence of amino-acid sequence on protein structure”. Biophysical Journal 5 (6): 809–22. Bibcode: 1965BpJ.....5..809G. doi:10.1016/S0006-3495(65)86753-4. PMC 1367904. PMID 5884309.

[5] Prothero JW (May 1966). “Correlation between the distribution of amino acids and alpha helices”. Biophysical Journal 6 (3): 367–70. Bibcode: 1966BpJ.....6..367P. doi:10.1016/S0006-3495(66)86662-6. PMC 1367951. PMID 5962284.

[6] Schiffer M, Edmundson AB (March 1967). “Use of helical wheels to represent the structures of proteins and to identify segments with helical potential”. Biophysical Journal 7 (2): 121–35. Bibcode: 1967BpJ.....7..121S. doi:10.1016/S0006-3495(67)86579-2. PMC 1368002. PMID 6048867.

[7] Kotelchuck D, Scheraga HA (January 1969). “The influence of short-range interactions on protein onformation. II. A model for predicting the alpha-helical regions of proteins”. Proceedings of the National Academy of Sciences of the United States of America 62 (1): 14–21. Bibcode: 1969PNAS...62...14K. doi:10.1073/pnas.62.1.14. PMC 285948. PMID 5253650.

[8] Lewis PN, Go N, Go M, Kotelchuck D, Scheraga HA (April 1970). “Helix probability profiles of denatured proteins and their correlation with native structures”. Proceedings of the National Academy of Sciences of the United States of America 65 (4): 810–5. Bibcode: 1970PNAS...65..810L. doi:10.1073/pnas.65.4.810. PMC 282987. PMID 5266152.

[Froimowitz-9] Froimowitz M, Fasman GD (1974). “Prediction of the secondary structure of proteins using the helix-coil transition theory”. Macromolecules 7 (5): 583–9. Bibcode: 1974MaMol...7..583F. doi:10.1021/ma60041a009. PMID 4371089.

[Dor-10] Dor O, Zhou Y (March 2007). “Achieving 80% ten-fold cross-validated accuracy for secondary structure prediction by large-scale training”. Proteins 66 (4): 838–45. doi:10.1002/prot.21298. PMID 17177203.

[Chou-11] Chou PY, Fasman GD (January 1974). “Prediction of protein conformation”. Biochemistry 13 (2): 222–45. doi:10.1021/bi00699a002. PMID 4358940.

[Garnier-12] Garnier J, Osguthorpe DJ, Robson B (March 1978). “Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins”. Journal of Molecular Biology 120 (1): 97–120. doi:10.1016/0022-2836(78)90297-8. PMID 642007.

[Pham-13] Pham TH, Satou K, Ho TB (April 2005). “Support vector machines for prediction and analysis of beta and gamma-turns in proteins”. Journal of Bioinformatics and Computational Biology 3 (2): 343–58. doi:10.1142/S0219720005001089. PMID 15852509.

[Zhang-14] Zhang Q, Yoon S, Welsh WJ (May 2005). “Improved method for predicting beta-turn using support vector machine”. Bioinformatics 21 (10): 2370–4. doi:10.1093/bioinformatics/bti358. PMID 15797917.

[Zimmermann-15] Zimmermann O, Hansmann UH (December 2006). “Support vector machines for prediction of dihedral angle regions”. Bioinformatics 22 (24): 3009–15. doi:10.1093/bioinformatics/btl489. PMID 17005536.

[Kuang-16] Kuang R, Leslie CS, Yang AS (July 2004). “Protein backbone angle prediction with machine learning approaches”. Bioinformatics 20 (10): 1612–21. doi:10.1093/bioinformatics/bth136. PMID 14988121.

[torsion-17] Faraggi E, Yang Y, Zhang S, Zhou Y (November 2009). “Predicting continuous local structure and the effect of its substitution for secondary structure in fragment-free protein structure prediction”. Structure 17 (11): 1515–27. doi:10.1016/j.str.2009.09.006. PMC 2778607. PMID 19913486.

[a0-18] Zhong L, Johnson WC (May 1992). “Environment affects amino acid preference for secondary structure”. Proceedings of the National Academy of Sciences of the United States of America 89 (10): 4462–5. Bibcode: 1992PNAS...89.4462Z. doi:10.1073/pnas.89.10.4462. PMC 49102. PMID 1584778.

[a1-19] Macdonald JR, Johnson WC (June 2001). “Environmental features are important in determining protein secondary structure”. Protein Science 10 (6): 1172–7. doi:10.1110/ps.420101. PMC 2374018. PMID 11369855.

[a2-20] Costantini S, Colonna G, Facchiano AM (April 2006). “Amino acid propensities for secondary structures are influenced by the protein structural class”. Biochemical and Biophysical Research Communications 342 (2): 441–51. doi:10.1016/j.bbrc.2006.01.159. PMID 16487481.

[a3-21] Marashi SA, Behrouzi R, Pezeshk H (January 2007). “Adaptation of proteins to different environments: a comparison of proteome structural properties in Bacillus subtilis and Escherichia coli”. Journal of Theoretical Biology 244 (1): 127–32. doi:10.1016/j.jtbi.2006.07.021. PMID 16945389.

[m-22] Costantini S, Colonna G, Facchiano AM (October 2007). “PreSSAPro: a software for the prediction of secondary structure by amino acid properties”. Computational Biology and Chemistry 31 (5–6): 389–92. doi:10.1016/j.compbiolchem.2007.08.010. PMID 17888742.

[Ph-23] Adamczak R, Porollo A, Meller J (May 2005). “Combining prediction of secondary structure and solvent accessibility in proteins”. Proteins 59 (3): 467–75. doi:10.1002/prot.20441. PMID 15768403.

[P-24] Momen-Roknabadi A, Sadeghi M, Pezeshk H, Marashi SA (August 2008). “Impact of residue accessible surface area on the prediction of protein secondary structures”. BMC Bioinformatics 9: 357. doi:10.1186/1471-2105-9-357. PMC 2553345. PMID 18759992.

[az-25] Lakizadeh A, Marashi SA (2009). “Addition of contact number information can improve protein secondary structure prediction by neural networks”. Excli J. 8: 66–73.

[26] Dorn, Márcio; e Silva, Mariel Barbachan; Buriol, Luciana S.; Lamb, Luis C. (2014-12-01). “Three-dimensional protein structure prediction: Methods and computational strategies” (英語えいご). Computational Biology and Chemistry 53: 251–276. doi:10.1016/j.compbiolchem.2014.10.001. ISSN 1476-9271. PMID 25462334.

[zhang2008-27] Zhang Y (June 2008). “Progress and challenges in protein structure prediction”. Current Opinion in Structural Biology 18 (3): 342–8. doi:10.1016/j.sbi.2008.02.004. PMC 2680823. PMID 18436442.

[28] Ovchinnikov S, Kim DE, Wang RY, Liu Y, DiMaio F, Baker D (September 2016). “Improved de novo structure prediction in CASP11 by incorporating coevolution information into Rosetta”. Proteins 84 Suppl 1: 67–75. doi:10.1002/prot.24974. PMC 5490371. PMID 26677056.

[29] Hong SH, Joo K, Lee J (November 2018). “ConDo: Protein domain boundary prediction using coevolutionary information”. Bioinformatics 35 (14): 2411–2417. doi:10.1093/bioinformatics/bty973. PMID 30500873.

[30] Wollacott AM, Zanghellini A, Murphy P, Baker D (February 2007). “Prediction of structures of multidomain proteins from structures of the individual domains”. Protein Science 16 (2): 165–75. doi:10.1110/ps.062270707. PMC 2203296. PMID 17189483.

[31] Xu D, Jaroszewski L, Li Z, Godzik A (July 2015). “AIDA: ab initio domain assembly for automated multi-domain protein structure prediction and domain-domain interaction prediction”. Bioinformatics 31 (13): 2098–105. doi:10.1093/bioinformatics/btv092. PMC 4481839. PMID 25701568.

[ShawBowers2009-32] Shaw DE, Dror RO, Salmon JK, Grossman JP, Mackenzie KM, Bank JA, Young C, Deneroff MM, Batson B, Bowers KJ, Chow E (2009). Millisecond-scale molecular dynamics simulations on Anton. Proceedings of the Conference on High Performance Computing Networking, Storage and Analysis - SC '09. p. 1. doi:10.1145/1654059.1654126. ISBN 9781605587448。

[PierceSalomon-Ferrer2012-33] Pierce LC, Salomon-Ferrer R, de Oliveira CA, McCammon JA, Walker RC (September 2012). “Routine Access to Millisecond Time Scale Events with Accelerated Molecular Dynamics”. Journal of Chemical Theory and Computation 8 (9): 2997–3002. doi:10.1021/ct300284c. PMC 3438784. PMID 22984356.

[34] Kmiecik S, Gront D, Kolinski M, Wieteska L, Dawid AE, Kolinski A (July 2016). “Coarse-Grained Protein Models and Their Applications”. Chemical Reviews 116 (14): 7898–936. doi:10.1021/acs.chemrev.6b00163. PMID 27333362.

[denovo2018-35] Cheung NJ, Yu W (November 2018). “De novo protein structure prediction using ultra-fast molecular dynamics simulation”. PLOS ONE 13 (11): e0205819. Bibcode: 2018PLoSO..1305819C. doi:10.1371/journal.pone.0205819. PMC 6245515. PMID 30458007.

[36] Göbel U, Sander C, Schneider R, Valencia A (April 1994). “Correlated mutations and residue contacts in proteins”. Proteins 18 (4): 309–17. doi:10.1002/prot.340180402. PMID 8208723.

[37] Taylor WR, Hatrick K (March 1994). “Compensating changes in protein multiple sequence alignments”. Protein Engineering 7 (3): 341–8. doi:10.1093/protein/7.3.341. PMID 8177883.

[38] Neher E (January 1994). “How frequent are correlated changes in families of protein sequences?”. Proceedings of the National Academy of Sciences of the United States of America 91 (1): 98–102. Bibcode: 1994PNAS...91...98N. doi:10.1073/pnas.91.1.98. PMC 42893. PMID 8278414.

[marks-39] Marks DS, Colwell LJ, Sheridan R, Hopf TA, Pagnani A, Zecchina R, Sander C (2011). “Protein 3D structure computed from evolutionary sequence variation”. PLOS ONE 6 (12): e28766. Bibcode: 2011PLoSO...628766M. doi:10.1371/journal.pone.0028766. PMC 3233603. PMID 22163331.

[40] Burger L, van Nimwegen E (January 2010). “Disentangling direct from indirect co-evolution of residues in protein alignments”. PLOS Computational Biology 6 (1): e1000633. Bibcode: 2010PLSCB...6E0633B. doi:10.1371/journal.pcbi.1000633. PMC 2793430. PMID 20052271.

[41] Morcos F, Pagnani A, Lunt B, Bertolino A, Marks DS, Sander C, Zecchina R, Onuchic JN, Hwa T, Weigt M (December 2011). “Direct-coupling analysis of residue coevolution captures native contacts across many protein families”. Proceedings of the National Academy of Sciences of the United States of America 108 (49): E1293-301. arXiv:1110.5223. Bibcode: 2011PNAS..108E1293M. doi:10.1073/pnas.1111471108. PMC 3241805. PMID 22106262.

[42] Nugent T, Jones DT (June 2012). “Accurate de novo structure prediction of large transmembrane protein domains using fragment-assembly and correlated mutation analysis”. Proceedings of the National Academy of Sciences of the United States of America 109 (24): E1540-7. Bibcode: 2012PNAS..109E1540N. doi:10.1073/pnas.1120036109. PMC 3386101. PMID 22645369.

[43] Hopf TA, Colwell LJ, Sheridan R, Rost B, Sander C, Marks DS (June 2012). “Three-dimensional structures of membrane proteins from genomic sequencing”. Cell 149 (7): 1607–21. doi:10.1016/j.cell.2012.04.012. PMC 3641781. PMID 22579045.

[44] Jin, Shikai; Chen, Mingchen; Chen, Xun; Bueno, Carlos; Lu, Wei; Schafer, Nicholas P.; Lin, Xingcheng; Onuchic, José N. et al. (9 June 2020). “Protein Structure Prediction in CASP13 Using AWSEM-Suite”. Journal of Chemical Theory and Computation 16 (6): 3977–3988. doi:10.1021/acs.jctc.0c00188. PMID 32396727.

[zhang2005-45] Zhang Y, Skolnick J (January 2005). “The protein structure prediction problem could be solved using the current PDB library”. Proceedings of the National Academy of Sciences of the United States of America 102 (4): 1029–34. Bibcode: 2005PNAS..102.1029Z. doi:10.1073/pnas.0407152101. PMC 545829. PMID 15653774.

[bowie1991-46] Bowie JU, Lüthy R, Eisenberg D (July 1991). “A method to identify protein sequences that fold into a known three-dimensional structure”. Science 253 (5016): 164–70. Bibcode: 1991Sci...253..164B. doi:10.1126/science.1853201. PMID 1853201.

[Rotamers21stCentury-47] Dunbrack RL (August 2002). “Rotamer libraries in the 21st century”. Current Opinion in Structural Biology 12 (4): 431–40. doi:10.1016/S0959-440X(02)00344-5. PMID 12163064.

[48] Ponder JW, Richards FM (February 1987). “Tertiary templates for proteins. Use of packing criteria in the enumeration of allowed sequences for different structural classes”. Journal of Molecular Biology 193 (4): 775–91. doi:10.1016/0022-2836(87)90358-5. PMID 2441069.

[49] Lovell SC, Word JM, Richardson JS, Richardson DC (August 2000). “The penultimate rotamer library”. Proteins 40 (3): 389–408. doi:10.1002/1097-0134(20000815)40:3<389::AID-PROT50>3.0.CO;2-2. PMID 10861930.

[bbdep2010-50] Shapovalov MV, Dunbrack RL (June 2011). “A smoothed backbone-dependent rotamer library for proteins derived from adaptive kernel density estimates and regressions”. Structure 19 (6): 844–58. doi:10.1016/j.str.2011.03.019. PMC 3118414. PMID 21645855.

[51] Chen VB, Arendall WB, Headd JJ, Keedy DA, Immormino RM, Kapral GJ, Murray LW, Richardson JS, Richardson DC (January 2010). “MolProbity: all-atom structure validation for macromolecular crystallography”. Acta Crystallographica. Section D, Biological Crystallography 66 (Pt 1): 12–21. doi:10.1107/S0907444909042073. PMC 2803126. PMID 20057044.

[52] Bower MJ, Cohen FE, Dunbrack RL (April 1997). “Prediction of protein side-chain rotamers from a backbone-dependent rotamer library: a new homology modeling tool”. Journal of Molecular Biology 267 (5): 1268–82. doi:10.1006/jmbi.1997.0926. PMID 9150411.

[voigt2000-53] Voigt CA, Gordon DB, Mayo SL (June 2000). “Trading accuracy for speed: A quantitative comparison of search algorithms in protein sequence design”. Journal of Molecular Biology 299 (3): 789–803. doi:10.1006/jmbi.2000.3758. PMID 10835284.

[scwrl4-54] Krivov GG, Shapovalov MV, Dunbrack RL (December 2009). “Improved prediction of protein side-chain conformations with SCWRL4”. Proteins 77 (4): 778–95. doi:10.1002/prot.22488. PMC 2885146. PMID 19603484.

[55] Battey JN, Kopp J, Bordoli L, Read RJ, Clarke ND, Schwede T (2007). “Automated server predictions in CASP7”. Proteins 69 Suppl 8 (Suppl 8): 68–82. doi:10.1002/prot.21761. PMID 17894354.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

表ひょう話はなし編へん歴れき生体せいたい分子ぶんし構造こうぞう
タンパク質たんぱくしつ構造こうぞう	一いち次じ二に次じ三さん次じ四よん次じ決定けってい予測よそく設計せっけい熱ねつ力学りきがく
核酸かくさん構造こうぞう	一いち次じ二に次じ三さん次じ四よん次じ決定けってい予測よそく設計せっけい熱ねつ力学りきがく
関連かんれん項目こうもく	タンパク質たんぱくしつタンパク質たんぱくしつドメインタンパク質たんぱくしつ工学こうがく核酸かくさん DNA RNA 二に重じゅうらせん