(Translated by https://www.hiragana.jp/)
Pfamデータベース - Wikipedia コンテンツにスキップ

Pfamデータベース

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
Pfamから転送てんそう
Pfam
内容ないよう
説明せつめい Pfamデータベースは、タンパク質たんぱくしつドメインの整列せいれつかくれマルコフモデルを提供ていきょうする。
キャプチャデータ タンパク質たんぱくしつファミリー
生物せいぶつ すべ
コンタクト
研究けんきゅう拠点きょてん EBI
主要しゅよう引用いんよう PMID 19920124
アクセス
データフォーマット ストックホルムフォーマット
ウェブサイト pfam.xfam.org
ダウンロードURL FTP 1 FTP 2
ツール
その
ライセンス GNU Lesser General Public License
バージョン 34.0
ブックマーク
エンティティ
yes
テンプレートを表示ひょうじ

Pfamは、タンパク質たんぱくしつファミリーのデータベースであり、アノテーションとかくれマルコフモデルをもちいて生成せいせいされた多重たじゅう配列はいれつアライメントふくんでいる[1][2][3]最新さいしんばんのPfam 33.1は、2020ねん5がつにリリースされ、18,259けんのファミリーを収録しゅうろくしている[4]

用途ようと

[編集へんしゅう]

Pfamデータベースの一般いっぱんてき目的もくてきは、タンパク質たんぱくしつのファミリーとドメインの完全かんぜん正確せいかく分類ぶんるい提供ていきょうすることである[5]。もともと、このデータベース作成さくせい背景はいけいにある理論りろんてき解釈かいしゃくは、ゲノムに注釈ちゅうしゃくける作業さぎょう効率こうりつするために、既知きちタンパク質たんぱくしつファミリーにかんする情報じょうほうはん自動じどう収集しゅうしゅうすることであった[6]タンパク質たんぱくしつファミリーのPfam分類ぶんるいは、タンパク質たんぱくしつ幅広はばひろ網羅もうらし、命名めいめい規則きそくかりやすいことから、生物せいぶつ学者がくしゃひろ採用さいようされている[7]

ほんデータベースは、特定とくていタンパク質たんぱくしつ研究けんきゅうする実験じっけん生物せいぶつ学者がくしゃ構造こうぞう決定けっていあたらしいターゲットを特定とくていする構造こうぞう生物せいぶつ学者がくしゃ配列はいれつ組織そしきする計算けいさん生物せいぶつ学者がくしゃタンパク質たんぱくしつ起源きげん追跡ついせきする進化しんか生物せいぶつ学者がくしゃによって利用りようされている[8]。ヒトやハエなどの初期しょきのゲノムプロジェクトでは、ゲノムデータの機能きのうアノテーションにPfamがひろ利用りようされていた[9][10][11]

Pfamウェブサイトでは、ユーザーがタンパク質たんぱくしつやDNAの配列はいれつ送信そうしんして、データベースないのファミリーと一致いっちするものを検索けんさくできる。DNAが提出ていしゅつされた場合ばあい6フレーム翻訳ほんやく英語えいごばんおこなって、かくフレームを検索けんさくする[12]。Pfamでは、一般いっぱんてきBLAST検索けんさくおこなうのではなく、プロファイルかくれマルコフモデル使用しようしている。このモデルでは保存ほぞんされたサイトでの一致いっちをより重視じゅうしするため、遠隔えんかくあい同性どうせいをよりよく検出けんしゅつでき、注釈ちゅうしゃくきのきんえんしゅがいない生物せいぶつのゲノム注釈ちゅうしゃくけるのにてきしている[13]

Pfamはまた、構造こうぞうデータベースない情報じょうほうとこれらの構造こうぞうへのPfamドメインのマッピングにもとづいて、タンパク質たんぱくしつないおよびタンパク質たんぱくしつあいだのドメイン-ドメイン相互そうご作用さようをカタログするiPfamなどのほかのリソースの作成さくせいにも使用しようされている[14]

特徴とくちょう

[編集へんしゅう]

Pfamないかくファミリーについて、つぎのことができる。

  • ファミリーの説明せつめい表示ひょうじする
  • マルチプルアラインメントを表示ひょうじする
  • タンパク質たんぱくしつドメインの構造こうぞう表示ひょうじする
  • たね分布ぶんぷ調しらべる
  • のデータベースへのリンクをたどる
  • 既知きちタンパク質たんぱくしつ構造こうぞう表示ひょうじする

エントリーには、ファミリー、ドメイン、リピート、モチーフなどの種類しゅるいがある。ファミリーはデフォルトのクラスであり、たんにメンバーが関連かんれんしていることをしめす。ドメインとは、複数ふくすうタンパク質たんぱくしつのコンテキストに存在そんざいする自律じりつ構造こうぞう単位たんいまたはさい利用りよう可能かのう配列はいれつ単位たんい定義ていぎされている。リピートは通常つうじょう単独たんどくでは安定あんていしておらず、ドメインまたは拡張かくちょう構造こうぞう形成けいせいするために、通常つうじょう縦列じゅうれつ反復はんぷく形成けいせいする必要ひつようがある。モチーフ通常つうじょう球状きゅうじょうドメインの外側そとがわにあるみじか配列はいれつ単位たんいである[9]

Pfamファミリーの説明せつめいは、ウィキペディアを使用しようして一般いっぱん人々ひとびと管理かんりしている(「歴史れきし」を参照さんしょう)。

リリース29.0の時点じてんで、UniprotKB英語えいごばんタンパク質たんぱくしつ配列はいれつの76.1%が、すくなくとも1つのPfamドメインと一致いっちしていた[15]

新規しんきエントリーの作成さくせい

[編集へんしゅう]

あたらしいファミリーは、さまざまな情報じょうほうげんからられているが、おもPDBと、Pfamにヒットしない遺伝子いでんしプロテオーム全体ぜんたい解析かいせきからつけされる[16]

ファミリーごとに、代表だいひょうてき配列はいれつのサブセットがこう品質ひんしつなシードアライメントに整列せいれつされる。シードアライメントの配列はいれつは、おもにpfamseq(リファレンスプロテオームの冗長じょうちょうデータベース)から取得しゅとくし、一部いちぶUniprotKB英語えいごばんから補足ほそくされる[15]。このシードアライメントは、つぎに、HMMER英語えいごばん使用しようしたプロファイルがくれマルコフモデルの構築こうちく使用しようされる。そして、このHMMを配列はいれつデータベースで検索けんさくし、精査せいさされた収集しゅうしゅう閾値にたっしたすべてのヒットをタンパク質たんぱくしつファミリーのメンバーとして分類ぶんるいする。このようにしてられたメンバーのコレクションをプロファイルHMMに位置いちわせし、完全かんぜんアライメントを生成せいせいする。

ファミリーごとに、手動しゅどう精査せいさされた収集しゅうしゅう閾値がてられる。この閾値は、そのファミリーにたいするしん適合てきごうすう最大さいだいしつつ、にせ陽性ようせい除外じょがいするものである。にせ陽性ようせいは、おなじクランのものではないPfamファミリーのヒットあいだでの重畳ちょうじょう観察かんさつすることによって推定すいていされる。この閾値は、ファミリーHMMにマッチしたものを、タンパク質たんぱくしつファミリーにふくめる必要ひつようがあるかどうかを評価ひょうかするために使用しようされる。Pfamの更新こうしんのたびに、新規しんきファミリーと既存きそんファミリーが重複じゅうふくしないように、収集しゅうしゅう閾値がさい評価ひょうかされる[16]

機能きのう未知みちドメイン

[編集へんしゅう]

機能きのう未知みちドメイン英語えいごばん(DUF)は、Pfamデータベースのなか増大ぞうだいする部分ぶぶんめている。このファミリーはたねえて保存ほぞんされていることがわかっているが、たしている役割やくわり未知みちのためにこのような名前なまえけられた。あたらしく追加ついかされたかくDUFには、追加ついかされたじゅん名前なまえけられる。これらのエントリの名前なまえは、機能きのう特定とくていされるたびに更新こうしんされる。通常つうじょう、DUFにぞくするすくなくとも1つのタンパク質たんぱくしつ機能きのう決定けっていされると、DUF全体ぜんたい機能きのう更新こうしんされ、ファミリーの名前なまえ変更へんこうされる。名付なづけられたファミリーのなかには、まだ機能きのう未知みちドメインで、代表だいひょうてきタンパク質たんぱくしつにちなんで名前なまえつものもある(れい:YbbR)。機能きのう不明ふめい保存ほぞんされた配列はいれつ配列はいれつデータじょう発見はっけんされるにつれて、DUFのかず増加ぞうかつづけると予想よそうされる。DUFのかずは、最終さいしゅうてきには機能きのうがわかっているファミリーのかず上回うわまわると予想よそうされている[16]

時間じかん経過けいかとともに配列はいれつざんもと網羅もうらりつ増加ぞうかし、ファミリーがえるにつれ、よりおおくの進化しんかてき関係かんけい発見はっけんされ、ファミリーをクラン(clan、一族いちぞく意味いみ)に分類ぶんるいすることができるようになった[8]。クランは、2005ねんにPfamデータベースに最初さいしょ導入どうにゅうされた。これらは、構造こうぞうてき機能きのうてき配列はいれつおよびHMMの比較ひかくによって確認かくにんされた、単一たんいつ進化しんかてき起源きげん共有きょうゆうする関連かんれんファミリーのグループである[5]。リリース29.0の時点じてんで、タンパク質たんぱくしつファミリーのやく1/3がクランに所属しょぞくしていた[15]。この部分ぶぶんは、2019ねん(バージョン32.0)までにやく3/4まで増加ぞうかした[17]

クラン関係かんけい可能かのうせい特定とくていするために、Pfamキュレーターは、ECODデータベースからの情報じょうほうくわえて、出力しゅつりょく単純たんじゅん比較ひかくプログラム(Simple Comparison Of Outputs Program、SCOOP)を使用しようしている[17]。ECODは、構造こうぞうられているタンパク質たんぱくしつファミリーのはん自動じどう階層かいそうがたデータベースであり、Pfamエントリーに容易よういにマッピングされるファミリーと、通常つうじょうPfamクランにマッピングされるホモロジーレベルをそなえている[18]

歴史れきし

[編集へんしゅう]

Pfamは、細胞さいぼう動物どうぶつタンパク質たんぱくしつコード遺伝子いでんし注釈ちゅうしゃくけに使用しようできる、一般いっぱんてき存在そんざいするタンパク質たんぱくしつドメインのコレクションとして、Erik Sonhammer、Sean Eddy、Richard Durbinによって1995ねん設立せつりつされた[6]設立せつりつ当初とうしょおも目的もくてきひとつは、せんちゅうのゲノムのアノテーションけを支援しえんすることであった[6]。このプロジェクトは、Cyrus Chothiaによる「One thousand families for the molecular biologist」(分子生物学ぶんしせいぶつがくしゃのための1000のファミリー)で部分ぶぶんてき推進すいしんされ、タンパク質たんぱくしつにはやく1,500のことなるファミリーがあり、だい多数たすうタンパク質たんぱくしつはそのうちのわずか1,000のファミリーに分類ぶんるいされると主張しゅちょうされた[5][19]。この主張しゅちょうはんして、Pfamデータベースには現在げんざい固有こゆうタンパク質たんぱくしつドメインとファミリーに対応たいおうする16,306けんのエントリーがふくまれている。ただし、これらのファミリーのおおくは、構造こうぞうてきおよび機能きのうてき類似るいじせいふくんでおり、進化しんかじょう起源きげん共有きょうゆうしていることをしめしている(クランこう参照さんしょう[5]

Pfamが設立せつりつされた当時とうじのデータベースとおおきくことなっていたてんは、エントリーに2種類しゅるいのアライメントを使用しようしていたことである。1つは、手動しゅどうでチェックされた小規模しょうきぼなシードアライメントと、もう1つは、シードアラインメントから構築こうちくされたプロファイルがくれマルコフモデルに配列はいれつ整列せいれつさせて構築こうちくされた完全かんぜんアライメントである。このちいさなシードアライメントは、配列はいれつデータベースのあたらしいリリースにわせて更新こうしんすることが容易よういである。そのため、ゲノム配列はいれつがより効率こうりつてきになり、時間じかん経過けいかとともによりおおくのデータを処理しょりする必要ひつようしょうじたときに、どのようにしてデータベースを最新さいしん状態じょうたいたもつかというジレンマにたいする有望ゆうぼう解決かいけつさくとなった。データベースの更新こうしん速度そくどはバージョン24.0でさらに向上こうじょうし、HMMER2の~100ばい速度そくどでよりたか感度かんどつHMMER3が導入どうにゅうされた[8]

Pfam-Aのエントリーはすべての既知きちタンパク質たんぱくしつ網羅もうらしていないため、Pfam-Bとばれる自動じどう生成せいせいされた補足ほそく提供ていきょうされた。Pfam-Bには、ADDAというアルゴリズムによって作成さくせいされたクラスターから派生はせいした多数たすうちいさなファミリーがふくまれていた[20]。Pfam-Bファミリーは品質ひんしつおとるもののPfam-Aファミリーがつからない場合ばあい役立やくだつ。Pfam-Bはリリース28.0で廃止はいしされたが[21]あたらしいクラスタリングアルゴリズムMMSeqs2を使用しようしてリリース33.1でさい導入どうにゅうされた[22]

Pfamは当初とうしょ冗長じょうちょうせい維持いじするために世界中せかいじゅうの3つのミラーサイトでホストされていた。しかし、2012ねんから2014ねんにかけて、PfamリソースはEMBL-EBIに移動いどうされた。これにより、重複じゅうふくする2つの独立どくりつしたデータセンターを使用しようして、1つのドメイン(xfam.org)からウェブサイトをホスティングできるようになった。これにより、複数ふくすうのセンターからのホスティングによる重要じゅうよう障害しょうがい許容きょようりょく維持いじする一方いっぽうで、更新こうしん情報じょうほう一元化いちげんかや、Rfam英語えいごばんTreeFam英語えいごばん、iPfamなどのほかのXfamプロジェクトとのグループ可能かのうになった[23]

Pfamは、キュレーションにかかる手作業てさぎょうをさらに削減さくげんし、より頻繁ひんぱん更新こうしん可能かのうとするために、過去かこ2年間ねんかん大幅おおはばさい編成へんせいおこなった[15]

コミュニティキュレーション

[編集へんしゅう]

このようなだい規模きぼなデータベースをキュレーションするには、新規しんきのファミリーや更新こうしん情報じょうほう追加ついかするりょう維持いじするてん問題もんだい提示ていじした。データベースのリリースを迅速じんそくおこなうために、開発かいはつしゃはデータベースの管理かんりにコミュニティがふか関与かんよできるように、さまざまなみを開始かいしした。

エントリーの更新こうしん改善かいぜんのペースをげるための重要じゅうようなステップは、リリース26.0でPfamドメインの機能きのうアノテーションをウィキペディアコミュニティに公開こうかいすることであった[16]。すでにウィキペディアがエントリをっているエントリはfamページにリンクし、っていないエントリについては、コミュニティがエントリを作成さくせいしてキュレーターに通知つうちしてリンクするようにした。コミュニティの参加さんかにより、これらのファミリーのアノテーションレベルが大幅おおはば向上こうじょうすることが予想よそうされる一方いっぽうで、なかにはウィキペディアに掲載けいさいするには不十分ふじゅうぶんなものもあり、その場合ばあいもとのPfamの記述きじゅつ保持ほじされる。ウィキペディアの記事きじなかには、ジンクフィンガー記事きじのように、複数ふくすうのファミリーをあつかっているものもある。また、InterProおよびPfamのデータにもとづいて記事きじ生成せいせいする自動じどうされた手順てじゅん実装じっそうされており、これは情報じょうほうやデータベースへのリンク、利用りよう可能かのう画像がぞうをページに事前じぜん設定せっていし、キュレーターによるレビューをけた記事きじはサンドボックスからウィキペディアに適切てきせつ移動いどうされる。記事きじ破壊はかい行為こういふせぐために、ウィキペディアのかく改訂かいていばんは、Pfamのウェブサイトに表示ひょうじされるまえに、キュレーターによってレビューされる。ただし、ほとんどすべての破壊はかい行為こういは、キュレーターにとどまえにコミュニティによって修正しゅうせいされている[16]

Pfamは、3つのグループからなる国際こくさいコンソーシアムによって運営うんえいされている。Pfamの初期しょきのリリースでは、ファミリーエントリーの修正しゅうせい英国えいこくのケンブリッジのサイトでしかできず、コンソーシアムメンバーがサイトのキュレーションに貢献こうけんする能力のうりょく制限せいげんされていた。リリース26.0では、開発かいはつしゃあたらしいシステムに移行いこうし、世界中せかいじゅう登録とうろくユーザーがPfamファミリーを追加ついかまたは修正しゅうせいできるようになった[16]

参照さんしょう項目こうもく

[編集へんしゅう]

脚注きゃくちゅう

[編集へんしゅう]
  1. ^ Finn RD, Tate J, Mistry J, Coggill PC, Sammut SJ, Hotz HR, Ceric G, Forslund K, Eddy SR, Sonnhammer EL, Bateman A (2008). “The Pfam protein families database”. Nucleic Acids Res 36 (Database issue): D281–8. doi:10.1093/nar/gkm960. PMC 2238907. PMID 18039703. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2238907/. 
  2. ^ Finn, R. D.; Mistry, J.; Schuster-Böckler, B.; Griffiths-Jones, S.; Hollich, V.; Lassmann, T.; Moxon, S.; Marshall, M. et al. (Jan 2006). “Pfam: clans, web tools and services” (Free full text). Nucleic Acids Research 34 (Database issue): D247–D251. doi:10.1093/nar/gkj149. ISSN 0305-1048. PMC 1347511. PMID 16381856. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1347511/. 
  3. ^ Bateman, A.; Coin, L.; Durbin, R.; Finn, R. D.; Hollich, V.; Griffiths-Jones, S.; Khanna, A.; Marshall, M. et al. (2004). “The Pfam protein families database”. Nucleic Acids Research 32 (Database issue): 138D–1141. doi:10.1093/nar/gkh121. ISSN 0305-1048. PMC 308855. PMID 14681378. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC308855/.  オープンアクセス
  4. ^ Pfam 31.0 is released”. Xfam Blog (8 March 2017). 13 March 2017閲覧えつらん
  5. ^ a b c d Sammut, Stephen; Finn, Robert D.; Bateman, Alex (2008). “Pfam 10 years on: 10 000 families and still growing”. Briefings in Bioinformatics 9 (3): 210–219. doi:10.1093/bib/bbn010. PMID 18344544. 
  6. ^ a b c Sonnhammer, Erik L.L.; Eddy, Sean R.; Durbin, Richard (1997). “Pfam: A Comprehensive Database of Protein Domain Families Based on Seed Alignments”. Proteins 28 (3): 405–420. doi:10.1002/(sici)1097-0134(199707)28:3<405::aid-prot10>3.0.co;2-l. PMID 9223186. 
  7. ^ Xu, Qifang; Dunbrack, Roland L. (2012). “Assignment of protein sequences to existing domain and family classification systems: Pfam and the PDB”. Bioinformatics 28 (21): 2763–2772. doi:10.1093/bioinformatics/bts533. PMC 3476341. PMID 22942020. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3476341/. 
  8. ^ a b c Finn, R. D.; Mistry, J.; Tate, J.; Coggill, P.; Heger, A.; Pollington, J. E.; Gavin, O. L.; Gunasekaran, P. et al. (2009). “The Pfam protein families database”. Nucleic Acids Research 38 (Database): D211–D222. doi:10.1093/nar/gkp985. ISSN 0305-1048. PMC 2808889. PMID 19920124. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2808889/. 
  9. ^ a b Bateman A, Birney E, Cerruti L, Durbin R, Etwiller L, Eddy SR, Griffiths-Jones S, Howe KL, Marshall M, Sonnhammer EL (2002). “The Pfam protein families database”. Nucleic Acids Res. 30 (1): 276–80. doi:10.1093/nar/30.1.276. PMC 99071. PMID 11752314. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC99071/. 
  10. ^ Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, Scherer SE, Li PW, Hoskins RA, Galle RF, George RA, Lewis SE, Richards S, Ashburner M, Henderson SN, Sutton GG, Wortman JR, Yandell MD, Zhang Q, Chen LX, Brandon RC, Rogers YH, Blazej RG, Champe M, Pfeiffer BD, Wan KH, Doyle C, Baxter EG, Helt G, Nelson CR, Gabor GL, Abril JF, Agbayani A, An HJ, Andrews-Pfannkoch C, Baldwin D, Ballew RM, Basu A, Baxendale J, Bayraktaroglu L, Beasley EM, Beeson KY, Benos PV, Berman BP, Bhandari D, Bolshakov S, Borkova D, Botchan MR, Bouck J, Brokstein P, Brottier P, Burtis KC, Busam DA, Butler H, Cadieu E, Center A, Chandra I, Cherry JM, Cawley S, Dahlke C, Davenport LB, Davies P, de Pablos B, Delcher A, Deng Z, Mays AD, Dew I, Dietz SM, Dodson K, Doup LE, Downes M, Dugan-Rocha S, Dunkov BC, Dunn P, Durbin KJ, Evangelista CC, Ferraz C, Ferriera S, Fleischmann W, Fosler C, Gabrielian AE, Garg NS, Gelbart WM, Glasser K, Glodek A, Gong F, Gorrell JH, Gu Z, Guan P, Harris M, Harris NL, Harvey D, Heiman TJ, Hernandez JR, Houck J, Hostin D, Houston KA, Howland TJ, Wei MH, Ibegwam C, Jalali M, Kalush F, Karpen GH, Ke Z, Kennison JA, Ketchum KA, Kimmel BE, Kodira CD, Kraft C, Kravitz S, Kulp D, Lai Z, Lasko P, Lei Y, Levitsky AA, Li J, Li Z, Liang Y, Lin X, Liu X, Mattei B, McIntosh TC, McLeod MP, McPherson D, Merkulov G, Milshina NV, Mobarry C, Morris J, Moshrefi A, Mount SM, Moy M, Murphy B, Murphy L, Muzny DM, Nelson DL, Nelson DR, Nelson KA, Nixon K, Nusskern DR, Pacleb JM, Palazzolo M, Pittman GS, Pan S, Pollard J, Puri V, Reese MG, Reinert K, Remington K, Saunders RD, Scheeler F, Shen H, Shue BC, Sidén-Kiamos I, Simpson M, Skupski MP, Smith T, Spier E, Spradling AC, Stapleton M, Strong R, Sun E, Svirskas R, Tector C, Turner R, Venter E, Wang AH, Wang X, Wang ZY, Wassarman DA, Weinstock GM, Weissenbach J, Williams SM, WoodageT, Worley KC, Wu D, Yang S, Yao QA, Ye J, Yeh RF, Zaveri JS, Zhan M, Zhang G, Zhao Q, Zheng L, Zheng XH, Zhong FN, Zhong W, Zhou X, Zhu S, Zhu X, Smith HO, Gibbs RA, Myers EW, Rubin GM, Venter JC (2000). “The genome sequence of Drosophila melanogaster”. Science 287 (5461): 2185–95. Bibcode2000Sci...287.2185.. doi:10.1126/science.287.5461.2185. PMID 10731132. 
  11. ^ Lander, Eric S.; Linton, Lauren M.; Birren, Bruce; Nusbaum, Chad; Zody, Michael C. et al. (2001). “Initial sequencing and analysis of the human genome”. Nature 409 (6822): 860–921. doi:10.1038/35057062. ISSN 0028-0836. PMID 11237011. 
  12. ^ Finn, Robert D.; Bateman, Alex; Clements, Jody; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Heger, Andreas; Hetherington, Kirstie et al. (2014). “Pfam: the protein families database”. Nucleic Acids Research 42 (D1): D222–D230. doi:10.1093/nar/gkt1223. ISSN 0305-1048. PMC 3965110. PMID 24288371. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3965110/. 
  13. ^ Sonnhammer EL, Eddy SR, Birney E, Bateman A, Durbin R (1998). “Pfam: multiple sequence alignments and HMM-profiles of protein domains”. Nucleic Acids Res. 26 (1): 320–2. doi:10.1093/nar/26.1.320. PMC 147209. PMID 9399864. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC147209/. 
  14. ^ Finn, R. D.; Marshall, M.; Bateman, A. (2004). “iPfam: visualization of protein-protein interactions in PDB at domain and amino acid resolutions”. Bioinformatics 21 (3): 410–412. doi:10.1093/bioinformatics/bti011. ISSN 1367-4803. PMID 15353450. 
  15. ^ a b c d Finn, Robert D.; Coggill, Penelope; Eberhardt, Ruth Y.; Eddy, Sean R.; Mistry, Jaina; Mitchell, Alex L.; Potter, Simon C.; Punta, Marco et al. (2016). “The Pfam protein families database: towards a more sustainable future”. Nucleic Acids Research 44 (D1): D279–D285. doi:10.1093/nar/gkv1344. ISSN 0305-1048. PMC 4702930. PMID 26673716. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4702930/. 
  16. ^ a b c d e f Punta, M.; Coggill, P. C.; Eberhardt, R. Y.; Mistry, J.; Tate, J.; Boursnell, C.; Pang, N.; Forslund, K. et al. (2011). “The Pfam protein families database”. Nucleic Acids Research 40 (D1): D290–D301. doi:10.1093/nar/gkr1065. ISSN 0305-1048. PMC 3245129. PMID 22127870. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3245129/. 
  17. ^ a b El-Gebali, Sara; Mistry, Jaina; Bateman, Alex; Eddy, Sean R; Luciani, Aurélien; Potter, Simon C; Qureshi, Matloob; Richardson, Lorna J et al. (8 January 2019). “The Pfam protein families database in 2019”. Nucleic Acids Research 47 (D1): D427–D432. doi:10.1093/nar/gky995. PMC 6324024. PMID 30357350. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6324024/. 
  18. ^ Evolutionary Classification of Protein Domains”. prodata.swmed.edu. 18 May 2019閲覧えつらん
  19. ^ Chothia, Cyrus (1992). “One thousand families for the molecular biologist”. Nature 357 (6379): 543–544. Bibcode1992Natur.357..543C. doi:10.1038/357543a0. ISSN 0028-0836. PMID 1608464. 
  20. ^ Heger, A.; Wilton, C. A.; Sivakumar, A.; Holm, L. (Jan 2005). “ADDA: a domain database with global coverage of the protein universe” (Free full text). Nucleic Acids Research 33 (Database issue): D188–D191. doi:10.1093/nar/gki096. ISSN 0305-1048. PMC 540050. PMID 15608174. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC540050/. 
  21. ^ Pfam 28.0 release notes”. 30 June 2015閲覧えつらん
  22. ^ A new Pfam-B is released” (英語えいご). Xfam Blog (30 June 2020). 2021ねん5がつ6にち閲覧えつらん
  23. ^ Moving to xfam.org”. 25 November 2016閲覧えつらん
  24. ^ Dunbrack, Roland. “PDBfam”. Fox Chase Cancer Center. 9 March 2013閲覧えつらん
  25. ^ Xu, Qifang; Dunbrack, Roland (2012). “Assignment of protein sequences to existing domain and family classification systems: Pfam and the PDB”. Bioinformatics 28 (21): 2763–72. doi:10.1093/bioinformatics/bts533. PMC 3476341. PMID 22942020. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3476341/. 

外部がいぶリンク

[編集へんしゅう]
  • Pfam - EBI UKのタンパク質たんぱくしつファミリーデータベース
  • iPfam - PDBにおけるPfamドメインの相互そうご作用さよう
  • PDBfam - 米国べいこくFox Chase Cancer Center英語えいごばんでのPfamドメインとPDBの配列はいれつとの関連かんれん
  • PlantTFDB - Pfamドメインにもとづいた植物しょくぶつ転写てんしゃ因子いんしのファミリーてルール