(Translated by https://www.hiragana.jp/)
InChI - Wikipedia コンテンツにスキップ

InChI

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
InChI
開発元かいはつもと InChI Trust
初版しょはん 2005ねん4がつ15にち (2005-04-15)[1][2]
最新さいしんばん
1.04 / 2011ねん9がつ (13ねんまえ) (2011-09)
リポジトリ ウィキデータを編集
対応たいおうOS Microsoft Windows and Unix-like
プラットフォーム IA-32 and x86-64
サイズ 4.3 MB
対応たいおう言語げんご 英語えいご
サポートじょうきょう Active
ライセンス IUPAC / InChI Trust Licence
公式こうしきサイト https://www.inchi-trust.org/
テンプレートを表示ひょうじ

InChI(International Chemical Identifier)は、標準ひょうじゅんてきかつ人間にんげんめる方法ほうほう分子ぶんし情報じょうほう提供ていきょうし、またウェブじょうでのデータベースからの情報じょうほう検索けんさく機能きのう提供ていきょうする。元々もともと、2000ねんから2005ねんIUPACNISTによって開発かいはつされ、フォーマットとアルゴリズムは営利えいりであり、開発かいはつ継続けいぞくは、IUPACも参画さんかくする営利えいり団体だんたいのInChI Trustにより、2010ねんまでサポートされていた。現在げんざいの1.04はんは、2011ねん9がつにリリースされた。

1.04はんまえまでは、ソフトウェアはオープンソースGNU Lesser General Public License無償むしょう入手にゅうしゅできたが[3]現在げんざいは、IUPAC-InChI Trust Licenseとばれる固有こゆうのライセンスとなっている[4]

概要がいよう

[編集へんしゅう]

識別子しきべつしは、情報じょうほうのレイヤーとして化学かがく物質ぶっしつ記述きじゅつする。レイヤーには、原子げんしとその結合けつごう互変異性いせい情報じょうほう同位どういたい情報じょうほう立体りったい化学かがく電荷でんか情報じょうほうがある。しかしすべてのレイヤーが提供ていきょうされるわけではなく、たとえば互変異性いせいのレイヤーは省略しょうりゃくされることがある。

ひろもちいられているCAS登録とうろく番号ばんごうとは、以下いかてんことなる。

  • 自由じゆう使つかえ、営利えいりである。
  • 構造こうぞう情報じょうほうから計算けいさんでき、組織そしきによる割当わりあて必要ひつようない。
  • ほとんどの情報じょうほうは、ひとむことができる。

そのため、InChIは、IUPAC命名めいめいほう一般いっぱん極端きょくたん定式ていしきしたものとなすことができる。単純たんじゅんSMILES記法きほうよりもおおくの情報じょうほう表現ひょうげんでき、すべての構造こうぞうが、データベースの応用おうよう必要ひつよう独自どくじのInChI文字もじれつてんことなっている[よう出典しゅってん]原子げんしの3次元じげん配列はいれつ情報じょうほうはInChIではあらわせず、この目的もくてきのためにはPDBひとしのフォーマットがもちいられる。

InChIアルゴリズムは、入力にゅうりょくされた構造こうぞう情報じょうほうを、正規せいき冗長じょうちょう情報じょうほう除去じょきょ)、標準ひょうじゅんかく原子げんし固有こゆう番号ばんごう生成せいせい)、整列せいれつ特徴とくちょう文字もじれつ付与ふよ)の3段階だんかい過程かてい固有こゆう識別子しきべつし変換へんかんする。

hashed InChIともばれるInChIKeyは、25文字もじ固定こていちょうであるが、デジタル表現ひょうげんなので人間にんげんにはむことができない。InChIKeyの仕様しようは、ウェブでの検索けんさく可能かのうにするために、2007ねん9がつにリリースされた[5]。InChIそのものとはことなり、InChIKeyは一意いちいではなく、非常ひじょうまれではあるが重複じゅうふく発生はっせいする[6]

2009ねん1がつ、InChIソフトウェアの最終さいしゅうの1.02はんがリリースされた。これにより、いわゆるstandard InChI生成せいせい可能かのうとなった。standard InChIは、InChI文字もじれつと、ことなったグループによって生成せいせいされたキーの比較ひかく容易よういにし、データベースやウェブ資源しげんとう広範こうはん情報じょうほうげんからのアクセスを可能かのうにした。

フォーマットとレイヤー

[編集へんしゅう]
InChI format
MIMEタイプchemical/x-inchi
種別しゅべつchemical file format

すべてのInChIは、InChI=という文字もじれつからはじまり、バージョン(現在げんざい1)がつづく。standard InChIでは、これにS文字もじつづく。のこりの情報じょうほうは、レイヤーとサブレイヤーの配列はいれつとして構造こうぞうされ、各々おのおののレイヤーは、1つの種類しゅるい情報じょうほうおさめる。レイヤーとサブレイヤーは、区切くぎ文字もじ /へだてられ、(メインレイヤーの化学かがくしきサブレイヤーをのぞき)固有こゆう接頭せっとう文字もじはじまる。6つのレイヤーと各々おのおの重要じゅうようなサブレイヤーは、以下いかとおりである。

  1. メインレイヤー
    • 組成そせいしき接頭せっとう文字もじなし) - すべてのInChIにあらわれる唯一ゆいいつのサブレイヤー
      元素げんそはHill順位じゅんいそく、すなわち炭素たんそC、水素すいそH、元素げんそをアルファベットじゅん、で記述きじゅつされる
    • 原子げんしつながり(接頭せっとう文字もじ: c) - 組成そせいしきちゅう水素すいそ以外いがい元素げんそには出現しゅつげんじゅん番号ばんごう付与ふよされる。このサブレイヤーでは、原子げんしのどの原子げんし結合けつごうされているかを記述きじゅつする。
    • 水素すいそ原子げんし接頭せっとう文字もじ: h) - 各々おのおの原子げんしにいくつの水素すいそ原子げんし結合けつごうしているかを記述きじゅつする。
  2. 電荷でんかレイヤー
    • プロトンサブレイヤー(接頭せっとう文字もじ: p中性ちゅうせいけいからプロトンなん付加ふか/除去じょきょするかをあらわ
    • 電荷でんかサブレイヤー(接頭せっとう文字もじ: qけい電荷でんかあらわ
  3. 立体りったい化学かがくレイヤー
    • じゅう結合けつごうクムレン接頭せっとう文字もじ: b
    • 原子げんしよん面体めんてい配置はいちアレーン接頭せっとう文字もじ: t, m
    • 立体りったい化学かがく種類しゅるい情報じょうほう接頭せっとう文字もじ: s
  4. 同位どういたいレイヤー(接頭せっとう文字もじ: i, h同位どういたい立体りったい化学かがくたいしては b, t, m, s
  5. 固定こていHレイヤー(接頭せっとう文字もじ: f) - 原子げんしつながり以外いがいの、上記じょうき一部いちぶまたはすべてのレイヤーをふくむ。oサブレイヤーでわってもよい。
    InChI生成せいせい構造こうぞう正規せいきするさい水素すいそ除去じょきょされるため、互変異性いせいたいそうせいイオンなどはおなじInChIをあたえる場合ばあいがある。これらを区別くべつするために水素すいそ結合けつごうしている原子げんし明示めいじてきあたえる必要ひつようがある。
  6. さい接続せつぞくレイヤー(接頭せっとう文字もじ: r) - 金属きんぞく原子げんしさい接続せつぞくするすべての構造こうぞうのInChIをふくむ。standard InChIにはふくまれない。

区切くぎ文字もじ接頭せっとう文字もじのフォーマットは、使用しようしゃ特定とくていのレイヤーのみ合致がっちする識別子しきべつしさがすために容易よういワイルドカード検索けんさく実施じっしできるてん優位ゆういせいがある。

CH3CH2OH
エタノール
InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3

InChI=1S/C2H6O/c1-2-3/h3H,2H2,1H3 (standard InChI)

CH3N+H3
メチルアンモニウム
InChI=1/CH5N/c1-2/h2H2,1H3/p+1

InChI=1S/CH5N/c1-2/h2H2,1H3/p+1 (standard InChI)


L-アスコルビンさん
InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1

InChI=1S/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-8,10-11H,1H2/t2-,5+/m0/s1 (standard InChI)


名前なまえ

[編集へんしゅう]

このフォーマットは、元々もともとIChI(IUPAC Chemical Identifier)とばれていたが、2004ねん7がつINChI(IUPAC-NIST Chemical Identifier)と改名かいめいされ、同年どうねん11がつInChI(IUPAC International Chemical Identifier)にさい改名かいめいされ、IUPACの商標しょうひょうとされた。

開発かいはつ継続けいぞく

[編集へんしゅう]

InChIの管理かんりは、IUPACのVIIIしょう委員いいんかいおこなわれており、あたらしい標準ひょうじゅん拡張かくちょうのための調査ちょうさとう経費けいひは、IUPACとInChI Trustが負担ふたんしている。InChI Trustは、InChIの発展はってん試験しけん文書ぶんしょ整備せいびのための資金しきんしている。現在げんざい拡張かくちょうでは、じゅう合体がったいおよ混合こんごうぶつマルクーシュ構造こうぞう反応はんのう有機ゆうき金属きんぞく取扱とりあつかいについて定義ていぎしており、VIIIしょう委員いいんかい承認しょうにんされればアルゴリズムにくわえられる。

採用さいよう

[編集へんしゅう]

InChIは、ChemSpiderPubChemひとしふく大小だいしょう様々さまざまなデータベースに採用さいようされている。しかし、おおくのデータベースで構造こうぞうとInChIのちがいがられ、リンクようデータベースの課題かだいとなっている[7]

関連かんれん項目こうもく

[編集へんしゅう]

出典しゅってん

[編集へんしゅう]
  1. ^ IUPAC International Chemical Identifier Project Page”. IUPAC. 5 December 2012閲覧えつらん[リンク]
  2. ^ Heller, S.; McNaught, A.; Stein, S.; Tchekhovskoi, D.; Pletnev, I. (2013). “InChI - the worldwide chemical structure identifier standard”. Journal of Cheminformatics 5 (1): 7. doi:10.1186/1758-2946-5-7. PMC 3599061. PMID 23343401. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3599061/?tool=pmcentrez. 
  3. ^ McNaught, Alan (2006ねん). “The IUPAC International Chemical Identifier:InChl”. Chemistry International (IUPAC) 28 (6). http://www.iupac.org/publications/ci/2006/2806/4_tools.html 2007ねん9がつ18にち閲覧えつらん 
  4. ^ http://www.inchi-trust.org/sites/default/files/inchi-1.04/LICENCE.pdf [リンク]
  5. ^ The IUPAC International Chemical Identifier (InChI)”. IUPAC (5 September 2007). 2007ねん9がつ18にち閲覧えつらん[リンク]
  6. ^ E.L. Willighagen (17 September 2011). “InChIKey collision: the DIY copy/pastables”. 2012ねん11月6にち閲覧えつらん
  7. ^ Akhondi, S. A.; Kors, J. A.; Muresan, S. (2012). “Consistency of systematic chemical identifiers within and between small-molecule databases”. Journal of Cheminformatics 4 (1): 35. doi:10.1186/1758-2946-4-35. PMC 3539895. PMID 23237381. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3539895/?tool=pmcentrez. 

外部がいぶリンク

[編集へんしゅう]

ドキュメントとプレゼンテーション

[編集へんしゅう]

ソフトウェアとサービス

[編集へんしゅう]
  • NCI/CADD Chemical Identifier Resolver Generates and resolves InChI/InChIKeys and many other chemical identifiers
  • ChemSpider InChI resolver
  • Search Google for molecules (generates InChI from interactive chemical and searches Google for any pages with embedded InChIs). Requires Javascript enabled on browser
  • ChemSketch, free chemical structure drawing package that includes input and output in InCHI format
  • PubChem online molecule editor that supports SMILES/SMARTS and InChI
  • ChemSpider Services that allows generation of InChI and conversion of InChI to structure (also SMILES and generation of other properties)
  • MarvinSketch from ChemAxon, implementation to draw structures (or open other file formats) and output to InChI file format
  • BKchem implements its own InChI parser and uses the IUPAC implementation to generate InChI strings
  • CompoundSearch implements an InChI and InChI Key search of spectral libraries
  • JNI-InChI Java library that wraps the InChI library
  • the Chemistry Development Kit uses JNI-InChI to generate InChIs, can convert InChIs into structures, and generate tautomers based on the InChI algorithms
  • Bioclipse generates InChI and InChIKeys for drawn structures or opened files