Vol.2 No.1 2009
64/94

研究論文:創薬の効率を飛躍的に高めた化合物スクリーニング計算(福西ほか)−61−Synthesiology Vol.2 No.1(2009)2 目標目標は、毎年市販される数百万種類の化合物をもとにして、VSで用いることができる化合物DBを短期間に作成し、すみやかに医薬品産業界で利用可能にすることである。世界の主たる数十の試薬ベンダーは2次元の分子構造を記載した電子ファイルを試薬カタログとして配布しているが、VSでは、2次元の化学構造式ではなく、3次元の立体的な分子構造が必要である。したがって、カタログ上の数百万種類の2次元構造式から3次元構造を作成し、それらをデータベース化して配布することとした。3 価値医薬品の開発は、いかなる手法であれ、最初は化合物データベースから標的蛋白質に結合しうるヒット化合物を探索することから始まる。現代的な創薬では、計算機を用いて化合物データベースを探索することは必須である。ここにはいくつかの問題があった。(1)VS用化合物DBは、海外ソフトウェア会社により1980年ごろより医薬品メーカー向けに開発・市販されてきたが、年間1ライセンス当たり400-600万円と高価である[1]。(2)化合物DBを作成するためのソフト類も海外ソフトウェア会社より市販されている[2]。我々もVSを行うため、高価な化合物DB作成ソフトなどを使ってみたが、品質に問題があり、しばしば誤った3次元分子構造を提示する、あるいは水素原子の付加に間違い・存在確率が低い構造の生成があるなどの問題があった。(3)化合物DBを作成するための市販ソフトには、使用許諾条件上、生成したデータ を他者に配布できない。後に述べるように、我々は化合物DBを元にして、蛋白質−化合物相互作用行列という新しいVS用DBを作成し、配布することが使命である。しかし、市販ソフトを用いると、この目的が達成できない。もし、化合物データ生成ソフトを自作し、さらに化合物DBも自前で作成すれば、上記の問題が解決される。これらを配布すれば、高価なライセンス料を支払えない中小企業・アカデミック研究者にVSの利用を促し、大企業に対しても新しい高度なVS手法を普及できるなどの経済的・技術的効果が見込まれる。4 プロセス4.1 全体像全体の開発プロセスを以下のように設定した。約10ステップある(図1)。試薬ベンダーから提供される2次元SDファイル用語1には化合物の重複があるため、まず、これを除外する(例えばどのベンダーでもメタノールは売っている)。2次元構造式では通常、水素原子(H原子)が省略されているためH原子を付加する。全ての原子に、原子間の距離や結合角などのパラメータを割り当てる。この情報をもとに2次元構造座標から3次元構造座標を生成し、光学異性体があれば光学異性体も発生させる。量子化学計算により原子電荷を計算し、等価な原子が等価な電荷を持つようにする。こうして生成した3次元データはリレーショナルデータベースに収録する。各ステップにつき市販ソフトが存在する場合が多く、それらの特許を回避するようにソフト開発を進めた。以下に各ステップについて述べる。4.2 大量のデータの扱いデータは数が多いと取り扱いに困難をきたす。数百万の化合物情報は、1ファイルに格納するとファイルサイズが大きくなりすぎて計算機で扱えなくなる。1ファイルに1化合物を記載すると、計算機システムの制約上、数百万のファイルを1つのフォルダーに置くことができない。そこで、1ファイルに1化合物を記載し、1フォルダーに1万化合物程度を置き、このフォルダーを数百用意するという階層構造で数百万の化合物情報を扱うことにした。できあがりの化合物DBは64bitアーキテクチャー上で1つのリレーショナルデータベースとして保存できた。4.3 分子の重複を除く:化合物同一性の判断2つの分子が同一か異なるかを判定する必要がある。400万個の分子の同一性を判断する作業は400万x400万回に達するため、我々は下記に述べる高速な数段階での同一性判断法を開発した。また、速度を優先するために判断の精度を一定程度落とすことを許容した。なぜなら実際に購入した市販化合物には、構造式の同定の誤りや、品質管理の落ち度により実際の構造と異なる場合が数%ある。したがって、数学的厳密さを過度に追求しても意味がないからである。4.3.1 擬似分子量による化学組成式の同一性判断化学組成式は、分子に含まれる元素の種類と数を表記したものであり、メタノール(CH3-OH)ならばC1O1H4と図1 化合物立体構造の作成手順電子カタログの情報・2次元平面構造・水素原子なし・電荷情報なし・光学異性なし・水素原子の付加・芳香族環の判定・原子タイプの判定・エネルギー的に安定な立体構造の発生・光学異性体の発生・量子化学計算による原子電荷発生・mol2ファイル形式へ変換・データベース化2次元電子カタログからの化合物 3次元データベースの作成

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です