Vol.4 No.1 2011
38/74

研究論文:有機化合物のスペクトルデータベースの開発と公開サービス(齋藤ほか)−35−Synthesiology Vol.4 No.1(2011)られませんが、産総研発足後、大量のデータをまとめて提供したことが数件あり、いずれも契約に基づいて著作権料の支払いを受けています。また、現在でもIRスペクトルについては新規公開するごとに提供し、著作権料の支払いを受けている案件があります。ちなみに、米国の某データベースにはアナログデータ(gif画像データ)を提供した経験があります。議論6 ほかのスペクトルデータベースとの比較質問(小野 晃)世界にはこのデータベースのほかにも公開されているスペクトルデータベースがあるのではないかと思います。特に有料でデジタルのスペクトルデータを企業等に頒布するサービスをしている企業はあるのではないでしょうか。それらを紹介していただき、このデータベースとの役割や特徴の違いに関してご教示願います。回答(齋藤 剛)まず、ウェブ公開しているスペクトルデータベースはそれほど多くありません。このデータベースのように無料で多くのスペクトルデータを閲覧可能なものは限定されます。特にこれだけ1H NMRのスペクトルパターンとその化合物への帰属情報を無料で閲覧することができるスペクトルデータベースは、このデータベース以外には著者が調べた範囲ではありません。数少ないウェブ公開のデータベースの中でまず挙げられるのは、米国国立標準技術研究所(National Institute of Standards and Technology, NIST)が提供するNIST Chemistry WebBook (http://webbook.nist.gov/)です。物理化学情報やスペクトル情報等、さまざまな情報をウェブを通して無料で利用することができます。これは産総研の研究情報公開データベース(RIO-DB)と類似しており、NISTで得られた成果を中心にそのデータを公開しているもので、公開されているスペクトルはMSが1.5万件、IRが1.6万件のほかに紫外可視吸収スペクトルやテラヘルツスペクトルがあります。ウェブを通した利用は、NIST WebBookを閲覧するために特別なソフトウエアをインストールする必要はありません。化合物を検索した結果から、スペクトルやそのほかの情報を参照する形で構成されています。化合物リストを把握しておらず推測ですが、一般的な試薬は多く収録されており、本スペクトルデータベースと同様公的機関としての役割を担っていると考えます。この一方で、MSデータはNISTで評価したスペクトルを中心に、米国国立衛生研究所(NIH)と米国環境保護庁(EPA)のデータを合わせてNIST 08 Mass Spectral Library(2008年に発表されたもので、旧バージョンは2005年に発表された)としてパソコン単体で利用するよう販売されています。データはウェブで公開されているデータ数よりはるかに多く、約19万の化合物に対して22万件のスペクトルが収録されています。旧工業技術院の時代に共同研究を行った際に、このデータベースのMSデータも数多く登録されており、このデータもこのライブラリのデータの一部になっていると思われます。このデータベースは有償で配布されており、多くの質量分析装置に搭載して、質量ピークのパターン検索に利用されています。SpecInfoは1H NMRが9万件以上、13C NMRが30万件以上、このほかの核種のNMRやIRやMSも収録されているスペクトルデータベースで、ウェブをとおして有料公開を行っていますが、NMRスペクトルが2006年に更新されたのを最後に、データの更新がされていないようです。国内では、分散型データベースで基礎代謝、植物二次代謝標準物質の高精度精密質量スペクトルを対象として、ウェブでデータ公開を行っているMassBank(http://www.massbank.jp/)があります。2010年12月1日の時点で、19研究機関から約3万スペクトルがウェブで無料公開されています。登録されるデータが、このデータベース(SBDS)とは異なり植物二次代謝物質と専門性の高い領域をターゲットに高分解能MSスペクトルを集積しており、検索等に利用するツールをクライアントパソコンにインストールする事で、データベースの検索や、スペクトルの拡大等を含めたデータ参照、そしてデータ登録を行うことができるようになっています。2006年度から、(独)科学技術振興機構バイオインフォマティクス推進事業の研究課題「メタボローム・マススペクトル統合データベースの構築」で構築を行っているもので、このデータベースも開発当初はこのようなプロジェクトで基礎を固めたことにかんがみると、このプロジェクトが修了した後どの様な形にMassBankが発展して行くか期待しています。ウェブ公開ではない形で提供しているものにBio-Rad社のスペクトルデータベースがあります。かつてのSadtler社のデータを中心に、SpecInfo、NISTのMSやこのデータベースのNMR等のデータを収録しており、検索したり物質の同定に活用したりする独自の検索ソフトウエアである「KnowItAll」と合わせてパソコン単体にデータをインストールして利用する形で販売されています。登録されているスペクトル概数は、1H NMRが5万件、13Cが43万件、MSが19万件、Ramanが7千件、IRが23万件です。1Hと13C NMRにはこのデータベースのスペクトルのデータがそれぞれ約1.3万件と1.1万件登録されています。それぞれのスペクトルのパターン検索を利用することが可能で混合物のスペクトルマッチング等、複雑な検索も行うことが可能なソフトウエアを搭載しています。一方、試薬会社のSigma-Aldrich社が、「Aldrichスペクトルライブラリー」を販売しています。これにはNMR、IRとRaman合わせて延べ5万物質以上が登録されており、パソコン単体で利用する形態と、スペクトル集の書籍としての形態で販売されています。ウェブ公開するデータベースとパソコン単体で駆動されるデータベースとを比較すると、それぞれ一長一短があります。例えば、ウェブで公開するデータベースの利点としては即時性が挙げられます。このデータベースはデータの追加、更新作業を比較的簡易に行うことが可能であり、年に2回のデータ更新を行っており、常に最新のデータをユーザーへ供給しています。ただ、上に示した多くのデータベースは、スペクトルの追加、更新作業をこのような頻度で行っていないようです。一方、パソコン上で単独に駆動されるデータベースは利便性に勝り、例えばスペクトルのパターン一致検索ができる等、ユーザーへの利便性が高いものとなっているようです。

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です