Vol.4 No.1 2011
31/74
研究論文:有機化合物のスペクトルデータベースの開発と公開サービス(齋藤ほか)−28−Synthesiology Vol.4 No.1(2011)試薬瓶に対して与えられるビン番号、取得した各スペクトルに対して与えられるスペクトル管理番号と、そのうちデータベースに登録されたものに与えられるスペクトルコード、各化合物に対して与えられるSDBS化合物番号(このデータベース内では単にSDBS番号と呼ばれている)である。スペクトルコードは、MS、IR、13C NMRと1H NMRで別々に管理しており、それぞれの化合物情報やスペクトルデータは独立したデータベースとして切り出すことも可能である。これらの番号に対応した化合物情報やスペクトル情報はリレーショナルデータベースの形態で管理しており、現場での作業が円滑に行えるようにした。特に化合物に固有なSDBS化合物番号を採用したことは、このデータベースの特徴である。この番号は単なる化合物の管理番号ではなく、この採用によって、データベースの中で化合物辞書を一つのデータベースとしてスペクトルデータベースから独立させたので、柔軟な変更が可能となり、現在でも有用な化合物情報としてこのデータベースの運営を可能としている。この画期的なSDBS化合物番号を採用した背景には、旧工業技術院時代に先行的な研究を行っていたガスクロマトグラフィーデータ委員会、赤外データ委員会、NMRデータ小委員会等でのさまざまな成果があり、またこのデータベースの基本構造の設計時に多くの知見の蓄積があり、そのことが30年近くたった現在でも機能するデータベースを可能としたと考えられる。このデータベースではすべて産総研が入手した化合物に対して実際にスペクトル測定をしてデータを取得することを原則とした。入手した化合物の試薬瓶ごとに固有の番号であるビン番号を付与した。一方、SDBS化合物番号は化合物に対する固有の番号であることから、ある新たな試薬瓶に入っている化合物がすでに登録された化合物と同じ化合物であるかどうかの判断を行う必要があり、既登録の化合物と一致しなかった場合にのみ新しいSDBS化合物番号を付与した。化合物数が多くなかった初期の時点ではこの作業はさほど困難なものではなかったと思われるが、これらの確認作業には疑問や問題が生じることもしばしばあった。3万件に及ぶ化合物を対象とし、しかも開発当初とは異なり化合物の名称やその構造がより複雑になった現在においては、化合物に対して固有の番号を付与することはより労力と時間を要する作業となり、専門化学者がこれらを行う必要性があるために、スペクトル収集そのものよりも労力と時間を費やすようになっていった。この問題を解決し、専門家のリソースをスペクトル測定、収集、評価により多く確保するために、SDBS化合物番号の確認方法として、多くの化合物情報項目の一致検索を行った結果、データベースにすでに登録されている可能性があるという判定が示されたときにのみ、複数の専門化学者が疑問点を重点的に確認する方式を確立した。これにより、作業の質を落とすことなく、SDBS化合物番号を付与するために専属の専門家が不要となっただけでなく、データベースの化合物登録作業が円滑になり、化合物番号の重複が起きにくくなった。2.2 データベースの運用とプラットフォーム変更に際しての判断開発当初の1980年代はこのデータベースの運用を大型コンピュータで開始した。この時期が日本のWindows PCの源流であるNEC PC-9800シリーズの発売開始時期と変わらないことからみても、大型コンピュータで運用を開始したことは当然であろう。しかし、この大型コンピュータ(FACOM MSP)は旧工業技術院の方針により運用が1999年3月末で終了したため、他の大型コンピュータへ移行するか、あるいはパソコンへ移行してデータベースを継続するか、あるいは活動を終了するか選択を迫られた。この時点で私達はデータの管理を行うシステムにWindows PCを採用することに決定し、新たにパソコンを利用したデータ入力ツールを開発することにより活動を継続した[7]。多くのソフトウエアでMS-DOSからWindowsへの移行がうまくいかずに再構築しなければならない等の困難に遭遇したが、このデータベースを全く異なる環境のプラットフォームに移すことに成功した。このときに大型コンピュータにこだわっていたら、現在のデータベースのようなデータの入力や管理を助ける様々なツールを利用することに支障を来したであろう。データ収集をWindows PCで行うようにしたことでデータの管理が格段に容易になった。図5 有機化合物スペクトルデータベース(SDBS)の構造図中のSDBSには、化合物番号であるSDBS化合物番号と、その化合物の元素数等が記録されている。それぞれのスペクトルデータベースを代表して1H NMRデータベースの構造を示した。すべての情報は、SDBS化合物番号を利用したリレーショナルデータベースで関係づけられている。MS DB 13C NMR DB Raman DB IR DB ESR DB 1H NMR DB 化合物名称DB SDBS SDBS化合物番号 ビン番号試薬瓶情報 DB 化合物辞書 1H NMRスペクトル コード 測定パラメータDB スペクトルパターンDB ピークDB シフト& 帰属DB スペクトル 1H NMR CAS番号DB 分子式 分子量DB 活動中止
元のページ