Vol.4 No.1 2011
37/74

研究論文:有機化合物のスペクトルデータベースの開発と公開サービス(齋藤ほか)−34−Synthesiology Vol.4 No.1(2011)議論3 データベースにかかる人と経費質問(小野 晃)産総研の有機化合物スペクトルデータベースの構築と公開に要するコストについて伺います。データベースシステムの構築(ハードウエアとソフトウエア)、試料の入手、測定の実施、データの管理と品質の確保、ユーザー対応等にかかるマンパワーと経費は大まかにどの程度のものでしょうか。回答(齋藤 剛)産総研発足から2007年度までは研究者が全体のデータベースの方針等の策定、スペクトル評価等を行い、MS、IR、NMRと、化合物辞書を担当する契約職員4名の体制でデータベース構築を行い、構築したデータの公開は産総研の研究情報公開データベース(RIO-DB)のシステムエンジニア(SE)に多くの作業を依頼しています。私達がスペクトルデータベースの作業にかかわった期間では、研究者は一年あたりの延べ作業量として、データベースシステム構築0.25名、測定0.25名、データの品質確保に0.8名、データ管理とユーザー対応を合わせて0.25名程度のマンパワーを費やし、経費は概算で一年間当たりデータベースのハードウエアシステムの構築に20万円、ソフトウエアシステム構築に150万円、試薬の入手に25万円、装置の購入費を除く測定にかかわる消耗品や装置のメンテナンス費用として180万円、データ管理に70万円程度を要しています。このほかに、データベースの公開を担当するSEに多くの作業を依頼していますが、これに関しては私達は把握できておりません。議論4 網羅性、信頼性、緊急性のバランス質問(小野 晃)①データベースの構築では常に網羅性と信頼性のバランスが問題になることはこの論文でも述べられています。このデータベースの目的を、汎用の化合物を同定するための標準スペクトルデータの提供とし、データの信頼性を第一に考え、試料に関する情報と測定はすべて自己(産総研)が把握・管理できる範囲に限定するという方針を採ったと理解しました。このためデータベースの網羅性は、その達成が後回しになってもやむを得ないとし(すなわち時間が解決するという方針をとり)、開始30年後の現在では十分な量(3万種類の化合物)に達した、という理解でよろしいでしょうか。②一方、汎用の化合物だけでなく、最近ではこの論文でも指摘されているように農薬や劇物等、社会が緊急に求めている特殊な化合物のスペクトルデータも求められているように思います。これらのスペクトルデータベースを構築して公開することは重要だと思われますが、現在世界のどこかの機関から公開されているのでしょうか。これらのデータベースはユーザーから見て十分な状況にあるのかどうかお尋ねします。③もし十分な状況でない場合、緊急かつ大量にスペクトルデータが必要ならば、これまでの産総研の対応方針ではニーズに対して間に合わない恐れがあります。農薬や劇物等のスペクトルデータベースに関しては、その信頼性をやや落としてまでも、網羅性と緊急性を最優先にしたデータベース構築が求められるように思いますが、この点に関して著者の方々はどのような見解をもっておられるかお伺いします。回答(齋藤 剛)①基本的には、データベースの網羅性より信頼性を優先した結果、データ量を急激に増加することができなかった点も、活動を長期にわたって継続した結果、化合物数で3万件、スペクトル数で10万件と大規模になったことも、ご指摘のとおりです。汎用性の高い化合物は網羅できたと考えられます。 NMRに限定すると、スペクトルデータの公開にはスペクトルを測定するだけでなく、帰属も行うこととしたので、活動を行っている人的、装置的な時間制約でこれ以上データ量を増やすことが困難でした。また、ほかのスペクトルについても研究所内やほかの機関から試薬の調達を試みましたが、十分な試薬を集めるための予算が不足していた点も網羅性を達成する妨げの一因であったと考えられます。②医薬品、毒物、農薬、汚染物質のマススペクトル・データベースがJohn Wiley & Sons社からCDと本のセットで、農薬等の環境関連IRデータベースがBio-Rad社から提供されています。劇物については、国内法にのっとった分類であり、このような形で分類されたスペクトル集はないと思います。このような分類を明示していませんが、農薬や劇物に分類される化合物のスペクトルデータは他にもあると考えていますが、ユーザーから見て十分な状況にあるとは言い切れないと考えているため、このデータベースでもこれらのスペクトルデータの整備を行っています。③現在の体制では、スペクトルの信頼性を落とすだけでは限界があり、網羅性と緊急性に対応しきれない面もあります。これを達成するためには、緊急性の高い化合物のスペクトル情報を優先的に測定、評価して、これらのデータ公開をしていくプロジェクトを立ち上げる方法が良いと考えています。一つの選択肢として、産総研外のデータを収集する方法やスペクトル評価基準を構築して、将来的に公募形式のスペクトルデータベースへ発展させることがあります。こうすれば一定水準の品質を確保した上で、より網羅性を備えたスペクトルデータベースへ発展させることが可能ではないかと考えています。議論5 デジタルデータと著作権質問(小野 晃)このデータベースの中ではデータはデジタル化して管理されていますが、ウェブに公開するときにはアナログ化し、ユーザーはデジタルデータにはアクセスできないようになっていると理解しましたが、それでよろしいでしょうか。ユーザーがデジタルデータにアクセスできない理由には、産総研が取得したスペクトルデータには著作権があり、第三者がデジタルデータを使用したいときには著作権料を支払うことになるという理解でよろしいでしょうか。回答(齋藤 剛)ご質問にある、「デジタルデータ」が「スペクトルを構成するポイントが座標情報として示されたデータ」、「アナログデータ」が公開に用いている「gif画像データ」という意味で、ご指摘のとおりです。ユーザーがデジタルデータにアクセスできないようになっている理由は、著作権や著作権料自体の観点からではなく、著作権保護の観点からです。つまり、SDBSを不当な模倣から守り、また、模倣によって第三者が不当な利益を上げるのを未然に防ぐためです。デジタルデータは加工性が高いため商業的価値が高く、もしデータが大量にコピーされればSDBSと同等、あるいはそれ以上のデータベースを簡単に作られてしまう可能性があります。これはSDBSにとっては非常に脅威です。仮に著作権侵害が認められ裁判所に訴えることができても、そのためにかなりの労力を費やさなければならないと考えます。ところで、現在公開しているアナログデータも大量にコピーされれば著作権侵害でありSDBSに脅威を与えるので、SDBS防御の立場からアクセス状況を絶えず監視しています。一方、アナログデータであれデジタルデータであれ、第三者がデータを利用したい場合には産総研からの使用許可が必要であり、特に第三者がデータを販売したいときは著作権料を産総研に支払うことになります。これはウェブの公開における著作権の問題とは別の話になると考えます。秘守義務の関係上会社名を挙げ

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です