Vol.2 No.1 2009
36/94
研究論文:グリッドが実現するE-サイエンス(田中)−33−Synthesiology Vol.2 No.1(2009)GEO GridはE-サイエンスの1例であるが、他にもタンパク質データベースなどバイオ情報データベースを用いて創薬を効率よく行うといったバイオ情報分野、大量の医療画像データベースを活用して癌診断を支援するシステムや医療データベースを利用して治療に役立てる次世代医療診断システムなどを開発する医療産業分野など、E-サイエンスにより技術開発を大幅に加速することができると期待される分野は多岐にわたる。グリッドの要素技術の多くは実用に耐えるレベルに達しているが、実際にはいまだ広く利用される技術となっていないのは、以下の理由によると考える。・もともと高性能計算の分野から派生したグリッドは、「スパコンを束ねて大規模計算を行う技術」というイメージが強いが、この計算グリッドにおいては、インターネットの性能がベストエフォート型であり性能が保証されないといった性能的な課題や、既存の並列プログラミング手法が耐障害性や計算機の同時確保などの問題によりグリッドには適していないこと、また、最適な計算資源を選び出すスケジューリングの技術がまだ研究段階の域を脱していないといった技術的課題など、解決すべき課題がある。・「グリッドを使ったらこんなことができた」といった実例報告がまだ少なく、応用分野のコミュニティから見ると、依然として「使ってみたいがどう使うのか分からない」「どうせ使えないだろう」「何に使えるのか分からない」といった印象がある。確かにグリッドの要素技術がすべて実用化のレベルに達しているというわけではないが、これまで開発されてきた技術を組み合わせれば多くの科学技術分野に対して新たな、かつ現実的な研究手法を提供できると考える。本研究の目的は、GEO Gridを題材としてグリッドを用いたE-サイエンス基盤を構築し、地球科学の研究者に研究環境を提供するとともに、他の応用分野も含めた幅広い科学技術分野における真の実用化に向けた課題を明確にし、その解決を図ることにある。これにより、科学技術分野におけるイノベーションの創出に寄与することを目指す。目標の達成を目指し、本研究ではGEO Gridの応用事例のシナリオに基づいて情報基盤に対する要求仕様を解析し、システムの設計と実装を行った。実際に衛星データを配信するシステムを構築し、地球科学の研究者にグリッドを用いた研究環境を提供しつつ、そこから得られる知見やフィードバックを通じて残された課題を明確にし、真の実用化に向けての道筋を立てる戦略をとった。本稿では、GEO Gridを例にE-サイエンスにおけるセキュリティやシステム構築の実現方法および残された課題を明確に述べる。本稿の主たる目的は、応用分野の読者に対してグリッドの実例を提示し、「何ができて何ができていないのか」を明確にすることにより、グリッドの理解を深め、グリッドの普及を図ることにある。また、情報技術分野の研究者を対象に、多数のソフトウエアコンポーネントを組み合わせて1つのシステムを構築する方法論について論じる。GEO Gridはアプリケーション、コンテンツ、および情報基盤により構成されるが、本稿においては情報基盤の設計と実装について報告する。はじめに情報技術分野におけるシステム構築の方法論について論じる。また、GEO Grid情報基盤に対する要求およびそれに基づく設計方針を示し、実装方法および実システムの構築を通じて得られた知見、検証結果を述べる。2 情報基盤に対する要件GEO Grid情報基盤に対する要件を以下にまとめる。(1)大規模データの提供衛星観測データはその運用期間を通じると数百テラバイトからペタバイト級の大きさになるが、そのような大規模データからユーザが求めるデータを迅速に見つけ出す、データサイズに対する高いスケーラビリティが要求される。(2)多様なデータの取扱い衛星観測データ以外にも、気候に関する温度、湿度、雲量などの異なる物理量や異なる時空間分解能から得られたデータなど、異なる組織により提供され、様々な書式で蓄積されている多様なデータを取り扱う機能が要求される。(3)データ提供ポリシーの尊重データには利用に制限がかからないフリーなものも存在するが、一般的にはデータ所有者はデータアクセスの許可範囲や提供可能なデータ書式の制限など、利用許諾権とその条件を設定・変更する権限を有し、データ提供者の公開ポリシーに応じた柔軟なアクセス制御を実現する必要がある。(4)データと計算の統合データの形式変更や事前処理などの簡便な計算およびデータに基づいた火砕流到達範囲の計算などの大規模シミュレーションなどの計算とデータとの統合が必要である。(5)多様なコミュニティの支援環境監視、災害監視、資源探査をはじめ、地球科学に関する多様なコミュニティや多数のプロジェクト研究を支援し、柔軟な構成変更および共通に利用できるデータ、計算およびツールやテンプレートになった処理フ
元のページ