技術宝箱
311/333
技術紹介ライフサイエンス51. 大量データの周期性自動判別法2. 適用条件・横軸が時間、位置座標などの等間隔数値データであること・縦軸は数値データであること・サンプル点数は、一つの観測対象あたり数十点程度以下 (横軸上のデータ点数、点数が多い場合には間引いて適用することもできる)・観測対象は、数万~数十万程度まで (プロットされている折れ線の本数)・サンプル点数や観測対象が少なければ、古いパソコンで実行可能 (Windows XP、Windows 2000など)・容易に高速化でき、より規模の大きなデータに対応できる (PCクラスタを用いた並列実行など)3. 開発の背景などDNAマイクロアレイ技術による遺伝子発現の観測では、一度に数千から数万の各遺伝子について、その発現量が定量的に測定できる。この10年でシステム化が進み、安価で簡便に観測できるようになってきている。マイクロアレイによる時系列観測では、数時間おきに10回から多くても20回程度のデータを主に扱うが、回数が少なくても同時に数千から数万の遺伝子を観測しているため、大規模なデータとなる。たとえば糖尿病を対象に薬剤を開発しようとする際には、候補となる薬剤物質の投与により健康への影響があるかないかを調べるが、病気の特長から、概日周期リズムへの影響が重要視される。そのため、数万の遺伝子の時系列データから、投薬前に24時間周期がなく、投薬後に24時間周期が回復している遺伝子を探す、といった作業が必要になる。これを効率的に行うために、本技術は開発された。大規模データへの適用を目的に開発されたため、判定時間は非常に短くて済む。一方、時点数が増えると急激に時間がかかる。これは内部で「組み合わせ総探索」を行っているためである。30点以上あるデータに対しては非常に弱いので、発見的探索法を用いるなどの改良を加える余地が残っている。とても一つ一つ見てはいられない…そこで以下の式を使って判断していく。309
元のページ