日本の景観をAIに「見せる」には
\研究者にきいてみた!/
日本は、世界でも珍しいほど高品質なSAR*1データを持つ国だ。しかし、その“宝の山”を十分に活用できる人工知能(AI)の基盤モデル*2は、長い間存在していなかった。そんな状況を変えようと、インテリジェントプラットフォーム研究部門 Nevrez Imamoglu主任研究員らは宇宙航空研究開発機構(以下、「JAXA」)と協力し、日本の国土に特化したSAR基盤モデルづくりに挑んだ。背景には、技術的な好奇心を超え、社会に直接的なインパクトをもたらす研究に取り組むという強い思いがある。
――まず、今回の研究に取り組むことになったきっかけを教えてください。
Nevrez日本には、JAXAの「だいち2号」(以下、「ALOS-2」)によって継続的に収集されている膨大な高品質SARデータがあり、防災、インフラ監視、環境モニタリングなど多様な用途に活用をされてきました。一方で、ChatGPTなどの生成AIで活用されている大規模言語モデルに代表される、基盤モデル開発は進んでいたものの、リモートセンシングデータ、特にSARデータを活用可能とするAI基盤モデル構築は、十分な議論や体系的な検討が行われていませんでした。
今回、JAXAとの協力によって膨大なSARデータを活用し、日本の地形や土地被覆の特性に合わせた「AI基盤モデル」を開発しました。また、SAR画像は通常の光学画像とは大きく異なり、解釈には領域特有の専門知識を必要とします。その点も、この研究に適していると感じた理由です。
――なぜ今、「国土に特化したSAR基盤モデル」が必要だと考えられたのでしょうか。
Nevrez従来のアプローチではデータの偏りが生じる可能性があり、地域やタスクが変わるとうまく転移しないことがあります。同時に、SARデータ解析により最適化されたAI手法への需要は高まっています。全国規模、複数年分のALOS-2アーカイブが利用可能で、かつ産総研の大規模AI計算基盤ABCIがある今は、日本向けに最適化したモデルを構築するために大規模データを活用できる絶好の機会でした。
――この研究は、産総研だから実現できたのでしょうか。
NevrezABCI、AI研究の蓄積、JAXAとの協力による大規模データアクセスという三つが同時にそろっていました。この組み合わせによって、全国規模での安定した学習と評価が可能となったのです。産総研は、観測データを実社会で使えるAIへとつなぐ役割も果たしています。
――モデルの主要な特徴を教えてください。
Nevrezこのモデルは、日本全域をカバーするSARデータで学習された汎用AI基盤モデルです。SARの偏波を考慮した損失関数を設計し、意味ラベルなしで表現を学習できる自己教師あり学習を用いました。その後、森林、都市域、水域、農地など、土地利用・土地被覆分類やセグメンテーションのために、データバランスを考慮した学習データセットでチューニング可能です。
30万枚以上の画像パッチを使用して大規模な自己教師あり事前学習*3を行いました。その結果、転移学習での評価において、土地利用・土地被覆の意味セグメンテーション精度が明確に改善されました。
――活用シーンを具体的に教えてください。
NevrezSAR基盤モデルは、災害時の状況把握、土地被覆マッピング、都市変化検出、環境解析など、さまざまなタスクの事前学習モデルとして使用できます。基盤モデルがあることで、新しいタスクは比較的少ない追加学習で実装でき、実利用における一貫性や信頼性の向上につながります。
今後は、ALOS-2やALOS-4のデータを用いた災害状況把握の自動化や、SARデータの観測内容を自然言語で説明する機能にも発展させたいと考えています。
――最後に、この記事の読者にメッセージを。
NevrezSAR技術には大きな可能性があります。研究者、学生、産業界、自治体など、興味のある方々との協力を通じて、その実用化を支援したいと考えています。この基盤モデルが、新しいアイデアや応用の出発点となればうれしいです。
*1: Synthetic Aperture Radar。SAR、センサーから電波(マイクロ波)を発射し、地表で反射されて返ってくる電波を捉えその強度を計測する観測機器で、合成開口という技術によって画像解像度を高めている。マイクロ波は雲を透過するため、天候や昼夜によらず画像を取得することが可能。[参照元へ戻る]
*2: 教師無しや半教師無し学習などを用いて膨大な入力データで学習を行った大規模な人工知能モデル。その構築には大量のデータと大規模な計算が必要となるが、一度構築してしまえば、それをベースにした転移学習によりさまざまなタスクをこなすAIモデルを構築できる。[参照元へ戻る]
*3: 2枚の異なる画像をつぎはぎのように組み合わせた画像をAIに見せ、元の2枚の画像をそれぞれ再現させるという課題を与える。この学習方法により、AIは「混ざった画像から元の内容を見分ける」という難しい推測を繰り返すため、より効率的に、より幅広い特徴を理解できる能力を身につけられるとされている。[参照元へ戻る]