- 産総研の大規模AIクラウド計算システム「ABCI」を活用し、JAXAが運用する人工衛星「だいち2号」のSAR観測データの大規模学習を実現
- 土地利用・土地被覆の偏りを均等化して構築した学習データセットを用いて日本の国土に特化したSAR基盤モデルを構築
- 基盤モデル活用により専門的な知識を必要とするSAR画像判読の敷居を下げることで、SAR利用の拡大に期待

国土に特化したSAR基盤モデルの構築と期待される応用。日本全体の土地利用・土地被覆図に用いた高解像度土地利用土地被覆図はJAXAより提供。
国立研究開発法人 産業技術総合研究所(以下「産総研」という)インテリジェントプラットフォーム研究部門 Nevrez Imamoglu 主任研究員、Ali Caglayan 主任研究員、神山 徹 研究グループ長、堤 千明 総括研究主幹は、国立研究開発法人 宇宙航空研究開発機構(以下「JAXA」という)と共同で、「だいち2号」(ALOS-2)搭載の合成開口レーダー(Synthetic Aperture Radar: SAR)、PALSAR-2により、日本国土を対象に定常的に取得されている高解像度観測モードのSARデータを用いて、国土に特化したSAR基盤モデルを構築しました。
今回、70%が森林であるなどの日本の国土の特徴を考慮し、特定の土地利用・土地被覆種別への学習の偏りを避け、学習データに含まれる土地利用・土地被覆の割合を均等化する目的で、あらかじめ学習に用いる地点を選択しました。PALSAR-2による観測データは国土全域を網羅していますが、その中から選択地点を含む範囲を画像パッチとして抽出することでさまざまな土地利用・土地被覆を反映する学習データセットを整備しました。このデータセットを用いて大規模な教師無し学習を行うことで、国土に特化したSARデータ用の基盤モデルを構築しました。転移学習により土地利用・土地被覆推定作業を実施したところ、無作為に作成した学習データセットによる基盤モデルを利用した結果や、そもそも基盤モデルを用いず推定した結果に比べ、顕著に高い精度の推定結果が得られ、均等化したデータセットを利用した基盤モデルは高い性能を示すことが確認できました。当初はJAXA、産総研を含む研究者による基盤モデル・高次付加価値プロダクトの利用を想定していますが、この基盤モデルの活用により、専門的な知識を必要とするSAR画像判読の敷居を下げることで、より広い方々によるSAR利用の拡大が期待できます。
本成果は産総研とJAXAによる「衛星データのAI解析手法の研究開発に関する協定」に基づき実施されました。なお、この研究成果の詳細は2025年6月4日~6月5日に開催される「日本リモートセンシング学会第78回(令和7年度春季)学術講演会」において発表されます。
SARは、マイクロ波を利用したリモートセンシング技術の一つで、人工衛星や航空機による合成開口技術を用いることで、昼夜を問わず高解像度の画像を観測データとして得ることができます。中でもLバンドと呼ばれる1 GHz~2 GHzの周波数帯のマイクロ波は空気中の水蒸気や植生などに対して透過性が高いため、森林の多い我が国などの地形変化や災害時の状況把握などでの活用が進められています。JAXAの人工衛星「だいち2号」(ALOS-2)はLバンドのSARであるPALSAR-2を搭載しており、天候や昼夜に影響されず日本を含め世界中の観測を続けています。
一方で、SARのより広い分野への利用拡大には課題もあります。SARデータの判読には専門知識が必要なためAI技術の導入が進んでいますが、大規模計算や大量のデータ取得にはコストもかかります。この問題を解決するために基盤モデルの導入が考えられます。基盤モデルは、その構築には大量のデータと大規模な計算が必要となりますが、構築してしまった後は、それをベースにして、わずかな学習でさまざまなタスクをこなすAIモデルを構築することができます。
JAXAの人工衛星「だいち2号」搭載のPALSAR-2によるSARデータ、特に日本国土を高解像度観測して得られた豊富なSARデータについてはこれまで基盤モデルは存在しませんでした。産総研とJAXAは「衛星データのAI解析手法の研究開発に関する協定」を締結し、産総研が所有する大規模AIクラウド計算システム「ABCI」を使用してPALSAR-2のデータの大規模計算を行いました。
なお、本成果は産総研政策予算プロジェクト「フィジカル領域の生成AI基盤モデルに関する研究開発」に基づき実施されました。また本成果は産総研及びAIST Solutionsが提供するABCI 3.0を、「ABCI 3.0開発加速利用」の支援を受けて利用し実施されました。
「だいち2号」搭載のPALSAR-2は日本の国土全体を3 mなどの高解像度モードでくまなく観測しています。また、この観測は地震などによる地殻変動を捉えるために定常的に実施されており、「だいち2号」の周回軌道に合わせ年4回程度の割合で国土のほぼ全体のデータが更新されます。今回の成果は画像用に開発された教師無し学習手法の一つ、Masked Auto Encoder(MAE)から派生したMixMAEにより大規模事前学習を実施し、国土を観測した豊富なSARデータから基盤モデルを構築しました。
SARによる観測ではセンサーから電波を地球へ向けて照射し、地表や水面から反射されセンサーに返ってきた電波の強さを計測することで地表や水面の様子を観測します。人間の目で見る波長とは異なるため、SAR画像は気象衛星の画像などで馴染みのあるものと大きく異なり、画像の判読には専門的な知識が必要とされます。この判読を助けるためSAR画像へのAI応用が広がっていますが、目的に応じてAIの構築をゼロから行うことはデータの準備、AIの学習に必要な計算などコストの面で課題があります。基盤モデルでは事前に基本となる学習を完了しておくことでわずかな追加学習(転移学習という)でさまざまな問題へ適応できます。
基盤モデルの性能には、データの量はもちろん、データに含まれる情報の多様性も大きく影響します。例えば日本の国土は70%が森林に覆われており、無作為にデータを学習させると森林に知識が偏ることが予想されます。実際には森林以外にも市街地や河川、耕作地帯など国土の土地種別はさまざまです。そこで、すでに得られている国内の土地利用・土地被覆データを参照し、森林、市街地、水域(河川や湖など)、耕作地帯を均等に指定しました。学習に用いるデータとするため、指定地点を中心とした256 x 256画素の小画像(画像パッチ)に切り分け、30万枚以上の学習データを準備しました。また、SAR特有のスペックルノイズや反射条件による極端に強い信号の影響を低減するため、極端に反射電波強度の強い領域の影響を無視するような損失関数を考案しました。基盤モデルは、作成した学習データセットと考案した損失関数による教師無し学習を実施して構築しました。

図1 国土SAR基盤モデルに用いる学習データの構築。土地利用・土地被覆割合を参考にALOS-2/PALSAR-2の観測地点を選択。高解像度土地利用土地被覆図はJAXAより提供。
※原論文の図を引用・改変したものを使用しています。
基盤モデルはそのままでは特定の目的をこなすことはできませんが、目的に合わせた少数のデータセットによる転移学習を実行することによりさまざまな用途に活用することができます。本成果では基盤モデルの性能を評価することも目的として、土地利用・土地被覆推定を行えるよう転移学習を行いました(図2)。

図2 転移学習後のAIモデルを用いた茨城県域の土地利用・土地被覆の推定。高解像度土地利用土地被覆図(正解図)はJAXAより提供。
※原論文の図を引用・改変したものを使用しています。
基盤モデルを利用した場合は、事前に大規模にSARデータを学習し、SARデータを理解するのに役立つ情報の抽出が完了していることもあり、基盤モデルを利用せずに土地利用・土地被覆推定を行ったモデルより10%以上の精度の向上があることが分かりました。
今後は構築した基盤モデルを軸に、災害検知や都市の変化検知などさまざまな応用を行い、SARデータの実用例の積み上げと基盤モデルの性能評価を行っていきます。また、これまでは画像からAIが得た情報を人間が理解しやすい言語説明に変換することは困難でしたが、基盤モデルにより言語と画像、言語と音響など異なる種別の情報と統合することが容易になるため、SARデータの判読結果の説明を言語により行うことも可能になります。さらに言語表現された説明を別の言語モデルが理解し、観測を再度行うべきかなどのタスキングに役立てる応用も期待できます。これらにより、これまで専門知識を必要としたSARデータの理解をより直観的・かつ迅速にし、将来的にはさらなるSARの利用拡大を目指します。
会議名:日本リモートセンシング学会第78回(令和7年度春季)学術講演会
タイトル:Self-Supervised Pre-Training and Image Segmentation Task on ALOS2 Single-Channel SAR Images
著者:Nevrez Imamoglu, Ali Caglayan, Toru Kouyama