macroscope

( はてなダイアリーから移動しました)

データ同化 (data assimilation)

【まだ書きかえます。いつどこを書きかえたかを必ずしも明示しません。】

- 1 -
わたしは「データ同化」という用語をふだんからつかっている。このブログにも、それに関する話題をたびたび書いているが、この用語の説明としてはまだ書いていなかった。定義のようなものをのべることはむずかしいのだが、ともかく、わたしがこの用語をつかうばあいに想定していることを書いておきたい。

- 2 -
気象のデータ同化技術は、数値天気予報の初期値を得る方法から発展してきたものだ。その方法は、かつて「客観解析」あるいは「予報解析サイクル」とよばれていた。(「客観解析」ということばについては、[2015-04-30 いろいろな解析、分析、analysis] の記事のなかでいくらかふれた。)

数値天気予報よりまえに、天気図をおもな手段とした天気予報があった。天気図は、海面更正気圧をはじめとする気象要素の分布を地図上にしめしたものだが、かつては観測点の空間分布がまばらだったから、それをもとに天気図をかく作業は、それを担当する技術者の、それまでの天気図を見てきた経験や、大気はどのような物理法則にしたがうべきかについての知識を背景とした、専門家判断を必要とした。それで、天気図をかく作業や、それをふくむ天気の現状を解釈するしごとが「天気解析」とよばれることがあった。

数値予報は、スウェーデンで 1954年、アメリカ合衆国で 1955年に現業化された。まだ天気予報の材料としての重要性はおおきくなかったが、ともかく毎日リアルタイムの予報計算がおこなわれた。数値予報は「初期値」を必要とする。それは、ある時刻 (初期時刻とよぶ) での予報対象領域の空間をうめつくす予報対象変数の値だ。ごく初期には人の手でつくられた天気図から格子点での数値を読みとったこともあったけれども、すぐに、一定の計算機プログラムに観測値の数値データをあたえてつくる方式がおもになった。同じプログラムに同じ入力データをあたえれば、だれがやっても同じ結果になり、作業者の主観がはいらない。(プログラムがちがえば結果がちがい、そこにプログラム作成者の主観がかかわっている可能性はあるが。) 天気解析とにた作業を、いわば客観的なてつづきによっておこなうことを、「客観解析」とよぶようになった。客観解析のなかでおこなわれるおもな作業は、観測値を空間内挿することだ。

ところが、予報対象領域のうちには、どの観測点からも遠いところもある。そこでも、まがりなりにも数値予報がうごいているならば、前回 (6時間まえなり、12時間まえなり) の客観解析にもとづく数値予報の結果はある。風上に観測値があったならば、まったくの架空の計算ではない。そこで、観測値の不足を予報値でおぎなうという発想が導入された。さらに考えると、観測にも誤差があるし、観測値の空間内挿の際にも誤差が生じる。予報値にも誤差があるが、観測値を空間内挿したものと、予報値とをうまくブレンドして、なるべく誤差の小さい初期値をつくることができるだろう。「客観解析」は、このようなブレンドの計算をさすことがおおくなった。

数値予報を業務としておこなう現場では、6時間 (または12時間) ごとに「客観解析」をおこない、そこから 6時間 (または 12時間) の予報計算をする、ということをくりかえすことになる。このくりかえしが「予報解析サイクル」とよばれるようになった。(数値天気予報の本体の計算はそこから分岐していく。)

- 3 -
1970年代のうちに、予報解析サイクルの実体ではなく、それを解釈する発想に、転換がおこりはじめた。予報モデル (の計算内容である数値群) は、実際の大気と同様に、自律的な発展 (evolution、ただし自然選択による進化ではない) をつづけるシステムだとみることができる。予報モデルは、観測データを「食い」、食ったものを自分のからだの構成物にかえながら「発展」していく。生物による物質同化のメタファーで、「データ同化」 (data assimilation) という考えができてきた。

また、従来の客観解析は、世界時の 0 時、12時などに一斉におこなう定時観測をおもな材料にしてきたのだが、1970年代には気象衛星による観測値がふえてきた。こちらは定時ではなく連続的におこなわれている。時刻がふぞろいなデータをとりこむためには、空間だけでなく時間の次元もふくめた数量の内挿外挿をする必要があるだろう。そのような課題が「4次元データ同化」とよばれた。

日本語圏の出版物としては、1978年に、日本気象学会の『気象研究ノート』 134号として『数値予報』が上下2冊で出ている。その下巻に「客観解析法」の章 (清水 喜允) と別に、「4次元同化作用とイニシャリゼーション」の章 (住 明正) がある。前者は当時までの現業でつかわれていた技法、後者はあたらしい研究開発の動向を論じている。当時、この分野で assimilation の概念はあたらしかったので、ひとまず「同化作用」と訳されたのだとおもう。その後、「作用」をふくまない形がふつうになった。

- 3X -
ここにでてくる「イニシャリゼーション」 (initialization) は、数値天気予報の初期値をつくるためのプロセスのひとつだ。数値予報モデルに、初期値として、観測値と前のステップからの予報値とをブレンドしてえられた「客観解析」の結果をそのままわたすと、結果があばれる。大気の運動には遅いモードと速いモードがあり、観測データは遅いモードを表現するにはじゅうぶんだが速いモードを現実的に表現する目的にはとぼしい。客観解析結果にもとづいて速いモードの予報計算をしても結果は現実と対応しない。そこで、客観解析結果をモードに分解して、速いモードの振幅を落とすような修正をしてから、初期値にしたほうが予報の誤差がちいさくなる。ここでいうイニシャリゼーションはこの修正のことだ。予報解析サイクルは、実際は「客観解析」→イニシャリゼーション→予報 のサイクルとして実行されていた。

生物の物質同化の比喩でいえば、食物のうちで消化できるものとできないものとをよりわけることにあたるかもしれない。

- 4 -
国際共同研究事業の Global Atmospheric Research Program の一環として First GARP Global Experiment (FGGE、別名 Global Weather Experiment) がおこなわれた。そこでは、1978年12月から1979年11月までの1年間、世界の気象観測を強化し、さらに、その観測データをとりこんで、4次元データ同化によって格子点型の気象データセットがつくられた。(この格子点データセットは、1996年以後の用語でいえば「再解析」だが、当時は「level 3 b データ」とよばれた。) わたしは博士課程のとき、その 4次元同化の成果のデータをつかって研究をした。博士論文を提出したあと書いた、当時のデータ同化に関するレビューがつぎのものである。

  • 増田 耕一、1989: 大気データの4次元同化による気候系の解明。『日本の科学と技術』 30 巻, 255号, 54 - 59. [著者によるHTML版]

FGGE level 3 b データの作成は、2つの機関で、対照的な方法でおこなわれた。ECMWF (ヨーロッパ中期天気予報センター) の方法は、6時間ごとの予報解析サイクルであり、6時間ごとのイニシャリゼーションによって速いモードを落とした。結果の格子点データは温帯に関するかぎり従来の客観解析よりもすぐれていたが、熱帯の降水はあきらかに弱かった。GFDL の都田 菊郎 博士のチームの方法は、予報モデルを連続運転しながら観測値をとりこんでいく方式だった。熱帯の循環は大局的には ECMWF よりもよかったようだが、まちがった観測値をチェックするのがむずかしく、プロダクトはノイズの多いものになった。

その後、気象データ同化技術の発達がつづいてきた。いま代表的な方法としては「4次元変分法」と「アンサンブル カルマン フィルター」がある。わたしはこのあたりの方法の名まえを聞いてはいるが、説明できるほどよくわかっていない。わたしはもっと勉強しないといけない。

- 5 -
ちかごろでは、データ同化という方法が、気象および (基本的に同じ理屈が通用する) 海洋物理 だけでなく、おおくの分野でつかわれるようになった。その内容を、わたしはあまりよく知らない。

気象のデータ同化では、気象には物理法則にもとづく数値モデルがあり、それによる予報が、完全ではないが、予報誤差を定量的に論じることができる程度にはうまくいっていることが前提となっている。

また、予報結果をもとに観測値と対比できる数量をつくることができ、それと観測値との差を評価することができることも前提となっている。そのような差を多数あつめた指標変数の値を最小にするように予報結果を修正すること (あるいは予報結果と観測値を内挿したものとをブレンドすること) によって、同化がさきにすすむのだ。

気象以外の対象では、予報モデルは物理法則にもとづくものでなくてもよいかもしれない。それにしても、対象の状態が、因果関係にもとづいて、定量的に予測できるようなモデルがあることが前提となるとおもう。