macroscope

( はてなダイアリーから移動しました)

気象・気候の問題に使われるスペクトル解析についての序説

[このブログには世の中に対する意見を書くことが多くなったが、科学的知識や科学で使う方法について書きたくなることもある。ウェブサイトにまとまった知識を書くときは、単純HTMLページかwikiを使おうと思うのだが、そこまで行っていない覚え書きを書く場としてブログを使うことがある。]

スペクトルということばには、関係はあるが区別したほうがよいいくつかの意味がある。

おそらく近代科学用語としての最初の意味は、光が、プリズムを通したとき、色ごとに分かれて見える形をさしていたと思う。色の違いが波長の違いに対応することがわかり、光を波長別に分けることをさすようになった。光の速さは一定値と見てよいので、振動数(周波数)は波長に反比例する。光を波長別に分けることは振動数別に分けることでもある。

そして、時間あるいは空間に分布する数量を、さまざまな振動数あるいは波数(波長の逆数)をもつ波のたしあわせとして表現することを、スペクトル分解というようになった。

偏微分方程式の近似解を求める方法としてスペクトル法と呼ばれるものがある。少なくとも気象モデル(あるいは気候モデルの大気の部分)の文脈では、数量の時空間分布のうち水平2次元の座標の関数となる部分を直交関数系で展開してその係数で表現することをさす。係数は水平位置座標の関数ではなく波数の関数となる。この話はここまでにしておく。

時系列データ解析でスペクトルということばを使うときは、データを、さまざまな振動数の正弦波の重ね合わせとみなそうという発想がある。

データの理論的分布には、離散と連続、有限区間と無限区間が考えられる。フーリエ変換には双対性があり、「離散と連続」と「有限区間と無限区間」が入れかわる。現実のサンプルは有限個であり時間範囲にも限りがあるので、時間領域・振動数領域とも「離散・有限区間」の定式化で計算することが多い。しかし、理屈をつけるときには、定常確率過程を想定し、時間領域では無限区間、振動数領域では連続分布を理想とし、有限個のサンプルによる計算はその近似とみなすことが多い(と思う)。単純に有限区間で計算すると、同じ区間が無限回くりかえしていることを想定することになり、多くの場合それは現実と違うので、端を特別扱いする処理をする場合と、がまんして使う場合がある。

時系列解析では時間等間隔のサンプルから出発する技法が発達している。等間隔でないデータを扱う方法はあまり発達していない。等間隔であってもデータが欠損することがある。欠損の一般的対策はなく、対象ごとにその特性に応じた対策が考えられていると思う。

スペクトル解析のうちいちばんよく使われるのはパワースペクトルを求めることだ。これは自己共分散をフーリエ変換したものであり、ランダムデータのもつ分散を振動数の区間ごとに分配したものだ。

パワースペクトルを求める主要な方法は大きく次の2つがある。

第1は、振動数領域を等間隔に区切り各区間のパワースペクトル値を求めるという発想に立つ。時間領域で(いろいろな時間差について)自己共分散を計算したあとフーリエ変換する方法(Blackman-Tukey法)と、まず時系列をフーリエ変換して振動数領域でパワーを求める方法がある。データ欠損の扱い、データの存在する区間の端の扱いと、数値計算上の誤差を別とすれば、両者は同等である。いずれにしても、サンプル値からこの理屈で単純に計算したものは、サンプル値が確率過程の一実現例だとして母集団のパラメータを推定する立場では、推定誤差が大きすぎる。対策としてBlackman-Tukey法では自己共分散にウィンドウ関数をかけること、フーリエ変換法ではパワースペクトルを平滑化することが行なわれる。

第2は、サンプルの時系列が確率過程からの出力例であると考え、確率過程のパラメータを求めるという発想に立つ。確率過程のモデルとしてまず使われるのは自己回帰(auto-regression)モデルである。時間を離散で扱う場合、各時間ステップの値は、同じ時系列の過去の有限個の値を時間差だけに依存する係数をかけて重ね合わせたものに白色雑音が加わる形をとる[この部分2011-10-24訂正]。観測された時系列がこのモデルの出力だとして、係数の値を推定する。係数が決まればパワースペクトルを求めることができる。スペクトル解析の分野でmaximum entropy法というものは情報エントロピーの考えに基づいているが、この自己回帰モデルのあてはめと同じとみてよい。

気象の分野では、第1の方法が圧倒的によく使われる。第2の方法は、振動現象が見えているにもかかわらず有効なデータの期間が短いために第1の方法ではうまく抽出できない場合に限って勧められる。

地震などの固体地球物理の分野では第2の方法のほうがよく使われるようだ。

この違いは、おそらく流体と固体の力学系としての性質の違いから来ているのだろう。固体の振動は少数の固有振動の重ね合わせで大部分が説明できることが多いが、流体の振動は起こりうるあらゆる振動数にパワーが分配されることが多いのだ。

ただし、気象・海洋を主な部分とする気候システムの現象でも、日周期・年周期・Milankovitch周期、あるいは潮汐周期などは、流体系内部ではなく天体力学の質点系または剛体系に支配された強制作用の周期性なので、第2の方法によって抽出されやすい。ただし、そのように強制された運動が流体の運動全体のうちでどれだけの割合を占めているかを考えるためには、第1の方法による解析も必要となる。

文献

  • 赤池 弘次, 1968: スペクトル解析。相関関数およびスペクトル--その測定と応用 (磯部 孝編, 東京大学出版会), 28-46. [赤池氏は自己回帰による方法の開拓者だが、この文献はここでいう第1の方法の解説。赤池氏の著作リストは 赤池記念館にある。]
  • Julius S. Bendat & Allan G. Piersol, 1971: Random Data: Analysis and Measurement Procedures. Wiley. [2020-01-28 追加]
  • [同、日本語版] J. S. ベンダット、A. G. ピアソル 著, 得丸 英勝 ほか 訳, 1976: ランダムデータの統計的処理。培風館。とくに 9.6節 パワスペクトル密度関数、9.7節 二つの記録に対する計算。 [2020-01-28 追加]
  • 花房 龍男,林 良一, 1977: スペクトル解析. 気象研究ノート(日本気象学会),第131号.
  • 日野 幹雄, 1977: スペクトル解析。朝倉書店。
  • 宮田 元靖, 1983: データとパワースペクトル (I, II)。日本物理学会誌, 38(3), 195-202 https://doi.org/10.11316/butsuri1946.38.195 ; 38(4), 267-272 https://doi.org/10.11316/butsuri1946.38.267 [2021-07-31 リンク変更] .
  • 東京大学大型計算機センター, 1987: G3/TC/RXL, 実数時系列のクロススペクトル・パワースペクトル解析、 Blackman・Tukey ラグ共分散法。東京大学 大型計算機センターニュース、Vol. 19 Supplement 1, 69 - 85. [林 良一[よしかず]・新田 勍[つよし] 両氏によるプログラムを増田が改訂したものです。] [増田によるソースプログラムを置いたページ] [説明文書 (1987年の記事を2000年に部分修正)] [2020-01-28 追加]