macroscope

( はてなダイアリーから移動しました)

地上気象観測データセット GHCNd に見られた 1968年夏のラサ (Lhasa) の異常値

【まだ書きかえます。どこをいつ書きかえたかを必ずしも明示しません。】

- 1 -
気象観測データがほしいとき、日本の気象庁の観測値ならば、かなり多くのものが気象庁ウェブサイトから、あるいは配信されたものをアーカイブした大学などのサイトからダウンロードできるし、気象業務支援センターから購入できるものもある。しかし、どの配布のしくみからもこぼれてしまっているものもある。

外国の気象現業観測のデータについては、まずアメリカ合衆国 (USA) にあるデータセンター、なかでも NOAA (海洋大気庁) の National Centers for Environmental Information (NCEI, http://www.ncei.noaa.gov ) がたよりになる。NCEI は、かつて National Climatic Data Center (NCDC) とよばれていた気象データを保管する部門をふくんでいる。USA の政府系データセンターは、早くから世界のデータをあつめる意欲をもっていたし、連邦政府の集めたデータは (機密がからまないかぎり) パブリックドメインで公開する原則をもっていた。そして、NCDC は World Data Center (WDC) という制度の World Data Center A for Meteorology という機能をひきうけていた。WDC は World Data System に再編成され、そのなかでも NCEI はデータセンターをひきうけている。

NCDC が WDC の機能として作成していたデータセットに GHCN (Global Historical Climatolgy Network) というものがあった。これは地上観測点の月平均気温と月降水量の観測値をまとめたものだった。【Climatology というがここでは平年値ではなく、毎年毎月の値であり、気候の変化が論じられるような品質の連続性をできる範囲で追求したものである。Historical というがここでは先近代ではなく、気象観測機器による観測があるうちでの過去にさかのぼって編纂するという意味である。】 それはいまの NCEI にひきつがれていて、GHCN monthly (GHCNm) とよばれている。そのほかに、毎日の気温や降水量をまとめた GHCN daily (GHCNd) というデータセットがつくられている。わたしがはじめて GHCNd を知ったのは 20-00 年代で、収録されている国はかなりかたよっていた。しかしその後、充実してきた。

- 2 -
2022年2月に、NCEI のウェブサイトから GHCNd をダウンロードした。GHCNd のデータは、地点ごとの、気温や降水量など複数の気象要素をまとめた、時系列型の csv ファイルになっている。1地点だけほしいのならば、まず地点表をダウンロードし、それで地点名と地点コード (アルファベットと数字のくみあわせによる) との対応をみて、その地点コードの csv ファイルをダウンロードすればよい。しかしほしい地点数が多いときはこれではやりきれない。全部の地点を tar.gz でまとめたアーカイブファイルがある。大きさは 7 ギガバイトで、ダウンロード自体はむずかしくない。

ところがそのアーカイブファイルを展開すると、そのときつかっていたパソコンのディスクがいっぱいになってしまった。展開すると 100 ギガバイト以上の場所をとるのだ。地点表とならんで inventory というファイルがあって、どの地点のどの気象要素には何年から何年までの値があるかがしめされているから (途中にぬけがあるかどうかはわからないが)、実際に展開しなくてもデータ量のみつもりはできたはずだったが、わたしは展開をはじめてからあわてた。いったん作業を中止し、じゅうぶんな容量があるディスクを確保して、ともかく全部展開してみた。USA 自体のほか、オーストラリアなどの国の地点数がとてもおおい。日本でいうアメダスにあたる自動観測網の観測値も収録したのだろう。地点コードの最初の2文字が国名コードだから (インターネットのドメイン名につかわれてよく知られている ISO の 2文字コードとはちがった NOAA 独自のコードだが)、csvファイルをファイル名の最初の2文字で分類すれば国別になる。

ひとまず見たいのは中国の観測値だったので、国名コード「CH」のものだけぬきだした。228地点あった。(香港はふくまれ、台湾の地点はなかった。) 中国が 1970年代以来 世界に継続的に公開してきたのが約 200 地点だから、それがひきつがれているのだろう。地点コードには WMO に登録された 5けたの地点番号がふくまれている。地点名はローマ字で、だいたい WMO の地点表でもつかわれている中国の公式のつづりかた (ピンイン、ただしかならずしも漢語でなくチベット語、モンゴル語などそれぞれ中国政府制定の方式) にあわせているようだ。【ただし不統一にきづいたところがある。ウルムチ (WMO地点番号 51463) は WMO地点表では Urumqi となっている (ウイグル語ピンインにもとづき、補助記号を省略した形)。GHCNd では「WU LU MU QI」となっている。漢字をあててから漢語ピンインにした形だ。おそらく中国気象局が過去にこの形でデータをだしていたのだろう。】

- 3 -
学生の卒業研究の題材として、GHCNd の中国の部分を提供した。そうしたら、学生が奇妙なことを発見した。

【そのひとつは、ウルムチの2010年2月18日の気温の値として「32766」がはいっていたということだ。すなおに読むと 3276.6 ℃となる。「X」という品質の flag がつけられている。これは、あらかじめ設定されたありうる数値の範囲をこえているということである。GHCNd のドキュメントを読みきれていないが、32766 という値を GHCNd の編集の際に何かの意味をもたせて入れたとは考えられず、NCEI が受け取ったもとのデータにふくまれていたにちがいない。データをつかうがわとしては、この日は欠測 (データ欠損) であるとするしかなく、それ以上なやむことはない。 [この部分 2022-08-20 改訂]】

謎なのは、ラサ (Lhasa, WMO地点番号 55591、GHCN 地点コード CHM00055591) の 日平均気温が、1968年の夏に、ほかの夏にくらべて異常に高いことだ。高い値に はりついているわけではなく、日々の変動はある。たぶん、この年のラサが異常に暑かったということではなく、観測機器が故障していた (温度に応じた変化はするが感度が高すぎるような故障だった) か、観測場所のローカルな条件が温度が高くなりやすいものになっていた (日射があたるとか、通風がよくないとか) のだろうと思う。しかし、そうだと自信をもっていえるほどの根拠はない。

- 4 -
ひとまず GHCNm を見てみることにした。GHCNm のうち気温は version 4 ができている。そのうち、品質管理はしてあるが補正はしていない ghcnm.tavg.v4.0.1.20220130.qcu.dat というファイル (160メガバイトのテキストファイル) をひらいてみる。

ラサ (GHCN 地点コード CHM00055591) の 1968年の6月から9月の値には「O」という flag がついている。readme.txt をみると「O」は、おおざっぱにいえば、その月の長期平均から標準偏差の5倍以上はずれている、ということらしい。(正確に理解するには GHCNmの技術的なドキュメントをよく読む必要があるが。) また、1968年10月の値には「T」という flag がついている。これは、おおざっぱにいえば、水平距離 500 km 以内の他の地点の観測値とのくいちがいが あるしきい値をこえたということだ。おそらく 6月から9月の値も T の条件をもみたしているが、O を優先させたのだろう。

近くの地点といえば、西に 300 km ほど離れているが、シガツェ (Xigaze, CHM00055578) がある。 そこの 1968年の夏の各月の気温をみると、前後の年より高くはない (むしろ、1℃ぐらい低い)。したがって、かりにラサの気温が実際に高かったとしても、その現象は空間規模が 300 km よりも小さいものだったといえる。機器の故障または観測場所のローカルな条件の問題だろうというわたしの推測は (わたしの主観としては) 強まった。

- 5 -
アメリカにつたわるまでにデータが化けた可能性もあるので、中国のサイトで確認しようと思ったが、まだ確認できていない。

中国気象局の「国家気象科学数据中心 中国気象数据網」https://data.cma.cn/ というウェブサイトで、いろいろなデータを提供している。そのうち「地面資料」の部に「全球地面気象站定時観測資料」というデータセットがある (「站」zhan は station である)。その地点一覧にラサはない。GHCNm とかさなる地点としては、55228 獅泉河 と 55299 那曲 がある。そのデータをダウンロードしようとしたが、そこでサイトがもとめてくる問い (ユーザー登録せよと言っているのだとおもうが) にどうこたえてよいのかよくわからない。中国語がわかる人に相談してわかったらさきに進もうと思う。しかし予想としては、ここに置かれているのはわりあい新しい期間のもので、1968年にはさかのぼらないだろうと思う。このサイトは「気象」むけであって「気候」むけではないようなのだ。

中国の気候むけのデータサイトとしては「中国気象局 国家気候中心 気候系統監測・診断・預測・評価」のサイト http://cmdp.ncc-cma.net/en/ があるが、ここは季節予報のモデル出力が中心で、観測値によるモニタリングもあるのだが格子点化されたものをだしていて、もとの観測値はみあたらない。

中国科学院 チベット高原研究所 の National Tibetan Plateau Data Center https://data.tpdc.ac.cn/en/data からは、おもにこれまでの研究観測でえられたデータが公開されている。現業観測によるチベットの地点の地上気温のデータもあるのだが、1979年以後のものだ。(中国全土の格子点化した気温のデータは 1951年からのものがあるのだが。)

- 6 -
日本の気象庁は、季節予報やそれに関連した気候診断のためにあつめたデータをつぎのウェブページで提供している。

各種データ・資料 > 地球環境・気候 > 世界の天候 > 世界の天候データツール(ClimatView 月統計値)
https://www.data.jma.go.jp/cpd/monitor/climatview/frame.php
各種データ・資料 > 地球環境・気候 > 世界の天候 > 世界の天候データツール(ClimatView 日別)
https://www.data.jma.go.jp/cpd/monitor/dailyview/index.php

地点を選択すると、その地点の観測値の時系列を、グラフや数字の表として見たり、csvでダウンロードしたりできる。
ただし、このサイトにある月統計値は 1982年以後、日別値は 2018年以後のものである。
ラサも観測地点として採用されているのだが、このサイトでは1968年にさかのぼることはできなかった。

- 7 -
1968年夏のラサの気温についてわたしがこれまでに知ったことは、NCEI の GHCNd と GHCNm に異常値が見られること、GHCNm の編集者はそれが異常値であるという flag を入れていることである。 (ただし、おそらくあらかじめ決めた基準による自動処理なので、編集者がここに異常値があると意識しているとはかぎらない。) 異常の原因の手がかりとなる情報はなく、実際に小さな空間規模で異常な高温が生じた可能性は残っているが、ラサをふくむ水平 100 km ほどの規模の地域の観測値とみなすのはまずいだろうと、暫定的に判断している。

別の検討材料をごぞんじのかたがおられれば、おしえていただけるとありがたい。