【まだ書きかえます。どこをいつ書きかえたか、かならずしも しめしません。】
【この記事は、話題をしめす順序について、まよいながら書いています。発表してから順序の入れかえをふくむ書きなおしをするかもしれません。いちおうのまとめは 4f 節にあり、そのあとは各論や発展的議論です。】
【この記事は、大学で気象学をおしえる教員のたちばで書いています。】
- 1 -
気象学には、国の気象現業機関 (日本のばあいは気象庁) が提供してくれるデータ、とくに気象現業機関自身による観測データが必要だ。たとえ研究者自身の観測にもとづいて研究をするとしても、背景情報として気象庁の観測値をつかうだろう。
気象学をおしえる大学教員として、つねに、気象庁から直接、あるいは、(一般財団法人) 気象業務支援センター (以下便宜上英語略称「JMBSC」でしめす) やそのほかの組織を通じて提供されるデータのおせわになっている。
そのなかでいくつか、不満におもっていることがある。しかも、最近数年間に、不満が強まってしまったことがある。それをすなおに書くと、気象庁やJMBSCに対する苦情になってしまう。それをそのまま一般公開の場に書くことは思いとどまった。気象庁も、そのほかの関係者も、かぎられた予算のなかで、せいいっぱいやっていると思うからだ。気象データを教育のために必要とする (大学だけでなく高校・中学などの) 教員や、趣味などでくわしく見たい個人が、自分たちが気象データをつかいやすくするために労力あるいはおかねをだしあう必要があるのだと思う。しかしそれがばらばらでは便利にならない。データ整備を共同でやり、そこに気象庁やJMBSCからも協力が得られるような場をつくっていく必要があるのだと思うようになった。まだどんな場をつくるかの具体的な構想はないし、わたし自身がさける時間も少ししかないが、ひとまず、考えをのべておきたい。
- 2 -
気象庁のデータ提供の態度は、「データそのものは無料だけれど、そのデータを利用者のもとへ届けるための必要経費については、利用者が負担する」というものである。この表現は、気象庁長官をつとめたあと現在 JMBSC の理事長である 長谷川 直之 さんの著書 (215ページ) からとった。
- 長谷川 直之, 2025: 『天気予報はなぜ当たるようになったのか』 (インターナショナル新書 158)。集英社インターナショナル, 254 pp. ISBN 978-4-7976-8158-1. [読書メモ]
1990年代、世界の多くの国で、役所は税金のほかにも収入源をもつべきだという考えがつよまり、観測データを有料にするべきだという政策提案があった。しかし、気象データは防災にも必要であり、国際的に交換されている。公共財であるという主張もあった。世界気象機関 (WMO) の 第12回総会 (1995年) の決議 (Resolution) 40 で、気象データのうち基本的なデータは無料・無制約で国際交換されるという原則ができた。(ただし、長谷川 (2025) が 209ページあたりでのべているように、各国気象現業機関は、商業目的のデータ再輸出を禁止してもよい、ということになっている。商業利用は有料となることもありうるのだ。)
日本では、「気象業務法」という法律が 1993年に改定され、民間の天気予報事業がはじまった。気象庁のやくわりは、天気予報事業者に対する監督官庁と、データの流れの上流側で観測データや数値予報プロダクトを提供することがおもになった。JMBSC がつくられた。その名まえからも想像できるように、そのおもな顧客としては天気予報事業者が想定されている。気象庁のデータをリアルタイムで天気予報事業者に提供するのは、気象庁から直接ではなく、JMBSC が担当することになった。なぜかというと、通信回線をつかったデータ提供には費用がかかり、手数料をとるのだが、日本の国の役所のしくみでは利用者から直接おかねをとって経費としてつかうことがむずかしい (特別な法制度づくりを必要とし、いちいちつくっていられない) からだ。なお、「気象業務法」にもとづく制度である気象予報士試験も JMBSC が担当しているが、同じ法人であるのはたまたまであって必然性はない。
気象庁自身のウェブサイトからのデータ発信は防災に力をいれてきた。ただし、リアルタイムの、画像中心の発信に重点がある。防災の根拠として過去の気象の数値データを一貫した基準で統計をとりなおしたいユーザーは、自治体の防災担当者、研究者のほか、防災に関心をもつ個人にもいると思うが、そのためのデータ提供体制は、貧弱だと思う。気象庁 (およびその前身である気象台・測候所) の過去の地上気象観測 (アメダスをふくむ) のデータは、気象庁ウェブサイトから無料でダウンロードできるように提供されているが、そのサイトの能力は需要に対して弱い。まとめて取得したい人にむけては、JMBSC経由のオフライン提供がある。ところが、その経路では2020年代の観測値が得られなくなってしまった。最近にいたる長期の多地点の観測データをつかいたい人がデータをえる手段は、10年ほどまえよりも衰退してしまったといえる。この件についてはあとの 4節 でのべる。
- 3 -
気象庁がつくったデータが、他の機関からインターネットに提供されていることがある。気象庁がデータはフリーとしていることのおかげでもある。それはありがたいことだが、大学からの提供はそこでの研究のついでの自発的な努力によるものだし、DIASはデータ提供を本務としてはいるが時限の研究開発事業なので、社会のインフラストラクチャーとしては、気象庁などの現業機関にくらべて、弱いところがある。
- 3a -
JMBSC経由でリアルタイムのデータ配信を受けることは有料なのだが、受信者が自発的にそのデータを発信することは、リアルタイムから少し遅れての発信ならば (「少し」がどのくらいなのか未確認だが、1日程度のようだ)、認められている。少し遅れるから、短期予報にはつかえないが、過去にさかのぼった研究には有用だ。
この種類のもので、わたしがおせわになっているのは、京都大学 生存圏研究所 (RISH) のデータベースの気象庁データの部だ。これには、ウィンドプロファイラの観測値、全国合成レーダーデータ、MSM (メソスケールモデル) 解析値がふくまれていて、だれでもダウンロード可能である。
- 3b -
気象庁の気象衛星 ひまわり による観測データは、気象庁のウェブサイトからは、「防災情報」の部で最新の約1日ぶんがみられるだけである。
気象庁ウェブサイトのつぎのページによれば、気象庁にかわって 4つの機関からデータが配布されている。
- (気象庁) 知識・解説 > 気象観測・気象衛星 > 気象衛星観測について > 衛星観測データの活用 > 協力機関からの研究者向けデータ公開https://www.data.jma.go.jp/sat_info/himawari/orgnization.html
その機関は、NICT (情報通信研究機構)、千葉大学 環境リモートセンシング研究センター (CEReS)、JAMSTEC (海洋研究開発機構)、JAXA (宇宙航空研究開発機構) 地球観測研究センター (EORC) である。ただし JAMSTEC はつぎにのべる DIAS の事業でひきうけているものである。
わたしはおもに千葉大学 CEReS におせわになっている。可視・赤外各チャネルの観測値 (可視では反射の強さ、赤外では輝度温度) の数値データとして、しかも位置合わせして地球上の緯度経度格子にして、ユーザーが取得可能な形でサーバーに置かれているからだ。(画像として目で見るためには他のサイトのほうが便利だろう。)
- 3c -
気象庁では天気予報の材料として数値予報というシミュレーションをおこなっており、数値予報モデルに観測データをとりこむデータ同化という技術をつかっている。そのデータ同化技術を、過去の観測データに適用して、なるべく質のそろった格子点データをつくる「再解析」という事業がおこなわれている。再解析でつくられたデータセット (再解析プロダクト) は、(かつては気象庁自身が用意したウェブサイトに置かれていたこともあったが) 現在の最新版である JRA3Q は 気象庁とは別のいくつかの機関から配布されている。そのひとつの機関が DIAS (データ統合・解析システム, diasjp.net ) である。DIAS は文部科学省の研究開発事業で、時限 (5年でくりかえされてきたが現在は10年) で文科省から業務委託を受けた法人が担当しており、2021年度から10年間は JAMSTEC が担当することになっている。
- 3d -
気候変化 (地球温暖化) の予測型シミュレーションは、CMIP という国際的なわくぐみでおこなわれている。日本の気象庁の気象研究所 (MRI) も CMIP に参加している。CMIP のシミュレーション結果のデータセットは、ESGF (Earth System Grid Federation) というわくぐみで、アメリカ合衆国、ヨーロッパ、オーストラリアの複数の機関が共同で維持するサイトから公開されている。かつて (CMIP5 の時期) には DIAS も ESGF の一端をになっていたことがあったが、いまはかかわっていないようだ。
気象研究所でおこなわれたシミュレーション結果のデータセットには、CMIP 以外のものもあり、そのいくつかは DIAS から提供されている。
- 4 -
気象庁のデータのうちでも、かけがえのないねうちがあるのは、気象庁自身やその前身の気象台・測候所による観測値である。
- 4a -
気象庁は、その前身の中央気象台のころから、かずかずの印刷物のデータ報告書をつくってきた。(一例として『気象庁月報』というものがあった。) その多くは非売品だが関連分野の研究機関や大学などに配布されてきた。残念ながら図書館でいう「図書」や「雑誌」として登録されているところは多くないが、貴重な資料である。
- 4b -
1990年代以来、気象庁のデータ集は、印刷物からしだいに CD-ROM, DVD-ROM に移行してきた。ディジタルデータとして利用できるようになって紙より便利になった。保存のスペースがすくなくてすむのもよいことだが、反面、データ集が発行されていることに気づく人が少なくなり、図書館などで保存されることも、紙の出版物だったころにくらべてさらに少なくなってしまった。
そのデータ集の CD や DVD は、JMBSC ができて以来、JMBSC から、(プレスされたストックがなくなればon-demand copyで) 有料だがいわば実費で、配布されてきた。
ところが、その大部分が (JMBSCでのコピーではなく、気象庁での原盤作成が) 2010年あたりで終了してしまった。「気象庁月報」ディスクは2009年の内容のもの、「気象庁年報」ディスクは2010年の内容のものが最後である。JMBSC の努力で編集されていたらしい「気象庁観測月報 CD-ROM」も 2019年の内容のものまでで終了してしまった。
最近の観測データがこの形で手にはいらない期間がだんだん長くなっていくことは、大学教員であるわたしからみると、気象データ提供体制が衰退している、と感じられる。
- 4c -
気象庁は、気象台・測候所とアメダスをふくむ地上気象観測データを、気象庁ウェブサイトの、(「防災情報」の下に最近1日ぶんを置いているのを別として、過去のものを) 「各種データ・資料」の下の「過去の気象データ・ダウンロード」のページから、だれでも無料でダウンロードできるようにしている。ブラウザでそのページに行って、地点を選択し、気象要素 (たとえば気温、降水量) を選択し、期間を選択して、ダウンロードボタンをおせば、手もとのパソコンに CSV 形式のデータファイルが得られる。たしかに有用なサービスである。
しかし、いくつか不満がある。まず、このサイトでは、一度にダウンロードできるデータ量にきびしい制限がある。それはサーバーのハードウェアの能力の限界からきているらしく、複数人が同時にダウンロードをこころみるとサーバーが混雑してだれもデータを取得できなくなることもたびたびある。
1地点の1つの気象要素の値がほしいのならば、1年ぶんの1時間ごとの値、あるいは観測開始以来の月ごとの値を一度に取得できるので、このデータ量制限値は、じゅうぶんかもしれない。
しかし、気象学を専門とする学生には、気象要素の空間分布が時間とともにどう変化するかを観察してほしい。また、大まかには同様だがこまかくみるとちがう複数の事例を比較検討してほしい。ひとりの学生に一度に見てもらいたいデータだけでも、地点数と気象要素数と時間ステップ数をかけざんすると、すぐに一度にダウンロードできるデータ量をこえてしまう。
【たとえば、ひとつの県のすべての地点の降水量の1時間ごとの値がほしいとき、一度にダウンロードできる期間の長さは、地点の多い県のばあい、7日ぐらいなのだ。ひと夏あるいはひと冬の3か月ぶんのデータをそろえるには13回にわけないといけない。地点のうちには最近観測がおこなわれていないところもあるのでそれをはずせば1回の日数をのばせるが、データをすぐつなげる形でダウンロードするためには、(つぎにのべるように) 地点を選択する順序がかわらないように注意深くする必要がある。】
【学生がおおぜいいれば、分担してダウンロードすることはできるはずなのだけれど、サーバーの混雑の問題があるので、実習授業の時間に練習させて手順を身につけたか確認することができない。】
また、このダウンロードのページは、ユーザー登録やログインが必要ない便利さの反面で、自分の定型操作を記録しておいて再利用することができない。(手もとのブラウザの記憶がつかえることはあるが、接続を切ってつなぎなおしたときには忘れているだろう。) そのうえ、地点や気象要素の組み合わせが同じであっても、メニュー画面上で指定した順序がちがうと、得られるデータの列の順序が同じにならない。複数回にわけてダウンロードしてあとでつなぐのには、いろいろと注意深くする必要がある。
それから、このダウンロードのページでは、検索過程でも、得られたCSVファイルでも、地点のID番号がはいっておらず、地点は、地点名 (漢字かなまじり) と都道府県名で区別しなければならない。しかも、気象庁の前身の観測開始から昨日までのデータを同じインタフェースで検索できる便利さとうらはらなのだが、同じ都道府県に同じ地名の地点が複数ある (観測期間はかさなっていないはずだが) ことさえある。多数地点のデータをまぎれなくあつかおうとすると、「その県の全地点を指定したうえで、同名の地点のあるばあい古いほうの地点だけをはずしてから、ダウンロードを実行する」といった、このシステム固有のくせに適応した作業が必要になる。(ID番号をおもてにださないことについては、国際地点番号とアメダス地点番号のまぎらわしさとか、ちょっとした移転でアメダス地点番号は変わったが実用上は同一地点とみたほうがよいばあいがあるとか、もっともな理由も想像できるのだが、そのあたりの知識のあるユーザーが必要と思ったときにはつかえるようにしてほしいと思う。)
大量のデータのダウンロードは、接続したその場で完了するとはかぎらないから、予約をとって準備ができたら通報するようなしくみが必要になるだろう。そのためには、ユーザー登録やログインのしくみも必要になるだろう。いまのダウンロードのメニューの単純な変更ではすみそうもない。
- 4d-
多地点・多時刻のデータをあつかうには、CD, DVD などの形でのオフラインデータ提供のほうが、これまでのところ、ありがたかった。
わたしはおととし、JMBSC から、「気象庁観測月報 CD-ROM」の2010年から2019年までの10年ぶんの毎月、120枚をとりよせた。このような注文がくるのはおどろきだったかもしれない。
実際にそのCDを読むのはそれぞれ一度、コンピュータ内蔵のハードディスクにコピーするときだけで、すぐにコンピュータ上のプログラムで展開処理し、実際に学生につかってもらうのは展開処理の結果できたファイルだ。それをつかうと日本全国のアメダス観測点の10年ぶんの1時間ごとの値をあつかう統計処理がすぐできる。その前の時期、アメダス観測開始の1976年から2009年までについても、「アメダス統計値」と「アメダス年報」のCD-ROM があるので、解読さえできれば同様につかえる。(データ形式を理解するまでにてまどってしまったが、現在、展開作業中である。) ところが、学生が自分の体験と関連づけることが期待できる 2020年以後の期間について、観測データをつかって広域を見ようとすると、気象庁ウェブサイトから複数回にわけてダウンロードしてつながなければならず、慣れない学生には勧めにくい。「事例は2019年以前からえらんでください」などと言うことになる。気象の教育のための条件が、2019年以前よりも衰退してしまったと感じる。
- 4e -
オフラインデータ提供のほうがありがたいと思う事情はもうひとつある。観測データには、たとえば観測機器が故障していたことがあとでわかった、などといった事情で、修正がくわえられることがある。すると、同じ地点、同じ日時、同じ気象要素について、ちがった数値をふくむ複数のバージョンのデータセットが存在することになる。観測の情報をつかう大部分の需要では、最新の修正がくわえられた結果を見ればよく、データを最新版の値で上書きしてしまってよい。しかし、他人の研究結果がたしかにそうなることを確認したいばあいや、同じデータに他の方法を適用して方法間の比較をしたいばあいなど、たとえ観測値としての正確さは劣るとしても、過去の人がつかったのと同じデータセットを見たいことがある。気象データの解析では、浮動小数点演算をふつうにつかっているし、端数が 0.5 になるばあいの四捨五入の手続きなども統一できているとはかぎらないので、誤差をふくむ数値の厳密な再現性はあきらめていると思う。過去のバージョンを確認したいのは、系統的な補正がはいったばあいか、まちがいの訂正のばあいだろう。CD-ROM のようなメディアならば、そしてその配布もとにマスター版がのこっていて配布されたものがそれのコピーであることが確実に言えるならば、その問いにこたえることができる。CD や DVDの枚数がふえると煩雑になることもわかるので、メディアはハードディスクでよいからときどき固定したバージョンのデータセットをつくって保存するか、あるいは、データベースの改訂履歴をのこして過去のバージョンを復元可能にしてほしいと思う。あきらかに少数の専門家からの要望なのだが。
- 4f -
4節のまとめ、そしてこのブログ記事でわたしがいちばんいいたいことは、オンラインかオフラインかはどちらでもよいから、気象庁の観測による多地点・多時刻の同一規格のデータをまとめたデータセットをつくって配布してほしい、あるいはまとめてダウンロードできるシステムを整備してほしい、という要望である。それは気象庁の協力を得ないとできないが、気象庁に要望するだけでは進まないだろう。だれが主体になれば進みうるだろうか? たとえばわたしが数百万円をその主体に提供すれば進むだろうか? もっとおおぜいのユーザーから募金をあつめる必要があるだろうか?
ここからは、いろいろな方向への各論や発展的議論である。
- 5 -
JMBSCのオフラインデータ (CD, DVD など) の有料配布には、実際おせわになっている。これは続いてほしい。
この配布体制は、個人向けと法人向けにわかれている。
法人あては、請求書による後払いがふつうになっている。わたしの所属する法人はこれに対応できるので、うまくいっている。法人の経理の葉ざかい期にかかって法人から払ってもらえず、個人で払ってしまったことがあるが、JMBSC側はそれでもさしつかえなかったようだ。
しかし、個人あては、宅配便の代金引換だけであり、しかも日時指定ができない。これはきびしい制限だ。たいていの個人は、いつでも支払いができる体制で待機していることはできない。宅配業者は再配達をしてくれるけれども、それにも限度がある。【代金引換でない宅配便のばあいだが、業者が再配達可能でわたしが在宅可能な日程がなかったことがあった。そのときは営業所にとりにいくことが可能だったので受け取れたのだが。】 これでは、JMBSC はほとんどの個人の利用を拒否しているとさえいえる。
ふつう通信販売ならば、クレジットカードまたは先払いの銀行ふりこみによる支払いをみとめるだろう。支払いがすんでいるのに品がとどかないとき、どちらの責任なのか (JMBSCが代わりの品を送る、または払いもどす義務を負うのはどんな条件のときか) という問題が生じる。JMBSC はそのようなトラブルに対応できる事務能力がなく、支払い方法の選択肢をふやせないのだろう。
JMBSCに個人向けの前払いを処理する能力がないのならば、JMBSCが卸売りとなり、他の業者が小売りとなることをみとめるべきだと思う。小売り業者は、配達トラブルのリスクを負うかわりに、マージン (追加手数料) をとってよいことにすればよい。
- 6 -
気象庁の地上観測データのうちには、まだ気象庁ウェブサイトからの公開にいたっていないものもたくさんある。
気象庁やその前身の気象台・測候所による観測のうちには、かつて紙に記録されたまま、数値データとしてすぐつかえるところまで整備されていないものがある。その大きな部分は、わくだけ印刷されたところに手書きで数字などが書きこまれた観測原簿である。
そのうち、1990年代ごろに気象庁の本庁にあった資料は、マイクロフィルムに収録された。それはさらにスキャンされて、TIFF形式の画像ファイルになっている。そしてそれはJMBSCからハードディスクで有料配布されるようになった。その内容のかなりの部分が、国立情報学研究所の北本研究室の「デジタル台風」のサイトから公開されるようになった。JMBSC に払ったおかねは手数料であり、画像の内容は公共財なので公開してよいのだと思う。
なお、このほかにも気象庁に残っている資料があり、国立公文書館への移行がすすめられているときいている。
「デジタル台風」に置かれたものもその他のものも含めて、気象庁やその前身の観測原簿のいろいろな部分を、研究者が自分で、あるいはアルバイトの人をやとって、読みとっている。手書き文字のばあい機械読み取りでうまくいくことは少なく、人が画像を見て文字を読んでいることが多い。読み取りの品質管理はまちまちである。2人の人に読ませて照合する人もいれば、それだけの労力があれば別の地点・日時のデータを読みたい人もいる。しかし、質はまちまちであっても、研究者としては他の研究者によるディジタイズ結果をつかわせてもらいたいことがある。個別の知り合いどうしの融通はすでにあるが、あちこちの研究者が共有できる置き場があるとよいと思う。
しかし、源が気象庁なので、気象庁に無断で公開したらまずいだろう。ところが、気象庁レベルの品質管理ができているわけではないので、気象庁が発信するデータにくわえてもらうのはむずかしいだろう。この置き場は、気象庁の外につくるべきだと思うが、気象庁からも友好的な他者としてみとめてもらう必要がある。そのような合意形成をめざしたいと思う。サイトは持続性の高い組織におきたい。時限の研究費ばかりがつく研究開発機関でないほうがよいだろう。大学や学校法人か? 法人化された学会か? 出版社、その他の企業の公益事業か? サイトをひきうけてくださるところが決まれば、わたしはひとりの作業者として、データの例を示し、そのデータの説明文書の項目をどのようにつくったらよいかを考えたいと思っている。
- 7 -
ここまでおもに、日本での観測にもとづくデータを日本語話者に提供することをかんがえてきたのだけれど、外国語話者のことや、外国のデータのことにも視野をひろげるべきだろう。
大学教員としてわたしは日本語を話す学生をあいてにしているので、関心は日本語話者むけのデータ提供にむかいがちだが、ときどきは、外国の同僚のことも考える。そのうちには、世界の多数の地域のひとつとして日本にも関心をもっている人たちがいる。
気象庁のデータ発信は、気象庁自身の日本語ウェブサイトでの無料配布と気象業務支援センター経由の有料配布、いずれもドキュメントはほとんど日本語である。国の役所が発信を自国語ですることはわるくはないのだが、日本語を読まない人からみると、日本のデータ配布体制は閉鎖的にみえるだろう。
気象庁は、世界気象機関 (WMO) の役割分担としてひきうけた国際貢献はしっかりやっている。
世界の温室効果気体濃度の観測値をあつめて公開する World Data Center for Greenhouse Gasses のウェブサイトは気象庁ウェブサイトの英語の部の中にある。
また、季節予報にかかわる天候の観測情報や予測情報をあつめる Tokyo Climate Center や、台風をふくむ北西太平洋の熱帯低気圧の観測情報や予測情報をあつめる The Regional Specialized Meteorological Center (RSMC) Tokyo - Typhoon Center は、気象庁と同僚関係にある各国の気象現業機関むけに発信しており、そのうちには、だれでも取得できるデータもある。
しかし、日本語を読まない人が日本の観測データにたどりつくことはむずかしいだろう。これまでは、アメリカ合衆国の、政府機関である NOAA (海洋大気庁) の NCEI (National Centers for Environmental Information) と、大学共同利用機関である NCAR (National Center for Atmospheric Research) が、世界の観測データをあつめて提供してくれるので、各国のデータをそれぞれもとめる需要は少なかったかもしれない。しかし、2025年以後の Trump 大統領の政策で、NOAA や NCAR の予算がおおはばにけずられようとしているので、今後はアメリカにたよれないかもしれない。日本は日本で、世界へのデータ発信をもっとやっていく必要もあると思う。
また、日本でも、外国の観測データをつかいたいこともある。これまでは NCEI や NCAR にたよることができたが、今後は、日本でも従来以上に、世界のデータの収集・提供をしていく必要がありそうだ。