macroscope

( はてなダイアリーから移動しました)

オープンサイエンス・市民科学の事例、気象・気候の場合

【まだ書きかえます。どこをいつ書きかえたかを必ずしも明示しません。】

- 1 -
[2016-03-01の記事]でふれたように、「オープンサイエンス」という人々の動きは、学術データの公開・共有と、専門家だけでない多くの人が学術研究をいっしょにやっていこうという考えを含んでいる。後者は「市民科学」(citizen science)と呼ばれる動きと重なり合うところがある。

環境科学の場合、学術研究への市民参加としてはまず、市民による観察の情報を持ち寄ることがあげられる。生物多様性関係で、希少種や外来種の目撃情報を集めることなどでは、すでに成果を上げている例もある。

気象の場合は、天気予報などの実用目的で、観測とデータ交換の制度化・標準化が進んだ(Edwards 2010 参照)。その結果、市民の学術研究への参加がよいこととする立場からは残念ながら、気象学や、気象データを使う気候学への、市民による観察の役割は小さくなっている。制度化された観測網からもれる、たとえば たつまき などの空間規模が小さい現象については、市民の目撃情報が重要なこともあるだろう。また、制度化された観測のない時期にさかのぼる場合、非専門家による記述を掘り起こして解釈する仕事がある。専門家も関与する必要があるが、アマチュアの活躍も可能だろう。観測のある時期についても、観測記録に疑問が生じることがあり(たとえば1地点だけ異常に大きい降水量の値は本ものか、まちがいか)、その裏づけとして、しろうとの証言(この例ならば、大雨を体験したか)が有効なこともあると思う。

- 2 -
いったん市民科学から離れて、データの公開性について述べる。気象を含む地球観測データに関する権利の問題については、たとえばMarlin-Bennett (2004)の本で論じられている。(残念ながらわたしはその後の進展をきちんと追いかけていない。)

気象観測データは天気予報のために即時交換が必要だ。他方、データを外国に出したくない国(の役所)や、有料で売りたい国(の役所)もある。そこで、各国の気象現業機関(日本の場合は気象庁)の連合体であるWMO (世界気象機関)では、1995年の第12回総会決議40 (WMO, 1995)で、各国の気象現業で得られた「基本的」データは公開・再配布自由とするが、その他の(「付加的」)データは各国の判断で制限をつけてもよい、と決めた。アメリカ合衆国のように、政府による気象観測データをみな公開している国もある。他方、100kmくらいの間隔で分布する地点での観測だけを基本的データとして公開し、それよりも細かい観測網のデータの提供は個別の許可が必要としている国や、有料で売ることにしている国もある。なお、日本の気象庁の観測データは、原則は公開であり、しかも気象庁ウェブサイトから無料提供されるものがしだいにふえているのだが、気象業務支援センターから買う形をとる必要があるものもあり、外国の研究者からは、公開性はあまり高くないと見えているようだ。

気象観測データには、研究活動で得られたものもあるが、その交換・公開のルールは、現業観測の場合と違って、確立していない。データを研究者がかかえこんでいて出てこないこともある。研究者がデータをすぐに出さないことには、いくらかの正当性がある。まず、データの整理や品質管理に、いくらかの時間がかかる。また、多くの場合、研究成果を、観測を実施した人が著者となる学術論文の形で発表することが期待されており、他の研究者にデータを利用させると研究成果を先取りされてしまうことを警戒することもある。しかし、長期にわたって他の研究者がデータを使えないのは、学術にとって困ったことである。気象の観測研究では、多数の研究グループが日時をそろえて観測を行なう共同研究事業が多い。そのような共同研究事業では、データ共有・公開のルールを決める。たとえば、観測後1年で共同研究メンバーで共有し、観測後2年で公開する、というようなものである。その約束によってデータが広く利用可能になる。

しかし、研究事業が終わり、それを推進していたお金の提供が終わったあと、データ保管・提供をだれがするかはむずかしい問題だ。ICSU (国際科学会議)のもとにWorld Data Center(s) (WDC)という制度があり、現在はWorld Data System (WDS)になった。データが、WDSを構成するデータセンター(ここでは便宜上「世界データセンター」と呼ぶ)の収集対象に含まれているものならば、そこにまかせることができることもあるだろう。アメリカ合衆国では、気象庁に相当する機能をもつNOAA (海洋大気庁)のNational Climatic Data Center (NCDC) [現在はNational Centers for Environmental Information (NCEI)の一部になっている]が、NOAA自身による観測データを保管・提供する任務に加えて、気象に関する世界データセンターの役割もしているし、さらに、大学関係の共同利用研究所であるNational Center for Atmospheric Research (NCAR)が、研究者の求めるデータを紹介するとともに、終わった研究事業のデータの保管・提供も引き受けてくれた([2015-02-06の記事]参照)。日本には、電離層・磁気圏などについての世界データセンターはあるが、気象のデータを扱うデータセンターがない。データセンターを始めることは重い仕事である。データセンターは長期持続してほしいのだが、とくに近年の日本の、5年くらいの期間ごとに必ずscrap and buildをさせるような科学技術政策のもとでは、国から運営費をもらっている法人はどこでも、5年くらいの時限でデータ提供事業を請け負うことはできても、たとえば30年にわたって継続する約束は(その法人が死守したい対象と認めない限り)できない。データセンターに持続性をもたせるためには、目新しさを求める役所の要求に翻弄されない、民間の非営利の基金が必要なのかもしれない。

- 3 -
さて、地球温暖化問題が世界の政治の課題のひとつになっているので、その基礎となる気候変化の科学についても、専門外の人々からの関心が高まった。そのうちには、科学的知見として示された内容が政治的意図によってゆがめられているのではないかと疑う人々もいた。

2009年11月、イギリスのEast Anglia大学(UEA)のClimatic Research Unit (CRU、気候研究部門)の職員の電子メールが暴露されるという事件(「Climategate」と呼ばれることがある)をきっかけに、気候研究への疑いが強まったことがあった([2010-07-16の記事][2010-11-17の記事]、別ページ「IPCCへの信頼がゆらいだ事件とそれをめぐる考察」、Pearce (2010) など参照)。

問題になったCRUでの研究は、世界の地上気温を、観測点から格子点へ空間内挿し、全球や半球で集計することだった。集計の前に、データの品質管理や、観測方法変更や観測点移動などの影響を補正する作業があり、むしろその部分に専門家の仕事の特徴がある。出力データ(全球・半球の平均値や、内挿結果の格子点データ)は公開されていたのだが、批判者は、それだけでなく、入力データ(観測点での値)の公開を求めた。しかし、入力データには、データを再配布しない条件でもらっていたものがあった。政策決定に使われる研究はデータ源にさかのぼれるtraceabilityをもつべきだというのは正論であり、もし観測機関も自国の研究機関であれば、たとえば国会の議決によってそのデータを公開させることも正当だろう。しかし、もとのデータ提供機関のほとんどは、(この例ではイギリスから見て)外国にあり、しかも研究機関ではなく現業官庁なので、そのデータに対する権利主張は研究データとは別の理屈によっている。メール暴露事件よりも前から、CRUはデータ提供機関に公開許諾をもらう交渉をしていたがなかなか進んでいなかったのだった。事件以後、イギリス気象庁が交渉し、入力に使われたデータの全部ではないものの大部分の国のものが公開されたそうだ。

実は、(近過去の気候のデータ解析すべてではないが) 全球・半球平均気温などを得る仕事に関する限り、公開データだけでも大筋同じ結果が得られる。アメリカ合衆国のNASA GISSやNOAA NCDCのものはそうだった。

事件後、イギリス気象庁やNOAA NCDCの呼びかけによって、世界の地上気温のデータを、品質も、公開性やtraceabilityをも高めようという活動がある。International Surface Temperature Initiative (ISTI)と呼ばれており、ウェブサイトは http://surfacetemperatures.org だ。これについては[2010-08-01の記事]でその時点までの動きを紹介した。その後の動きをわたしはよく追いかけていないが、たまたま得た情報を[2014-07-10の記事]で紹介した。

- 4 -
これに関連して、市民科学と言えるような動きがいくつかあった。[2014-07-21の記事]の、Paul N. Edwards氏(Michigan大学)の東京での講演内容の紹介として書いたが、もう少しだけ詳しく述べてみる。

そのひとつは、Nick Barnes氏が始めたClear Climate Code ( http://clearclimatecode.org )という活動だ。現在はClimate Code Foundation ( http://climatecode.org )となっている。

NASA GISSでは全球地上気温の観測データから内挿・集計をしてウェブサイト http://data.giss.nasa.gov/gistemp/ から発表している。その入力データはNCDCがまとめた公開ずみのものであり、内挿・集計の手順は論文やウェブサイト記事として説明されてはいるが、それだけでは情報公開が不充分だと批判する人々がいた。GISSはプログラム公開にふみきった。

そのプログラムは、Fortranという言語で書かれ、1980年代から何段階も書きたされており、見通しが悪かった。【わたしが思うに、Fortranでも見通しがよいプログラムを書くことはできる。しかし、1980年ごろ以後に普及した制御構造構文や段下げのスタイルを使う必要がある。それ以前にプログラミングを学んだ人のスタイルの部分が多く残っていたならば、見通しが悪いものだったにちがいない。】

Barnes氏は、公開されたFortranプログラムを読んで、計算の趣旨を理解し、Pythonで書きなおし、事実上同じ結果が得られることを示した。プログラムのまちがい(バグ)を指摘したこともあった(集計結果を大きく変えるものではなかったそうだ)。

利害をともにしない第三者によって、(会計監査と同じ意味ではないが、いわば)監査されたことによって、GISSの気温内挿・集計に疑いを持っていた人 (信頼しないことに決めていた人は別として) の多くが信頼をとりもどしただろう。また、Barnes氏の仕事は、GISSのソフトウェアの品質改善に貢献したと言えるだろう。なおClimate Code Foundationの最近の活動では、ISTIが集めた観測データ(GISSの入力データよりも詳しい)を、GISSと同様なアルゴリズムで内挿するなどの試みをしている。

【GISSはこの内挿・集計プログラムだけでなく、気候モデル(model E)のソースプログラムも公開している( http://www.giss.nasa.gov/tools/modelE/ )。これは偉いと思う。しかし、このようなプログラムの公開をすることが、公費をもらっているすべての研究者の義務とされると、つらいと思う。研究のために作成した計算機プログラムには、作者自身や、作者がいつでも話ができる人だけが使うことを前提として作られていて、それ以外の人にわかるドキュメントがつけられていないものが多い。プログラムが「ひとりあるき」して、作者が想定しない条件で使われたとき、作者には責任をとりようがないだけでなく、問い合わせに答えることもむずかしいのだ。詳しいドキュメントをつければよいと言われるかもしれないが、それには人間が時間をかける必要がある。研究費の人件費では、そこまでまかなえないことが多いのだ。研究費を出す側が「プログラムの公開とそのためのドキュメント作成まで計画に入れ、それに必要な人件費を含めて申請せよ」と言えば変わるだろうが。】

- 5 -
同じくEdwards氏の講演に出てきた件として、Anthony Watts氏たちのsurfacestations.org http://surfacestations.org がある。彼らは、気象観測機器設置場所の状況によって報告される気温の値に偏りが生じているという疑いをもち、市民参加で観測地点の写真を集めて検討した。

気象の観測値が観測機器設置場所の局所的な状況の影響を受けるという問題については、近藤純正氏(気象学者、東北大学名誉教授)のウェブサイト http://www.asahi-net.or.jp/~rk7j-kndu/ に詳しい。

なお、surfacestations.orgの報告を見ると、アメリカのNOAAの観測点のメインテナンスは、日本の気象庁の観測点に比べてだいぶおおざっぱなようだが、アメリカ合衆国は日本よりも国土面積が広く平均の人口密度が低いので、そうなるのも無理もないかと思う。

アメリカ合衆国の全国規模の気温の変化傾向については、NOAA NCDCが、職員による研究論文やウェブサイト記事などで、上昇傾向を示している。Watts氏は、この報告された気温上昇は、現実のものでなく、設置場所の状況からくる偏りによって生じたものだ、と主張する文書を書いた (学術雑誌論文ではなかった)。

それに対してNOAA NCDCのMenne氏たちがさらにデータ解析をして、査読を経た学術雑誌論文(Menneほか, 2010)として発表した。彼らは、Watts氏たちによる設置状況の階級わけに従って観測地点を分類し、階級間で気温の変化傾向に違いが見られるかを解析した。結果を見ると、設置状況によって気温の値にバイアスが生じることはある。(原因が特定されたわけではないが、ありがちなのは、「風がさえぎられると、近藤氏のいう「日だまり効果」によって、高温になりやすい」ということらしい。) しかし、このバイアスの経年変化傾向には、各地点ごとのまちまちな動きはあるものの、多数地点に共通な増加も減少も見られない。したがって、全国で集計した気温の経年変化に対するこの効果によるバイアスは無視できる、という結論である。

これは、いわば、NOAAの仕事をWatts氏たちが「監査」したのに対して、逆にWatts氏たちの主張をNOAAのMenne氏たちが「監査」したと言えるかもしれない(Edwards氏はそのような表現をしていた)。

surfacestations.org の成果とされている学術論文として、Fallほか(2011)のものがある。わたしは[別サイトの2011-06-11の記事]で紹介した。結果はちょっと複雑だった。ともかく、温暖化懐疑論者として知られるWatts氏と、温暖化は進行していると考えているNielsen-Gammon氏を含む共著者の間で、この内容が共有される知識となったことは有意義なのだと思う。

文献