macroscope

( はてなダイアリーから移動しました)

研究過程の記録の必要性とそれについての悩み

研究不正の疑いが濃い事件が起こり、ネットメディアだけでなく(日本の)マスメディアで大きくとりあげられている。わたしはその事件について論評するつもりはない。ただ、それをめぐる人々の論評のうちに、科学研究一般の規範を論じているものがある。それは、いま始まった話ではなく、数年前からおりにふれて議論されてきたことがらだ。そのうちには、わたしの専門分野にそのまま適用されたら困ると思うものもある。また、わたしの専門分野でも適用したほうがよさそうだが、自分はそれを実践できそうもなく、わたしにはいまどきの研究職はつとまらないのかもしれないと思うことがらもある。これはわたしにとって気の重い話で、文章でうまく表現できるかどうかわからないが、ひとまず頭の中のわだかまりを押し出す意味でここに書き出してみる。

前おきとして、「研究不正」と仮に表現したことに、複数の意味があることに注意しておきたい。第1は、一般社会の規範である法制度への違反である。一般の刑法などへの違反もありうるのだが、とくに、(研究を職務として雇われている場合)雇用契約、研究請負契約、知的財産権などにかかわる問題がおもになると思う。第2は、科学者共同体の規範への違反である。科学的知見の品質を確保するためには、メンバーが規範をまもっていることが前提となるのだ。とくに、成果が政策決定の材料となる場合や、国民の税金に由来する資金が使われている場合は、成果の品質は科学者共同体だけでなく社会全体の問題ともなる。実際の研究不正事件はどちらの観点でも規範違反であることが多くはあるが、2種類の規範違反は質が違う問題とみるべきだろう。ただし、現実の議論では両者の区別がわかりにくいことが多い。わたしも、両者を初めから区別して議論することはむずかしいと感じているので、ここでは区別しないで議論を始めて必要を感じたときに区別することにする。

- - -

さて、いま問題にしたい件は、次の2つだ。ここで「研究者」とは、法人に雇われ、研究をおもな職務とする人を想定している。
1. 研究者は勤務中の作業をすべて改ざん不可能な(改訂履歴が明示される)形で記録しておかなければならないか。
2. 研究者が勤務中に書いたものはすべて法人の財産であって研究者が持ち出してはいけないのか。あるいは、あらゆる人に対して公開されるべきものであるのか。(「あるいは」の前と後の文は両立しないと思うが、研究者の自由裁量でない点が共通している。)
この記事ではまずその 1 について書いてみる。次の記事で 2 について書きたいと思う。

(もうひとつ、研究はたいてい多くの人の貢献によって成り立つものだが、そのうち研究論文の著者になるのはどういう人である(べきである)か、著者になったらどういう責任が生じるか、という問題が気にかかっている。著者になることを業績評価に直結させることがひずみを招いており、著者にならなくても、研究課題を考えた人、プロジェクトを管理した人、材料を提供した人などのそれぞれの業績を高く評価することができればよいのだと思う。この件は別の機会に考えたい。)

(また、他人の著作物からの文章の盗用(いわゆるコピペ)についての話題もあるのだが、これも別の機会にしたい。)

わたしは、地球科学者であり、専門の分野名は「気候」と書くことが多いが、教育を受けた分野を学会名で代表させて言えば「気象学」である。わたしの感覚は気象学者の文化を反映したところが多いと思う。ただしそのうちで「データ解析」屋である。自分が観測をしているわけでも、オリジナルな理論モデルを作っているわけでもない。他人の観測に基づくデータをいろいろ集めてきて、さらに計算処理して結果を出している。材料となるデータは、公開されていることもあるし、個別に頼んで提供してもらうこともある。観測あるいはモデルの研究者から頼まれてデータ解析を担当する立場になることもある。解析作業のために自分で計算機プログラムを書くことがよくあるが、売り物になるようなプログラムを書くことはめったにない。

- - -

2007年、当時「...センター」と呼ばれていたわたしの職場に「センター長補佐」が着任した。センター長は学者だが研究管理のプロではないので、親組織がほかから研究管理のプロと目される人を呼んできたらしかった。詳しいことは知らないが、センター長補佐は実験室での実験が主な方法である研究機関を経験した人にちがいなかった。われわれ研究員にハードカバーのノートブックを配って、「毎日の仕事内容を記録しなさい、あとで書きかえてはいけません」と言った。わたしは2ページだけそのノートを使ったけれども、あとは使うのをやめてしまった。幸か不幸か、ノートをチェックされることはなく、2009年には改組になって「センター」がなくなってその件は忘れられていった。

このときわたしは、作業の記録を残すことは有意義だと思った。しかし、記録改変防止の必要性を感じなかった。そして、手書きよりは計算機上でメモをとることに慣れていた。それで、記録は計算機上でとるのが合理的だと判断したのだった。しかし、その後のわたしは計算機上に作業日誌を作る実践をしなかった。おりにふれてメモのファイルを作りはするものの、それをどこに置くかは書いたときの分類意識によるので、なん年かたつとたどりつけず、書いたかどうかさえわからなくなってしまうのだ。これは自分の利益にとってもまずいことなのだが、なおせないでいる。

ただし、作業記録をどのくらい詳しくとるべきかについて、おもに計算機上のディジタルデータを扱う仕事に、貴重な実験動物や薬品を使う仕事の流儀をあてはめないでほしいと思うことがある。自分にとって使いものになるかどうかわからないデータを、あるいは解析方法の情報を得たとき、試行錯誤的にそれをためしてみたくなることがある。もしその過程をきちんと記録しないといけないとすると、めんどうになって、データや方法の種類を広げるのをためらうことになりそうなのだ。「本番でこれを使う」と決めたところから、順を追って記録すればよい、としてほしいと思う。もっとも、試行錯誤段階についても「どこどこから何々のデータをもらって試行錯誤的に見てみた」くらいは記録したほうがよいと思っている。

- - -

さて、2009年、イギリスのEast Anglia大学(UEA)のClimatic Research Unit (CRU)の研究者の電子メールが暴露され、(暴露行為をした人ではなく) メールを書いた研究者に捏造や改ざんなどの不正行為の疑いがかけられるという事件があった。UEAが外部専門家に委嘱した調査や、イギリス国会の委員会の調査で、不正の疑いは晴れたと言ってよいと思う。

CRUへの批判のうち、「CRUとイギリス気象庁(UKMO)の共同研究で作られている全球格子気温データは、気候変動に関する政策決定に使われるものなので、どのような観測データからどのような手続きに基づいて作られたかを再現可能な形で示すべきである」という、いわゆるトレーサビリティの要求は、正当なものだといえる。ただしそれを過去にさかのぼって要求するのは酷なのだ。将来に向けては、CRUとUKMOは、事件後まもなくから、トレーサビリティを高める方向に動き出していると思う。ただし、彼らが最善をつくしたとしても、批判者が期待するほどトレーサブルに、つまり公開された情報に従えばだれでも同じ結果を再現できるように、できるとは限らないと思う。

CRUの格子データ作成の場合を例に、どこにむずかしさがあるか考えてみる。

材料と手続きのうち、観測点から格子点への空間内挿の手続きは、比較的簡単に、再現可能な形で公開可能だと思う。むずかしい問題は、そこに至る前の段階にあるのだ。

むずかしい問題の第1は、気象データには無条件に公開されたものも多いのですべてそうだと思っている人もいるが、CRUが材料としたデータのうちには、いろいろな国の気象業務機関などから、データをCRUの研究に使うことはよいが再配布はしないという条件で提供されたものもあるのだ。法的状況はよく知らないが、データに著作権を適用するのは困難なのでライセンス契約の問題ととらえるべきだと思う。データの所有権は提供元に残っていてCRUは使用権だけを持っていると考えればよいのかもしれない。しかしCRUが気温の解析を始めた1980年代にはデータの知的財産権の考えかたは明確でなかったので、ライセンスの文書が作られていない場合もある。一部の批判者は、公開不可と明示されていなければ公開せよとせまった。しかし、一部の提供元のポリシーは再配布不可が原則にちがいなかった。CRUとUKMOは、提供元に再配布許可を求める努力を続けていた。その結果、最近のバージョンの格子データ作成に使われた材料データの大部分が公開に至っている。しかし全部ではない。

(2009年に批判のまとになっていたのは、全球平均気温などの空間分解能のあらい気候のとらえかたであり、その目的ならば、他の複数の機関(アメリカ合衆国のNOAA NCDCやNASA GISSなど)が、公開されたデータだけを使って格子データを作っているので、実は、再配布できない材料データに頼る必要はなかったのだ。他方、空間分解能の細かい情報を必要とする場合に、再配布できないデータを使うとよい結果が出るが、第三者が再現することが困難だ、ということが起こりうる。)

むずかしい問題の第2は、観測データに適用される品質チェックや補正の手続きだ。観測データは、観測が行なわれた現場からいろいろな伝達過程を経て解析者に届くので、さまざまな誤差やまちがいを含むことがある。

定量的バイアスには、まず観測機器自体のバイアスや、機器が置かれたローカルな状況(通風や日射など)によるものがある。また、観測点の標高の違いや、観測点を含む地区の都市化などによって、観測自体は正確でも、その地域の気候変化のデータとしては代表性がそこなわれることがある。バイアスの補正方法が決まれば、それの適用は、一定の計算機プログラムによって、いわば客観的にすることになるだろう。しかし、補正対象を認定したり補正方法を考えたりする過程では、試行錯誤が必要だろうし、最後まで客観化できず「ここは専門家判断によった」としか言えないこともあると思う。

定性的なまちがいには、違った変数・場所・日時の値がまぎれこんでしまうこと、桁や単位のまちがい、数字の書きまちがいや通信の際の化け、観測機器が故障して出力と気象変数との対応が失われていること、などがある。まちがいの検出は客観的にできるかもしれないが、そこに達するまでに人が探索的にデータを見てどんなまちがいがありうるかを判断することが必要だろう。まちがいのうちには訂正できる場合もあるが、それには原因の推測が必要であり、そこに専門家判断がはいるだろう。

そこで、研究者が材料データと解析手続きをすべて公開すると決めたとしても、それさえ受け取れば別の人が同じ結果を再現できるようにできることを要求するのは無理があると思う。ただし、解析のどの段階で専門家判断がはいってどう判断したかの記録を添えることはでき、もしそこで同じ判断をすれば結果も同じになるようにはできるかもしれない。

- - -

なお、厳密な再現が困難な理由には、数値計算上の誤差の問題もある。平均値などの統計量の計算や、単位の換算の際に、端数をまるめる四捨五入などの処理をどの段階でするか、またそこで計算機が実際にどんな演算をするかによって、結果の数値がぴったり同じにならないことがある。

(われわれの計算は、数値を実数の近似値とみなす場合と、有限桁数の値とみなす場合がある。

実数の近似値として扱う場合は、Fortran処理系や表計算ソフトウェアの浮動小数点演算をそのまま使うことが多い。多数の時間ステップを踏むシミュレーションの場合は、計算過程で誤差が累積して結果が大きく違ってくる心配があるが、データ解析で生じる計算では、誤差はランダムに出てバイアスのもとにはならないだろうと(必ずしも根拠なしに)期待して、実際に困っていないことが多い。厳密な再現性を求めないことが前提であるが。

他方、有限桁数の値の処理では端数の処理はランダムとみなせないこともある。思いあたるのは、観測機器の精度を考慮して数値が0.5きざみで記録されている場合に、通常の四捨五入を適用して0.5をいつも切り上げるとバイアスが生じる。)

- - -

むずかしさを述べることが続いてしまったが、わたしは、データ解析のトレーサビリティを高めることには基本的には賛成なのだ。

しかし、なさけないことに、わたし自身の仕事では、(これまたなさけないことに)政策決定に使われる成果を出していなかったから責任を問われることはなくてすんだものの、作業過程のトレーサビリティを高めるくふうがまったくできていない。バージョン管理ソフトウェアであるCVSRCSの名まえを知っているし(gitもその同類かはよく知らないのだが)、そういうものを使って自分のソースプログラムを管理している人の話を聞いたこともあるのだが、自分が慣れる機会を作れないまま来てしまった。また、そういうソフトウェアが数値データファイルについて使いものになるかどうか、試みもしていないからだが、よくわからないままだ。

このなさけない状況のうちどれだけが、わたしの努力不足や、わたしがとしをとって新しい技術を覚える能力が落ちているせいなのだろうか。どれだけが、データ解析のトレーサビリティを高めることをめざしたソフトウェアの開発や実装によって解決することなのだろうか。どれだけが、解決がなかなか見つからない構造的な困難なのだろうか。