macroscope

( はてなダイアリーから移動しました)

「科学者はプログラムやデータを公開するべきだ」とはどういうことか?

[2010-02-07: English version is here.]

公共のお金をもらって研究している科学者は、その研究が再現可能であることを示すために、計算機プログラムやデータを公開するべきだ(あるいは監査されるべきだ)という意見は、前からあったのだが、いわゆるClimategate事件(前の記事参照)をきっかけに、よく聞くようになった。

その意見には、似たように聞こえても、実は違う意味のことがある。その意味の違いによって、もっともだとも言えるし、とても納得できないとも言える。ここでは、あまり話を具体的にしないで,問題の構造をしわけてみたい。

計算機プログラムとデータとは、知的財産権の制度上は、違った位置にある。しかし今の話の文脈ではこの違いをあまり問題にしないでいっしょに扱ってよいと思う。

問題の第1は、「べきだ」というのは、奨励することなのか、義務づけることなのかの区別だ。

第2は、ある研究の過程で作られたプログラムやデータと、その研究の過程で使われたプログラムやデータの区別だ。

第3は、研究を始める段階で約束した義務と、始めてから(ときには終えてから)課される義務の区別だ。

第4は、プログラムやデータを、だれでも見られるように公開することと、監査をする役まわりを公認された人に提供することの区別だ。

以上の論点を組み合わせて自由に少し議論を進めてみる。

わたしは、科学者が研究の過程で作ったプログラムやデータを公開することは望ましいことだと思う。とくにその研究が公共の資金によるものであるとき、またそれが公共的意義のあるときはそうだ。

そして、もし研究が契約によるものならば、研究費を出す組織は、その研究によって作られたプログラムやデータを公開することを、契約条件に入れることができるだろう。(ただし、このルールはきびしくしすぎると働かない。実際に役にたつプログラムやデータはたいてい資金源の違う仕事によって作られた部分の組み合わせであることも考慮に入れる必要がある。)

研究に使われるプログラムやデータの源はさまざまだ。そのうちには、パブリックドメインのものや、明確なオープンソースのライセンスがついているものもある。しかし、知的財産としてまもられなければならないものもある。いくつもの国の政府は、気候データの多くの部分を、公共財ではなく国の財産ととらえている。それを、第三者に出さないという条件で提供を受けて利用している科学者に、それを公開せよとせまるのは、無理な要求だ。

不正が疑われる場合は強制捜査が必要になる。平常でも、会計監査と別に研究という仕事に関する監査があるべきだという考えはいちおうもっともだ(実際にどういう人にやってもらえばよいかはむずかしいのだが)。研究契約あるいは研究者の雇用契約に、監査を受ける義務を組みこんでおくこともできる。プログラムやデータを捜査官や監査人に提供することは、それを一般に公開することとは区別できる。もちろん、監査人は倫理的義務を負う。合法的に公開を制限された情報を横流ししないことや、監査の機会を自分の利益のために使わないことなどだ。

たとえ監査に法律的裏づけがあるとしても、それは一国の政府によるものだということには注意が必要だ。データが外国の財産であって第三者に使わせない契約になっている場合、それへの監査人のアクセスを強制的に可能にすることは、自国の権力による外国の権利の侵害となる可能性があり、外交問題になりうる。

さて、これまで述べたこと以外に,科学者の仕事はどこまで追跡可能(トレーサブル)であるべきかという問題があると思う。確かに、わかりやすいプログラムや、よいドキュメントのついたデータベースをもつのはよいことだ。他方、研究者は試行錯誤を必要とする。ときには、しっかり記録をとるよりも速くためしてみたいこともある。たぶん、そのようなためしの作業は、そのまま成果を公表できるものではなく、その前にもう一度、記録をとるスイッチを入れて、やりなおすべきなのだろう。