macroscope

( はてなダイアリーから移動しました)

NCARのデータマネジメントについて、わたしが知っていること

アメリカ合衆国のNational Center for Atmospheric Research (NCAR、全国大気研究センター http://www.ncar.ucar.edu )のデータマネジメント業務について、おたずねがあった。わたしは1980--90年代、おもにデータ利用者として、NCAR Data Support Section (DSS)とつきあいがあった。そこで知ったことの要点は増田(2001)の中に書いた。しかし2000年代以後はつきあいが薄くなっていて、最近の状況をよく知らない。ひとまず、ウェブサイトの現在の所在の確認だけしながら、わたしが知っていることを書き出してみる。

アメリカの気象・気候関係のデータマネジメントの主役は、NOAA (海洋大気庁)、そのうちでもNational Climatic Data Center (NCDC http://www.ncdc.noaa.gov )であり、NCDCはICSUのもとにつくられたWorld Data Center制度(現在はWorld Data Systemに移行している)の中でWDC-A for Meteorologyという機能をもになってきた。しかし、NCDCに代表される連邦政府(インターネットドメインではgov)セクターに加えて、大学(edu)セクターのデータマネジメント活動があった。その中心がNCARであった。

NCARは、University Corporation for Atmospheric Research (UCAR、大気研究大学連合 http://www.ucar.edu )という法人が、主としてNSF (国立科学基金)から運営費をもらって運営している共同利用研究所である。UCARは、気象学を含む大気の研究の推進に目的を限った、多数の大学の組合のようなものである。(アメリカ合衆国には基本的に国立大学はなく、大学は、私立か、州などの公立である。) Nationalと称し、また間接的ながら国の支出で成り立ってはいるが、国の役所ではない。

わたしが知っているNCARのデータマネジメントは、主としてData Support Section (DSS)という部署のものだ。これは、Scientific Computing Division (SCD)に属していた。SCDの最大の業務は共同利用計算機の運営をすることで、それに加えて、数値計算技術を開発する研究部門もあった。現在はSCDはComputational and Information Systems Laboratory (CISL http://www.cisl.ucar.edu )となっており、その中にDSSは今もあるが、そのウェブサイトはRDA (Research Data Archive http://rda.ucar.edu )という名まえに変わっている。DSSがSCDの下にあったのは、その正面の機能が、SCDが管理する共同利用計算機のユーザーに対して、その計算機上でデータを使うことを支援することだったからにちがいない。(DSSが管理する大量のデータを置く場所がSCDの計算機システムの一部でありそれ以外にありえなかったという事情もあると思うが。) しかし、NCAR DSSは、SCDの計算機ユーザーでないデータ利用者にも、テープ媒体などにデータをコピーして実費で提供することをしてきた。インターネット経由でのデータ提供が普及してきた2000年ごろ以後は事情が変わってきたが、1980--90年代、NCAR DSSは、日本の大学などの研究者がデータを入手する際に、最重要の窓口だったと思う。NCDCの提供対象でなかった(終了したものを含む)研究プロジェクト由来のデータも扱っていたうえに、NCDCよりもデータ編集などの技術にたくみであり、また、役所直営でないためか支払い手続きで柔軟に対応してくれたので(買う側が日本の国公立大学で後払いを求め、売る側がアメリカの役所で先払いを求めると詰まったのだ)、ありがたかった。

DSSがこのように力をもったのには、Roy Jenne氏という人物がいたことに大きくよる。1970年ごろ、NCARは、世界(とくに南半球)の大気大循環の観測値に基づく格子点データを作成するプロジェクトを請け負い、Jenne氏はそのデータの整理を担当した。そのfollow-upから、常設のデータマネジメント活動になったらしい。1980年代のDSSの活動は、多数のデータセットの中から利用者の需要に合いそうなものを紹介するライブラリアン(図書館員の同類)的なものが主だったと思う。しかし1990年代にNCEP/NCAR再解析というデータ同化プロジェクトがあり、データ同化の本体はNOAAの部署であるNational Centers for Environmental Prediction (NCEP)が担当したのだが、入力となる観測データの整理をNCAR DSSが担当した。Jenne氏はそのときまで現役であった。

Jenne氏の引退後、DSSはRDAという形で存続し機能を果たしているが、気象・気候研究者に対するその相対的重要性はだいぶ薄れているように、わたしには思われる。

NCARにはもうひとつ、Earth Observing Laboratory (EOL)の下に、Data Management Group (DMG http://www.eol.ucar.edu/content/data-management-group-dmg/ )がある。(この体制は2005年以後のもので、その前は、UCARの下ではあったがNCARとは別のJoint Office for Science Supoort (JOSS)の下にあった。) EOLは、NCARの観測用飛行機などの観測設備の管理や機器の開発をしているところで、DMGの本来の役割は、その設備を使った野外観測プロジェクトのデータを整理し、プロジェクト内外に提供することであるらしい。CEOP (Coordinated Energy and Water Cycle Observations Project http://www.ceop.net )の現場(in situ)観測データのマネジメントを担当しているのはこの部署である。

なお、UCARの下ではあるがNCARには含まれないデータマネジメント事業として、Unidata (http://www.unidata.ucar.edu )がある。これは、おもに、NOAAの気象データをリアルタイムで大学に提供するサービスである。これに加入している大学にとってだけでなく、それ以外の人々にとっても、netCDFなどのソフトウェアの開発者として重要である。

文献