はじめに
惑星探査は数100億円以上のプロジェクトであり、それらプロジェクトに携わることができるのはその時代・その場に生きた一部の関係者のみです。しかしそれらプロジェクトが残したデータは世界中の人がアクセス可能で、さらには時代を超えた人類の資産と言えます。そのため古いプロジェクトのデータがどのような困難に直面し、どのように保存されてきたのかを知ることが重要です。
温故知新
人類が月・惑星探査を始めてからまだ100年も経っていません。月・惑星探査における古いデータの代表格は米国のApolloミッションになります。1969年に初めて人類が月面に降り立ったこのミッションは、科学的にも重要なミッションでした。特に月面に置かれた地震計データは、50年以上前のデータにも関わらず、今なお研究対象として利用価値の高いデータです。
Apolloミッション以降、一度も月面に地震計が設置されていないことが理由の1つとして挙げられますが、同様に研究者がデータを共有することを前提に作られたデータであることもその理由です。図1は過去の論文に掲載された図と、デジタルデータから復元した図の比較です。近年の科学論文投稿ではデータの提示を求められることが多く、50年以上前のデータがこうして復元できることは論文の正しさを未来の技術で検討する上で必要なことです。しかしながら、長期間データを使えるようにするために、様々な変化に対応する必要がありました。この50年間でデータ管理を取り巻く環境の何が変化したのか見てみます。
1. コンピュータを取り巻く環境の変化
データを長期間保存することを考えた場合、それらのデータが未来の環境で読み取れることが必要です。例えば現在のコンピュータではアルファベットと数字の対応にはASCIIコードが使われていますが、Apollo時代の文字コードはEBCDIC*が使われていました。記録媒体も最初はオープンリールテープで保存され、その後小型のカセットテープ、そして現在はハードディスクや半導体メモリへと変遷しています。また現在の地震研究で使用されている標準的なデータフォーマット(SEED、SAC、 SEG-Y等)はまだ存在せず、独自フォーマットとなっています。
また記録媒体の大容量化や高速化も研究環境の変化に大きく寄与しています。Apollo月震計のデータは約110GBになりますが、リールテープで一部屋丸ごと占有していた時代と比較すると、現在はUSBメモリで保存可能なサイズです。インターネットから全データをダウンロードしても数分から数時間程度で手に入れることができます。
インターネットで配布する際にも注意が必要です。様々な事情により配布元のURLが変化することが考えられるからです。科学データの共有はプロトコルとしてftpが主流でしたが、その後httpになり、さらに現在はhttpsが使われるようになりました。またドメイン名に関しては、保存している機関の名称変更等により変わり得ます。
* EBCDIC:1963年にIBMによって開発された文字コード体系。
2. 研究環境の変化
惑星科学分野ではNASAが各国の研究拠点となるRegionalPlanetary Image Facility(RPIF)を設立しています。そこではNASAからデータを収めたCDやDVDが送付され、研究者はRPIFに集まり研究を行ってきました。JAXA相模原キャンパスにもRPIFがありますが、インターネットが普及しデータをダウンロードできる現在ではRPIFを目的に訪れる研究者はほぼいません。
解析環境も大きく変化しています。データを解析するための準備が今よりもずっと大変でした。専用のOSに解析専用ソフトウェアの導入が必要でしたが、ソフトウェアが高価で個人の研究者が研究をするにはハードルが高いものもありました。しかし現在は無料で強力な計算ライブラリや描画ライブラリを備えた環境を数多く利用することができます。高度な処理環境が既に用意されているため、研究者はより本質的なところで議論することが容易となり、さらには惑星科学を専門としない他分野の研究者の惑星科学への参加が期待されます。
3. データ保全に対する意識の変化
かつては、データは論文の構成要素の1つとみなされ、データは基本的には実験者自ら取得し第三者のために共有するという考えはありませんでした。しかし近年はデータに対する意識が変わり、データを皆で共有しようというオープンデータという動きがあります。そこでは共有データについてFindable(データを探しだせる)、 Accessible(アクセスできる)、Interoperable(相互運用できる)、 Reusable(再利用できる)の頭文字を取ったFAIR原則として知られる原則があります。また研究プロジェクトにおいても、データの取り扱いについてデータ管理計画(Data Management Plan; DMP)が求められるようになりました。研究データを安全に保管するために、明らかにひと昔前とはデータに対する意識が異なってきています。そのためデータを長期間利用可能な状態で保存するには、以下の視点から見て、維持可能な状態を構築することが重要であることが分かります。
4. 分野を超えた協力関係の必要性
今日、世界各国が宇宙開発へと参画し、また国際宇宙ステーションの後継や月探査計画、惑星科学とそれ以外の分野の境界線が曖昧になってきています。惑星科学の分野でも天文学で良く使われるFITS(Flexible Image Transfer System)と言うフォーマットは広く利用されています。また地球科学で使うGIS(Geographic Information System)関連の技術はそのまま他の惑星科学でも利用可能です。民間企業の宇宙開発への参画も相まって、各分野で培われたノウハウの調和を取っていくことが最重要課題となっています。その先には、非専門家によるデータの利用可能性、いわゆるオープンサイエンスへの道筋があります。
データの標準化
コンピュータや研究環境の変化が進む一方で、データ自身も進化してきました。データを効率よく共有・分析を行うためには「標準」が必要となります。惑星探査の分野で最も良く使われるデータに関する標準として「Planetary Data System(PDS)」と「SPICE」があります。PDSは惑星探査の科学データを保存するための標準であり、SPICEは軌道や姿勢など科学データに付与される補助データ(アンシラリデータ)を保存するための標準です。これらの使用は国際惑星データ連合(International Planetary Data Alliance; IPDA)により推奨されており、各国の宇宙機関はこれらの標準に従ってデータ整備することが求められています。JAXAが公開する惑星探査のデータも近年の探査機は全てこれら標準に準拠するよう作成を行っています(図2)。
標準の精錬化
標準化されたデータを使い始めてしばらく経つと、その標準では満足できないことがあります。機能不足や処理しやすいフォーマットへの対応などです。そのため標準自体、時代とともに改良されていきます。改良を繰り返すうちに、歴史的なノウハウが詰まった高度に精錬された標準が出来上がります。実際、上記の惑星探査で使用される2つの標準は、非常に高度化されているので、一つ一つの正確な意味を理解した上でデータを作成するのは、一般的なサイエンスとは異なる知識と技術が必要となります。こうしたデータを作成する人のことを「データアーカイビスト」と呼ぶことがあります。データアーカイビストと科学者の関係は、自動車の開発者と運転者の関係に良く似ています。開発者は車や運転者のことを熟知している必要があり、お互いが密接に協力しないと品質の高い製品を作れません。
分業化
標準が高度化・精錬化された結果、標準に準拠して作成することが難しくなっていきます。人の多い大型プロジェクトは対応できますが、小型のプロジェクトではどうしてもデータを正しく作成することに人手を割くことができません。大きなプロジェクトも小さなプロジェクトも同じ品質でデータを作成するためには「データを専門的に作成するチーム」が必要になります。NASAやESAには当然あります。JAXAにはこの専門のチームというものがこれまで存在しませんでしたが、これを組織として進めるための土台を作ろうという動きがあります。
まずデータアーカイブを進める上で3つの主体的なプレーヤーと11個の要素が存在します(図3)。3つのプレーヤーとは、1つはプロジェクト、そしてデータセンター、最後にコミュニティです。プロジェクトが行うべきデータを作るという観点では5つの要素「定義」「生成」「文書化」「構築」「評価」があります。そしてデータセンターが担う維持管理という観点では3つの要素「保存」「公開」「識別」があります。科学データを使うという観点においてコミュニティは「利用」「協力」「標準化」を担当します。今までもこれからもプロジェクトが責任を持ってデータを作ることに変わりはありませんが、品質の高いデータを残すためにもデータアーカイビストの専門チームによるサポートが必須となります。
IPDA
標準が世界の標準として認められるためには、影響力のある団体に「これが世界標準としましょう」と認めてもらう必要があります。惑星探査の分野では、米国NASAや欧州ESAのデータ相互利用のために立ち上げた前述のIPDAがそれにあたります。発足から15年以上経った現在は、世界各国の宇宙機関がデータ標準や利用促進を議論する場となっています。
最後に
長い間、宇宙は特別な空間であり、惑星探査は国家レベルのプロジェクトでした。しかし今後は、民間企業による宇宙開発が活性化する時代へと変遷し、データの利活用が重要な役割を担うことになります。これまで世界の宇宙機関が積み上げてきた努力の結晶とも言えるデータとその標準を活用して頂けたら幸いです。
【 ISASニュース 2023年3月号(No.504) 掲載】