PLAINセンターニュース第159号
Page 3

情報通信技術を宇宙科学にどう活用するか?(第5回)

村田 健史
愛媛大学総合情報メディアセンター
宇宙科学情報解析センター客員


3.3 STARS 1 & STARS 2:オブジェクト指向とオブジェクト指向開発技法
    (その2 〜データフォーマットについての考察)
の つづき

 前回、太陽系プラズマ観測データには、自分自身のデータフォーマットを表現するメタ情報を内包する自己記述型のデータ形式が有効であることを述べた。筆者は、愛媛大学総合情報メディアセンターの木村映善助手(現在は同大学医学部助教授)や私の研究室の修士課程の学生諸氏(山本和憲君、石倉聡君、久保卓也君など)と一緒に NASA/GSFC が提唱する自己記述形式 CDF(Common Data Format)について勉強し、CDF が今後の STP 分野の科学衛星観測データには最も有効な自己記述型データフォーマットであると確信している。

 数年前、縁あって PLAIN センターの新 DARTS システムの太陽系プラズマ観測データサイトの設計に関わるようになり、同センターの篠原育助教授や松崎恵一助教授との協力のもとで、DARTS が管理する太陽系プラズマ観測分野の観測データの CDF 化を進めている。表に、これまでに CDF 化を行ったデータの一覧を示す。この中でまず手がけたのが、前述の SDB 形式で記述されていた GEOTAIL 衛星および AKEBONO 衛星観測データの CDF 形式への変換作業である。変換作業は、篠原助教授と久保君が中心となり各 SI の協力の元で進めており、必ずしも順調とはいえないが、現在も続いている。

表 PLAIN センターが管理する太陽系プラズマ観測データ CDF 化の現状:
○は実装済み、△は実装中、□はCDF の設計中(2007年1月現在)

AKEBONO 衛星

 軌道(△)、VLF(△)、PWS(□)
GEOTAIL 衛星
 軌道(○)、PWI/SFA(□)、PWI/WFC(△)、MGF(○)、LEP(□)
REIMEI 衛星
 軌道(○)、EISA(○)、MAC(○)、GAS(○)、CRM(○)

  2005年に打ち上げられた REIMEI 衛星については、打ち上げ前から SI と相談し、全ての Level-2 データを CDF 形式で記述することを申し合わせた。各 SI データの CDF 設計を打ち上げ前からはじめたおかげで、表に示すように打ち上げ後 1年ですべての REIMEI データを CDF 化することができた。(この作業は、宇宙研の笠羽助教授には特にご尽力をいただいた。)GEOTAIL や AKEBONO 衛星の作業が順調には進んでいないことと比較すると、打ち上げ前からデータフォーマットを定義することが L2 データベース構築には効率的であることがこの表から明らかである。この教訓を生かし、我々は SELENE、Planet-C、BepiColombo といった打ち上げが予定されているプラズマ観測衛星のデータ形式についての議論をすでに始めている。

 なお、久保君はすでに 10 種類以上の太陽系プラズマ観測データの CDF 化に関わっており、今や CDF のスペシャリストである。彼は優秀であるが、しかし情報工学専攻の学生であり、科学衛星観測データの物理解析の経験はまったくない。データの物理的意味を理解していない彼にデータ構造の設計を任せるのは、やはり重荷であろう。物理知識がある専任の若手研究者の中からデータ構造設計のスペシャリストを育成することは、宇宙科学研究本部の責務のひとつである。

 このように、太陽系プラズマ観測データの自己記述形式での L2 データベース作成は軌道に乗りつつある。しかしなぜ太陽系プラズマ観測データの CDF 化は、netCDF の気象学、FITS の天文学と比較してこれほど遅れたのであろうか? ひとつの理由は、気象学や天文学と比較すると太陽系プラズマ観測データはデータ構造が複雑であり、また観測モードも多岐にわたるからである。天文学は原則的には 2次元の天空撮像データが主体となるため、画像形式を主対象とする FITS フォーマットで対応できる。一方、地上観測である気象学はテレメトリと言う衛星独自の制約がないため観測データ量を節約する必要がなく、衛星観測のように(最適な観測データを取得するための)複雑なモード設定が不要である。太陽系プラズマ観測は、観測機器が多く、また機器ごとの観測モードも多い。一つのデータ形式であらゆる観測データに対応する設計には年月を要したのである。NASA/GSFC の CDF に関わった技術者には頭が下がる思いがする。

 もうひとつ、忘れてはならないことがある。それは、「コスト」である。残念ながら太陽系プラズマ研究グループには、これまでコストと言う概念が不足していたように思われる。SI が独自にデータ構造を記述する SDB と“あてがいぐち”でデータを記述しなくてはならない CDF では、どちらが SI にとって楽なデータフォーマットであろう? もちろん SDB である。自由にデータ構造を記述できるのであるから、SI にとってこれほど都合がよいデータ構造はない。私の経験から言っても、CDF というフレームワークの中で自分の観測データを記述するのは、正直なところ、各 SI にとっては楽な作業ではない。しかし、その努力を惜しんではならない。なぜなら、一度標準的なデータフォーマットで記述してしまえば、その後の作業は情報処理の専門家にバトンタッチできるからである。近年の IT または ICT(情報通信技術)の普及により、システムエンジニアやプログラマの数は増え、技術力のあるプログラマに比較的安価でシステム構築を依頼することもできるようになってきた。これは広い目で見れば、システム構築の大きなコストダウンである。

 わたしは、これまで多くの太陽系プラズマ研究者が「情報処理技術者(たとえばプログラマ)にデータを渡しても、物理的側面の知識がないプログラマがデータ解析ツールを作れるはずがない」という言葉を聞いてきた。しかし、それは間違いである。重要なのは、客観的にデータ構造を表現することである。物理的側面を消してデータの構造を客観的に記述できれば、優秀なプログラマであればデータを処理したりプロットしたりするツールの実装は困難ではない。では、誰がそのデータ表現をするのか。それは、データの物理的側面を理解している研究者の仕事である。(だからこそ、物理知識を持つデータ構造設計のスペシャリストが必要なのである。)現在、篠原助教授と松崎助教授が中心となり実装が進んでいる新 DARTS-STP では、その客観的設計があらゆるところで行われている。その結果、すばらしいシステムが、プログラマやシステムエンジニアとのコラボレーションによって構築されつつある。期待していただきたい。

次号 に続く)

このページの先頭へ



「あかり」ののデータプロセッシングの現状 へ

宇宙研計算機,ネットワークに関するお知らせ


(800kb/ 4pages)

Next Issue
Previous Issue
Backnumber
Author Index
Mail to PLAINnewsPLAINnews HOME