PLAINニュース第177号
Page 2

C-SODA 科学データ利用促進グループの業務について

海老沢 研
科学衛星運用・データ利用センター 科学データ利用促進グループ

 宇宙科学研究本部内の衛星運用、データ利用、情報システム関連業務を行う複数の部署が統合する形で、4月から「科学衛星運用・データ利用センター」(Center for Science satellite Operation and Data Archive; C-SODA) が発足したが、その組織と役割の概要については、PLAIN ニュース4月号に加藤センター長が述べている通りである。私は、やはりこの4月から発足した「宇宙科学情報解析研究系」の主幹として宇宙科学研究に携わると同時に、C-SODA の科学データ利用促進グループ(以下、データ利用G)長として、JAXA の科学衛星データ利用促進に関連する諸々の一般業務を行うことになった。実際には、昨年度まで PLAIN センターとして行っていた業務の内容に変化がある訳ではないが、このように、宇宙科学研究本部の各教育職員(教授、准教授、助教)が行っている研究業務(たとえば、学会発表や論文執筆など)と一般業務(たとえば衛星機器開発、衛星運用、データベース整備など)を定義しなおし、それらに対する従事割合も明らかにして切り分けることが、4月からの科学本部の組織改編の目的の一つであった。

 この改編は JAXA 全体の組織改編の一環として実施されたものであるが、それとは独立に、我々は一年以上前から科学衛星運用・データ処理の「end2end」にわたる効率的なシステムを実現するための新たな組織を提案してきた。そのキーワードは、昨今多くの産業や IT の現場で叫ばれている「見える化」であり、C-SODA が発足してやっと軌道に乗りつつある今、その効果は徐々にではあるが見えつつあると思っている。

 C-SODA が行う業務に関して、まだまだ「見える化」を進めて行かねばならないが、このたびデータ利用G内で十分な議論を行い、今まで PLAIN センターとして行ってきた業務の「棚卸し」を行い、データ利用Gが今後行っていく業務に関して、一通りの見解をまとめたので、ここに報告する。現在、小型衛星計画や国際宇宙ステーション (ISS) への機器搭載、海外のミッションへの参画等、新たな研究グループが宇宙科学に参入する機会が増えつつあり、その裾野が広がりつつある。それは大変望ましいことであるが、では近い将来、たとえば小型衛星や ISS の観測装置を運用することになる、今まで衛星ミッションの経験のないグループは、データ処理やアーカイブズに関して、C-SODA にどこまで期待できるのか?それを私たち C-SODA データ利用Gの立場から明らかにすることが本稿の目的である。

1. データ利用Gの目標

 データ利用Gの目標は、各プロジェクトや C-SODA 内の衛星運用グループ、計画調整グループ(情報基盤チーム、技術情報システムチーム)と協力し、JAXA の科学衛星データ利用のためのシステムを開発し、それを長期間にわたって運用することによって、国内外の科学者によるデータ利用を促進し、衛星の生み出す科学的成果を最大化することである。

2. データ利用Gの業務

 データ利用Gの行う業務には、JAXA の科学衛星プロジェクトに依存するものと、依存しないものがある。

(ア) JAXA の科学衛星プロジェクトに依存しない業務

  • 共用ソフトウェアの整備
    宇宙科学本部の計算機の上で、プロジェクト横断的に使える共用ソフトの整備、運用を行っている。詳細な内容、具体的なソフトウェアについては、PLAIN センターニュース 151号を参照。ただし、これについては、今後 C-SODA の情報基盤チームの業務と定義し直す可能性がある。
  • データ、ソフトウェアのミラー
    現在、TRACE, RHESSIという太陽衛星、X線天文衛星 Swift、磁気圏観測衛星 THEMIS のデータ、X線天文学データ解析用 CALDB, HEASOFT のミラーを行っている。
  • サーバの提供
    衛星プロジェクトを含む ISAS 内の各グループに対して、データ公開やファイル交換用の ftp サーバ、情報公開用の http サーバを提供し、運用している。バックアップも行っているが、そこに置かれるデータやウェブページの内容については関与していない。これについては、今後は C-SODA の情報基盤チーム、または技術情報システムチームの業務として定義しなおす予定である。
  • 国内外の宇宙科学データベースプロジェクトとの調整
    データアーカイブズにおいて重要なのはその汎用性、普遍性であり、国内外の宇宙科学データアーカイブズと足並みを揃えて開発を進めていく必要がある。たとえば、天文学や惑星科学における国際的なデータフォーマットやデータアクセスプロトコルの策定などについて、国内外の機関と議論,調整をおこなっている。

(イ) JAXA の科学衛星プロジェクトと協力して行う業務

 データ利用Gは、各衛星プロジェクトと協力し、科学本部が運用する衛星、探査機のデータに関して、データの低次処理システム、データの高次処理システム、データの配布・検索・ブラウズ(早見)システム、およびデータ解析環境を開発、整備、運用する。低次処理システムは、テレメトリデータベースである SIRIUS(同 121, 122, 124 号参照)と工学データベースである EDISON (140, 149 号参照)からなる。データの高次処理システムは DANS (同 118号参照) と呼ばれ、配布・検索・ブラウズシステムは DARTS (http://darts.isas.jaxa.jp) である。データ利用Gが運営するデータ解析用計算機群を「解析サーバ」 (http://plain.isas.jaxa.jp/ana_servers) と呼んでいる。

3. データ利用Gとプロジェクトが協力して行う業務の詳細

 上の(イ)で述べた、衛星プロジェクトとデータ利用Gが協力して行う各々の業務について、支援対象、業務主体、具体的な内容、および課題を述べる。今後の課題については、現時点ではまだ不十分であるが、今後数年間をかけて各プロジェクトと協力して実現していきたい事柄を挙げた。

(ア) データの低次処理 (SIRIUS、EDISON)

支援対象 ISAS の全プロジェクト
業務主体 データ利用促進G
具体的な内容 衛星からのパケットをアーカイブし、ISAS 標準プロトコル (SDTP プロトコル) にてプロジェクト関係者に配布する (SIRIUS)。衛星からの housekeeping データを衛星設計情報ベース (SIB) に従って工学値変換し、Web 経由でプロジェクト関係者に配布する (EDISON)。
課題 最も効率の良いデータ処理のために、将来的にデータ蓄積装置(現在は衛星運用グループの所管)とのマージも視野に入れた新 SIRIUS システムの概念検討。それが実現した暁には、打ち上げ前のエンジニアリングモデル、プロトタイプモデル段階からの試験データの SIRIUS への登録を目指す。
EDISON に関しても衛星運用システムとの関係を整理し、すべてのミッションについて EDISON の存在をデフォルトとする(現時点では、科学本部のすべての衛星について SIRIUS は存在するが、EDISON が存在するのは、はやぶさ、すざく、ひので、あかりのみである)。

(イ) データの高次処理

支援対象 科学データを公開するプロジェクト
業務主体 プロジェクトが主体となり、データ利用促進Gが協力して実施
具体的な内容 SIRIUS 中に保管されている衛星のテレメトリデータに関して、衛星固有のフォーマットを解釈し、観測装置の較正情報を用いて機器の特性に依らない物理量に変換し、衛星固有の知識を持たないユーザーでも使える「こなれた」形に変換するまでの高次処理を、できるだけ自動化して行う(パイプライン処理)。
データ利用促進Gはプロジェクトに対してサーバ、ストレージを含むデータ処理用の計算機資源 (DANS) を提供し、バックアップ、disaster recovery も含めた運用を行う。各衛星プロジェクトは、DANS の上で走るプロセシングスクリプトを開発し、定常的に高次データ処理を実行する。
データ利用Gは高次データ処理のための定常的な人的リソースは持たないため、原則としてプロジェクト側で高次データ処理システム開発・運用のための予算、人員を担保する。たとえば、ポスドクやオペレーターを確保し、プロジェクト固有のデータプロセシングの開発や定常処理に従事させる。
データ利用Gはプロジェクトによるポスドクや技術者確保の支援、複数ミッション汎用の技術支援、計算機リソースの提供を行う。
課題 現時点では、衛星ごとにプロセシングシステムが独立に開発されているが、可能な限り複数の衛星のプロセシングに共通の技術・部品を切り出し、新たな衛星に使い回せるような標準的な手法、テンプレートを確立する。複数プロジェクトのデータプロセシングに従事することを前提とした専門性の高い技術者を定常的に確保し、データ利用G内に、できるだけ広範囲の分野やミッションに適用可能な、パイプラインプロセシングの人的、技術的ノウハウを確立する。

(ウ) データ配布・検索・早見システム (DARTS)

支援対象 科学データを公開するプロジェクト
業務主体 データ利用Gが主体となり、プロジェクトの協力を受けて実施
具体的な内容 Web を通じて、世界中の研究者を対象に、公開データの配布を行うシステム (DARTS) を開発・運用する。衛星について特別な知識を持たない科学者でも、大量の公開データから必要な情報を容易に検索、早見できるようにするための先進的なシステム開発を行い、それによって、データの利用を促進する。現在開発しつつあるそのようなシステムの例として、複数の太陽地球物理衛星の同時イベントを検索するための CEF (Conjunction Event Finder)、天文衛星のカラーイメージを全天マップから選んで拡大表示するための JUDO (JAXA Universe Data Oriented)、X線天文衛星の画像から任意の領域を選び、スペクトルやライトカーブを抽出して表示する UDON (Universe via DARTS ON-line) 等がある。
特に、すでに終了したミッションのデータを利活用するシステム、複数ミッションのデータを同時参照するシステムの開発や、外部のデータベースとの連携強化などは、個別のプロジェクトでは対応不可能で、C-SODA データ利用Gが中心になって行う。
課題 複数の衛星に共通に使える DARTS 開発手法の確立 (PLAIN ニュース 149, 153 号の松崎氏の記事参照)。ユーザーである科学者からの DARTS に対する要求条件の引き出しと分析。DARTS の中でミッション固有部分の開発に対するミッションからの理解とリソースの提供。終了したプロジェクトに関する DARTS 開発、およびミッション横断的なシステム開発についての継続的なリソースの確保。

(エ) データ解析環境の整備、運用

支援対象 科学データを公開するプロジェクト
業務主体 データ利用Gが主体となり、プロジェクトの協力を受けて実施
具体的な内容 衛星データ解析のためのハードウェア,ソフトウェア環境を整備、運用し、ISAS 内外の研究者に提供する。
課題 計算機環境が急速に進歩しつつ現状において、各プロジェクトが運用するワークステーション群や、各研究者が専有する計算機との役割分担。C-SODA にしかできない、あるいは C-SODA に期待されている解析環境整備の業務を定義し、それに注力する事。

 すでに述べてきた事から明らかなように、C-SODA データ利用Gのほとんどの業務が、科学衛星ミッションなしではあり得ない。その一方、「縦糸」である個別のミッションでは対応できないデータ処理・利用業務に関連して、ミッション間の「横糸」を通すのがデータ利用Gの役割である。宇宙科学に関わるすべてのミッションと緊密に協力し、そこから優れた科学的成果が生み出されるよう努力していきたい。現在、あるいは将来の宇宙科学プロジェクトに関わる多くの方々からのご意見を、お聞かせいただければ幸いである。

このページの先頭へ



宇宙情報システム講義第2部 これからの衛星データ処理システムはこうなる (第4回 機能オブジェクト2)


(608KB/ 4pages)

Next Issue
Previous Issue
Backnumber
Author Index
Mail to PLAINnewsPLAINnews HOME