PLAINセンターニュース第168号
Page 1

情報通信技術を宇宙科学にどう活用するか?

村田 健史
愛媛大学総合情報メディアセンター
宇宙科学情報解析センター客員

 (155号から続く)
1. 緒言
2. Cyber Media Space −愛媛大学総合情報メディアセンターの最近の取り組み−
2.1 概要
2.2 スーパーコンピュータ
2.3 3D Web
2.4 バーチャルリアリティー (VR) システム
2.5 ボリュームコミュニケーション
2.6 MPEG7 による e-Learning 系マルチメディアコンテンツ
3. 科学衛星地上観測データ解析参照システム(STARS)
3.1 STARS について
3.2 STARS1 & STARS2:オブジェクト指向とオブジェクト指向開発技法について
3.3 STARS1 & STARS2:オブジェクト指向とオブジェクト指向開発技法 (その2〜データフォーマットについての考察)
3.3 STARS1 & STARS2:オブジェクト指向とオブジェクト指向開発技法 (その2…) のつづき
3.4 STARS3:メタデータベースの重要性
3.4 STARS3:メタデータベースの重要性 のつづき
3.5 STARS4:分散メタデータベースの重要性
3.6 STARS4:分散メタデータベースの重要性 (続き)

番外編 〜Google Earth を使った新しい取り組み〜
番外編 〜ペタスケールコンピュータをどう利用するか? (その1)〜


番外編
〜ペタスケールコンピュータをどう利用するか?(その2)

 私が所属していた地球シミュレータ(以下 ES)プロジェクトである「宇宙環境シミュレータプロジェクト」(平成 19 年度は継続申請を行わず)での経験を踏まえて、2010 年ごろに運用が開始される予定のペタスケールコンピュータ(以下ペタコン)プロジェクトへの提言をまとめてみた(図 22)。ここでは、スーパーコンピュータのハードウェアに対する提言ではなく、「プランニングからポスト処理まで、本当にペタコンで結果を出すことができる」ための問題点と提案をまとめている。ペタコンプロジェクトで世界規模の成果を挙げるためには、コード開発からデータ処理・可視化までのプロセスの流れにボトルネックがあってはならない。たった一ヶ所のボトルネックが、研究テーマの成功を妨げることもある。ペタコンプロジェクトを推進する側(理化学研究所)は、プランニングからデータ処理(前回の図 20)まで、どこにもよどみがない環境を検証し、実現する必要がある。なお、この提案は、ES プロジェクト申請時のメンバー、ネットワーク関係者、スパコン関係者、可視化関係者など、幅広い関係者のアドバイスを受けて、それらを整理して作成したものであり、私個人の意見ではない。

    ◆プロジェクト申請と審査

     ・ 申請研究テーマへの制限の緩和
     ・ 分担を明確にしたプロジェクトチーム単位での申請義務
     ・ 柔軟で多面的なプロジェクト申請評価

    ◆人材育成

     ・ 積極的な若手研究者支援
     ・ 若手研究者の育成

    ◆計算環境(ソフトウェア)

     ・ 共有ライブラリの提供
     ・ 汎用アプリによる大規模計算で成果を期待できるユーザへのサービス
     ・ 先端的アプリケーションの公開
     ・ スケルトンコードの準備

    ◆数値データ処理環境(ポスト処理)

     ・ 3次元データ可視化環境の充実
     ・ 充実したポスト処理支援環境整備

    ◆ネットワーク関係

     ・ ネットワークアクセスを許可しなかったことによる弊害
     ・ ネットワークインフラ対策

    ◆プレプロジェクト段階での準備

     ・ プレプロジェクト段階での基礎技術開発
     ・ ペタコン利用の準備としての国内スパコン利用

    ◆その他

     ・ 数値データ・計算結果の公開

図 22:ペタコンプロジェクトへの提言のまとめ

 さて、図 22 の各項目の中で、ここでは特に「充実したポスト処理支援環境整備」について述べてみたい。ES プロジェクトでは、ポスト処理支援環境は残念ながら十分とはいえないものであったと思う。たとえば、ES の計算で出力されるデータを各研究機関に転送する仕組みが十分にできていなかった。フェリーシステムなどで ES センターの端末まではデータを持って来ることができるが、そのあとは自前のディスク(アレイ)などにデータを吸い上げるなど、原始的な方法でしかデータを持ち帰ることができなかった(最近はネットワークでのデータ転送は可能になったが利便性はあまりよくないと聞いている)ため、ES センターでのポスト処理が望まれた。しかし、ES では、計算結果処理(ポスト処理)をセンターにおいて行うサービスが不十分であった。そのため、実質的には利用者は計算出力データ(数値データ)を大学に持ち帰り(それが困難であることは上述のとおり)、ポスト処理を行う必要があった。ジョブ結果をすぐに確かめることができないため、次のジョブを打つまでの間が開くなどの問題が生じた。

 さて、この問題を、ペタコンではどのように解決するべきであろうか?まずは、ポスト処理(特に一次処理)をペタコンセンターで行う環境を整備するべきである。汎用性の高い 3次元可視化ツール、大規模なデータを処理できる数学ライブラリなどの充実が必要である。各研究チームがそれまでに利用してきた環境を有効に活用するために、それらのライブラリは C 言語、フォートラン言語、C++言語、Java 言語をはじめとする、主要な(何が主要かは要調査)言語に対応していることが重要となる。同時に、Linux だけではなく、UNIX、Windows、Mac などの複数の OS 上での利用が可能であることも必須となる。ポスト処理を、既存の(過去に開発した)計算機環境で行いたいユーザは多い。図 23 に示すような独自のポスト処理用計算機をセンター内に持ち込むサービスを実現する。もちろんこの場合にはセキュリティー対策が必要となるが、データ転送の制限やポートの制限を行うなどの対応を立てることで実現する。

 次に、図 22 の項目の中で、ネットワークインフラ対策について考えてみたい。ペタコン利用者を多く抱える大学・研究所は、旧帝大・準帝大を除くとごく少数である。特に地方大学ではペタコン(ES)を利用するユーザが 1,2 名ということが多い。これら少数ユーザのため、10G 以上のネットワークインフラに投資できる大学は少数である。ほとんどの教職員・学生は 100M〜1G 程度の生活回線で十分なのである。しかし、生活回線レベルの低速ネットワークでペタコンデータを転送することは不可能である。たとえば、ES プロジェクトではESセンターから愛媛大学までのデータ転送は(ネットワーク回線速度が低速であるため)実現できなかった。


図 23:利用者が自分のポスト処理環境を持ち込む場合

 ES と比較するとペタコンで出力されるデータサイズは 10〜1000 倍程度に増大すると予想されるが、出力データの転送については対策が必要である。SINET3 ではバックボーンで 10〜40G などの高速ネットワークが実現しているが、これは次の点で実用上は不十分である。(1)10 G ノード校であっても 10G 回線を学内に引き込めているわけではない。たとえば前回の図 21 に示したように、愛媛大学では SINET3 ノードから学内は 100〜300M 程度の足まわり回線である。(2)現在、国内大学のほとんどが SINET を生活回線として利用しているが、そのためにセキュリティー対策が重要となっている。ほとんどの大学でネットワークの入り口に FW を導入しており、その結果、実行スピードは FW で 100M〜1G 程度に低下してしまうと予想される。これらを改善して、End to End での高速データ転送が 1G を超える環境を整える必要がある。たとえば、現在のデータ転送実効速度を 10MB/sec と考えると、1TB のデータ転送に 10万秒(〜1日)が必要となる。ES が最大 10TB のメモリ容量であるので、ペタコンではシミュレーションの1ステップに 1TB 程度の出力は十分に予想されるが、この場合 100 ステップのシミュレーションデータ転送に 100 日かかってしまうことになる。

 さて、この問題はどのように対策を立てるべきであろうか?まず、情報研などとの協力により、ネットワークに関する情報や対応策をあらかじめ研究機関に積極的に通達すべきである。利用希望大学は、通達を受けて準備を開始できる。並行して、利用を希望する大学・研究所に対しての特別支援(たとえばモデルケースとしての高速なセキュリティールータ購入の補助金など)を検討することも有効であろう。データ転送環境整備と並行して、データを大学・研究所に転送せずに利用できる分散ネットワークサービスの基礎実験を開始するべきである。たとえば、図 24 は現在愛媛大学が中心となって宇宙科学研究本部、情報通信研究機構、名古屋大学等との間で試験的に構築を計画している GRID ミドルウェア(Gfarm:筑波大学と産総研が開発)を使ったデータファイルの仮想共有システムである。このシステムでは、可視化処理などを情報通信研究機構において行い、可視化出力データ(オリジナルデータよりも十分に小さい)のみをダウンサイズする。必要であればデータファイルの一部(または全部)を取得することができる。また、将来的には SINET3 の MPLS パスによるデータ伝送環境の実現も検討している。これについては機会があれば書いてみたいが、現在はまだ計画を立てている段階である。


図 24:愛媛大学が中心となり行っている分散データ共有実験の例(山本和憲君による)

次号 に続く)

このページの先頭へ



この号のもくじ へ

SINET 3 の紹介 へ


( 736kb/ 4pages)

Next Issue
Previous Issue
Backnumber
Author Index
Mail to PLAINnewsPLAINnews HOME