ビジネスに最適なIT環境の
構築をサポートするサイト

導入事例

大学共同利用機関法人 高エネルギー加速器研究機構

宇宙誕生の謎に挑戦する素粒子物理学の最前線
「Belle II実験」を支える中央計算機システムを全面刷新

導入について

なぜ反粒子だけが消えてしまったのか?宇宙誕生の謎に迫る「Belle II実験」が間もなく始動

全ての粒子には、反対の電荷を持つ「反粒子」が存在することがわかっています。宇宙誕生の直後には、ビッグバンの高エネルギー状態からつくられた粒子と反粒子が、まったく同じ数だけ存在したと理論上推定されています。
しかしながら日常世界では、反粒子でできた反物質は見つかっていません。粒子と同じ数だけ存在した反粒子は、そのほとんどが粒子と対になって消滅し、何らかの理由によって粒子だけが現在の宇宙に生き残ったと考えられています。

それにしても、なぜ反粒子だけが我々の宇宙から消えてしまったのか——。こうした宇宙誕生の謎、そこに隠された新たな物理法則を探るべく、高エネルギー加速器研究機構(以下、KEK)が中心となり、国際協調による共同実験として準備が進められているのが「Belle II(ベル・ツー)実験」です。

Belle II(ベル・ツー)測定器

大学共同利用機関法人
高エネルギー加速器研究機構
計算科学センター センター長 教授
金子 敏明 氏

2008年にノーベル物理学賞を受賞した小林誠氏と益川敏英氏の両博士が理論で示した「CP対称性の破れ」を実験的に証明するなど多くの成果を挙げてきた「Belle実験」(1999~2010年)を、継続的に発展させたものがBelle II実験です。具体的には、Belle実験で蓄積されたデータの約50倍となる膨大なデータを収集・解析することで、粒子と反粒子の対称性の破れや宇宙の誕生初期に起こったはずの極めてまれな現象を再現し、未知の粒子や力の性質を明らかにしていくといいます。

KEK 計算科学センターのセンター長を務める金子敏明教授は、「2017年からいよいよビーム衝突のデータの取得を開始し、宇宙から反粒子が消えた謎に迫るための実験を重ねていきます」と、今後に向けたスケジュールを語ります。

ただ、Belle II実験から生成されるこのような膨大なデータを収集・解析するためには、必然的に従来とは桁違いのコンピューティング・パワーと大規模なリソースが要求されることになります。そこでKEKが2016年の中央計算機システムの定期リプレースに際し、競争入札を経て新たに導入したのがIBMのストレージ・ソフトウエアならびにレノボのサーバー群から構成されたHPCクラスターのインフラです。 こうして刷新されたKEKの中央計算機システムは、素粒子物理学の最先端においてどのような貢献を果たしていくのでしょうか。

コンピューティング・パワーはいくらあっても足りない CPUコアをトータルでどれだけ確保できるか

Belle II実験の中核を担うのは、KEKの敷地内に建設された「SuperKEKB(スーパーケックビー)」と呼ばれる周長約3km(直径約1km)の加速器です。地下10mのトンネル内に粒子(KEKでは電子と陽電子)を曲げたり収束したりする電磁石が約2,500台、粒子を加速する加速空洞が約40台設置されています。

SuperKEKB(スーパーケックビー)加速器

大学共同利用機関法人
高エネルギー加速器研究機構
計算科学センター研究機関講師
村上 晃一 氏

これによりBelle II測定器が位置する衝突点で光速に近い速さに加速した電子と陽電子を衝突させ、素粒子の多様な反応(事象)を大量に発生させるのです。ナノビームをはじめとする最先端技術の導入により、前身のKEKB加速器の40倍のルミノシティ(単位時間あたりに起こる反応の回数)を達成し、積分ルミノシティを約50倍に高めることを可能にします。先述の「Belle実験で蓄積されたデータの約50倍」とは、そのような意味です。

ちなみにBelle実験で使用したデータ量は「7.7×10の8乗個」です。ここでいう「個」とはB中間子と反B中間子を生成した数(B中間子対)を意味しており、両方を合計したデータ容量は約2ペタバイトです。すなわちその50倍となるSuperKEKBでは、約100ペタバイトのデータの取得を目指すことになります。
「コンピューティングのパワーは、どれだけあっても足りません」と語るのは、KEK 計算科学センターの佐々木節教授。

KEKでは、日本原子力研究開発機構と共同で、J-PARCという加速器を東海村に建設し、素粒子・原子核物理学、物質科学、材料工学、生命科学など幅広い分野の研究に利用されており、年間2ペタバイト程度のデータが中央計算機に送られて来ます。つくばキャンパス内にある放射光施設も同様に幅広い分野の研究に利用されています。実験を支える理論研究を含め、KEKのすべての研究プロジェクトを支えるのが中央計算機なのです。年々増える需要の増加に限られた予算で答えなくてはなりません。

「実際の実験では観測から得られたデータだけでなく、シミュレーション結果と比較しながら解析を行います。それらのソフトウエアは、浮動小数点だけではなく整数演算性能を必要としています。そこで今回新たに調達する中央計算機システムのサーバー群に関しては、『どれくらいのクロックのCPUを、トータルで何コア確保できるか』を選定の基準としました」と語ります。

加えてBelle II実験を支えるプラットフォームとして絶対に欠かすことができないのが、信頼性と可用性です。SuperKEKBやBelle II測定器を使った実験に要する一日電力は、中程度の市に相当するため、観測データを失うことがあってはなりません。また、中央計算機システムは、国内外で連携する大学や研究機関とグリッド技術を用いて共同利用している、広域分散処理システムの一角を担っているだけに、計画外の停止は許されません。「原則として24時間365日の稼働が義務付けられているのです」と佐々木教授は強調します。

一方で中央計算機システムには、様々な制約もあります。KEK 計算科学センターの村上晃一氏は、このように語ります。 「仮にどんなに高性能を発揮するサーバー群を調達できたとしても、マシンルームのファシリティを改修することは困難で、"受け皿"はまったく変わらないのです。これまで旧システムを運用してきたのと同じラックスペース、同じ電源容量、同じ空調設備の環境下で、要求性能を満たしながら安定稼働を実現できるプラットフォームでなければなりませんでした」

レノボのサーバーが提案構成に採用された理由とは

上記のような厳しい条件をクリアして競争入札を勝ち残ったのは、日本IBMが主契約者となって提案を行ったソリューションです。分散ストレージ・ソフトウエアの「IBM Spectrum Scale」ならびに「High Performance Storage System」、そして計算ノードとしてインテル® Xeon® プロセッサー E5-2600 v4 製品ファミリーを搭載したレノボの「Lenovo NeXtScale System M5シリーズ」から構成されたシステムです。
なぜ計算ノードは Lenovo NeXtScale System nx360 M5 だったのでしょうか。

KEKが必要としている計算ノードの基本仕様を満たすためには、インテル® Xeon® プロセッサー(2.6GHz相当以上)をベースに、トータル10,000個以上のコアを備える必要があり、また、この大規模なシステムを1システムとして運用できることも最も重要なポイントとなっていました。そして、こうしたスケーラブルなサーバーファームを容易に実現できるのが、インテル® Xeon® プロセッサー搭載 Lenovo NeXtScale System でした。

加えて Lenovo NeXtScale System M5 シリーズは、KEKが従来から使用してきたIBM System x iDataPlexの後継機である点も大きかったのです。ハードウエア・ベンダーがIBMからレノボに変わっても、開発体制や保守体制などはこれまで通り引き継がれているため、お客様に運用サポートに対する不安感を与えずに済むためです。

さらに中央計算機システムの様々な制約条件に対応するためには、収納ラックの構成、トータルコスト、設置面積、消費電力、発熱量、電源の冗長化性、管理コストなど、総合的な観点から機器構成にあたる必要がありました。そうした中でインテル® Xeon® プロセッサー搭載 Lenovo NeXtScale System M5 シリーズは、非常に高密度サーバーでありながら電源を複数の計算ノードで共有できるなど、省電力化にも大きく貢献する点を高く評価されました。

こうしてレノボのサーバーは、中央計算機システムの計算ノード以外にも電子メールシステムやWebシステムなどの情報基盤環境、さらにはグリッド広域分散処理システムにいたるまで、KEKの幅広いシステムに採用されることとなりました。

これらのシステムにはいずれも高いRASISが求められ、24時間365日の無停止運用が大前提となると同時に強固なセキュリティの確保が必須となります。KEKの仕様書にもそれらの要求項目が詳細に記載されていましたが、レノボのサーバーはそのすべてをその要求を過不足なく実現していました。また、IGTF準拠の電子認証局をはじめとする多くのサービスをインターネット経由で国内外の研究者に提供しているといった貢献からも、レノボのサーバーであれば高い満足を提供できると判断されました。

インテル® Xeon® プロセッサー搭載 Lenovo NeXtScale System M5 シリーズ

ITのイノベーションがKEKから発信される可能性

実際、レノボのサーバー群は狙いどおりの安定性で運用を開始しました。「旧システムからの更新もスムーズに完了。既存のマシンルームの中にきちんと収まり、まったく問題を起こすことなく稼働を続けています」と金子教授も高く評価しています。

Belle II実験が本格化するまでは、解析に必要なシミュレーションや、J-PARC及び放射光施設から得られたデータの解析や、理論の研究にLenovo nx360 M5 がフルに利用されます。前システムの平均利用率は常時90パーセントを超えていたため、需要を十分に満足せせることはできませんでした。新システムは、利用開始直後から高い利用率を示しており、Belle II実験開始に先立ち、システムのチューニングが行われています。

「KEKにおける素粒子物理学の実験や研究は、ある意味で計算インフラに対して日本一過酷な耐久テストを繰り返し行っているようなもので、現時点では予想もつかない困難な問題に直面することになるかもしれません」と佐々木氏は先を見据えています。もっとも、これはネガティブな発想ゆえの言葉ではありません。「そうした局面こそ私たちが知恵を絞るべき、腕の見せ所と考えています」と佐々木氏は語ります。

現在のインターネットで当たり前となったWorld Wide Webが、もともとは欧州原子核研究機構(CERN)の研究から誕生したという例もあります。宇宙誕生の謎に迫るとともに、新たなITのイノベーションがKEKから発信される可能性も大いにあり得るでしょう。

関連導入事例

法人のお客様限定

販売店・特約店からのご購入を
希望の方もお使いいただけます。