CERNデータ処理センターは、ライブラリに永久保存されている 200 ペタバイトの物理データの壁を超える歴史的な記録を達成しました。この情報のほとんどは、今週ヒッグス粒子発見 5 周年を祝うジュネーブ (スイス) の大型ハドロン衝突型加速器( LHC)で行われた実験から得られたものです。 CERNが声明で詳述しているように、粒子は検出器内で毎秒約10億回衝突し、毎秒1ペタバイトの情報が生成される。
現在のコンピューティング システムではこの量のデータを保存することは不可能であるため、最終的に記録される情報はフィルタリングする必要があります。 CERN データセンターには、最も「興味深い」データのみが保存されます。処理および保存される情報が大幅に減少しているにもかかわらず、世界最大の素粒子物理学研究室では、 1 日あたり平均 1 ペタバイトの情報を記録しています。このようにして、CERN は 6 月 29 日に物理データ ストレージの歴史的記録を超えることができました。現在までに、同研究所は LHC 実験から得た情報を年間 30 ペタバイト記録することに成功しました。これは、120 万枚の Blu-ray ディスクに書き込むか、250 年分の HD ビデオを埋めるのに十分な量であり、100 ペタバイトの永久保存が可能となり、すでに記録を達成しています。超えた。
ジュネーブ粒子加速器は、LHC の 4 つの主要な実験 ( ATLAS 、 CMS 、 ALICEおよびLHCb ) のおかげで、過去 2 年間に前例のない量のデータを生成しました。後者は、標準模型によって予測されていたが、つい昨日その存在が確認されたばかりで、何年も追跡されてきた新しい亜原子粒子を検出することに成功した。大型ハドロン衝突型加速器の高いパフォーマンスと可用性、および光度の増加 (つまり、1 秒あたりに実行される衝突の数) は、生成およびアーカイブされる物理データの量の大幅な増加を説明するパラメーターです。
このような量の保存情報をサポートするために、CERN はコンピューティング インフラストラクチャ、特に衝突時に得られたデータを記録するシステムを更新する必要がありました。これらの改善により、同機関は 2016 年に受信した 73 ペタバイトのデータを処理できるようになり、そのうち 49 ペタバイト (情報の 67% 強) は LHC からのものであり、今年これまでに得られた情報の流れを反映しています。永久に保存される物理データは、 CASTOR システム( CERN Advanced STORage システム) を通じてテープに保存され、安定して保存される 200 ペタバイトの歴史的記録をなんとか超えています。残りの情報はユーザーがアクセスできるように一時的に記録されますが、定期的に削除されます。
実験で生成されるデータ量の増加によるもう 1 つの主な結果は、データ転送の需要が増大することです。昨年 2 月以来、CERN は 3 番目のはるかに強力な光ファイバー ネットワーク (100 Gbps) を導入し、データ センターと 1,800 キロメートル以上離れたウィグナー物理学研究センター (ハンガリー) にある遠隔延長線を接続しました。この帯域幅の増加により、素粒子物理学研究室で取得および物理的に保存された情報の転送が向上します。素粒子物理学研究室のコンピューティング能力は、日々直面する科学的課題に直面する中で必須の要件となります。
参考資料一覧
- http://home.cern/about/updates/2017/07/cern-data-centre-passes-200-petabyte-milestone
- https://home.cern/about/computing/processing-what-record
- https://press.cern/backgrounders/facts-figures
- https://www.flickr.com/photos/doctorow/2711081060
