ビデオ: ACQUAã®ããã12æ19æ¥äºåã ã¼ãã¼ (十一月 2024)
世界最速のスーパーコンピューターの最新のリストはあまり変わりませんでしたが、毎年開催されるスーパーコンピューティングショー(SC14)では、リストにある新しいシステムについて多くの議論が行われました。 NVIDIA。
Intel Xeon CPUとXeon Phiアクセラレータを使用する中国のTianhe-2スーパーコンピューターは、ピークパフォーマンスが54.9ペタフロップス(1秒あたり数十億の浮動小数点演算)で、Top500リストの1位を維持しました。 実際、今年の上位9つのシステムは、10位にランクインした新製品と同じでした。これは、Intel Xeon E5-2660 v2 CPUとNvidia K40 GPUを介して接続されたCray CS-Stormである不特定の米国政府システムマシンですインフィニバンド。
リストのさらに下には、78の新しいシステムがありましたが、これでも記録的な低さです。 全体として、500システムの総電力の成長率が低下しているようです。
これらのシステムのランキングはLINPACKベンチマークに基づいていますが、現在、さまざまな種類のコンピューティングを対象とした新しいベンチマークの作成に多くの取り組みが行われています。 ショーでのスピーチで、Top500リストの編集者であるHorst Simonは、2020年までにエクサスケールのコンピューター(1秒あたり1エクサフロップス(約1, 000ペタフロップス))に到達するという目標にもかかわらず、 2024年末までご案内します。これは、エクサスケールシステムに必要な電力を20メガワットに抑えるために、シリコンフォトニクスや3D統合やパッケージングなどの省電力技術が必要になるためです。 これらは大きなシステムです。
上部に大きな変更はありませんでしたが、特にIntelとNvidiaからの新しい発表がいくつかありました。これらは、より高速なマシンへの道を示すものです。
GPUとCUDAプログラミング言語が高性能コンピューティングのアクセラレーターとコプロセッサーへの動きを実際に開始したNvidiaは、多くのシステムでショー全体に登場しました。 現在、K40アクセラレーターを提供しており、ショーで次のバージョンであるTesla K80を発表しました。TeslaK80は、デュアルGPUアプローチを使用して、同社の言うことをほぼ2倍のパフォーマンスと前世代の2倍のメモリ帯域幅を提供します。
N80は、K80が4, 992個のCUDAコアと24メガバイトのRAMを提供し、ボードあたり2.91テラフロップスのピーク容量があると言います。 K80が現在入手可能であり、多くのシステムメーカーがすでにボードを備えたシステムを提供していることは興味深いことです。 たとえば、Dellは新しいPowerEdge C4130サーバーを披露しました。これにより、1Uサーバーに最大4つのNvidiaアクセラレーターボード(またはIntel Xeon Phiアクセラレーター)を搭載でき、K80バージョンは各ボックスで最大7.2テラフロップスを提供します。 これは、ラック内のクレイジーな計算能力にすぎません(ただし、大量のエネルギーを使用し、多くの冷却を必要とするもの)。
一方、IntelはXeon Phiチップの次のバージョン(最初の商用システムが来年出荷を開始するKnight's Landingとして知られるバージョン)に、50人以上の顧客が新しいプロセッサバージョンを使用することを計画していると発表しました(ここでXeon Phiは新しいスーパーコンピューターのシステムプロセッサーとして機能します。 さらに多くのシステムが、製品のコプロセッサーPCIeカードバージョンを使用しています。
Knights Landingの顧客には、ロスアラモスとサンディア国立研究所の共同の取り組みであるTrinityスーパーコンピューターと、米国エネルギー省(DOE)国立エネルギー研究科学コンピューティング(NERSC)センターによって発表されたCoriスーパーコンピューターがあります。 Knight's Landingは約3テラフロップスのパフォーマンスを提供することになっており、IntelのシリコンフォトニクスベースのOmni-Path Fabricテクノロジーを統合します。 (InfiniBandプロバイダーは現在、新しいバージョンについても話していることに注意してください。)
Intelは、Knight's Hillとして知られるフォローアップは、Intelの10nmプロセス技術を使用して構築され、次世代のOmni-Pathファブリックを使用すると述べた。 Knight's Landingに従いますが、正確なタイミングは明らかにされていません。
方程式から除外されないのは、AMDで、FirePro S9150シングルCPUカードを発表し、表示していましたが、2.53テラフロップスのパフォーマンスを提供できると述べています。 OpenCLを使用してプログラムされたこのシステムは、すでに出荷されています。
実際、S9150 GPUとIntel Xeon 2690v2 10コアCPUに基づくGSI Helmholtz CenterのL-CSCと呼ばれる新しいスーパーコンピューターが、ワットあたりの処理能力の順にスーパーコンピューターをリストするGreen500リストの新しいバージョンを突破しました。 これは、システムが1ワットあたり5ギガフロップス(1ワットあたり1秒あたり10億回の操作)を超えることができた初めての例です。 そのリストに注意してください。2位のシステムはSuirenで、PEZY-SCメニーコアアクセラレータとXeon CPUを搭載しています。 トップ10の残りはNvidia Tesla GPUを使用しており、そのようなシステムの範囲を示しています。
他にも、より珍しいオプションがあります。 Micronは、ネットワークセキュリティやゲノミクス検索などで使用するためのパターンマッチング用に設計された本質的に専用のチップであるAutomataチップを公開しています。 これは32チップのPCIe 3ボードに開発されており、2015年の第1四半期に、当初は少量で発売される予定です。 (同社はまた、そのようなシステムの次世代メモリ用のハイブリッドメモリキューブの背後にあります。)IBMはTrueNorthプロセッサを搭載しており、より「脳のようなコンピューティング」への道を示しています。 NECは、次世代のSX-ACEベクトルプロセッサに取り組んでいます。これは、GPUよりもプログラミングが簡単だと言います。 そしてもちろん、ARMは、さまざまなアクセラレータカードに接続するプロセッサとしてApplied MicroのX-Gene1が使用され、サーバー市場にも参入しようとしています。
多くのベンダーが新しいシステムを示していました。 先に述べたDellシステムに加えて、Lenovoは、カスタムIntel Xeon E5-2798Aプロセッサ(最大3.2GHzで動作する16コア)をベースとする水冷デュアルプロセッサシステムを示しました。これは1.083テラフロップスを実現します。 そして、来年のKnights Landing Xeon Phiプロセッサは、わずか2つの標準42Uラックで複数のペタフロップスを提供する「ペタキューブ」システムを可能にするという。
One Stop Serversは、高密度コンピュートアクセラレーターを示しました。これは、PCIe Gen3を使用して、単一または複数のサーバーから最大16個のハイエンドアクセラレーターボードをサポートし、同社はTesla K80ボードを使用して最大89.6テラフロップスを提供します。 これは、IBMのPower8プロセッサーで機能します。 Huaweiは、X6800データセンターサーバーと、FusionServer 9000ブレードサーバーの水冷バージョンの米国での利用可能性を示していました。
システムをリンクするために、Obsidian TechnologiesはInfiniCortexイニシアチブを開始しました。これは、長距離で100ギガビットのInfiniBand接続を取るように設計されています。 同社は、シンガポールの科学技術研究機関(A * STAR)からの支援を発表しました。 メラノックスは、ファイバー経由で100メートル以上、銅経由で8メートル以上で動作する100ギガビットのInfinibandを示しました。
最大のスーパーコンピューターを作成するために、組織は通常、IBMやCrayなどの企業に頼ってシステムを組み立てますが、これらのシステムの構築には何年もかかります。 ショーでのこの種のCrayの最大の発表は、サウジアラビアのキングアブドラ科学技術大学でUrika-GDグラフ分析アプライアンスを含むCray XC40用のShaheen IIとして知られる8000万ドルのシステムでした。
そしてもちろん、ショーの直前に、DOEはIBM(およびコンポーネントベンダーのNvidiaとMellanox)に、それぞれが100ペタフロップスを超える国内最大のスーパーコンピューターとなる巨大な契約を授与しました。
編集者注:この投稿は11/26に更新されました。 Tianhe-2のピークパフォーマンスは54.9ペタフロップスであり、テラフロップスではありません。