ビデオ: ä¸è¦å²ç¬æåçæ§ (十一月 2024)
中国のTianhe-2スーパーコンピューターが現在世界で最も速いという昨日のニュースは、それほど衝撃的ではありません。 結局、以前のバージョンは2010年にスーパーコンピューティングリストの上位にありました。
もう少し驚いたのは、天河-2(天の川-2)の背後にあるアーキテクチャです。 Intelの新しいXeon Phiアーキテクチャに基づいており、多数のx86コアを1つのチップに結合しています。 その後、スーパーコンピューターはそれらのチップを単一のアーキテクチャに結合します。 このシステムは今後2、3年は導入されないと予想されていたため、Xeon Phiベースのシステムがリストの上位にあることに驚いた。 ここで最も魅力的なのは、主にGPUコンピューティングに基づいたシステムとの競争です。 実際、NvidiaのCUDA GPUコアをベースにしたシステムは、前回リストのトップでしたが、現在2位になっています。
世界最速のコンピューターのTop500リストは、通常、年に2回公開されます。1回は、現在ドイツで開催されている国際スーパーコンピューティング会議(ISC)に関連し、秋にはスーパーコンピューティング会議(SC 13)で開催されます。
中国長沙にある国立防衛技術大学に拠点を置くTianhe-2は、LINPACKベンチマークで33.8ペタフロップス(1秒あたり17, 500兆を超える浮動小数点演算)以上の持続的なパフォーマンスと54.9ペタフロップスのピークパフォーマンスを示しています。 これにより、以前のリーダーである米国エネルギー省のオークリッジ国立研究所(ORNL)に拠点を置くTitanシステムの約2倍の速度になりました。 Tianhe-2には16, 000のノードがあり、各ノードに2つのIntel Xeon E5-2692(Ivy Bridgeを使用した12コアプロセッサ)プロセッサと3つのXeon Phiプロセッサがあり、合計3, 120, 000コンピューティングコアです。 Xeonコアは、22nm Ivy Bridgeアーキテクチャに基づくXeon#5-2600ファミリの今後の12コアバージョンに基づいています。 合計システムは17.8MWを消費し、トップ500リストのトップシステムの大部分を占めていますが、パフォーマンスの数値が非常に高いため、依然として比較的電力効率が高いと考えられています。 最も効率的なスーパーコンピューターであるGreen500の6月のリストは間もなく発表されます。
前のリストを突破したORNLのTitanシステムは、現在2位になっています。 これは、18, 688ノードのCray XK7システムに基づいており、各ノードには16コアAMD Opteron 6274とNvidia Tesla K20xグラフィックスプロセッシングユニット(GPU)アクセラレーターが含まれています。 このシステムは、LINPACKベンチマークで17.5ペタフロップス(1秒あたり17, 500兆を超える浮動小数点演算)の持続的なパフォーマンスと、27ペタフロップス以上のピークパフォーマンスを示しています。 IBMのBlueGene / QシステムとそのPower CPUをベースにしたLawrence Livermore National LaboratoryのSequoiaシステムは、1年前にTop500リストで2位になりましたが、3位に落ちました。 4位のシステムは、富士通SPARC64プロセッサをベースとした日本の理化学研究所計算科学研究所の「Kコンピュータ」のままです。
上位4つのシステムは、4つの非常に異なるアーキテクチャを示しています。 IBMのBlueGene(Power)や富士通のSPARCアーキテクチャに基づくシステムなど、従来のビッグアイロンシステムは現在も稼働していますが、ほとんどの注目はIntelの新しいXeon PhiアーキテクチャとNvidiaのCUDAアーキテクチャに向けられています。 一方、中国はスーパーコンピューティング用の独自のプロセッサを作成するために取り組んでいるという話が続いています。
詳細については、Nvidiaは昨日、スタンフォード大学の研究者がGPUを使用して、人間の脳の学習方法をモデル化するために設計された世界最大の人工ニューラルネットワークを作成していると発表しました。 また、CUDAツールキットがARMベースのプラットフォームをサポートすることも明らかにしました。
スーパーコンピューティング会議の一環として、IntelはXeon Phiコプロセッサファミリの新しいバージョンも発表しました。これには、1.23GHzでクロックされる61コア、16GBのメモリ容量サポート、1.2TFlopsを超える倍精度パフォーマンスを備えた7100が含まれます。 1.1GHzでクロックされる57個のコアと倍精度の1TFlopsを備えたXeon Phi 3100ファミリ。 ブレードフォームファクターで使用するためにソケットをミニボードに接続できるように設計された新しい5100D。 Intelは、「ナイツランディング」として知られ、今後の14nmプロセステクノロジーに基づいた次世代は、コプロセッサーとしてだけでなくプライマリプロセッサーとしても機能し、データを異なるメモリプールに移動する複雑さをなくすと述べています。 これにより、パッケージ上のメモリが統合され、パフォーマンスが向上します。
Intelは、従来のXeonプロセッサとXeon Phiプロセッサの組み合わせを「新異種アーキテクチャ」と呼びます。 ハードウェアアーキテクチャには、共通のプログラミングモデルによってアクセスされる複数のクラスの計算機能があります。 同社は、CPUとGPUアクセラレータの組み合わせを使用する場合はより困難になる方法で開発と最適化を効率化できるのはすべてx86であるため、強調しています。 NvidiaとGPUコンピューティングを推進する他の企業は、その評価に同意しません。
インテルは、政府や軍事研究などの従来の用途や、石油やガスのシミュレーションなどのハイエンドの商用アプリケーションだけでなく、ビッグデータなどのアプリケーションにも高性能コンピューティングを使用することについて話しました。 目標は、スーパーコンピューティングをより主流にすることです。
Top500スーパーコンピューターの全リストはこちらをご覧ください。