ビデオ: ãªã¤ãã®æéã¯ã¦ããããã (十一月 2024)
サーバーチップは、毎年開催されるHot Chipsカンファレンスで最も注目を集めていますが、AMDとIntelは、今年の初めにリリースしたチップについて話をする機会を利用しながら、今後のプロセッサについてのティーザーにしか触れませんでした。
会議が正式に開始される前に、AMD、Qualcomm、およびヘテロジニアスシステムアライアンス(HSA)の他のメンバーは、さまざまな種類のプロセッサを搭載したSoC(システムオンチップ)をより良く動作させるために設計された今後のHSA仕様を推進していましたが、より統一されたメモリモデル。 当初、これはCPUとオンダイグラフィックユニット(GPU)をより統一された方法で動作させることを目的としていますが、他のタイプのオンダイアクセラレータのサポートは後日提供される予定です。
これは、Kronos GroupのOpen CLやNvidiaのCUDAなど、GPUコンピューティングの管理を支援するように設計されていますが、ほとんどの場合、個別のグラフィックで使用される他のアプローチとは多少異なります。
それでも、コンセプトは非常に似ており、実際、Open CLなどをサポートするツールとライブラリの多くはHSAに適合させることができます。 その考え方は、標準プログラミング言語を使用して、CPUとGPUの両方で並列プログラミングを簡単に行えるようにすることです。 高帯域幅メモリを共有するこれらすべてのコンポーネントを備えたプロセッサを持つことは良いスタートですが、開発者がそれらを実際に活用できるため、はるかに便利になります。
AMDは長年HSAのコンセプトについて話してきましたが、Hot Chipsでは、同社が今年初めにリリースしたKabiniとRichlandとして知られるチップについてしばらく話をしました。
EシリーズおよびAシリーズのローエンドとして販売されているKabiniは、クアッドコア「Jaguar」x86コアとRadeon HD 8000グラフィックコアネクスト(GCN)アーキテクチャを使用しています。 同社によると、これは「異種コンピューティングの準備を整えてくれます」。 AMDは、これにより前世代(オンタリオ州として知られている)のワットあたり2倍以上の性能が得られると述べました。 Kabiniは9億1400万個のトランジスタを使用し、28nmプロセスで105mm 2を測定します。
Aシリーズのハイエンドパーツを構成するRichlandは、32nmプロセスで製造されたTrinityチップの改訂版です。 このチップには、Piledriver CPUコアを備えた2つのモジュールがあり(各モジュールには2つの整数コアがあり、浮動小数点などの機能を共有します)、それぞれに2MBの共有L2キャッシュと、6つのコンピューティングユニットを備えたRadeon HD 8000シリーズDX11対応GPUがあります。 しかし、講演の焦点は、AMDが電力管理をどのように改善できたかでした。
リッチランドは、温度を測定するためのオンダイセンサー、追加のブースト状態、OEM用の構成可能なTDP、およびCPUで実行されているワークロードが周波数に敏感かどうかを検出する「インテリジェントブースト」を追加します。 そうでない場合、Intelligent BoostはCPUを抑制し、GPUにより多くの電力を供給して、システム全体のパフォーマンスを向上させることができます。 全体として、AMDはRichlandがTrinityよりも最大29%高いCPUパフォーマンスと41%優れたGPUパフォーマンスを提供し、HDビデオ再生でTrinityよりも最大51%効率的であると述べました。 私自身のテストでは、純粋なCPUタスクでは、競合するIntelチップよりもはるかに遅いことがわかりましたが、バッテリー寿命にはあまり重点を置いていません。 リッチランドはHSAをサポートしていません-仕様は実際には完全ではありませんが、同社は「おそらく60%に準拠している」と述べています。 これは来年初めに、より多くのHSA機能をサポートするKaveriとして知られるチップに置き換えられます。
Intelについては、数か月前に出荷を開始したHaswellとして知られる第4世代Coreプロセッサラインの詳細を説明しました。 デュアルコアおよびクアッドコアプロセッサのファミリであり、さまざまなグラフィックオプションを備えており、最新のグラフィックバリアント用の組み込みDRAMを備えたバージョンが含まれています。
最近の世代と同様に、HaswellはCPUコアとGPUを単一チップ上で共有し、最終レベルの共有キャッシュを組み合わせて、OpenCLなどの標準プログラミングAPIをサポートしています。 ただし、Iris Proグラフィックスを搭載した第4世代Coreの一部のバージョンには、別のダイ上ではあるが、同じパッケージに追加の128 MBのeDRAMも含まれています。
より大きなキャッシュにより、システムは既存のタスクを高速化できます。 たとえば、GPUはフレームごとにデータを保存および再利用して、3Dゲームのパフォーマンスを向上させることができます。 CPUコアとGPUは同じメモリの物理プールを使用しますが、それらは別個のポインターまたは仮想メモリアドレスを使用するため、HSA Foundationのより野心的なアプローチとは異なります。 しかし、Intelは、より多くのコンピューティングワークロードにGPUを使用し、最新のDirectX 11およびOpenCL標準のサポートによりプログラミングを容易にするという同じ一般的な方向に向かっていると言ってもいいようです。
講演の多くは、Haswellがどのように電力管理をうまく処理するかを扱っていました。 これは、非常に少ない電力を使用しながらシステムが情報を収集できるように設計された、新しい超低電力アクティブ状態(S0ixと呼ばれる)を備えています。 また、Haswellは、Ivy Bridgeおよび前世代の個別のコンポーネントであった多数の個別の電圧レギュレーターを統合しています。
その他の変更には、4Kビデオ再生、リアルタイム速度の4〜12倍のQuickSyncビデオなど、グラフィックスとメディア処理の改善が含まれます。 コア自体には新しい分岐予測とその他の機能があり、新しい計算命令にはAVX2が含まれ、チップにはデータベースのトランザクションメモリと高性能コンピューティングのサポートが追加され、仮想化サポートが向上します。 Haswellシステムでの私の最初のテストでは、実世界のベンチマークでパフォーマンスがいくらか改善されましたが、ここでの大きなニュースはバッテリー寿命であり、MacBook Airのようないくつかのシステムでは大幅な改善が見られます。
Intelは、モバイルデバイス向けの今後のSoCであるBay Trailについては講演しませんでした。 おそらく来週のIntel Developer Forumを待っているだろうが、CloverTrail +のスマートフォン版であるAtom Z2580の詳細を明らかにした。 これには、デュアルコアグラフィックス(イマジネーションテクノロジーズのPower-VR SGX544MP2)、メモリコントローラー、ビデオエンコードおよびデコードエンジンとともに、2つのAtom CPUコアが含まれます。 Medfieldとして知られる前世代と比較して、これは1コア/ 2スレッドCPUから2コア/ 4スレッド設計に移行し、メモリ、グラフィックス、ディスプレイ、低電力音楽再生機能も改善しました。新しい電源管理状態。 Intelは全体的に、これによりCPUパフォーマンスが2倍に改善され、グラフィックスが3倍改善されたと述べています。 (特にARMシステムと比較したベンチマークの数値は議論の余地があります。)
ホリデーシーズンに向けて出荷されるシステムに搭載されるはずのIntelのBay Trailと、AMDのKaveriについて、もっと詳しく知りたいと思っていました。 それでも、プロセッサ市場で起こっている変化、つまりパフォーマンスから最も重要な基準への移行、そしてその代わりに電力効率とスケーラビリティへの注目を考えると、プロセッサ市場ではかなり興味深い年でした。