前向きの考え方 2018年のモバイルプロセッサ:機械学習機能の台頭

2018年のモバイルプロセッサ:機械学習機能の台頭

目次:

Anonim

驚くことではありませんが、今年のスマートフォンは、昨年発生したものよりも高速なプロセッサを備えています。これは毎年発生しています。 しかし、今年新しくなったのは、ほとんどすべてのプロセッサベンダーがデバイスを差別化する方法として売り込んでいる機械学習機能の優位性です。 これは、独自のチップを設計する電話ベンダー、電話ベンダーにプロセッサーを販売する独立系または商人のチップベンダー、さらにはプロセッサー自体に入るコアを設計するIPメーカーにも当てはまります。

バックグラウンド

最初に少しの背景:すべての最新のアプリケーションプロセッサには、他社、特にARM、イマジネーションテクノロジーズ、MIPS、Cevaなどの企業のデザイン(知的財産、またはIPと呼ばれることが多い)が含まれています。 このようなIPはさまざまな形式で表示できます。たとえば、ARMは、32ビットおよび64ビットアーキテクチャの基本ライセンスから、CPU、グラフィックス、画像処理などの特定のコアまですべてを販売します。プロセッサを作成します。 通常、チップ設計者は、これらのコアを独自の設計と組み合わせて組み合わせ、メモリ、相互接続、およびその他の機能に関してさまざまな選択を行い、パフォーマンスと電力要件、サイズ、およびコストのバランスを図ります。

CPUの面では、ほとんどのチップには、より強力で高速かつ高速に動作するより大きなコアと、より効率的なより小さなコアの組み合わせがあります。 通常、電話はほとんどの場合、より小さいコアを使用しますが、要求の厳しいタスクでは高性能コアに切り替え、コアとGPUおよび他のコアの両方を組み合わせて使用​​し、パフォーマンスニーズと熱に関する考慮事項を最適に管理します(できません)高性能コアは非常に長時間実行されます。これは、コアが過熱するためです。通常は必要ありません。 ビッグコアの最も有名な例は、ARMのCortex-A75およびA73コアです。 一致する小さなコアはA55とA53です。 今日のハイエンド携帯電話では、オクタコアレイアウトと呼ばれるもので、それぞれ4つがよく見られますが、一部のベンダーは他のアプローチを採用しています。

グラフィックについては、ARMのMaliラインを選択するベンダー、Imagination TechnologiesのPowerVRを選択するベンダー、独自のグラフィックコアの設計を選択するベンダーなど、多様性があります。 また、画像処理、デジタル信号処理、最近のAI機能などに関しては、さらに多様性があります。

林檎

Appleは秋の電話アナウンスでAI機能のプッシュを開始しました。これには、特にiPhone 8および8 Plus、およびiPhone Xで使用される「A11 Bionic」チップが含まれます。

A11 Bionicは、2つの高性能コアと4つの効率コアを備えた6コアアーキテクチャです。 Appleは(ARMアーキテクチャライセンスの下で)独自のコアを設計し、従来からシングルスレッドパフォーマンスを推進してきました。 これは、4コアのA10 Fusionからのステップアップであり、Appleは、A11のパフォーマンスコアはA10よりも最大25%高速であり、4つの効率コアはA10 Fusionチップよりも最大70%高速であると述べました。 また、グラフィックプロセッサの速度が最大30%向上すると述べています。

Appleは、カメラアプリでのシーン認識に役立つデュアルコア「Neural Engine」、iPhone XでのFace IDとAnimojiを搭載したチップについて語っています。また、サードパーティを支援するためにCoreMLと呼ばれるAPIもリリースしました。開発者はこれを活用するアプリケーションを作成します。

Appleは通常、プロセッサに関する多くの情報を提供しませんが、A11 Bionicニューラルエンジンは、リアルタイム処理で1秒間に最大6, 000億回の演算を実行できるデュアルコア設計であると言います。

他のほとんどのプロセッサメーカーとは異なり、Appleはモデムをアプリケーションプロセッサに統合せず、代わりにスタンドアロンのQualcommまたはIntelモデムを使用しています。 AppleがIntelでもサポートされているQualcommモデムの機能のみをサポートしているかどうかについては、いくつかの議論がありました。 実際には、これはiPhoneが3-wayキャリアアグリゲーションをサポートしていることを意味しますが、より高度な機能の一部はサポートしていません。

ファーウェイ

HuaweiはAI推進の初期段階でもあり、昨秋のIFAショーで発表したキリン970を「世界初のモバイルAI処理ユニット」と呼びました。 Kirin 970は現在Huawei Mate 10で使用されています。最大2.4 GHzで実行される4つのCortex-A73 CPUコアと、ARMのMali G72 MP12 GPUとともに最大1.8 GHzで実行される4つのA53が含まれます。

970で特に新しくなったのは、HuaweiがNPUまたはニューラルプロセッシングユニットと呼んでいるものです。 同社は、このプロセッサーにオフロードできるタスクは、CPUクラスターで実行されるタスクと比較して、パフォーマンスが25倍、効率が50倍になると述べています。 これは、特に画像認識の高速化と写真の改善を目的としています。 ショーで、ファーウェイは電話が1.92 16ビットTeraFLOPを処理できると述べた。

Kirin 970には、デュアルイメージシグナルプロセッサ、5キャリアアグリゲーションを備えたカテゴリ18 LTEモデム、および最大ダウンロード速度1.2Gbpsを可能にする4 x 4 MIMOが搭載されています。

HuaweiはMobile World Congressで、最初の5GモデムであるBalong 5G01を発表しました。これは、出荷する最初の5Gモデムになると述べています。 将来のアプリケーションプロセッサにもこのモデムが採用される可能性がありますが、まだ発表されていません。 技術的には、これらの製品はすべて、同社のHiSilicon子会社によって作成されています。

クアルコム

今年の米国の主力Androidスマートフォンのほとんどの中心となるチップは、QualcommのSnapdragon 845です。これは、2017年のプレミアムAndroidスマートフォンのほとんどで使用されていたSnapdragon 835のアップグレードであり、 Galaxy S9の北米バージョン。

他のほとんどのベンダーと同様に、クアルコムは、ニューラルネットワークとAIを今年のチップの最大の改善分野の1つとして推し進めています。

AI分野では、クアルコムは、マルチコアニューラルプロセッシングエンジン(NPE)についてお話します。NPEは、Hexagon DSPの新しいバージョンと、推論にCPUとGPUを使用します。

このチップにはHexagon 685 DSPが搭載されており、クアルコムによると、AI処理パフォーマンスは2倍以上になります。 Kryo 385 CPU。パフォーマンスコア(最大2.85 GHzで動作する4つのARM Cortex-A75コア)のパフォーマンスが25〜30%向上し、「効率性コア(4最大1.8 GHzで実行されるCortex-A55コア、すべてが2MB L3キャッシュを共有、およびAdreno 630 GPU、クアルコムは30%のパフォーマンス向上または30%の電力削減をサポートし、最大2.5倍より高速なディスプレイ。

AI分野では、このチップは多数の異なる機械学習フレームワークをサポートしており、同社はこれがオブジェクト分類、顔検出、シーンセグメンテーション、話者認識などに有効であると述べています。背景をぼかしたポートレートを作成するため)、アクティブな深度センシングと構造化された光により、顔認識が改善されます。 Qualcommは、推論をクラウドからデバイスに移行することで、低遅延、プライバシー、および信頼性の向上という利点が得られると述べています。

イメージング分野では、このチップにはクアルコムのSpectra ISPの新しいバージョン、マルチフレームノイズリダクションによる改善されたUltra HDビデオキャプチャ、1秒あたり60フレームで16メガピクセルビデオ、480で720pスローモーションビデオをキャプチャする機能1秒あたりのフレーム。 VRの場合、845は毎秒120フレームで2K x 2Kの解像度のディスプレイをサポートします。これは、835でサポートされている毎秒60フレームの1.5K x 1.5Kからの大きなステップアップです。

その他の機能には、独自のコアを使用してカーネルの外部にセキュリティ情報を保存し、CPUおよびQualcommのTrustZone機能と連携する安全な処理ユニットが含まれます。

845は、昨年Qualcommが導入したX20モデムを統合します。これは、LTEカテゴリー18(最大1.2 Gbpsの速度)、最大5キャリアアグリゲーション、4X4 MIMOをサポートし、License-Assisted Accessなどの技術を使用して高速化しますより多くの地域で可能な速度。

このチップは、サムスンの10nm低電力プロセスで製造されています。

Qualcommは、OppoやVivoを含む多くの中国ベンダーが使用する660を中心とするSnapdragon 600ファミリーのアプリケーションプロセッサも製造しています。 Mobile World Congressの準備段階で、Hexagon DSP、Spectra ISP、Adrenoグラフィックス、Kryo CPUなど、800ファミリと同じ機能の多くを備えたSnapdragon 700ファミリを導入しました。 クアルコムは660と比較して、デバイス上のAIアプリケーションを2倍改善し、電力効率を30%改善すると述べています。

サムスン

北米のほとんどの携帯電話でQualcommプロセッサを使用していますが、他の多くの市場では、Samsungは独自のExynosプロセッサを使用しており、そのようなプロセッサを他の電話メーカーが利用できるようになっています。

その新しいトップラインはExynos 9810で、サムスンはGalaxy S9およびS9 +の国際バージョンで使用します。

繰り返しになりますが、サムスンは「ディープラーニングベースのソフトウェア」の新機能を推進しています。これは、プロセッサが携帯電話のアイテムや人物を正確に識別し、顔認識の奥行き感をサポートするためです。

9810はオクタコアチップでもあり、電力効率のための4つのA55コアとパフォーマンスのための4つのカスタムCPUデザインを備えています。 サムスンは、最大2.9GHzで動作可能なこれらの新しいコアは、より広いパイプラインと最適化されたキャッシュメモリを備えており、昨年の8895に比べてシングルコアの2倍のパフォーマンスとマルチコアの40%のパフォーマンスを実現しています公開されたベンチマークは、現実世界で改善を示していますが、主張されているほどではありません。この時点では、すべてのモバイルベンチマークに懐疑的です)

その他の機能には、Mali-G72 MP18グラフィックス、最大3840 x 2400ディスプレイおよび4096 x 2160ディスプレイのサポート、デュアルイメージシグナルプロセッサ(ISP)、120フレーム/秒での4Kキャプチャのサポートが含まれます。 9810には、最大1.2 Gbpsのダウンリンク速度と200 Mbsのアップロードを備えた、ダウンリンク用に6キャリアアグリゲーションと4 x 4 MIMO(アップリンク用に2 CA)のカテゴリ18モデムもあります。 紙上では、これはQualcommとHuaweiの両方が現在のトップチップに搭載しているカテゴリ18モデムに一致します。 Snapdragon 845と同様に、サムスンの第2世代の10nm FinFETプロセスで製造されています。

MediaTek

MediaTekはミッドレンジ以下の携帯電話のプレーヤーであり、先月は「New Premium」市場向けのHelio P60と呼ばれる新しいチップを導入しました。ハイエンド携帯電話の基本機能。 このチップを使用すると発表された最初の電話はOppo R15です。

昨年発表された同社のトッププロセッサはHelio X30で、これは高級電話向けのデカコアプロセッサです。 これには、最大2.5 GHzで実行される2つのARM Cortex-A73 CPUコア、最大2.2 GHzで実行される4つのCortex-A53コア、および最大1.9 GHzで実行可能な4つのA35コアが含まれます。 800 GHz、およびダウンリンクで3キャリアアグリゲーションが可能なLTEカテゴリ10モデム。 TSMCの10nmプロセスで製造された興味深いチップであり、より多くのコアがより柔軟になり得るという考えを推進しています。 これを使用すると発表された携帯電話の中には、デュアルスクリーンを搭載したMeizu Pro 7 PlusとVernee Apollo 2(8MPフロントカメラ、16MP + 13MPリアカメラ)があります。

昨年、MediaTekは、2.53 GHzで動作する8つのCortex-A53コアとMali G71 MP2グラフィックスをそれぞれ備えた、グローバル市場と特に中国向けの2つのミッドマーケットプロセッサ、Helio P23およびP30を発表しました。 これらはP60に取って代わるように設計されたチップであり、より多くの電力を提供し、一連の新機能を有効にします。

P60はより高いパフォーマンスを提供し、big.LITTLE構成への回帰です。過去にプッシュされたARMとMediaTekは、最大2.0 GHzの4つのより強力なARM Cortex-A73と、より効率的な4つのCortex-A53コア、2.0 GHzでも。 これらは、最大800 MHzのARM Mali G72 NMP3 GPUによって結合され、タスクの実行場所をスケジューリングするMediaTekのCorePilotテクノロジーの第4バージョンによってすべて制御されます。 MediaTekは、P23およびP30と比較して、P60がCPUとGPUの両方の操作で70%のパフォーマンス向上を提供すると述べています。

MediaTekもAIの時流に乗っており、P60にはニューラルネットワークハードウェアアクセラレーション用のNeuroPilotプラットフォームが含まれています。 これは、Google Android Neural Network(NN)とTensorFlow、TensorFlow Lite、Caffe、Caffe 2を含む一般的なAIフレームワークをサポートします。これは事実上、280 GMAC(1秒間に数十億の積和演算)が可能な特殊なデジタルシグナルプロセッサです。 携帯電話のロックを解除するための顔認識(これまでハイエンド携帯電話で見られたが、ミッドレンジ携帯電話では見られなかったもの)や、ビデオでも毎秒60フレームのオブジェクト認識などに使用するように設計されています。

さらに、P60には、16 MPおよび20 MPセンサーのデュアルカメラ構成または最大32 MPの単一カメラをサポートできる3つのイメージセンサープロセッサなど、多数の新しい画像機能があります。 (私はまだその数メガピクセルのカメラセンサーを搭載した携帯電話をまだ見ていませんが、それらはおそらく来ています。)これらのセンサーはリアルタイムボケ(ポートレートモードで使用される背景のぼかし)とともにノイズ低減機能を追加します。

チップには、カテゴリ7のダウンロード(最大300 Mbps)およびカテゴリ13のアップロード(2つのキャリアアグリゲーションで最大150 Mbps)をサポートするモデムが含まれています。 TSMCの12nm FinFetプロセスで製造されており、ゲームなどの電力を集中的に使用するアプリケーションで25%、全体で12%の節電を実現できると同社は述べています。

広がり

モデムのほとんどを中国市場で販売するSpreadtrumは、Intelの5GモデムとARM互換CPUを使用するIntelとのパートナーシップを発表しました。 これはまだ数年先なので、詳細はまだ利用できません。

Spreadtrumは米国ではあまり目立ちませんが、アプリケーションプロセッサのマーチャント市場ではQualcommとMediaTekのみを追跡していることに注意してください。 ほとんどはARM CPUと独自の4Gモデムを搭載した製品を販売していますが、Intelと取引をしており、少数所有です。 これにより、Intel CPUとSpreadtrumのモデムを搭載したチップができました(新しい発表の反対)。

もちろん、AIを次の大きな波と見なしているのはチップメーカーだけではなく、IPを作っている企業もこの分野で大きな前進を続けています。

IPメーカーの中で最も成功したARMは、先月、ハードウェアとソフトウェアの両方を含む機械学習用のIPスイートを発表し、これをMobile World Congressで推進しました。

Project Trilliumと呼ばれるこの製品には、新しいソフトウェアライブラリに加えて、機械学習(ML)とオブジェクト検出(OD)の両方のプロセッサ設計(IP)が含まれています。

MLプロセッサは、アプリケーションプロセッサ内に配置され、CPU、GPU、およびディスプレイコアの隣で実行されるように設計されています。 ARM NN(ニューラルネットワーク)として知られるソフトウェアライブラリは、TensorFlow、Caffe、Android NNなどのフレームワークをサポートするように設計されています。 これにより、これらのアプリケーションは、ARM CPUとグラフィックスを備えた既存のプロセッサ上でソフトウェアのみで実行できます。 もちろん、MLコアを含むプロセッサで実行すると、かなり高速になります。 サードパーティソフトウェアもプロセッサコアで動作します。 ARMによると、MLコアは特にニューラルネットワークを実行するためにゼロから設計されたという。 8ビットと16ビットの両方のアプリケーションを実行できますが、単純化のために8ビットに焦点を合わせる傾向があります。

ODプロセッサは、特に顔検出や動きの追跡などのアプリケーション向けに低電力のオブジェクト検出を提供するために、画像信号プロセッサ(ISP)と並んで配置されるように設計されています。 これは、ステレオカメラなどの新しいセンサーテクノロジーで使用するように設計された専用のハードウェアブロックです。

ARMは、新しいIPは4月に開発者向けプレビュー版で利用可能になり、今年後半には一般的に利用可能になると述べましたが、通常のタイムサイクルを考えると、2019年以降まで新しいプロセッサコアがチップに登場することはほとんどありません。 もちろん、既存のコアで動作するソフトウェアは、もっと早く展開できます。

ARMはまた、今日の物理SIMカードを置き換える低電力デバイス用のSoC内に構築されるように設計されたKigenと呼ばれる新しいSIMソリューションを含む、モノのインターネット向けの新しいソリューションをプッシュしました。

イマジネーションテクノロジーズ

PowerVRグラフィックスで知られるイマジネーションは、昨年秋にニューラルネットワークIPであるPowerVR 2NX Neural Network Acceleration(NNA)を発表しました。 これは、1〜8個のコアを備えた柔軟なアーキテクチャで、各コアには256個の8ビットマルチプレイ累積ユニット(MAC)を搭載できます。 イマジネーションは、1秒間に3.2兆回以上のオペレーションを実行できると述べています。

チェバ

他のIPベンダーも市場に参入しています。 DSPコアで知られるCevaは、エッジデバイス用に設計されたAIプロセッサコアのファミリであるNeuProを発表しました。 これらは、コンピュータービジョンの分野で同社が販売したプロセッサー上に構築され、さまざまな「AIプロセス」にCDNNフレームワークを使用します。 これは、一般的な機械学習フレームワークで動作し、これらを変換して、推論のためにモバイルプロセッサで実行します。 同社は、消費者、監視、ADAS製品(自動運転車用)向けに設計された2〜12.5テラオープ/秒(TOPS)の範囲のプロセッサを計画しています。 Cevaは、自動車の主要な顧客の1社が、10ワット未満の電力で100 TOPSのパフォーマンスを実現することを計画していると述べています。 ライセンスは今年の後半に開始されます。

Cevaは、5Gベースバンドモデム用DSPのPentaGプラットフォームも発表しました。 同社によると、現在のDSPは世界の携帯電話の40%に搭載されており、年間約9億台の電話とIntel、Samsung、Spreadtrumのモデムに対応しています。 新しいプラットフォームにはより多くのAIがあり、特に「リンクアダプテーション」に使用されます。 5Gの世界では、ハンドセットは基地局への複数のリンクを持つことができ、Cevaのハードウェアとソフトウェアは数ミリ秒ごとに最適なリンクを決定するのに役立つとCevaは言います。 これにより、ソフトウェアのみを使用する場合と比較して、多くの電力を節約できます。 これは、汎用DSPまたはニューラルネットワークチップではなく、通信専用に設計されたチップです。 発表されたばかりで、第3四半期に利用可能になるはずです。

また、Cevaは5G基地局市場でDSPを大きく推進しており、5Gの新しい無線インフラストラクチャの50%がNokiaやZTEのシステムを含む同社のDSP IPを使用すると述べています。

PCMag.comをお勧めしますか?

2018年のモバイルプロセッサ:機械学習機能の台頭