Intel Broadwell Xeon E3-1200 v4-新しいXeonラインとeDRAMについて知っておくべきこと

Intelは最近、新しいクアッドコアIntel Broadwell Xeon E3-1200 v4プロセッサの最新ラインを発表しました。 一連のサーバープロセッサIntel Xeon E3-1200 v3が2013年第2四半期に市場に登場し、2014年第2四半期にタイプE3-1231 v3のモデルで静かに更新されました。 Xeon v4が発表されました。 それを理解してみましょう:インテルは私たちに何を提供しますか?



Tick-to-Tack戦略の用語では、Broadwellはカチカチです。メーカーは14ナノメートルバージョンでHaswellアーキテクチャを使用しました。 ティックは革命的な変化を意味しません。 アナリストは、この段階でインテルはよく知られた技術を完成させ、改善は表面的なものになると考えています。 Broadwellの仕様は、前世代のプロセッサに匹敵する低消費電力と全体的なパフォーマンスを提供します。

LGA 1150ソケット上の3つの新しいIntel Xeon E3-1200 v4サーバープロセッサを検討してください。
CPUXeon E3-1285 v4Xeon E3-1285L v4Xeon E3-1265L v4
カーネル/スレッド4/84/84/8
ハイパースレッディングテクノロジーありますありますあります
クロック速度3.5 GHz3.4 GHz2.3 GHz
ターボモードの最大周波数3.8 GHz3.8 GHz3.3 GHz
ロック解除された乗数いやいやいや
TDP95ワット65ワット35ワット
HDグラフィックスアイリスプロP6300アイリスプロP6300アイリスプロP6300
GPU周波数1150 MHz1150 MHz1050 MHz
L3キャッシュ6 MB6 MB6 MB
統合eDRAM128 MB128 MB128 MB
DDR3サポート1333/1600/18661333/1600/18661333/1600/1866
VPro / TSX-NI / TXT / VT-dテクノロジーありますありますあります
命令セット拡張AVX 2.0AVX 2.0AVX 2.0
ソケットLGA1150LGA1150LGA1150

第3レベルのキャッシュの量は、以前のXeonモデルと比較して2 MB、つまり1/4削減されます。 www.anandtech.comが指摘しているように、L4に128 MBのeDRAMが出現したことを考えると、2 MBのL3の損失は無視できるほどです。

eDRAMとは何ですか?


2007年初頭、Intel、IBM、AMD、東芝、ソニーはほぼ同時にプロセッサを2倍高速化する技術を発表しました。 これを行うために、eDRAM(組み込みDRAM)を使用することが提案されました。これは、「絶縁体上のシリコン」(SOI、Silicon on Insulator)の技術とともに使用されます。 IBMは、これにより、キャッシュメモリが大幅に高速化され、プロセッサのアイドルモードでの密度が3倍になり、電力消費が5倍削減されると述べました。 その後、24 MBのキャッシュを使用することが計画されました。
技術的には、組み込みDRAMは、SDRAMとは異なり、プロセッサに「組み込まれた」DRAMです。 eDRAMには1 Vの電圧が必要です。これは、従来のメモリの電力よりも著しく低い電圧です。 実際には、これはeDRAMの消費電力が少なく、同等のパフォーマンスが得られることを意味します。 より小さなeDRAMセル( SRAMの場合は0.108um²、eDRAMの場合は0.029um²)は、同じサイズのチップ上で、わずかに大きめのわずかに遅いメモリセルに適合します。



Intelは有名なHaswellを14ナノメートルのレールに配置しただけではありません。 Broadwellプロセッサでは、メーカーはeDRAM機能を可能な限り完全に使用しました。 メーカーは、消費電力や熱放散などのパラメーターが25%改善されたと主張しています。



128 MB eDRAM Crystalwellは、4次キャッシュとして機能します。 Haswellには同様のボリュームのキャッシュがありましたが、これは上位E7モデルにのみありました。 同時に、テクスチャなどの大量のデータを処理する場合、eDRAMはグラフィックコアとプロセッサコアの両方で使用できます。 製造元によると、Crystalwellは各方向に51.2 GB / sのピーク帯域幅を提供します(合計で102.4 GB / s)。



3Dnews.ruが実施したテストによると、eDRAMベースのL4キャッシュのレイテンシは55サイクルであり、スループットはデュアルチャネルDDR3-1866 SDRAMの約2倍です。
Crystalwellを使用すると、プロセッサは低いシステムメモリ帯域幅の相対的な制限を克服し、HDビデオ処理および数学演算のパフォーマンスを向上させることができます。
Intel独自のテスト (Supermicro SuperServerを使用)によると、Broadwellを使用すると、4368 HDビデオストリームの同時処理が可能になります。 Haswellプロセッサを使用する場合の同じ指標は3120です。生産性が40%向上します。 BIOSの更新後、すべてのS upermicro X10シリーズマザーボードはv4をサポートします。



ビデオコアIris Proグラフィックス


プロセッサの新しいラインは、 Iris Pro Graphicsグラフィックコアを使用します。これは、以前はHaswellモバイルプロセッサでしか見られなかった「ライト」バージョンです。 現在、Iris Pro Graphics P6300にはGT3e構成と48個の実行ユニット(EU、実行ユニット)がありますが、HaswellのIris Pro Graphics 5100および5200グラフィックコアでは40 EUです。
Iris Pro Graphics P6300の使用は、Broadwellの新しいXeonとXeon E3-1200 v3の大きな違いでもあります。最後の行では、より高度でないIntel HD Graphics P4600とIntel HD Graphics P4700が使用されました。
問題のプロセッサの明らかな利点は、LGA1150スロットにインストールされていることです。IntelZ97およびIntel H97チップセットに基づくマザーボードの所有者は、システムを簡単にアップグレードできます。 正式には、新しいXeonはLGA1150ソケットの第8シリーズのシステムロジックのセットに基づいたマザーボードと互換性があります。
HaswellからBroadwellにアップグレードするユーザーは、これを比較的安価に実行できるようになりました。 したがって、E3-1285L v3の推奨 Intel 価格が774ドルである場合、E3-1285L v4のコストは445ドルです。
一部のユーザーにとっての欠点は、これらのプロセッサをオーバークロックできないことです。 ただし、このXeonシリーズはサーバーソリューションであり、メーカーは新しいラインの他のプロセッサをオーバークロックファンに提供しています。

テスト


www.anandtech.comが実施した一連のテスト 、Intel Broadwell Xeon E3-1200 v4プロセッサーは矛盾する結果を示しました。

合計ボリューム1.52 GBの2867ファイルをアーカイブする場合、E3-1285L v4が最良の結果を示し、さらに強力なE3-1285 v4を追い越しました。



ただし、他のテストでは、Xeonは競合他社に遅れをとっていました。 FastStone Image Viewer v.4.9アプリケーションを使用して一連の170枚の画像を変換することは、新しいXeonにとってかなり難しいタスクであることが判明しました。



Dolphinゲームコンソールエミュレーターの発売により、Intel Broadwell Xeon E3-1200 v4は、3Dシーンの開発において、弱いプロセッサーのみに先んじていることが示されました。



同時に、x264ビデオをmp4形式に変換する場合、BroadwellはIntel Core i7 6700Kのみに遅れをとっていました。


まとめると


新しいeDRAMメモリチップの使用により、Intel Broadwell Xeon E3-1200 v4プロセッサラインは、古いモデルを追い抜いて、困難な計算上の問題を解決し、低消費電力と熱放散でHDビデオを処理します。

なぜ必要なのか:


1)高性能グラフィックステーション

2)Tesla GPUを使用せずにトランスコーディングおよびストリーミングタスクを実行する専用サーバー。 新しいIntelプロセッサは、このようなタスクのパフォーマンスの40%を示し、トランスコーダーのハードウェアオーバーヘッドを削減できます。 Wowzaオンラインブロードキャスト製品のパフォーマンス比較表 -どのプロセッサがどのタスクに適しているかを示します。

2)グラフィカルアプリケーションの仮想化を可能にする専用サーバー-このため、以前はTeslaなどをインストールする必要がありました

Hostkeyでは、モスクワとオランダでレンタル専用サーバーを提供しています。3Dアプリケーションとストリーミング/ビデオ処理を仮想化するための新しいタイプのプロセッサーが2016年初頭に登場します。

このようなタスクには、古いマルチコアXeonプロセッサを使用することをお勧めします。たとえば、T-Platformスーパーコンピュータープラットフォームと32GBのメモリに基づいて2.5GHzで20コアの2x Xeon E5-2670 v2構成のマシンは、 1か月あたり23,000ルーブルかかります。

Source: https://habr.com/ru/post/J266519/


All Articles