テスト:IMX6とOMAP4のパフォーマンス比較


この記事では、Cortex-A9コアを搭載したARMプロセッサをベースにした2つのシステム、 OMAP4 PandaBoard ESおよびi.MX6Q SABER Lite (オンラインコミュニティエレメント14の開発キット)のパフォーマンスをテストした結果を共有します。



これらの開発キットの特性の完全なリストは上記のリンクにあります。この記事では、プロセッサとメモリのテストのパフォーマンスに直接影響する特徴的な機能のみを示します。



OMAP4 PandaBoard ES Rev B1


i.MX6Q SABER Lite


CPU


TI OMAP4460


Freescale i.MX 6Q(プロトタイプサンプル)


コア


Cortex-a9


Cortex-a9


コアの数


2


4


最大コアクロック速度


1.20 GHz


996 MHz


キャッシュ


L1 32Ki Iキャッシュ32 KB Dキャッシュ
L2 1MB


L1 32Ki Iキャッシュ32 KB Dキャッシュ
L2 1 MB


外付けSDRAM


1GB、デュアルチャネルDDR2 @ 400MHz


1 GB、64ビット幅DDR3 @ 532 MHz


SDカード


4GBを超える


4GBを超える



テストのベースシステムとして、Linaroディストリビューションを選択しました。


最初は、Linuxカーネル3.12を使用してLinaro 13.09でテストを実施する予定でしたが、SABER Liteでは、自分で作成したバニラカーネルを使用しました。 i.MX6サポートは、Linaro 12.04でのみ実装されました。 ただし、この構成では、すべてのパフォーマンステストで、CPU SABER LiteがPandaBoardよりもはるかに優れており(数十パーセント)、テスト結果はPandaBoardのopenbenchmarking.orgで公開されたデータとは大きく異なりました( 1、2 )。



その後、Linaro 12.04でテストを実行しようとしましたが、状況は繰り返されました。今回は、おそらくPandaBoardのLinaro 12.04カーネルでのcpufreqのサポートが原因でした(詳細については、 こちらを参照)。



その結果、PandaBoardにはLinaro 12.08ディストリビューションを、両方のSABRE LiteにはLinaro 12.04ディストリビューションを選択しました(どちらもUbuntu 12.04に基づいています)。 両方のボードのルートファイルシステムは外部SDカードに交換され、テストには同じメモリカードが交互に使用されました。 テストソフトウェアとして、Phoronix Test Suite 4.8.3(テスト開始時に利用可能な最新バージョン)が選択されました。



テストの主な焦点は、CPUおよびメモリのパフォーマンスの分析です。 結果を比較すると、i.MX6Qには4つのコアがあり、OMAP4460には2つのコアがあり、各プロセッサーのこれらのコアは異なる周波数で動作することを考慮する必要があります。 さらに、開発キット自体には異なる種類のメモリとそのバス周波数があります。 一部のテストは1つのコアでのみ実行されるため、説明ではテストが1つのコアで実行される場所と、複数のスレッドで実行される場所を示します。



以下は、Phoronix Test Suiteによって生成されたシステム情報の表です。





外部SDRAMメモリを使用したパフォーマンステストの結果から始めましょう。





PandaBoardは、SABER Liteに対して約10%勝ちです。 原則として、この結果(最初の近似値)を使用すると、メモリパフォーマンスの影響を考慮せずに、プロセッサパフォーマンステストの結果を比較できます。



以下は、SDカードにあるファイルシステムからの読み取り速度テストの結果です





このテストでは、測定エラーを考慮して、両方のボードが同じ結果を表示します。これにより、アプリケーションのビルド時テストなど、ファイルシステムで非常に集中的な作業が必要なテスト結果を比較できます。



OpenSSLテストは、openssl実装のRSA 4096ビット暗号化速度をチェックし、単一のスレッドで実行します。





周波数の正規化を考えると、両方のシステムのパフォーマンスはほぼ同じです(0.8%がSABER Liteを支持)。



C-Rayは 、浮動小数点計算でCPUパフォーマンステストします 。 これはマルチスレッドテストです(コアあたり16スレッド)。





このテストは、コアの数による結果のスケーリングを示しています。 周波数とコア数の正規化、および測定誤差を考慮すると、両方のシステムは同じパフォーマンスを示します。



次に、 オーディオデータとビデオデータをエンコードし結果を示します 。 FLACオーディオエンコーディングおよびLAME MP3エンコーディングテストは単一のストリームで実行され、x264テストはマルチスレッドです。





周波数の正規化を考えると、PandaBoardはSABER Liteと比較して9%高いパフォーマンスを示します。





MP3エンコードの同様の状況:PandaBoardは、SABER Liteと比較して3%優れたパフォーマンス(正規化を含む)を示します。





周波数とコア数の正規化を考えると、PandaBoardはSABER Liteよりも約30%進んでいます。



Timed MPlayer Compilationテストは、mplayerプレーヤーのビルド時間を分析します。アセンブリは、システム(この場合、両方のシステム— gcc 4.6.3)にインストールされたコンパイラーによって実行されます。 アセンブリスレッドの数は、コアの数と同じです。




期待される結果は、コア数による結果のスケーリングでしたが、この依存関係は観察されません。 4 x 1 GHzコアでは、テストは2つの1.2 GHzコアよりも6%遅くなります。 どうやらこれは、このテストのボトルネックがフラッシュメモリの操作速度であったためです。



次に、Cで実装されたSciMark 2.0テストの結果を示します;これらのテストは単一のコアで実行されます。







周波数を正規化すると、PandaBoardはSABER Liteと比較して15%、0%、40%高いパフォーマンスを示します。



テスト結果によると、次のことに注意することができます。



すべてのテストで、PandaBoardはSABER Liteと比較してより優れた、または同等のパフォーマンスを示しました。 2つのテストで、x264コーディングとSciMark2.0 Dense LU Matrix Factorizationの結果は大きく異なりました(Timed MPlayer Compilationは考慮されません)。



一般に、ソフトウェアとハ​​ードウェアの指定された構成内でTI OMAP4460プロセッサ(PandaBoard ES)に基づくシステムにはいくつかの利点があると結論付けることができます。 TIチップの詳細については、Promwad Electronics Design CenterのWebサイト( Texas Instrumentsマイクロプロセッサ)を参照してください



Source: https://habr.com/ru/post/J209844/


All Articles