スーパーコンピューター：第三世界のレース

PAVT 2011カンファレンスから戻ったばかりで、高性能コンピューティングの分野における現状と尊敬されるhabrasocietyを紹介したいと思います。
可能な限り、私は主要な情報源、すなわち、 Supercomputers誌の記事と会議資料を参照しようとします。

なぜこれがすべて必要なのですか？

従来、スーパーコンピューターは軍事および科学の目的で使用されてきましたが、近年、ビジネスに手頃なコストで実際のプロセスとオブジェクトをシミュレートする能力が高まったため、アプリケーションに革命的な変化がありました。
自動車業界では、セキュリティを強化するためにスーパーコンピューターでの計算が使用されていることを誰もが知っているでしょう。たとえば、フォードフォーカスは5つ星を獲得しました。航空業界では、従来の技術を使用した新しいジェットエンジンのリリースは高価な喜びです。たとえば、SU-27のAL-31の作成には15年かかり、50のプロトタイプの作成と破壊が必要で、費用は35億ドルでした。すでにスーパーコンピューターの参加を得て設計されたSukhoi Supergetのエンジンは6年で作成され、6億ユーロ、8つのプロトタイプが作成されました。
医薬品にも注意する必要があります。最新の医薬品のほとんどは、バーチャルスクリーニングを使用して設計されており、これにより根本的にコストを削減し、医薬品の安全性を高めることができます。
もっと多い。
今日、ヨーロッパの先進国では：
ハイテク製品の47.3％は、設計された複雑なシステムまたは製品の断片のシミュレーションモデリングを使用して生産されています。
製品の32.3％は、設計されたシステムおよび製品の小規模アナログのシミュレーションモデリングを使用して製造されています。
製品の15％は、設計されたシステムと製品の全面的なシミュレーションを使用して製造されています。
設計された複雑なシステムと製品のわずか5.4％がシミュレーションなしで生産されています。

現代世界のスーパーコンピューター技術は戦略分野になっており、これなしではさらなる開発は不可能です。 現在、国内のスーパーコンピューターの能力は、発電所の能力や核弾頭の数と同じくらい重要です。
そして今、世界は始まった

エクサフロップスの競争

なぜエクサフロップス？実際には、11年のサイクルで電力が増加しました。ギガフロップス、テラフロップス、ペタフロップス...ペタフロップスのラインは2008年に克服され、同時に米国のディフェンダーは2019年にレベル1のエクサフロップスに到達するという課題を設定しました。タスクの重要性により、すべての主要国がレースに参加し、中国のスーパーコンピューターが第一位になりました。
スーパーコンピューターコンピューティングは、次の2つの理由で経済競争の最前線にあります.1つ目は、これまで以上に需要が高まっていることです.2つ目は、プロセッサの周波数を上げながら消費電力を削減することにより、広範な開発の限界が使い果たされており、このexaflopの作成方法が誰にもわからないことです。

これまでに未解決の問題：
1） 消費電力。 既存のスーパーコンピューターはメガワットのエネルギーを消費します。同じテクノロジーを使用するExaflopsはギガワットを消費しますが、これはすでに都市のエネルギー消費量に匹敵します。会議では、彼らはすでに半分熱心にセントラルヒーティングシステムにスーパーコンピューターを使用することを提案しました。
2） 信頼性。 ノードが多くなるほど、信頼性が低下し、エクサフロップコンピューターは絶えず故障し、動作中に継続的に考慮する必要があり、根本的に信頼できないシステムのプログラミングテクノロジーはまだ初期段階にあります。
3） 効率。 コアの数が増えると、それらの共同作業の効率は継続的に低下します。数百万の並列コアを備えたexaflopシステムをプログラムする方法をだれも知らないため、新しい言語とプログラミングパラダイムの変更が必要です。

20世紀には、多くの点で文明のさらなる発展を決定する2つの偉大な人種がありました-原子と宇宙。
世代間の競争は私たちの世代の多くに落ちました。

ロシアとスーパーコンピューター

近年まで、ロシアのスーパーコンピューターの状況は失敗であり、ロシアのマシンのリストの上位500のみが輝いていました。現在、状況は変わりつつあります-評価にはすでに11台のスーパーコンピューターがあり、それらの中で最も優れているのはT-Platforms会社のLomonosovです-現在の評価では17位で、容量は500 TFlopです（発売時は11位でした）。今年、グラフィックアクセラレータの助けを借りたロモノソフの大規模な近代化が計画されており、その後、彼はトップ10に入るはずです。興味深いことに、1984年には、M-13ミサイル防衛コンピューターを使用して、評価の最初の行に1回しかいませんでした。
ロシアのスーパーコンピューター市場のリーダーであるT-Platformsは、現在、レイアウト密度の点で最初の場所を保持しています。これにより、現在のスーパーコンピューターのレースで良い結果を期待できます。 T-Platformsのディレクターがカンファレンスで講演し、それは素晴らしいパフォーマンスでした：若い、有能な、熱狂的な！私たちの他のプレーヤー、 RSK-SKIF会社については何も言えません-みんなは率直に全体報告書を台無しにし、次のパフォーマンスを撃ちました。
未確認の報告によると、3月に原子力技術者の街サロフで最初のペットフロップスーパーコンピューターが発売されましたが、まだトップ500に入ることはできていません。
かなりの資金が州からスーパーコンピューターの分野に送られていますが、お金だけでは十分ではありません。何千人もの人々の新しいアイデアと仕事が必要です。良いニュースと悪いニュースの2つのニュースがあります。悪いことは、ほとんどすべての深刻な深刻なスーパーコンピューターモデリングソフトウェアが米国で開発され、アメリカ人が独占を積極的に使用して配布していることです。たとえば、当社の航空機エンジンは特殊な航空機を使用していませんが、手頃な価格の自動車用ソフトウェアであり、もちろん機能ははるかに少ないです。そして、良いニュースは、近々行われる大規模並列化の観点から、すべてのソフトウェアを書き換える必要があるということです。つまり、リードに突入する非常に良いチャンスがあるということです。

プロセッサー

なぜならシリコンベースのプロセッサの周波数の成長は止まり、スーパーコンピューターの開発はますます並列化する道を進み、コンピューティングコアの数が増加しています。ただし、これが唯一の方法ではなく、シリコンの代替品の検索が継続されます。長い間、「以前の」科学者によって作成されたグラフェンは「救世主」の役割に位置付けられていましたが、今では新しい挑戦者であるモリブデンが登場しています。しかし、この問題全体は、たとえそれほど遠くないにしても、将来のものですが、プロセッサの並列アーキテクチャがますます輝いている一方で、 100個の核結晶がすでに計画されています。パフォーマンスが非常に重要になるだけでなく、消費電力1ワットあたりのパフォーマンスも重要になります。この点で、 AMDブルドーザープロジェクトは興味深いものです。このプロジェクトでは、コアが共通ブロックを使用して消費電力を削減します。
インテルは、 Intel PMICコアに基づくマルチコアアクセラレータであるIntel MICのアーキテクチャを開発して、それほど遅れをとっていません。
モバイル設計のAtomプロセッサーでさえ、スーパーコンピューターで使用されています。

グラフィックスアクセラレータ

NVIDIAは、強力なゲーム用グラフィックスカードの作成中に開発されたテクノロジーをパラレルコンピューティングに初めて適用することに成功しましたが、AMDはFireStreamアクセラレータにaしませんでした。グラフィックアクセラレータ（GPGPU）を使用すると、お金と消費電力の点で数十倍のコストを大幅に削減できます。 top500では、上位5つのスーパーコンピューターのうち3つがNVIDIA TESLAアクセラレーターを使用しています。 GPGPUは、通常のデスクトップケースでテラフロップスパワーの「パーソナルスーパーコンピューター」を獲得するための唯一のお金の機会です。しかし、デンマーク王国ではすべてがそれほど雲がないわけではないので、すでに書いたように、グラフィックアクセラレータのプログラミングは簡単な作業ではありません。また、何を選ぶべきかという疑問も生じます-高価で特化したテスラか、より高速で安価なトップエンドのグラフィックカードでしょうか？。いずれにせよ、多くの「軽量」コアに代わるものはまだ見つかっていません。つまり、より多くの並列プログラミングが必要になるということです。今、私たちには非常に興味深いチャンスがあります。スーパーコンピューターのプログラミングは、NVIDIA IONを搭載したネットブック上でも習得できますが、これは歴史上起こりませんでした。

プログラミング

現代のコンピューターは異種システムです。これはノードのクラスターであり、各クラスターには共有メモリと複数のグラフィックアクセラレーターを備えた複数のプロセッサーがあり、ノードは高速バスで接続されています（現在ではほとんどの場合InfiniBandであり、スーパーコンピューターの「家庭」の定義は「インフィニバンドを備えたもの」です）。
このテクノロジーの奇跡のプログラミングは、MPI（ノード間でタスクを分散）、OpenMP（プロセッサ間）、CUDA / OpenCL（グラフィックアクセラレータ間）の組み合わせを使用して行われます。
そのようなシステムでのコードの最適化（たとえば、ループのスイープ）は、最適化なしでは完全に読みにくくなり、効率は完全に不十分です。
これに対処するには、新しい環境とプログラミング言語を作成する必要があります。たとえば、Mosix OpenCLが開発されており、OpenCL互換言語の1つの大きなスタッフとしてクラスターを操作できます。カンファレンスで発表されたNUDA開発は、Nemerle言語のOpenCLの高度な「ラッパー」であり、グラフィックアクセラレータ用に最適化されたコードを自動的に生成できることは興味深いように思えました。

参加

それで、レースが始まったので、ここで歴史に残るチャンスがあります。
今何ができますか？
勉強する。「スーパーコンピューター技術のインターネット大学」が利用可能になりました
大きな問題を解決するためにGPUアクセラレーターを効果的に使用するための競争に参加する
他に何？
まだわかりません。書いて、一緒に見つけましょう。