Hadoop 3.0:新機能の概要

Apache Software Foundationは、分散プログラムを開発および実行するためのオープンソースフレームワークの新しいバージョン、Hadoop 3.0のリリースを発表しました。 これは、2013年のHadoop 2のリリース以来の最初のメジャーリリースです。 Hadoop 3.0の新機能のいくつかと、今後のバージョンで提供されるものについて詳しく説明します。


/写真クリスフェザー CC

新機能


HDFSの消去コーディング

これは主にオブジェクトストレージで使用されるデータ保護方法です。 これで、Hadoop 異なるクラスターにデータの3つのコピーを保存しなくなりました 。 代わりに、RAID 5または6に似たデータの断片化方法が使用され、レプリケーションの効率が向上したため 、ストレージ効率が50% 向上しました。

Hortonworksのアップデート開発者およびCTOの1人であるVinod Kumar Vavilapalli氏は、Erasure Codingを追加し理由は、ビッグデータクラスターの企業が保存するデータ量の増加にあると述べました 。 この新機能により、ストレージをより効率的に管理し、Hadoopクラスターの機能を最大限に活用できます。

糸の連合

Vavilapalliによる 、最初はYARNは1万ノードのみにスケーリングされました。 そのため、Microsoftの開発者はYARNフェデレーション機能を追加しました。これにより、YARNは40または10万のノードで動作することができます。

新しいタイプのリソース

Hadoop 3.0では、メモリとCPUに加えて、追加の種類のリソースを操作するための新しいフレームワークYARNが追加されています。 また、更新により、ビッグデータクラスター内のディスクをより詳細に制御できます。 将来的には、GPUおよびFPGAのサポートが追加されます。

Java 8

Hadoop 2はJava Developers Kit 7で実行されます。ApacheHadoop 3.0はJDK 8に移行します。Hadoop3.0に加えて、HBase 2.0、Hive 3.0、およびPhoenix 3.0でJDK 8のサポートが発表されました。

ロードマップ:Hadoop 3.1および3.2


開発者は、フレームワークの将来のバージョンで追加される機能について説明しました。 主な機能を見てみましょう。

Hadoop 3.1


Hadoop 3.2


開発者は、Hadoop 3.1およびHadoop 3.2の更新を3か月の差でリリースする予定です。



PS最初の企業IaaSブログのその他の資料:


Source: https://habr.com/ru/post/J344596/


All Articles