Googleプラットフォーム 10年以上

データの保管と処理は、人類が数千年にわたってさまざまな成功を収めてきた課題です。 この問題の解決に関連する問題は、データの物理ボリューム( volume )だけでなく、このデータの変動率( velocity )およびデータソースの多様性( 多様性 )にも関連しています-Gartnerの記事[11、12] 「3V」として指定。

コンピューターサイエンスは最近、民間企業、政府、科学界がITからの解決策を待っているビッグデータの問題に直面しました。

そして、さまざまな成功を収めながら、ビッグデータの問題に10年間取り組んでいる企業がすでに登場しています。 私の意見では(自由に入手できないオープンデータが必要であると確実に述べるため)、 営利団体または非営利団体は問題の会社よりも大量のデータを扱うことはありません。

この会社は、HBase、Apache Giraph、Apache Drillなど、Hadoopエコシステムの多くのコンポーネントと同様に、Hadoopプラットフォームのアイデアの主な貢献者でした。

ご想像のとおり、これはGoogleに関するものです。



Google Big Data Timeline


従来、Googleでの「ビッグデータ」ソリューションの開発の歴史は2つの期間に分けることができます。

2003-2008


この期間中、Googleのエンジニアは、Googleが問題を解決するために使用する3つのシステムについて、自由に利用できる研究論文を説明し、公開しました。

Googleが公開した作業がビッグデータ業界の発展の最初のステップに与える影響を過大評価することは困難です。
Googleが説明する概念の実装の最も有名な例は、Hadoopプラットフォームです。 したがって、 HDFSファイルシステムのプロトタイプはGFSです。 HBaseアーキテクチャの背後にあるアイデアはBigTableから来ています。 Hadoop MapReduce計算フレームワーク( YARNなし)は、同様のGoogle MapReduceフレームワークで具現化された原則の実装です。

Hadoopプラットフォーム自体は、2008年から数年間で人気を獲得し、2010年から2011年までにビッグデータを扱うための事実上の標準になります。

現在、Hadoopはすでにビッグデータの世界で「機関車」であり、このITセグメントに大きな影響を与えています。 しかし、かつて、Hadoopは、Googleが説明したビッグデータプラットフォームを構築するためのアーキテクチャアプローチに同じ大きな影響を与えました

Googleプラットフォーム自体は、ますます多くの新しい要件に適応して、これまでずっと開発を続けてきました。検索エンジンには、バッチモードではなくインタラクティブ処理モードに対応する性質を含む新しいサービスがありますチャンクサイズ(GFSのクラスター)は、すべてのデータタイプの効率的なストレージには適していませんでした。 地理的 分布分散トランザクションのサポートに関連する要件がありました。

2009年から2010年までに、Google自身と学術環境の両方で、2003年から2008年にかけてGoogleのエンジニアが説明したビッグデータプラットフォームを構築するための一連のアプローチの利点と制限を十分に詳細に研究しました。 はい、そして2009年までの期間のGoogleプラットフォーム自体が開発および進化しました。

2009-2013


そのため、(条件付きで)Googleのビッグデータプラットフォームの開発の第2段階-2009-2013-では、次のソフトウェアシステムがさまざまな詳細度で会社の研究者によって記述されました。

Googleプラットフォームシリーズの後続の記事では、Googleがデータの保存、構造化、検索、スパムの検出、コンテキスト広告サービスでの広告表示の効率化、データの一貫性の問題を解決する上記のGoogleソフトウェア製品のほとんどについて説明しますソーシャルネットワークGoogle+など

結論の代わりに


結論を出す代わりに、ClouderaのCEOであるMike Olson氏は、ビッグデータ業界の未来をうまく予測する能力をすでに証明している人を引用します。
大規模で高性能なデータ処理を知りたい場合
インフラストラクチャの将来は次のようになります。私のアドバイスは、現在公開されているGoogleの研究論文を読むことです。
-Cloudera CEO、マイク・オルソン

サイクルの準備に使用されるソースのリスト


主な情報源



追加のソース



変更履歴を投稿
コミット01 [2013年12月23日]。 記事のタイトルを変更しました。
-Googleプラットフォーム。 2003-2013
+ Googleプラットフォーム。 10年以上
コミット02 [2013年12月24日]。
+巨像の説明付きの投稿へのリンク。
コミット03 [12/25/2013]。
+ Spannerの説明を含む投稿へのリンク。
コミット04 [2013/12/26]。
+ Dremelの説明付きの投稿へのリンク。
コミット05 [2013/12/27]。
+ Photonの説明を含む投稿へのリンク。


ドミトリーペトホフ、
MCP、 博士課程学生 、ITゾンビ、
赤血球の代わりにカフェインを持つ人。

Source: https://habr.com/ru/post/J206972/


All Articles