Apache Spark Mitap

画像

4月27日、Apache Sparkとの共同作業に特化した最初のmitapがRAMBLER&Co atticで開催されます。

Apache Sparkは、ビッグデータを扱うための主要なフレームワークの1つとして既に確立されており、Amazon、Baidu、IBM、Databricks、NASA JPL、トリップアドバイザーなどの大企業で使用されています。 ロシアでは、Sparkが多くの中小企業や一部の大企業で使用されており、非常に効果的であることを知っています。

Rambler&Coでは、ETLと機械学習に関連する広告テクノロジー部門のほぼすべてのタスクにほぼ1年間Sparkを使用しています。 さらに、年の初めにバージョン2.1.0へのアップグレードに成功しました。

会議では、Sparkを運用環境に導入した経験を共有し、発生した問題について話し、適用したソリューションについて話し合いたいと思います。 Spark 2に登場した新しいクールな機能と、以前のバージョンから正常に移行されたバグを確認してくださいもちろん、この素晴らしいツールの他の愛好家や実践者と知り合い、イベントを定期的に開催してください。 さあ、それは面白いでしょう!

レポートのテーマ:

1.パベルクレメンコフ(機械学習責任者)
Apache Sparkの機械学習パイプライン
Sparkの前に私たちは何を持っていましたか、どのようにしてそれに到達し、数学者やプログラマーは何をしましたか?

2. Konstantin Kolokolov(数学者プログラマー)およびVladimir Shtanko(数学者プログラマー)
PySparkでプログラムする方法は?
フレームワークのアーキテクチャの簡単な紹介。 何が間違っているのか、どこを見て、どのように戦うのか? 足元で自分を撃つ方法は?

3.ドミトリー・ノソフ(数学者プログラマー)
Criteo 1TBベンチマーク
CriteoデータセットでVowpal Wabbit、XGBoost、Spark MLをテストします

4. Shorin Alexander(開発者開発エンジニア)
スパークからの分
Sparkが私たちと共に生きる方法、私たちが彼と共に生きる方法、操作の歴史、サポート、および水中レーキとの戦い。

18.30でのゲストのコレクション。
最初のレポートは19.00から始まります。

登録: rambler-co-e-org.timepad.ru/event/470664
ブロードキャストリンク: www.facebook.com/afishamansarda

Source: https://habr.com/ru/post/J325622/


All Articles