OpenDataScienceずMail.Ru Groupは、オヌプンな機械孊習コヌスを実斜したす

2017幎9月6日、デヌタ分析ず機械孊習に関するOpenDataScienceオヌプンコヌスの2回目の開始が開始されたす。 今回は、ラむブレクチャヌが開催され、サむトはMail.Ru Groupのモスクワオフィスになりたす。



芁するに、コヌスはHabré ここが最初の䞀連の蚘事、耇補された資料Jupyterノヌトブック、こちらがコヌスのgithubリポゞトリ 、宿題、Kaggle Inclassコンテスト、チュヌトリアル、個々のデヌタ分析プロゞェクトで構成されおいたす。 ここでコヌスにサむンアップできたす。 ここで 、OpenDataScienceコミュニティに参加しおください。ここでは、コヌス䞭にすべおの通信が行われたすSlack ODSのチャネル#mlcourse_open。 そしお、より詳现に蚀えば、これは猫の䞋であなたのためです。


蚘事の抂芁



コヌスの特城は䜕ですか



このコヌスの目暙は、既存の知識をすばやく曎新し、さらに孊習するためのトピックを芋぀けるこずです。 コヌスは、このトピックの最初のコヌスに完党に適合するずは考えられたせん。 デヌタ分析ず機械孊習に関する包括的なコヌスを䜜成するタスクを蚭定したせんでしたが、理論ず実践の完璧な組み合わせでコヌスを䜜成したいず考えたした。 したがっお、アルゎリズムは数孊を䜿甚しお十分に詳现に説明され、実践的なスキルは宿題、競技、個々のプロゞェクトによっおサポヌトされおいたす。


この特定のコヌスの倧きなプラスは、フォヌラムOpenDataScienceのSlackコミュニティでのアクティブラむフです。 䞀蚀で蚀えば、OpenDataScienceはロシア語を話すDataScientistsの最倧のコミュニティであり、 Data Festの開催を含む倚くのクヌルなこずを行っおいたす 。 同時に、コミュニティは積極的にSlackに䜏んでいたす。そこでは、誰でもDS質問ぞの回答を芋぀けたり、プロゞェクトの志を同じくする人々や同僚を芋぀けたり、仕事を芋぀けたりするこずができたす。 オヌプンコヌス甚に別のチャンネルが䜜成されたした。このチャンネルでは、新しいトピックを習埗するのに圹立぀3〜400人の人々が同じこずを勉匷したす。


玠材のプレれンテヌション圢匏を遞択しお、HabréおよびJupyterノヌトブックに関する蚘事を䜜成したした。 これで、ラむブ講矩ずそのビデオが远加されたす。


コヌスの察象者ず準備方法


前提条件専門倧孊の2幎次レベルで数孊線圢代数、解析幟䜕孊、数孊的分析、確率論、統蚈を知っおいる必芁がありたす。 Pythonで少しプログラミングできる必芁がありたす。


十分な知識やスキルがない堎合は、シリヌズの最初の蚘事で、数孊を繰り返し、Pythonプログラミングスキルを曎新たたは取埗する方法に぀いお説明したす。


はい、英語の知識はもちろん、ナヌモアのセンスも傷぀けたせん。



コヌスには䜕が含たれおいたすか


蚘事


Habrに賭け、蚘事の圢で資料を提出したした。 そのため、い぀でも玠材の適切な郚分をすばやく簡単に芋぀けるこずができたす。 蚘事は既に準備ができおおり、9月から11月に郚分的に曎新され、募配ブヌスティングに関する別の蚘事が远加されたす。


シリヌズの蚘事のリスト


  1. パンダを䜿甚した䞀次デヌタ分析
  2. Pythonを䜿甚したビゞュアルデヌタ分析
  3. 分類、決定朚、および最近傍法
  4. 線圢分類および回垰モデル
  5. 歌バギング、ランダムフォレスト
  6. 暙識の䜜成ず遞択。 ワヌプロ、画像、およびゞオデヌタタスクのアプリケヌション
  7. 教垫なし孊習PCA、クラスタリング
  8. Vowpal Wabbitによるギガバむトベヌスのトレヌニング
  9. Python時系列分析
  10. 募配ブヌスト

講矩


講矩は、9月6日から11月8日たでの19:00から22.00たでの氎曜日に、Mail.Ru Groupのモスクワ事務所で開催されたす。 講矩では、蚘事で説明されおいるのず同じ蚈画に埓っお、理論党䜓を分析したす。 しかし、講垫によるタスクのラむブディスカッションも行われ、各講矩の最埌の1時間は緎習に専念したす-孊生はデヌタを自分で分析しそう、盎接コヌドを曞く、講垫がこれを手䌝いたす。 珟圚の評䟡のコヌスの䞊䜍30人の参加者が講矩に参加できたす。 ランキングは、宿題、競技䌚、デヌタ分析プロゞェクトの圱響を受けたす。 講矩攟送も開催されたす。



講垫



ここでコヌス蚘事のすべおの著者に぀いお読むこずができたす 。


宿題


10のトピックにはそれぞれ宿題が付き、1週間が䞎えられたす。 タスクはJupyterノヌトブックの圢匏であり、そこにコヌドを远加し、それに基づいおGoogleの圢匏で正しい答えを遞択する必芁がありたす。 宿題は、コヌスの参加者の評䟡に圱響を䞎え始め、それに応じお、誰がラむブで講矩に参加できるようになるか、最初のものです。


コヌスリポゞトリで、 10の宿題ず゜リュヌションを芋るこずができたす。 コヌスの新しい立ち䞊げでは、宿題は新しくなりたす。


チュヌトリアル


コヌス䞭の創造的なタスクの1぀は、デヌタ分析ず機械孊習の分野からトピックを遞択し、それに関するチュヌトリアルを䜜成するこずです。 ここでの䟋を知るこずができたす 。 経隓は成功したこずが刀明し、コヌス参加者自身が、コヌスで考慮されなかったトピックに関するいく぀かの非垞に堅実な蚘事を曞きたした。


Kaggle Inclassコンペティション



もちろん、どこでもデヌタを分析する緎習をしなくおも、競争の䞭ですぐに䜕かを孊び、その方法を孊ぶこずができたす。 さらに、さたざたなパンの圢での動機「倧きな」Kaggleでのお金ず栌付け、そしお私たちが知っおいる栌付けの圢での栌付けは、デヌタ分析競争䞭の新しい方法ずアルゎリズムの非垞に掻発な研究に貢献したす。 コヌスの最初の開始では、非垞に興味深い問題が解決された2぀のコンテストが提䟛されたした。



個別プロゞェクト



Vkontakteの公開 「成人男性向けの機械孊習に関するミヌム」から。


コヌスは2.5か月間蚭蚈されおおり、倚くのアクティビティが蚈画されおいたす。 ただし、教垫が提案した蚈画に埓っお、独自のデヌタを䜿甚しお、最初から最埌たで独自のデヌタ分析プロゞェクトを完了する可胜性を必ず怜蚎しおください。 プロゞェクトは同僚ず話し合うこずができ、コヌスの終わりにプロゞェクトのピアレビュヌ怜蚌が手配されたす。
プロゞェクトの詳现に぀いおは埌ほど説明したすが、今のずころは、「プロゞェクトのために䜕かを予枬する」ためにどのようなデヌタを䜿甚するかを考えるかもしれたせん。 しかし、アむデアがなければ、問題ありたせん。分析のために興味深いタスクずデヌタをアドバむスしたす。それらは耇雑さの点で異なる堎合がありたす。


コヌスに登録するにはどうすればよいですか


コヌスに参加するには、 このアンケヌトに蚘入し、OpenDataScience コミュニティに参加しおください「OpenDataScienceに぀いおどうやっお知りたしたか」の「mlcourse_open」ず答えおください。 コヌス党䜓の通信のほずんどは、mlcourse_openチャネルのSlack OpenDataScienceで行われたす。


コヌスの最初の実行はどうでしたか


最初の打ち䞊げは2017幎2月から6月に行われ、玄1,000人がサむンアップし、最初の宿題は520人、最埌は150人でした。 フォヌラムでの生掻は本栌的で、Kaggleコンテストで数千個の小包が䜜られ、コヌス参加者は倚数のチュヌトリアルを䜜成したした。 たた、レビュヌから刀断するず、ニュヌラルネットワヌク、Kaggleの競争、たたは機械孊習の理論にさらに螏み蟌むこずができる玠晎らしい経隓を埗たした。


コヌスのトップ100のファむナリストにボヌナスをもたらしたのは、Mail.Ru Groupのモスクワ事務所のmitapでした。これには、珟代のDSに関連するトピックに関する3぀の講矩がありたした。



ボヌナスco-cs231nコヌス


そしお最埌に私たちが喜ぶ最埌のこず2017幎11月䞭旬、機械孊習入門コヌスの導入盎埌から、Slack ODSの#mlcourse_openチャネルの同じ堎所で、ニュヌラルネットワヌクで最高のコヌスの1぀であるスタンフォヌドコヌス cs231nの「Convolutional Neural Networks for芖芚認識。」


この玠晎らしい芏埋を孊ぶのに幞運-機械孊習 そしお、ここにいる二人の仲間-動機付けのために。



Andrew Ngは、ディヌプラヌニング専門の䞀環ずしお、Andrej Karpathyにむンタビュヌしたす。



Source: https://habr.com/ru/post/J334960/


All Articles