GoTo Data Science Challenge 2:Summer School Grants

GoToサマースクールのデータ分析と機械学習の方向性の一環として、助成金の競争を発表しています。 学童と学部生を招待します。 タスクとして、 Quoraの kaggleコンペ 提案されます。このコンペ 、重複する質問を決定するためのモデルを構築する必要があります。


画像


カットの下には、問題の状態の説明、有用な資料へのリンク、および簡単な解決策の例があります。



本質的に同一の質問を識別するためのモデルは、たとえば、フォーラム、技術サポート、オンライン相談などで使用でき、同じトピックを作成したり、一般的な質問に自動的に回答したりしません。 実際、非常に便利な話です。


一次近似まで、この問題はバイナリ分類の定式化で解決できます。それらが重複しているかどうかをいくつかの質問から予測することを学びます。 次に、機械学習の標準設定-教師とのトレーニングが始まります。 トレーニング用にマークされたペアは、コンテストの主催者から提供されました。2つのステップを完了するだけで十分です。質問のペアでサインを生成し、それらを選択して分類子をトレーニングします。


最も簡単な解決策の1つは、質問がほぼ同じ単語( bag of wordsモデル) 構成されている場合、質問は重複していると考えることです。 次に、1つの質問の指示的な記述は、単語の出現頻度からのベクトルです。
このような機能とロジスティック回帰を使用したソリューションの例については、 こちらをご覧ください


ソリューションのさらなる開発は、あなたの想像力によってのみ制限されます。



その他の例を以下に示します。



助成金を申請するには、次の手順に従う必要があります。



その結果、数人の参加者は完全な助成金(無料参加)を受け取ります。これはまともな結果を示しています-部分的な助成金。 登録後に送信されるレターの詳細。


学校について:


画像


6月13日-26日、7月1日-14日、8月16日-29日、モスクワから100 km離れた場所で、応用プログラミング、データ分析、バイオインフォマティクス、情報セキュリティ、およびロボットを使用したモノのインターネットに関心のある高校および中学生向けのGoToサマーデザインスクールが開催されます。 各学校の参加者は、プロジェクトを実施したり、研究を実施したりすることができます。プロジェクトの作業は、最高の大学の教師や大手企業の専門家によって監督されています。
選択の一環として、各分野への無料参加のためのコンテストが開催されます:応用プログラミング、ハードウェア、データ分析、情報セキュリティ、バイオインフォマティクス。 他のコンテストのお知らせはまもなく公開されます。


すべての質問や提案はschool@goto.msk.ruに送信できます。



Source: https://habr.com/ru/post/J327206/


All Articles