2018幎のKaggle Data Science Bowlぞの深局流域倉換の適甚

2018幎のKaggle Data Science Bowlぞの深局流域倉換の適甚


参照および元のdockerized コヌドによる蚘事の翻蚳を提瀺したす。 この゜リュヌションを䜿甚するず、数千の地域の参加者総数の䞭で競争の第2段階でプラむベヌトリヌダヌボヌドの䞊䜍100に入るこずができたす。 競合他瀟のタヌゲットメトリックが䞍安定であるため、タスクに同様の゜リュヌションを䜿甚する堎合は、以䞋で説明するいく぀かのチップを远加するこずで、この結果を倧幅に改善できるず考えおいたす。



゜リュヌションパむプラむンの説明


TLDR


 翻蚳者のメモ -䞀郚の甚語はそのたた残されおいたす。぀たり、ロシア語に適切な類䌌物があるかどうかはたったくわかりたせん。それらに぀いお知っおいる堎合は、コメントを蚘入しお修正しおください。


この闘争は毎幎、デヌタサむ゚ンスボりルのコンテストを開催したす。 昚幎はずおもクヌルでした 



残念ながら、昚幎コンテストが始たったずき、私はただ参加する準備ができおいたせんでした。 今幎、GoogleがCuggleを買収した埌、最初の「りェむクアップコヌル」いく぀かの「フィヌルドノヌト」- ここにありたす に気付き始めたした。 簡単に蚀えば、機械孊習競技䌚は、コミュニティず競技䌚の䞻催者の䞡方にずっお盞互に有益であるように芋えたしたが、今では悪いこずにいく぀かの奇劙な傟向が芋られたす-競技䌚が集合デヌタのマヌクアップのための挔習になり、および/たたは賞が魅力的ではなくなるように感じたす普通に参加するために必芁な努力の量に぀いおトップに䞊べる/トップに入るか、賞品/ポンプ。


このコンテストの組織が気に入らなかった理由



最初に、デヌタを開いたずき、私は䞀般的に参加したくありたせんでした。 メガバむト単䜍のボリュヌムは、信頌をたったく刺激したせんでした。 しかし、その埌、私はそれらをより詳しく調べ、ここでのタスクはinstance segmentationであるこずに気付きたした。 デヌタセットのサむズが小さいにもかかわらず、タスク自䜓- instance segmentation -は非垞に興味深いものです。 セルの正確なバむナリマスクを䜜成するだけでなく、合䜓したセルを分離するこずも期埅されたす申し蚳ありたせんが、セルではなく栞が存圚する可胜性がありたすが、マヌクアップによっお刀断するず、オヌガナむザヌ自身もこれに぀いおはわかりたせん。 䞀方、デヌタセットのサむズずマヌクアップの品質は、特に競争の䞻催者がテラバむトのデヌタを含む類䌌のデヌタセットを持っおいるず報告しおいるこずを考えるず、少し䞍十分なように芋えたした。



コンピュヌタヌビゞョンの基本的なタスク。 ここのリストには、理論䞊、オブゞェクトの分類もありたす叀兞的なタスクは、写真で猫ず犬を芋぀けるこずです


この投皿では、この問題を解決するためのアプロヌチを説明したす。 たた、むンスタンスセグメンテヌションのためのDeep Watershed Transformのむンスピレヌションを䞎える蚘事ずパむプラむンを共有し、他のアプロヌチず゜リュヌションに぀いお話し、同様にそのような競争を理想的に線成する方法に぀いおの意芋を共有したす。


EDAたたはMLが魔法ではない理由


トレヌニングデヌタセットには玄600個の画像ず怜蚌デヌタセット65が含たれおいたした。第2ステヌゞからの遅延テストデヌタセットには〜3000個の画像が含たれおいたした。
最初の段階の画像にはさたざたな解像床がありたした-それ自䜓が課題でした-どのようにそれらすべおのナニバヌサルパむプラむンを構築したすか


 256x256 358 256x320 112 520x696 96 360x360 91 512x640 21 1024x1024 16 260x347 9 512x680 8 603x1272 6 524x348 4 519x253 4 520x348 4 519x162 2 519x161 2 1040x1388 1 390x239 1 

トレヌニングデヌタの䞭には、K平均を䜿甚しお簡単に芋぀けられる玄3぀のクラスタヌがありたした。



これが、RGB画像を癜黒に倉換するこずがパブリックリヌダヌボヌドで圹立぀䞻な理由でした。



黒の画像



圢状、色、サむズの異なるコアバリ゚ヌション


3000枚の画像でテストデヌタセットを芖芚的に衚瀺したずころ、これらの画像の50以䞊がトレヌニングデヌタセットずは無関係であり、コミュニティ偎で倚くの論争ずresみが生じおいたした。 それでは、「ありがずう」を競い、時間を費やし、モデルを最適化し、トレヌニングデヌタずはたったく異なる3,000枚の写真を手に入れたしょう。 目暙が異なる可胜性があるこずは明らかです競技の段階間での手動による採点の防止を含む-しかし、これはあたり面倒ではありたせん。


テストデヌタセットからの泚目すべきファむル



背景にある小さなものが栞になるこずをお勧めしたす



正盎なずころ、それが䜕であるかわかりたせん



筋肉のように芋えたす。 繰り返したすが、これらの癜いものはカヌネルですか、それずも䞀般的なものですか



倜空...これらのコアたたは単なるノむズですか


深局流域倉換


あなたはそれが䜕であるかわからない堎合は、 ここに行きたす 。 盎感的には、分氎method法は非垞にシンプルです。画像をネガティブな「山の颚景」高さ=ピクセル/マスク匷床に倉え、プヌルが接続されるたで遞択したマヌカヌのプヌルを氎で満たしたす。 OpenCVたたはskimageチュヌトリアルを芋぀けるこずができたすが、通垞はすべお次のような質問をしたす。



Deep Watershed Transform DWTは、これらの問題のいく぀かを解決するのに圹立ちたす。



オリゞナル䜜品の䞻な動機



アむデアは、CNNが2぀のこずを孊習するこずです-境界ず゚ネルギヌレベル山の高さを瀺す単䜍ベクトル


実際には、 WT Watershed Transformを適甚するだけの堎合、パヌセルセグメンテヌションが倚すぎる可胜性がありたす。 DWTの背埌にある盎芳はこれです。CNNは、「山の颚景」を芋぀けるために教えられる必芁がありたす。


元の蚘事の著者は、2぀の別個のVNGタむプのCNNを䜿甚しお以䞋を取埗したした。



実際には、1぀のネットワヌクを䜿甚するこずも、耇数の小芏暡な゚ンドツヌ゚ンドネットワヌクをトレヌニングするこずもできたす 。 私の堎合、私は以䞋を生み出したネットワヌクで遊んでいたした。



それから、これらすべおず出来事を組み合わせるために少しの魔法が必芁です、あなたは「゚ネルギヌ」を持っおいたす。 私はアヌキテクチャをあたり実隓したせんでしたが、Dmitro䞊蚘の゜リュヌションの䜜者は、2番目のCNNを远加しおも良い結果が埗られないず蚀っおいたした。


私にずっお、最適な埌凊理 参照によるenergy_baseline関数は、次のアクションアルゎリズムでした。




最良の䟋の1぀-グリッドは合䜓したコアを明確に分離できた



孊習した募配は、流域ずしおの䜿甚には適しおいたせん。


コアセンタヌの盎接怜玢も機胜する堎合がありたしたが、党䜓的には速床の向䞊には圹立ちたせんでした。


その他のアプロヌチ


個人的には、このタスクの可胜なアプロヌチを4぀のカテゎリに分けたす。



私にずっお、DWT + UNetを遞択するこずは、面倒な䜜業を必芁ずしないこの゜リュヌションがシンプルでマスクの远加チャネルずしお゚ネルギヌレむダヌを単玔に䟛絊できる、䜜業を他のタスクに簡単に転送できるためです。 再垰的なUNet拡匵機胜も気に入っおいたすが、詊す時間はありたせんでした。


繰り返しのUNetの堎合、通垞のUNetず比范しお有効な3぀の新しいコンポヌネントがありたす。



これはすべお最初は圧倒的に思えたすが、将来的には間違いなく詊しおみたす。 ただし、この方法は、2぀のメモリノォラシャスアヌキテクチャRNNず゚ンコヌダ/デコヌダネットワヌクを組み合わせおいたす。これは、小さなデヌタセットず暩限以倖では実際に䜿甚するのは実甚的ではありたせん。



説明ConvLSTMレむダヌ



リカレントUnetアヌキテクチャ


私のパむプラむン


詳现はこちらで確認できたすが、私のアプロヌチは次のずおりです。




パむプラむン党䜓


このパむプラむンの結果を倧幅に改善する堎合は、 VGG-16゚ンコヌダヌをResnet152に眮き換える必芁がありたす。競合の参加者によるず、この゚ンコヌダヌは遅延怜蚌でより安定した動䜜をしたす。 たた、最埌のアクティベヌション関数ずしおsoftmaxをsigmoidに眮き換えるsoftmax 、がやけた境界が少なくなりたす。


そしお今、理論䞊、そのような競争をどのように組織すべきかに぀いお


芁するに、TopCoderプラットフォヌムの迷惑な瞬間を考慮するず、この芳点からのSpaceNetはほが完璧でした。



謝蟞


い぀ものように、実りのある議論ずヒントをくれたDmytroに感謝したす


参照




Source: https://habr.com/ru/post/J354040/


All Articles