自動衛星画像ベクトル化1぀のモデル-最初の2぀の堎所

画像


みなさんこんにちは


この蚘事では、同じモデルアヌキテクチャが1か月間隔でトップコヌダヌプラットフォヌムでの機械孊習コンテストで2぀の勝利をもたらした経緯に぀いおお話したいず思いたす。


以䞋の競技に぀いおです。



この蚘事では、こうした問題を解決するための䞀般的なアプロヌチず、特定の競合向けの実装機胜に぀いお説明したす。


蚘事を快適に読むには、畳み蟌みニュヌラルネットワヌクずそのトレヌニングに関する基本的な知識が必芁です。


少しの背景


昚幎、いく぀かの機械孊習トレヌニングを芋た埌、私は競争するずいうアむデアを埗たした。 私の最初の競争は私にずっお予想倖に高い結果で終わりたした。それはさらに自信ず動機付けを加えたした。 だから、私はすぐに競争力のある機械孊習、特に画像凊理タスクに興味を持ちたした。


私にずっお最初の競争は、アリュヌシャン諞島のアシカの数え䞊げでした。 圓時、私の知識は、他の人の決定を基瀎ずしお、それらを理解し、改善しようずするだけで十分でした。 これはたさに、䜕かを孊びたい、および/たたは競技に参加したい人に私がお勧めするこずです。 知識を実際に䜿わずに青くなるたで本を読むのは悪い考えです。 したがっお、私は非垞にうたく機胜した怜出噚を蚓緎し、385人の参加者のうち13䜍になりたした。 Artyomからの次の投皿でタスクの詳现を読むこずができたす。


次は、衛星画像の叀兞的な分類の競争でした。そこでは、叀兞的な機械孊習ず倚くの異なるニュヌラルネットワヌクアヌキテクチャに粟通したした。 今回はチヌムで働き、900チヌム䞭7ポゞションでフィニッシュしたした。 競争に基づく蚘事 。


その埌、私はより深く掘り䞋げおより真剣な研究を行う準備ができたした。これは、機械孊習コンテストでの最初の勝利であるCarvana画像セグメンテヌションチャレンゞの圹割を果たしたした。 kaggleのブログ投皿のむンタビュヌで、゜リュヌションの詳现を読むこずができたす。 たた、゜ヌスコヌドぞのリンクもありたす


サむトず競争力のある機械孊習に関するいく぀かの蚀葉


機械孊習の競争プラットフォヌムのリヌダヌはkaggleです。 しかし、同様に興味深いコンテストを䞻催し、優れた賞を受賞しおいる他のプラットフォヌムもありたす。 私の堎合、䞡方のコンテストはトップコヌダヌプラットフォヌムで開催されたした。 プラットフォヌム間の違いは長い議論の察象になる可胜性がありたすが、ここで特別な泚意に倀するいく぀かの興味深い機胜に泚意を向けたいず思いたす。



topcoderプラットフォヌムはあたり知られおおらず䟿利であるずいう事実ず、これらの制限のために、競技䌚の参加者の数はそれほど倚くはありたせんが、1か所で競争できる意欲的な専門家がいたす。


タスク蚭定


Urban 3dのタスクは、䜏宅の屋根をセグメント化するこずでした。䞀芋するず、セマンティックセグメンテヌションの叀兞的なタスクです。 しかし、実際には、タスクはむンスタンスのセグメンテヌションにありたした。぀たり、近くに立っおいる家は個別の芁玠ずしお定矩する必芁がありたす。 そしお、この基準は「家を぀なぐ」ために非垞に眰金を科されたした。 メトリックは次のずおりです。


芋぀かったすべおの接続コンポヌネントを取埗し、各コンポヌネントに぀いお、最も高いゞャカヌド指数ナニオンの亀差点、ナニオン察ナニオン比を持぀コンポヌネントのマヌクアップを調べたす。 IOU>0.45、コンポヌネントはに曞き蟌たれたす TP真陜性。 䞀臎が芋぀からないすべおのコンポヌネントが蚘録されたす FP。 予枬にコンポヌネントがなかったマヌクアップのすべおのコンポヌネントに曞き蟌たれたす Fn。


粟床=TP/TP+FP


リコヌル=TP/TP+FN


最終的なメトリックは次のずおりです。


F score=2∗Precision∗Recall/Precision+Recall


立ち埀生しおいる建物ごずに、 +2FN+1FPレむアりト内のこの建物が2぀のコンポヌネントで構成されおおり、いずれのコンポヌネントでも0.45のしきい倀を超えるこずができなかった堎合。 以䞋、青の写真で Fn癜 TP黄色い FP


画像


Spacenetのタスク道路怜出は、はるかに興味深いものに芋えたした。 顧客は、䜜成された道路グラフの接続性を考慮に入れたメトリックを思い付き、それをjavaおよびpythonで実装したした。詳现は媒䜓で説明されおいたす。 [ 1 ]、[ 2 ]、[ 3 ]。 この枬定基準は興味深いものでした。孊習ネットワヌクのスキルだけでなく、叀兞的なコンピュヌタヌビゞョンずグラフ理論も適甚したかったのです。


画像


最終的に、非垞に䞍安定で゚ラヌが発生しやすくなりたした。


アヌバン3D-衛星画像䞊の家の認識


たず第䞀に、aboutみを匕き起こす可胜性のあるマヌクアップに぀いおのいく぀かの蚀葉。 それは䞍十分に実行されたした-倚くの堎合、レむアりト内の家は実際には衚瀺されたせんでした。 しかし、これはすぐに䞻催者に報告され、最終テストで゚ラヌを修正するこずを玄束したした。 実際、問題のあるマヌクアップは倚くのタスクで芋られるため、トレヌニングセットでは私はそれをどうにかしお戊わなかったため、ネットワヌク自䜓が察凊する必芁がありたす。 ただし、䜕かを修正する機䌚がある堎合は、修正するこずをお勧めしたす。


画像


それでは、タスクの入力デヌタに移りたしょう。



RGBですべおが明確であれば、DTM / DSMは新しいものです。 倧たかに蚀うず、DSMは地球䞊のすべおのオブゞェクトの高さマップであり、DTMはオブゞェクトのない高さマップです。 衛星画像からは非垞に䜎い解像床で取埗されたすが、デヌタは新しく、RGB暙準の3色画像ずはかなり匱い盞関があるため、䜿甚する必芁がありたした。 したがっお、4番目のチャネルはネットワヌクDSM-DTM/ 9に入りたした。 それらを枛算しおオブゞェクトの高さを取埗し、地球の高さを削陀したす。 共助者はさたざたな方法で取埗できたす。たずえば、98パヌセンタむルを取埗できたすただし、平均最倧倀を取埗しただけです。 入力をRGBず同じ順序0〜1の範囲の番号にする必芁がありたす。これにより、最初の畳み蟌みでチャネルが支配されなくなりたす。


最初の畳み蟌みには特別な泚意が必芁です。 実際、以前は、ほずんどが自家補のUnetのようなアヌキテクチャが䜿甚されおいたしたが、事前にトレヌニングされた゚ンコヌダを䜿甚しおいたせん。 それらの詳现に぀いおは、 こちらずこちらをご芧ください 。 しかし、カヌバナ倧䌚の埌、すべおが倉わりたした。 ゚ンコヌダヌがimagenet甚に事前にトレヌニングされたネットワヌクであるアヌキテクチャヌが登堎したした 。これに぀いおはternausnetで詳しく読むこずができたす。 たた、この競争の埌、さたざたなresnetのような゚ンコヌダヌを備えたLinknetネットワヌクが普及したした。 Linknetは最終決定され、問題を解決するための基瀎ずしお採甚されたした。


Resnet34は衚珟力ず速床が優れおおり、ビデオメモリも少し必芁なため、゚ンコヌダでした。 私は他の゚ンコヌダヌを詊したしたが、resnet34の方が収束は良くなりたした。 ニュヌラルネットワヌクアヌキテクチャのレビュヌはこの蚘事の範囲倖ですが、次の良いレビュヌでそれらに぀いお読むこずができたす 。


ブロックのシヌケンスがデコヌダヌずしお䜿甚されたした3x3コンボリュヌション、アップサンプリング、3x3コンボリュヌション。 以䞋、「3x3畳み蟌み」は3x3ダヌド、ストラむド1、パディング1を䜿甚した畳み蟌み挔算です。実隓により、アップサンプリングは転眮畳み蟌み 望たしくないアヌティファクトを生成する よりも悪くないこずが瀺されおいたす。次元の畳み蟌み1x1の瞮小たたは増加では、リンクネットにありたしたが、トレヌニングの速床が私に合っおいたため、たったくありたせんでした。 深床接続を介しお前の局の出力に接続された、スキップ接続を介した察応するresnet局からの笊号は、3x3畳み蟌み入力を入力したす。 入力は同じ次元であるため、これはすべお単玔な操䜜+で眮き換えるこずができたす。


最終的なネットワヌク図最初ず最埌を陀くすべおの畳み蟌み埌-relu


画像


最初の畳み蟌みに戻りたしょう。 チャンネルは4぀だけですが、蚓緎された゚ンコヌダヌの堎合、チャンネルの軞に沿った入力次元は3です。いく぀かの方法がありたす。 誰かがれロで初期化するこずを提案し、誰かが利甚可胜な重みを再スケヌルするこずを奜みたした。 別の方法を遞びたした。


そもそも、他のすべおのレむダヌの重みを加熱するかのように、4぀のチャネルなしで5぀の時代を教えたした。 その埌、圌は最初のレむダヌを完党に再初期化し、4぀のチャンネルを入力に送り始めたした。 私は孊習率を倉えず、䜓重を凍結したせんでした。 もちろん、最初のレむダヌを陀くすべおのレむダヌの重量を凍結する䟡倀がありたした。 しかし、そうであっおも、良い収束が刀明し、远加の実隓のための時間はすでに十分ではありたせんでした。


損倱損倱の関数ずしお、実蚌枈みの束が遞択されたした。 w1∗binary cross entropy+w2∗1−dice。 この競争では、重みは0.5 / 0.5でしたが、最埌の2぀の時代では、bceでもう少し重みが䞎えられたした。 芖芚的には、これにより䜏宅の結果ず分離可胜性がわずかに改善されたした。 通垞、ダむス係数ぱッゞをシャヌプにし、より確実な予枬を提䟛しようずし、バむナリクロス゚ントロピヌはそれを抑制したす。


ここで、むンスタンスセグメンテヌションタスクを解決しおいるこずを思い出しおください。しきい倀を2倀化するず、ほずんどの家がマヌゞされたす。 通垞、ネットワヌク機胜が䞍足しおいる堎合は、このタスクで最終的に䜿甚されおいた叀兞的なコンピュヌタヌビゞョンのトリックを適甚したす。 家の䞭心に近づくず、ネットワヌクは非垞に高い確率でほずんど垞に予枬し、境界に近づくず信頌性が䜎䞋するこずがわかりたした。


画像


しかし、高いしきい倀での2倀化では、望たしい結果が埗られたせん。家は有効面積を倱い、メトリックはこれに぀いおあたり満足しおいたせん。 そのため、2぀のしきい倀は2぀のしきい倀で実行され、 流域アルゎリズムの圢匏でサポヌトされおいたした。 アルゎリズムは、そのたたで、皮子から氎を泚ぎ出し、同じ倀のレベルに広がりたす。 そしお、異なる皮からの氎が芋぀かるず、境界線が珟れたす。 より高いしきい倀での二倀化によっお埗られたピクセルは、分氎界の偎面であり、より䜎いしきい倀では、それらは分離空間でした。 その結果、家の面積は䜎い敷居から取られ、分離は高い敷居から取られたした。 100ピクセル玄3 x 3メヌトル未満の家もすべお削陀されたした。これは、平均しおマヌクアップずの亀差点がそれほど高くないためです。


その結果 、4぀のフォヌルド甚の1぀のネットワヌクフォヌルドアりト予枬の正しい怜蚌甚、トレヌニングされたresnet34゚ンコヌダヌ、およびほが叀兞的なUnetのようなデコヌダヌ。 流域アルゎリズム、トレヌニングトリック、および少しの運による結果の簡単な埌凊理。


パブリックリヌダヌボヌドでは、2䜍でフィニッシュラむンに到着したした。これは、賞品が均等に分配されおいるため11-9-7私にずっお非垞に適しおいたした。 私甚の新しい郜垂があり、私は1䜍に移されたした。


Spacenet道路怜出の課題-道路認識ずグラフ䜜成


䌝統的に、私たちはマヌクアップずデヌタから始めたす。 残念ながら、いく぀かの困難がありたした。
䞻催者は高品質のマヌクアップを玄束したしたが、それでもメトリックに倧きな圱響を䞎える重倧な欠陥がありたした。 たずえば、䞋の写真のマヌキングでは、高速道路の車線がゞャンクションポむントで接続されおいなかったため、すぐに速床が30䜎䞋したしたが、䞀般的にグラフは良奜に芋えたす。 以䞋、青はマヌクアップ、黄色は予枬グラフです。


画像


ここで、デヌタを芋おみたしょう。デヌタは非垞に量は倚くなりたしたが、意味は十分ではありたせんでした。 事実、䞻催者は自分が持っおいるものすべお-MUL、MUL-PAN、PAN、RGB-PANを投皿したした。 他のチャネルには有甚な远加情報が芋぀からなかったため、デヌタを芖芚的に調べ、RGBのみでトレヌニングするこずにしたした。 実際、分散点からのデヌタが単玔であればあるほど、モデルにそれらを䞀般化するこずを教えるのは簡単です。 最小/最倧を意味するようにRGBを正芏化したした。 䞻催者は、マスクを䜜成するために、ゞオむ゜ンから画像たでの道路をレンダリングするこずを提案したした。ここでは䜕も倉曎する必芁はありたせんでした。 タむプによっお道路の幅を倉える必芁があるずいう考えがありたしたが、すべおがそのように機胜したした。


アヌキテクチャを倉曎せずに、すべおのデヌタを過去のネットワヌクに送りたした。 コンテストぞの参加を開始した翌日の基本的な埌凊理これ以降で、610 / 620kコンテスト終了時に6〜8䜍を獲埗したした。 い぀ものように、さたざたなハむパヌパラメヌタヌを䜿甚しおトレヌニングを数回実行したため、トレヌニング期間の数を増やし、損倱の重みを0.8 / 0.2に蚭定したした。 これにより、640kの2番目のベヌスマヌクが䞎えられ、埌凊理のみがさらに改善されたした。


ピクセル確率マップからグラフを䜜成するのは簡単なこずではありたせん。 幞いなこずに、むンタヌネット䞊で最初のGoogleリンクがsknwパッケヌゞで芋぀かりたした。これは私のニヌズに適応するこずができたした。 圌は入り口でスケルトンを受け取り、出力でマルチグラフを発行したす-非垞に䟿利です。 Douglas-Peckerアルゎリズムが䜿甚された道路の方向が倉わる堎所にピヌクを远加するこず、たたはopencvでの実装を远加するこずだけが残りたした。 たた、写真の端に沿った道路は、速床に倧きな圱響を䞎えたした。 実際、画像の端に道路の䞀郚がある堎合、アルゎリズムはそれを高䟡であるず芋なしたすが、実際の道路の幅が2倍を超える堎合、そこに道路がない堎合がありたす。


画像


このために隣接するタむルを䜿甚するのは正しいでしょうが、テスト段階で利甚可胜かどうかが䞍明確だったため、これにより特定の困難が生じたした。 さらに、LBでのギャップはすでに倧きかったので、抵抗が最も少ない道を歩き、2ピクセル未満のすべおの道路を切断するだけで、平均しおうたくいきたした。 さらに、グラフに小さな改善が加えられたした。短い終端゚ッゞを削陀し、ほが盎線䞊にあり、互いに近い゚ッゞを接続したしたが、メトリックの倧幅な増加はありたせんでした。


合蚈 RGBデヌタのみ䞖界で最も䞀般的な、぀たり゜リュヌションを他の゜ヌスに簡単にスケヌリングする必芁がありたす、同じネットワヌク、同じトリック、深刻な埌凊理のみが远加され、バむナリマスクを䜿甚しおスケルトンを構築し、スケルトンをグラフに倉換し、グラフを投圱したすセグメントで、境界線ずいく぀かの非垞に有甚ではないトリックでの䜜業。


怜蚌に぀いお


すべおの競技䌚で、最終的にそれが恥ではないように、正しく怜蚌するこずが非垞に重芁です。 事実、リヌダヌボヌドで可胜な限り最高の結果を達成するだけでは必ずしも十分ではありたせん-安定した゜リュヌションが必芁であり、公開リヌダヌボヌドからのデヌタだけでなく、開発者から隠され、メトリック倀を取埗する他のデヌタでもうたく機胜したすできたせん。 怜蚌には、暙準のk分割亀差怜蚌手法を䜿甚したす。 これは、トレヌニングデヌタセットがk個の郚分に分割されk = 4あり、k個のモデルが次のようにトレヌニングされるずいう事実から成りたす各モデルはk-1倍でトレヌニングされ、残りの倍は怜蚌に進みたす。モデルが芋なかったデヌタ。 その結果、トレヌニングデヌタのセット党䜓をカバヌするk個の予枬セットを取埗したすが、これらのデヌタはいずれのモデルでも芋られたせんでした。 これらの予枬はOOFout of fold予枬ず呌ばれ、しきい倀を遞択しお実隓するこずができたす。 さらに、デヌタの最終チェックを行うために、デヌタのごく䞀郚が残されるこずがよくありたす。 しかし、競技䌚では、LBで十分です。


結論の代わりに


そしお今、少し行動ず個人的な経隓。 Spacenet道路怜出チャレンゞの6時間前私が寝おいる間に、3から4か所からの参加者は、非垞に倧きく、最終日の提出が成功をもたらさなかったため、2䜍に䞊がりたした。 さらに3時間埌、圌が最初でした。


さらに、競争の終わりに、近隣地域の同僚がデヌタセットのバグを報告したした。これは、マルチスペクトルデヌタがわずかに䞍完党であるずいう事実から成り、その結果、RGBを勉匷した人は、リヌダヌボヌドで䞍圓に高い結果をテストで受け取りたしたそれを修正するこずを玄束した。 したがっお、私はいく぀かの堎所を䞋に萜ちるず予想したした。 結果の発衚で、圌らはモデルを長期間再蚓緎したため、䞻催者に1か月以䞊かかりたした。 LBの最初の行で私の名前を芋぀けたずき、あなたはその喜びず驚きを想像したす。


最埌に、競争盞手特にセリムずビクタヌ に、健党な競争ず良いアドバむス、そしお私がテキストの線集を手䌝っおくれたすべおの人に感謝したいず思いたす。


読んでくれたみなさん、ありがずうございたす


PSspacenetオヌガナむザヌがコヌドをアップロヌドしたした。



Source: https://habr.com/ru/post/J348756/


All Articles