LIFT孊習した䞍倉特城倉換

画像


はじめに


近幎、ナビキタスニュヌラルネットワヌクはさたざたな知識分野でたすたす倚くのアプリケヌションを発芋し、長幎䜿甚されおきた叀兞的なアルゎリズムに取っお代わりたした。 コンピュヌタヌビゞョンの分野も䟋倖ではありたせん。そこでは、珟代のニュヌラルネットワヌクの助けを借りお、幎々、より倚くのタスクが解決されおいたす。 戊争で倒れた別の戊闘機、䌝統的なビゞョン察ディヌプラヌニングに぀いお曞く時です。 1999幎に提案されたSIFTScale-invariant Feature Transformアルゎリズムは、長幎にわたり、画像の局所的な特城いわゆるキヌポむントを怜玢するタスクで最高䜍に君臚し、倚くの人が頭を折り返しおそれを超えようずしたしたが、成功したのは深局孊習のみでした。 それでは、新しいロヌカルフィヌチャ怜玢アルゎリズム-LIFTLearned Invariant Feature Transformに䌚っおください。


デヌタの必芁性


画像


ディヌプラヌニングが機胜するためには、倧量のデヌタが必芁です。そうしないず、魔法が機胜したせん。 そしお、すべおの皮類のデヌタは必芁ありたせんが、解決したい問題の代衚的な衚珟ずなるデヌタです。 それでは、特異点の人工怜出噚/蚘述子ができるこずを芋おみたしょう



さお、ポむントの集合を含むデヌタセットが必芁です。特定のポむントごずに、さたざたな角床から受信したサンプルがたくさんありたす。 もちろん、任意の写真を撮り、そこからドットを切り取り、合成的に生成されたアフィン倉換を䜿甚しお、任意の倧きなサむズのデヌタ​​セットを取埗できたす。 しかし、モデリングの粟床には垞にいく぀かの制限があるため、合成は悪いです
実際のケヌス。 コンピュヌタビゞョンのいく぀かの適甚された問題を解決するずきに、芁件を満たす実際のデヌタセットが発生したす。 たずえば、いく぀かの角床から撮圱されたシヌンの3D再構築の堎合、次のようなこずを行いたす。



このようなアルゎリズムの操䜜の副産物ずしお、各クラりドのポむントが取埗されたす。各クラりドの3Dポむントは、シヌンフレヌム䞊の2D䜍眮投圱のいく぀かに察応しおいたす。 このクラりドは、必芁なデヌタセットにすぎたせん。 特にStructure From Motionの耇雑さに煩わされるこずなく、著者は3D再構築のために公開されおいるいく぀かのデヌタセットを取埗し、公開されおいる点矀構築ツヌルVisualSFMを介しお実行し、取埗したデヌタセットを実隓で䜿甚したした。 䌝えられるずころでは、そのようなセットでトレヌニングされたグリッドは、他のタむプのシヌンにも䞀般化されおいたす。


ネット、ネット、ネット


画像


デヌタセットを理解したので、最も興味深いもの、぀たりグリッドの研究に移りたしょう。 グリッド党䜓を3぀の論理ブロックに分割できたす。



たず、このモデル党䜓の掚論を怜蚎し、次にすべおのブロックを個別に怜蚎し、どのように正確にトレヌニングするかを怜蚎したす。


掚論


画像
特異点の怜玢ずその蚘述子の蚈算は、いく぀かの段階で行われたす。



蚘述子


SIFTの機胜以来、真にナニヌクなポむントを芋぀けるのが特に埗意ではないが、それらのそれぞれに察しおクヌルな蚘述子を構築できる堎合でも、問題を解決できる可胜性が高いこずが知られおいたす。 したがっお、レビュヌは最埌から、぀たり、すでに芋぀かった特異点の蚘述子の構築から始めたす。 䞀般的に、画像パッチを入力ずしおずる畳み蟌みグリッドは、この画像の特定の蚘述を出力したす。これは既に蚘述子ずしお䜿甚できたす。 しかし、実践が瀺すように、たずえばVGG16、ResNet-152、Inceptionなどの巚倧なネットワヌクを䜿甚する必芁はありたせん。小さなネットワヌクで十分です双曲線正接の圢でアクティブ化される2〜3の畳み蟌み局
正芏化バッチなどのその他の小さなもの


明確にするために、ネットワヌク蚘述子を瀺したす d=hpp theta どこで h... -蚘述子畳み蟌みネットワヌク、 p -そのパラメヌタヌ、 p theta -角床がれロのパッチ回転掚定噚から取埗。


特異点ごずに、2぀のペアを䜜成したす。



孊習プロセスでは、次の圢匏の損倱関数を最小化したす。


Ldescpk theta、pl theta= begincases |hppk theta−hppl theta |2、\正の堎合max0、C− |hppk theta−hppl theta |2、\ネガの endcases

、、正の堎合、、ネガの


぀たり 実際、類䌌ポむント間のナヌクリッド距離を小さくし、互いに類䌌しおいないポむント間の距離を遠くにしたいず考えおいたす。


回転掚定噚


空間の異なるポむントからだけでなく、異なる傟斜角からも同じポむントを芳察できるため、芳察する角床に関係なく、同じ特異点に察しお同じ蚘述子を構築できる必芁がありたす。 しかし、Descriptorに同じポむントのすべおの可胜な傟斜角を蚘憶するように教える代わりに、空間内のパッチの方向を決定する䞭間蚈算ナニットRotation Estimatorを䜿甚しお、回転に䞍倉な独自の状態にパッチを「回す」こずを提案したすSpatial倉換。 もちろん、SIFT特城を構築するためのアルゎリズムから取埗した空間内のパッチの方向を蚈算するためにナニットを䜿甚できたすが、21䞖玀の窓の倖では、コンピュヌタヌビゞョンのタスクを機械孊習に枛らすこずが䞀般的です。 そこで、別の畳み蟌みニュヌラルネットワヌクを䜿甚しおこの問題を解決したす。


したがっお、ニュヌラルネットワヌクを次のように瀺したす。  theta=g phip どこで  phi -ネットワヌクパラメヌタ、および p -゜ヌスパッチ。


トレヌニングサンプルずしお、パッチのペアを取りたす P1 、 P2 1぀の特異点に属するが、異なる傟斜角ず空間座暙を持぀ x1 、 x2 。


孊習プロセスでは、次の損倱関数を最小化したす。


L方向P1、x1、P2、x2= |hpGP1、x1−hpGP2、x2 |2

方向、、、、、


どこで Gp、x、 -向きを修正する手順の埌に受け取ったパッチ、 GP、x=RotP、x、g phiクロップP、x、、、クロップ、 。


぀たり ネットワヌクをトレヌニングするずき、蚘述子間のナヌクリッド距離が最小になるように、異なる傟斜角でパッチをラップしたす。


怜出噚


最埌のステップ、぀たり、元の画像の特異点の盎接怜出を怜蚎する必芁がありたす。 このネットワヌクの本質は、画像党䜓がそれを介しお駆動されるこずであり、出力では、特定の特城マップが期埅されたす。その特城点は、元の画像の特別な点に察応したす。


モデルの掚論により、怜出噚は画像党䜓で䞀床に起動したすが、トレヌニング䞭に個々のパッチに察しおのみ実行したす。


怜出噚の蚈算は2぀のステップで構成されたす。最初に、パッチのスコアマップを蚈算する必芁がありたす。次に、特異点の䜍眮を決定したす。


S=f muP= sumNn betan maxMmWmn∗P+bmn


次に、特異点の䜍眮を蚈算したす。


x=softargmaxS


どこで softargmax 蚈算の結果の重みで重み付き重心を蚈算する関数です softmax 


softargmaxS= frac sumy exp betaSyy sumy exp betaSy


ここで、yはスコアマップ内の䜍眮です \ベヌタ -softmax関数の「がやけ」の係数を担圓するハむパヌパラメヌタヌ。


怜出噚をトレヌニングするずき、4぀のパッチを䜿甚したす P1、P2、P3、P4 どこで P1、P2 -同じ特異点の投圱、 P3 -別の特異点の投圱、 P4 -特定のポむントに属さないパッチ。 このようなパッチを収集するには、次の損倱関数を最小化したす。


L怜出噚P1、P2、P3、P4= gammaLクラスP1、P2、P3、P4+LペアP1、P2


どこで \ガンマ -損倱関数の2぀のメンバヌのバランス調敎パラメヌタヌ。
正負の正しい分類を担圓する損倱䌚員


LclassP1、P2、P3、P4= sum4i=1 alphaimax0、1−softmaxf muPiyi2


特異点の正確なロヌカリれヌションを担圓する損倱メンバヌ


LpairP1、P2= |hpGP1、softargmaxf muP1−hpGP2、softargmaxf muP2 |2


トレヌニング


画像


ネットワヌク党䜓は、ファッショナブルな今日の゚ンドツヌ゚ンド方匏でトレヌニングされおいたす。 シャムネットワヌクずしおネットワヌクのすべおの郚分を䞊行しおすぐに孊習したす。 同時に、トレヌニング䞭に䜿甚される4぀のパッチのそれぞれに぀いお、重みがバランスされたネットワヌクの別個のブランチが䜜成されたす。


実隓


画像

著者らは、特異点を芋぀けるために以前に利甚可胜な方法ず比范しお、圌らのアプロヌチは最先端であるず結論付けたした。


そしお、圌らのネットワヌクの結果は次のビデオで芋るこずができたす



おわりに


提瀺された䜜品は、コンピュヌタヌビゞョンの埓来の方法の時代が過ぎおいるずいう事実のさらに別の確認であり、サンツの日付の時代に眮き換えられおいたす。 繰り返しになりたすが、いく぀かの難しい問題を解決する機知に富んだヒュヌリスティックを発明するこずを怜蚎する必芁がありたす。コンピュヌタヌが数癟䞇のヒュヌリスティックを個別に゜ヌトし、タスクを最良の方法で解決するものを遞択できるように問題を定匏化するこずは可胜ですか


参照資料



ご枅聎ありがずうございたした。


PS投皿は、 サヌクルでの1぀のディスカッションの結果であり、それに関連しお著者の音節では十分な文孊的ではない堎合がありたす。



Source: https://habr.com/ru/post/J323688/


All Articles