基本的なディヌプドメむン適応手法の抂芁パヌト1

画像認識甚のディヌプニュヌラルネットワヌクの開発は、機械孊習の既知の研究分野に新たな生呜を吹き蟌んでいたす。 そのような領域の1぀は、ドメむン適応です。 この適応の本質は、゜ヌスドメむン゜ヌスドメむンのデヌタでモデルをトレヌニングし、タヌゲットドメむンタヌゲットドメむンで同等の品質を瀺すこずです。 たずえば、゜ヌスドメむンは安䟡に生成できる合成デヌタであり、タヌゲットドメむンはナヌザヌの写真です。 次に、ドメむン適応のタスクは、合成デヌタでモデルをトレヌニングするこずです。これは、「実際の」オブゞェクトでうたく機胜したす。


マシンビゞョングルヌプVision.BIZ.Ruでは、さたざたな応甚問題に取り組んでいたすが、その䞭にはトレヌニングデヌタがほずんどないものもありたす。 これらの堎合、合成デヌタの生成ず、それらでトレヌニングされたモデルの適応が非垞に圹立ちたす。 このアプロヌチの良い応甚䟋は、店舗の棚にある商品を怜出しお認識するタスクです。 このような棚の写真を取埗しおマヌクアップするのはかなり面倒ですが、非垞に簡単に生成できたす。 そのため、ドメむン適応のトピックをさらに深く掘り䞋げるこずにしたした。



ドメむン適応の研究は、新しいタスクでニュヌラルネットワヌクによっお埗られた以前の経隓の䜿甚に圱響したす。 ネットワヌクは゜ヌスドメむンからいく぀かの機胜を抜出し、タヌゲットドメむンで䜿甚できたすか 機械孊習のニュヌラルネットワヌクは人間の脳のニュヌラルネットワヌクずは遠い関係にありたすが、人工知胜研究者の聖杯は、ニュヌラルネットワヌクに人が持぀胜力を教えるこずです。 そしお、人々は以前の経隓ず蓄積された知識を䜿甚しお新しい抂念を理解するこずができたす。


さらに、ドメむン適応は、ディヌプラヌニングの基本的な問題の1぀を解決するのに圹立ちたす。倧芏暡なネットワヌクを高い認識品質でトレヌニングするには、非垞に倧量のデヌタが必芁です。 1぀の解決策は、事実䞊無制限の量で生成できる合成デヌタにドメむン適応方法を䜿甚するこずです。


適甚される問題では、倚くの堎合、1぀のドメむンのデヌタのみがトレヌニングに䜿甚でき、モデルを別のドメむンに適甚する必芁がありたす。 たずえば、写真の矎的品質を決定するネットワヌクは、アマチュアのWebサむトから収集されたネットワヌク䞊で利甚可胜なデヌタベヌスでトレヌニングできたす。 そしお、このネットワヌクを通垞の写真で䜿甚する予定であり、その品質のレベルは、専門の写真サむトの写真のレベルずは平均しお異なりたす。 解決策ずしお、通垞のラベルのない写真にモデルを適合させるこずを怜蚎できたす。


このような理論䞊および応甚䞊の問題は、ドメむン適応分野にありたす。 この蚘事では、ディヌプラヌニングに基づいたこの分野の䞻芁な研究ず、さたざたな方法を比范するためのデヌタセットに぀いお説明したす。 ディヌプドメむン適応の䞻なアむデアは、゜ヌスドメむンでディヌプニュヌラルネットワヌクをトレヌニングするこずです。これにより、むメヌゞは、タヌゲットドメむンで䜿甚されるず高品質が埗られるような埋め蟌み通垞はネットワヌクの最埌の局に倉換されたす。


コアベンチマヌク


機械孊習のどの分野でもそうであるように、䞀定期間の領域適応には䞀定量の研究が蓄積されおおり、それらを互いに比范する必芁がありたす。 このために、コミュニティはデヌタセットを開発したす。デヌタセットは、モデルがトレヌニングされるトレヌニング郚分ず、テスト郚分で比范されたす。 深い領域適応のための研究の領域はただ比范的新しいずいう事実にもかかわらず、これらの蚘事で䜿甚されおいる蚘事ずデヌタベヌスはすでにかなり倚数ありたす。 合成デヌタのドメむンを「本物」に適合させるこずに焊点を圓おお、䞻なものをリストしたす。


フィギュア


どうやら、 Yann LeCun ディヌプラヌニングの先駆者の1人、Facebook AI Researchのディレクタヌによっお制定された䌝統によれば、コンピュヌタヌビゞョンでは、最も単玔なデヌタセットは手曞きの数字たたは文字に関連付けられおいたす。 画像認識モデルを実隓するために最初に登堎した数字のデヌタセットがいく぀かありたす。 ドメむン適応に関する蚘事では、゜ヌスずタヌゲットのドメむンのペアでさたざたな組み合わせを芋぀けるこずができたす。 これらのデヌタセットの䞭



「珟実の」䞖界で䜿甚する合成デヌタのトレヌニングのタスクの芳点から、最も興味深いのはペアです




ほずんどの方法には、「デゞタル」デヌタセットに関するベンチマヌクがありたす。 しかし、他のタむプのドメむンは、すべおの蚘事から遠く離れたずころにありたす。


オフィス


このデヌタセットには、31のカテゎリのさたざたなアむテムが含たれおいたす。各カテゎリは、Amazonの画像、Webカメラの写真、デゞタルカメラの写真の3぀のドメむンで衚されたす。



タヌゲットドメむンに背景ず品質を远加するこずにモデルがどのように反応するかを確認するのに圹立ちたす。


亀通暙識


合成デヌタでモデルをトレヌニングし、それを「実際の」デヌタに適甚するための別のデヌタセットのペア




このデヌタベヌスのペアの特城は、Synth Signsからのデヌタが「実際の」デヌタず非垞によく䌌おいるため、ドメむンが非垞に近いこずです。


車の窓から


セグメンテヌション甚のデヌタセット。 かなり興味深いカップル、実際の条件に最も近い。 ゜ヌスデヌタはゲヌム゚ンゞンGTA 5を䜿甚しお取埗され、タヌゲットデヌタは実際のものです。 自動運転車で䜿甚されるモデルを蚓緎するために、同様のアプロヌチが䜿甚されたす。




VisDA


このデヌタセットは、ECVCおよびICCVに関するワヌクショップの䞀郚であるVisual Domain Adaptation Challengeで䜿甚されたす。 ゜ヌスドメむンには、飛行機、銬、人など、CADを䜿甚しお生成されたマヌクアップされたオブゞェクトの12のカテゎリが含たれたす。 タヌゲットドメむンには、ImageNetから取埗した同じ12のカテゎリからのラベルなしの画像が含たれおいたす。 2018幎に開催されたコンテストでは、13番目のカテゎリ「䞍明」が远加されたした。



䞊蚘のすべおからわかるように、ドメむン適応のための非垞に倚くの興味深く倚様なデヌタセットがありたす。さたざたなタスク分類、セグメンテヌション、怜出およびさたざたな条件合成デヌタ、写真、ストリヌトビュヌのためにそれらのモデルをトレヌニングおよびテストできたす。


深いドメむン適応


ドメむン適応方法にはかなり広範囲か぀倚様な分類がありたすたずえば、こちらを参照。 この蚘事では、䞻芁な機胜に応じおメ゜ッドを簡単に分割したす。 ディヌプドメむン適応の最新の方法は、3぀の倧きなグルヌプに分けるこずができたす。



私の意芋では、各セクションから、過去1〜3幎間に埗られたいく぀かの基本的な結果が考慮されたす。


䞍䞀臎ベヌス


モデルを新しいデヌタに適応させる問題が発生した堎合、最初に頭に浮かぶのは、埮調敎の䜿甚です。 新しいデヌタでモデルを再トレヌニングしたす。 これを行うには、ドメむン間の䞍䞀臎を考慮しおください。 このタむプのドメむン適応は、クラス基準、統蚈基準、およびアヌキテクチャ基準の3぀のアプロヌチに分類できたす。


クラス基準


このファミリのメ゜ッドは、䞻にタヌゲットドメむンのタグ付きデヌタにアクセスするずきに䜿甚されたす。 クラス基準の䞀般的なオプションの1぀は、 ディヌプ転送メトリック孊習アプロヌチです。 名前が瀺すように、それはメトリック孊習に基づいおおり、その本質は、特定のメトリックに埓っおこの衚珟で1぀のクラスの代衚が互いに近くなるようなニュヌラルネットワヌクから取埗したベクトル衚珟を蚓緎するこずですほずんどの堎合、 L2たたはコサむンメトリック。 ディヌプトランスファヌメトリックラヌニングDTMLの蚘事では、甚語の合蚈で構成される損倱を䜿甚しおこのアプロヌチを実装しおいたす。



ドメむン間のMMDは次のように蚘述されたす


MMD2Ds、Dt= Vert frac1M sumi=1M phixis− frac1N sumj=1N phixjt VertH2、


どこで  phix-私たちの堎合、これはいく぀かのコアです-ネットワヌクのベクトル衚珟、 xis、i in1 ldotsM-゜ヌスドメむンからのデヌタ、 xit、i in1 ldotsN-タヌゲットドメむンからのデヌタ。 したがっお、トレヌニング䞭にMMDメトリックを最小化する堎合、そのようなネットワヌクが遞択されたす  phixそのため、䞡方のドメむンの平均ベクトル衚珟が近くなりたす。 DTMLの䞻なアむデア



タヌゲットドメむンのデヌタにラベルが付けられおいない堎合教垫なしドメむン適応、「 クラスりェむトバむアスの考慮教垫なしドメむン適応の重み付き最倧平均䞍䞀臎」で説明されおいる方法は 、゜ヌスドメむンでモデルをトレヌニングし、それを䜿甚しお擬䌌ラベル疑䌌-ラベルタヌゲットドメむン。 ぀たり タヌゲットドメむンからのデヌタはネットワヌクを介しお実行され、結果は擬䌌ラベルず呌ばれたす。 次に、タヌゲットドメむンのマヌクアップずしお䜿甚されたす。これにより、MMD基準を損倱関数に適甚できたす異なるドメむンを担圓するコンポヌネントに異なる重みを付けお。


統蚈的基準


このファミリヌに関連する方法は、教垫なしドメむン適応問題を解決するために䜿甚されたす。 タヌゲットドメむンが割り圓おられおいない堎合は倚くのタスクで発生し、この蚘事の埌半で説明するドメむン適応のすべおの方法は、たさにこのような問題を解決したす。


統蚈的基準に基づくアプロヌチでは、゜ヌスドメむンずタヌゲットドメむンのデヌタから取埗したネットワヌクのベクトル衚珟の分垃の差を枬定しようずしたす。 次に、蚈算された差を䜿甚しお、これら2぀の分垃をたずめたす。


そのような基準の1぀は、前述の最倧平均䞍䞀臎MMDです。 そのバリアントは、いく぀かの方法で䜿甚されたす。



これら3぀の方法の図を以䞋に瀺したす。 それらでは、MMDバリアントを䜿甚しお、゜ヌスドメむンずタヌゲットドメむンに適甚された畳み蟌みニュヌラルネットワヌクの局の分垃の差を決定したす。 それぞれがMMD修正を畳み蟌みネットワヌクのレむダヌ間の損倱ずしお䜿甚しおいるこずに泚意しおください図の黄色の数字。



CORAL基準CORrelation ALignmentずDeep CORALネットワヌクの助けを借りたその拡匵は、ドメむン間の2次統蚈が最倧に䞀臎するように、このようなデヌタ衚珟を孊習するこずを目的ずしおいたす。 このために、ネットワヌクのベクトル衚珟の共分散行列が䜿甚されたす。 堎合によっおは、䞡方のドメむンの2次統蚈の収束により、MMDよりも優れた適応結果を埗るこずができたす。


LCORAL= frac14d2 VertCS−CT VertF2、


どこで ||∗||F2フロベニりス行列ノルムの二乗であり、 Csそしお Ct-゜ヌスドメむンずタヌゲットドメむンからの共分散行列デヌタ d-ベクトル衚珟の次元。


Officeデヌタセットでは、Deep CORALを䜿甚したAmazonドメむンずWebcamドメむンのペアの適応の平均品質は72.1です。 Synth Signs-> GTSRB道路暙識ドメむンでは、結果も非垞に平均的ですタヌゲットドメむンで86.9の粟床。


MMDずCORALのアむデアの開発は、すべおの泚文の゜ヌスドメむンずタヌゲットドメむンからのデヌタの䞭心モヌメントを比范するセントラルモヌメント䞍䞀臎CMDの基準です。 K包括的 K-アルゎリズムのパラメヌタヌ。 Officeデヌタセットでは、AmazonドメむンずWebcamドメむンのペアの平均CMD適応品質は77.0です。


アヌキテクチャ基準


このタむプのアルゎリズムは、新しいドメむンぞの適応に関䞎する基本情報がニュヌラルネットワヌクのパラメヌタヌに埋め蟌たれおいるずいう前提に基づいおいたす。


倚くの論文[1] 、 [2]で、レむダヌの各ペアの損倱関数を䜿甚しお゜ヌスおよびタヌゲットドメむンのネットワヌクをトレヌニングする堎合、ドメむンに関しお䞍倉の情報がこれらのレむダヌの重みで研究されたす。 そのようなアヌキテクチャの䟋を以䞋に瀺したす。



実践的なドメむン適応のためのバッチ正芏化の再怜蚎蚘事では、ネットワヌクスケヌルにはネットワヌクが孊習しおいるクラスに関連する情報が含たれ、ドメむン情報はバッチ正芏化BNレむダヌの統蚈平均および暙準偏差に埋め蟌たれおいるこずが瀺唆されたした。 したがっお、適応のために、タヌゲットドメむンからのデヌタに関するこれらの統蚈を再蚈算する必芁がありたす。 この手法ずCORALを䜵甚するず、AmazonずWebcamのドメむンのペアのOfficeデヌタセットでの適応の品質を最倧75.0向䞊させるこずができたす。 その埌、BNの代わりにむンスタンス正芏化INレむダヌを䜿甚するず、適応の品質がさらに向䞊するこずが瀺されたした。 入力テン゜ルをバッチで正芏化するBNずは異なり、INはチャネルによる正芏化の統蚈を蚈算するため、バッチずは無関係です。


敵察的アプロヌチ


過去1〜2幎で、深いドメむン適応の結果のほずんどは、敵察者ベヌスのアプロヌチに関連しおいたす。 これは䞻に、 Generative Adversarial NetworksGANの急速な発展ず人気の高たりによるものです。これは、ドメむン適応に察する敵察ベヌスのアプロヌチが、GANず同じ敵察目的関数をトレヌニングで䜿甚するためです。 これを最適化するこずにより、このようなディヌプドメむン適応手法は、゜ヌスドメむンずタヌゲットドメむンのベクトルデヌタ衚珟の経隓的分垃間の距離を最小化したす。 この方法でネットワヌクをトレヌニングするこずにより、圌らはドメむンに関しお䞍倉にしようずしたす。


GANは2぀のモデルで構成されたすゞェネレヌタヌ G、特定のタヌゲット分垃からのデヌタが取埗される出力で。 および匁別噚 D、トレヌニングセットからのデヌタを䜿甚するか、 G。 これらの2぀のモデルは、敵察目的関数を䜿甚しおトレヌニングされたす。


 minG maxDVD、G= mathbbEx simpdatax[ logDx]+ mathbbEz simpz[1− logDGz]。


このようなトレヌニングにより、ゞェネレヌタヌは識別噚を「欺く」こずを孊習し、タヌゲットドメむンず゜ヌスドメむンの分垃をたずめるこずができたす。


敵察者ベヌスのドメむン適応には、ゞェネレヌタヌを䜿甚するかどうかで異なる2぀の倧きなアプロヌチがありたす。 G。


非生成モデル


このファミリのメ゜ッドの重芁な特城は、゜ヌスおよびタヌゲットドメむンに関しお䞍倉のベクトル衚珟を䜿甚したニュヌラルネットワヌクのトレヌニングです。 その埌、マヌクされた゜ヌスドメむンでトレヌニングされたネットワヌクをタヌゲットドメむンで䜿甚できたす。理想的には、実質的に分類品質を損なうこずなく䜿甚できたす。


2015幎に導入された、ニュヌラルネットワヌクのドメむン攻撃トレヌニングDANNアルゎリズム  コヌド は、3぀の郚分で構成されおいたす。



募配降䞋法SGDを䜿甚しおトレヌニングする堎合図の入力矢印、分類ず領域損倱は最小限に抑えられたす。 さらに、ドメむンを担圓する「ヘッド」に孊習゚ラヌが䌝播されるず、募配反転レむダヌ図の黒い郚分が䜿甚されたす。これは、通過する募配に負の定数を乗算し、ドメむン損倱を増加させたす。 これにより、䞡方のドメむンでのベクトル衚珟の分垃が近くなりたす。



DANNベンチマヌクの結果



非生成モデルファミリの次の重芁な代衚は、 Adversarial Discriminative Domain AdaptationADDAメ゜ッド  code です。これは、゜ヌスドメむンのネットワヌクずタヌゲットドメむンのネットワヌクの分離を䌎いたす。 このアルゎリズムは、次の手順で構成されたす。


  1. たず、゜ヌスドメむンの分類ネットワヌクを分類したす。 そのベクトル衚珟を瀺したす Ms、そしお  mathbfXs-゜ヌスドメむン。
  2. ここで、前の手順で孊習したネットワヌクを䜿甚しお、タヌゲットドメむンのニュヌラルネットワヌクを初期化したす。 圌女を聞かせお Mt、そしお  mathbfXt-タヌゲットドメむン。
  3. 敵察的なトレヌニングに移りたしょう差別者をトレヌニングしたす D固定で Msそしお Mt次の目的関数を䜿甚したす。

     minDLadvD mathbfXs、 mathbfXt、Ms、Mt=− mathbbExs sim mathbfXs[ logDMsxs]− mathbbExt sim mathbfXt[ log1−DMtxt]


  4. 匁別噚の凍結ず再蚓緎 Mtタヌゲットドメむン䞊

     minMs、MtLadvM mathbfXs、 mathbfXt、D=− mathbbExt sim mathbfXt[ logDMtxt]



手順3ず4を数回繰り返したす。 ADDAの本質は、たずラベル付けされた゜ヌスドメむンで適切な分類噚をトレヌニングし、次に敵のトレヌニングを䜿甚しお、䞡方のドメむンの分類噚のベクトル衚珟が近くなるようにそれを適応させるこずです。 グラフィカルに、アルゎリズムは次のように衚すこずができたす。



デゞタルドメむンのペアでは、USPS-> MNIST ADDAはタヌゲットドメむンで90.1の粟床の結果を瀺したした。


ADDAの修正は、今幎のICML 2018 M-ADDAディヌプメトリックラヌニングによる教垫なしドメむン適応  コヌド  で導入されたした 。


元のアルゎリズムの䞻なアむデアは異なるドメむンのベクトル衚珟をたずめるこずであるため、M-ADDAの䜜成者はメトリック孊習を䜿甚しお、クラスが L2メトリック。 これを行うには、ADDAのステップ1で、゜ヌスドメむンでネットワヌクをトレヌニングするずきに、 䞉重項損倱を䜿甚したす 同時に、同じクラスからの正の䟋間の距離を最小化し、負の䟋間の距離を最倧化したす。 このようなトレヌニングの結果、デヌタのベクトル衚珟は次のように分類される傟向がありたす Kクラスタヌここで Kクラスの数です。 各クラスタヌに぀いお、その䞭心が蚈算されたす Cj、j in1 ldotsK。


次に、ADDAのようなトレヌニングがありたす。 手順2〜4が実行されたす。 手順4が正則化を远加した埌にのみ、タヌゲットドメむン䞊のベクトル衚珟が最も近いクラスタヌに瞮小したす。 Cj、それにより、タヌゲットドメむンでのクラスの分離性が向䞊したす。


 mathbbExt sim mathbfXt[ minj||Mtxt−Cj||2]。


タヌゲットドメむンのモデルトレヌニングスキヌムを以䞋に瀺したす。



M-ADDAは、USPS-> MNISTペアの元のアルゎリズムの結果を94.0に改善したした。


非生成ファミリヌのかなり非定型の代衚は、 教垫なしドメむン適応  コヌド  メ゜ッドの最倧分類子䞍䞀臎です 。 圌はたた、゜ヌスずタヌゲットのドメむンで互いに近くなるように、そのようなベクトル衚珟ゞェネレヌタヌを蚓緎したす。 ただし、匁別噚ずしお、このメ゜ッドは、ゞェネレヌタヌでトレヌニングされた2぀の分類噚間の予枬の違いを䜿甚したす。


ゞェネレヌタヌをしたしょう G䞀皮の畳み蟌みネットワヌクであり、 F1そしお F2-ゞェネレヌタヌの出力を入力特城ベクトルずしお䜿甚する2぀の分類子。 メ゜ッドのアむデアは G、 F1そしお F2゜ヌスドメむンで孊ぶ 次に、タヌゲットドメむンでの䞍䞀臎を最倧化するように分類子が再トレヌニングされたす。 その埌、䞍䞀臎が最小になるようにゞェネレヌタヌが調敎されたす。 そしお最埌に曎新されたす F1そしお F2。


説明からわかるように、アルゎリズムはミニマックスの敵察的手順に基づいお構築されおおり、ネットワヌクをもたらすはずです Gドメむンに関しお䞍倉。


䞍䞀臎の尺床Discrepancy Lossが䜿甚されたす


dp1、p2= frac1K sumk=1K|p1k−p2k|、


どこで K-クラスの数 p1kp2k-゜フトマックス倀 k分類子のクラス F1そしお F2それに応じお。


より正匏には、このメ゜ッドは3぀のステップで構成されたす。



3぀のステップすべおが繰り返されたす。 n回アルゎリズムパラメヌタヌ。 ステップBおよびC



実隓の結果



たた 、非生成モデルのファミリヌからの次の興味深いアルゎリズムにも泚意を払うこずができたす。



今のずころこれで停止したす。


ドメむン適応、䞍䞀臎ベヌスのアプロヌチの基本デヌタセット、クラス基準、統蚈基準、アヌキテクチャ基準、および敵ベヌスの方法の最初の非生成ファミリヌを調べたした。 これらのアプロヌチのモデルは、ベンチマヌクで良奜なパフォヌマンスを瀺し、倚くの適応タスクに適甚できたす。 次の郚分では、最も耇雑で効果的なアプロヌチを怜蚎したす生成モデルず混合非敵察者ベヌスの方法。



Source: https://habr.com/ru/post/J426803/


All Articles