「あなたのために蚘事を読む」ずいう芋出し。 2017幎9月


こんにちは、Habr 私たちは䌝統を継続し、チャネル#a​​rticle_essenseからオヌプンデヌタサむ゚ンスコミュニティのメンバヌから科孊蚘事のレビュヌを毎月リリヌスしたす。 誰よりも早くそれらを受け取りたい堎合は、 ODSコミュニティに参加しおください


蚘事は、個人的な興味から、たたは進行䞭のコンテストに近いために遞択されたす。 蚘事の説明は倉曎せずに、著者がチャンネル#article_essenceに投皿した圢匏で提䟛されるこずを思い出しおください。 あなたがあなたの蚘事を提䟛したい堎合、たたはあなたが垌望を持っおいる堎合-コメントを曞くだけで、私たちは将来的にすべおを考慮に入れようずしたす。


今日の蚘事


  1. 機械孊習応甚蚈量経枈孊的アプロヌチ
  2. スクむズおよび励起ネットワヌク
  3. 拡匵畳み蟌みを䜿甚したテキストモデリング甚の改善された倉分オヌト゚ンコヌダ
  4. CNNず同じ速さでRNNをトレヌニングする
  5. 自動゚ンコヌダヌの倉換
  6. 動䜜が集合論に䟝存しない比范的小さなチュヌリングマシン
  7. さたざたな寿呜の暹朚皮におけるテロメア長ずテロメラヌれ掻性の分析、およびむガゎペりマツの幎霢
  8. 途方もなく倧芏暡なニュヌラルネットワヌク疎ゲヌトの専門家の混合局
  9. 意識優先

1.機械孊習応甚蚈量経枈孊的アプロヌチ


→ オリゞナル蚘事
投皿者dr_no


゚ントリヌ


MLなどの重芁性に぀いお など、蚈量経枈孊者ず高次元デヌタの芳点から、ML、ビッグデヌタず経枈孊、 LASSOのむントロに関する出版物ぞのリンクがありたす。 回垰問題における差および関係パラメヌタヌの掚定ず予枬に぀いお。


機械孊習の仕組み


問題の蚘述は、教垫あり機械孊習、最小二乗法の比范、回垰ツリヌ回垰ツリヌ、LASSO、ランダムフォレスト700ツリヌ䞭、オヌバヌフィット/クロス怜蚌/ cfoldsに぀いおです。


さたざたなアプロヌチの結果の評䟡


さらに、正則化、モデルパラメヌタヌの経隓的ツむストのアむデアを進めたす。


経枈的問題ぞの適甚に぀いおさらに
0モデル遞択;
1デヌタの準備/倉換。
2正芏化の察象ずなる掟生的特城郚屋の数に察する面積の割合などの重芁性、倚数の類䌌する特城の蚈算の困難性など。
3チュヌニング、ここでの考え方は、蚈量経枈孊は、䞀方では蚭蚈の遞択フォヌルドの数、予枬関数のタむプを支揎するこずにより、他方では、予枬の最終的な品質を決定するこずにより支揎するこずです2番目に、圓おはめられた予枬関数ホヌルドアりトサンプルにより、近䌌関数の予枬特性に関する適切なサむズのテストを正確に䜜成できたす。


機械孊習の出力から䜕を孊べるか孊ばないか


予枬関数に基づいおシミュレヌトされたプロセスのパタヌンを芋぀けようずする詊みの無意味さに぀いお。 家の䟡栌を予枬するずきにN の倉数N 関係しない堎合、これはこの芁玠が重芁ではないこずを意味したすか そのような結論は間違っおいたす。


そのような結論の問題は、係数の暙準誀差がないこずです。 その結果が線圢関数であるモデルであっおも、これは問題です。理由はモデルの遞択にある可胜性があるためです。


このような問題の別の䟋は、゜ヌスデヌタのサブセットで同等の品質を備えた元のモデルLASSO予枬子に類䌌した10モデルの再構築です。


䞊蚘の理由は、盞関、機胜の互換性です。 最終的な遞択はデヌタに䟝存したす。 さらに、埓来のアプロヌチでは、芳枬倀の盞関が倉数の最終効果を凊方する倧きな暙準誀差に反映されるず述べられおいたす。


MLでは、膚倧な数の異なる関数を取埗でき、異なる係数により同等の予枬品質が埗られたす。 正則化は、火灜に燃料を远加するだけで、耇雑さの少ない、したがっおより䞍正確なモデルを遞択するこずを䜙儀なくされ、倉数バむアスの省略による䜓系的な゚ラヌをもたらしたす。


それでも、モデルは時々、シミュレヌトされたものの性質に぀いお考えるための食物を提䟛できたす。
そしお、ML、ビッグデヌタ、絶察に䞀芋無関係なタスク倜間照明ず経枈指暙を解決するための衛星画像の䜿甚に関する倚くのむンスピレヌションを䞎えるスピヌチがあり、同様のタスクが他の応甚分野で䞎えられ、結論が匕き出されたす。 たずえば、裁刀官の決定のタスク拘犁埌、裁刀官は、被告人が自宅で聎聞䌚を埅぀か、バヌの埌ろで埅぀かを決定しなければなりたせん。


蚈量経枈孊者ぞの利益の芳点からの教垫付きMLに関する疑わしい考え。 私が奜きなこずから


1結果の重みず結果の関数は、根本的な問題に぀いお実際には話さない。
2モデルず正則化の芁玄衚。
3いく぀かの参照。
4裁刀官によっお「バヌの埌ろ/家」を遞択するずいう事実。


特に読むこずはお勧めしたせんが、蚈量経枈孊の人がMLの䟡倀を芋ない堎合は、この蚘事を手に入れるこずができたす。


2. Squeeze-and-Excitation NetworksImageNet 2017受賞者


→ オリゞナル蚘事
投皿者kostia

お気に入りのResNet、Inceptionなどに SEモゞュヌルを远加しお粟床を䞊げるこずができたす。たずえば、昚幎2.99の埌、ImageNetの新しいtop5が2.99になり、ResNet50では7.5ではなく6.6になりたす。 フロップのオヌバヌヘッドが最小で、時間のオヌバヌヘッドが玄10のResNet100ずほが同じです。


モゞュヌルは非垞に単玔で、畳み蟌みブロックの埌にすべおのSoTAアヌキテクチャに挿入され、実際にはゲヌティングチャネルを生成したす。 それがどのように機胜するかに぀いおの詳现は、図に瀺されおいたす。グロヌバルな平均プヌリングを行い、ReLUでブロットルネックを行い、シグモむドをゲヌティングしたす。 盎感は、チャネル間の䟝存関係を明瀺的にモデル化し、再調敎するこずです。


この蚘事には、モゞュヌルの実蚌分析も含たれおいたす。䞋䜍局では、すべおのクラスで同じこずを行い、出力に近いほど、異なるクラスでは異なるこずを行いたす。


3.拡匵畳み蟌みを䜿甚したテキストモデリング甚の改善された倉分オヌト゚ンコヌダ


→ オリゞナル蚘事
投皿者asobolev


たずえば、教垫なしモヌドで優れた機胜を芋぀けるのに圹立぀、テキスト甚のバリ゚ヌション自動゚ンコヌダヌに぀いお説明したす。 ただし、このようなVAEを単玔な方法で、぀たりRNN゚ンコヌダヌずRNNデコヌダヌを䜿甚しお行う堎合、倚くの著者が孊習の困難を報告したす。 実際、問題は、RNN自䜓がすでにかなり匷力なモデルであり、远加情報なしで蚀語モデルをモデル化し、リカレントネットワヌクがそのような分垃のみをモデル化できるこずです。


したがっお、通垞のRNNデコヌダヌは非垞に匷力なので、それらをより単玔なものに眮き換えたしょう。 著者は「垌釈畳み蟌み」「デビュヌ畳み蟌み」を遞択したした。これはWaveNetに぀いおの蚘事でデビュヌしたしたが、ストラむド畳み蟌みず混同しないように、 ここでは「簡単なもの」ずしお参照しおください。 私が理解しおいるように、この遞択の理由は、比范的浅いデコヌダでさえかなり広い範囲を持぀こずです。 十分に長いロヌカル䟝存関係をモデル化できたす。 このようなデコヌダヌの深さを増やすこずにより、そのパワヌを増やすこずが期埅されたす。


著者は、VAE自䜓だけでなく、それに基づく半教垫あり孊習も怜蚎しおいたす。 さらに、このようなモデルはクラスラベルを考慮するこずができるため、䜜成者が行うクラスタリングに䜿甚するのが自然です。


実隓通垞のLSTMが゚ンコヌダヌずしお䜿甚され、ベヌスラむンLSTMおよび4぀の畳み蟌みホヌルデコヌダヌが異なる深さ 小 、 äž­ 、 倧 、および非垞に倧きい スコヌプはそれぞれ16、63、125および187がデコヌダヌずしお䜿甚されたした。 ベヌスラむンのLSTMは、蚀語をモデリングするタスクYelpずYahooの応答のデヌタセットに぀いおはよく認識しおいるこずがわかりたしたが、隠されたコヌドは無芖したした。 䞀般に、パタヌンは目に芋えたす。デコヌダヌが小さいそしお匱いほど、隠れコヌドをより積極的に䜿甚したすが、良い蚀語モデルを孊ぶこずは難しくなりたす。 最適なデコヌダヌは倧きな畳み蟌み穎であるこずが刀明し、 非垞に倧きなデコヌダヌは悪化し、コヌドを無芖したした。


実際、これがすべお行われた理由他のタスクで圹立぀、優れた非衚瀺のビュヌコヌドが必芁です。 たず、䜜成者はそれを2次元にし、デヌタセット内のトピックが自動的にクラスタヌ化される方法を瀺したす。 次に、半教垫あり孊習が開始されたす。著者がずんでもない数のラベル付きサンプル100から2000を䜿甚しお、非垞にうたく既存の方法に関しお、れロからの孊習ずの比范はありたせんでした、5たたは10クラスに分類するための教垫ありモデルを教えたす。


さらに、最埌に、クラスラベル情報をモデルに含めるこずで、最終的にVAE生成モデルサンプルを生成するのに圹立぀小さな䟋がありたす。


远加の考え 



4. CNNず同じ速さでRNNをトレヌニングする


→ オリゞナル蚘事
コヌド
投皿者gsoul


圌らはSRUSimple Recurrent Unitをもたらしたした-h_t-1ぞの䟝存を取り陀き、リカレントネットワヌクを䞊列化したした。 圌らは 、速床は5〜10倍に向䞊し、超粟密ネットワヌクに匹敵するものの、品質に損倱はないず曞いおいたす。 さらに、倚くの堎合、結果はLSTMアナログの結果よりもよく瀺されおおり、テキスト理解、蚀語モデリング、機械翻蚳、音声認識などのかなり幅広いタスクでテストしたした。


この写真の蚘事の芁点



別のかなり重芁な結論は、機械翻蚳の堎合、明らかにオヌバヌフィットする傟向なく、10局のSRUを泚入できたずいうこずです。 そしお、機械翻蚳では、゚ンコヌダヌずデコヌダヌのレむダヌは通垞察称的に、぀たり 実際、これらは20局のリカレントネットワヌクであり、これは巚倧なものです。 比范のために、機械翻蚳の単なる人間は4 + 4局でモデルを構築したす。 Google、2016幎埌半-2017幎初頭に、6 + 6局のトレヌニングに倚かれ少なかれ成功し、その時点で8 + 8局を販売したが、これらは8 GPUで16局がレむアりトされたした。


PS同時に、BLEU En-> Deは、おそらくトレヌニング時間が短いため、どうにかしおうたくいきたせんでした。


5.自動゚ンコヌダヌの倉換


→ オリゞナル蚘事
投皿者yane123


これは、むメヌゞを操䜜するための新しいタむプのネットワヌクアヌキテクチャです。 ヒントンずCo.は、画像の凊理に぀いお話しおいる堎合、畳み蟌みネットワヌクの将来はありそうにないず考えおいたす。 たた、カプセルを優先しお畳み蟌みを拒吊するず、デヌタの䞍倉匏のより䟿利な衚珟を取埗できたす。


ネットワヌク内の各カプセルの目的は、芳枬に䜿甚可胜な倉換の党範囲倉䜍などで特定の゚ンティティを認識するこずを孊習するこずです。 カプセルは、レコグナむザヌ、生成郚分、および隠れ局で構成される小さなニュヌラルネットワヌクです。 隠されたレむダヌにあるものは、カプセルの出力倀より高いカプセルに移動するずしお解釈され、次の2぀の芁玠で構成されたす。


  1. ゚ンティティXが写っおいる可胜性。 圌女は、カプセルによるXの本質の「認識床」です。
  2. ゚ンティティXの特定のむンスタンスの「むンスタンス化パラメヌタヌ」。

カプセルの生成郚分は、むンスタンス化のこれらのたさにパラメヌタに埓っお排他的に生成されたす。 次に、生成の結果にカプセルの信頌床を掛けたす。 れロに等しい堎合、カプセルの最終的な再構成ぞの寄䞎もれロになりたす。


モデルの解釈 特定の䞍倉匏Xのすべおの可胜な圢匏が倚様䜓に眮かれおいる堎合、カプセルの出力での「認識床」は、倚様䜓のどの点がこのむンスタンスに察応するかに䟝存したせん。 高床な認知床は、適切な倚様性を獲埗するずいう事実に぀いおのみ語っおいたす。 しかし、むンスタンス化のパラメヌタヌは、すでにマニホヌルド内のオブゞェクトの䜍眮に䟝存しおいたす。


OOPのようなものです。カプセルAが高い信頌床でアクティブ化された堎合、ステヌゞにクラスAのオブゞェクトが存圚する可胜性が最も高いこずを意味したす。実際に存圚するず仮定するず、カプセルAの出力はそのパラメヌタヌになりたす。


最も単玔なケヌスでは、これらのパラメヌタヌは、2Dむメヌゞ内のオブゞェクトの座暙ずしお解釈される数倀のペアにするこずができたす。 もう少し耇雑なものでは、認識された゚ンティティの「暙準的な」衚珟に適甚される倉換行列にするこずができたす。 芁するに、想像力はここに瀺すこずができたす。


これらのカプセルのトレヌニングをどのように組織化しお、こうした「OOP方匏」での䜜業を開始するかずいう疑問が残りたす。 この蚘事は、カプセルが画像のペアでトレヌニングされるずこれが達成されるこずを瀺しおいたす。 この堎合、2番目のむメヌゞは最初のむメヌゞの倉換たずえば、シフトであり、ネットワヌク自䜓は倉換に関する情報たずえば、どこで、どれだけ移動したかにアクセスできたす。 ここでは、そのサッカヌドを持぀脳のように。


説明した孊習方法を䜿甚しお、カプセルに制埡可胜な画像プロパティの衚珟を䜜成させるこずができたす。 この蚘事では、カプセルを䜿甚したいく぀かの実隓に぀いお説明し、獲埗した専門分野を利甚しおいたす。
私の個人的な履歎曞 クヌル ずおも。


6.動䜜が集合論に䟝存しない比范的小さなチュヌリングマシン


→ オリゞナル蚘事
投皿者kt


理論の魅力的な才胜を備えた、理論蚈算機科孊の冷酷な抜象的でかなり愚かな郚門のファンのための参考蚘事。


この研究では、著者はチュヌリングマシンの構築ずいう目暙を蚭定したした。チュヌリングマシンは、Zermelo-Frankelの理論の公理が遞択の公理぀たり、ZFCがすべおの数孊の根底にあるものである堎合にのみ停止したす。 ゲヌデルのおかげで、ZFCルヌルを䜿甚しおZFCルヌルの矛盟を蚌明たたは反蚌するこずは䞍可胜であるこずがわかっおいるため、察応するプログラムが無限に機胜するこずを蚌明たたは反蚌するこずは䞍可胜であり、これは䞀皮の楜しみです。


必芁なタむプの最も単玔なプログラムは、ZFCから考えられるすべおの結論を単玔に順番にリストし、矛盟1 = 0などを芋぀けるず停止するプログラムです。 ただし、チュヌリングマシンの圢匏では、このようなプログラムは耇雑すぎたすが、もっず簡単なものが欲しいです。 このために、著者は特にいく぀かのトリックを䜿甚したした。



この矎しさを実珟するために、著者は2぀の特別な蚀語を実装したした。TMDは、チュヌリングマシンマシン自䜓をコンパむルできるを簡単に説明するためのもので、Laconicは、TMDでコンパむルされた高玚C蚀語のようなものです。


その結果、7918州から必芁なチュヌリングマシンを受け取りたした。 その埌、圌らは苊しみ、ゎヌルドバッハ4888州ずリヌマン5372州の仮説を蚌明するためにチュヌリング機械を積み䞊げたした。


この結果の面癜い結果の1぀は次のずおりです。 BBkを、k個の状態を持぀チュヌリングマシンが実行できるステップの最倧有限数ずしたすいわゆるビゞヌビヌバヌ関数。 この堎合、BB7918およびk> = 7918のBBkず同様は蚈算䞍可胜な数倀ですその倀はZFCから蚌明たたは反蚌するこずはできたせん。


7.さたざたな寿呜の暹皮におけるテロメア長およびテロメラヌれ掻性の分析、およびむガゎペりマツの幎霢


→ オリゞナル蚘事
投皿者kt


私たちが知る限り、分裂䞭の现胞はDNAテロメアの䞀郚を倱い、いわゆる 现胞の老化。 䞀郚の现胞胚性、癌性にはこれに察する特別なタンパク質がありたす-テロメラヌれはテロメアを回埩し、现胞に氞遠の呜を䞎えたす。


興味深い質問は、䜕が䜕癟幎から䜕千幎も生きるこずができる䞀方で、成長は䞻に分裂組織の領域で発生するため぀たり、「胚」现胞のように、朚の䞭で䜕が起こるかです。 この蚘事の著者によるず、2005幎には怍物の现胞老化の問題に぀いお特に明確なものはありたせんでしたそしお、私が個人的に結論付けたように、この蚘事はそれ以䞊明確になりたせんでした。


著者は、針、朚材、および根から異なる幎霢の6皮類の朚を取り、それらのテロメア長の分垃ずテロメラヌれ掻性を枬定し、これらの指暙の暹皮䟝存性のグラフ「長呜」、「䞭生」、「䜎生」および1぀の皮ある皮のマツ内の幎霢。


著者は、最も長いテロメアずテロメラヌれ掻性の長さは、長生きする朚では平均しお長いように芋えたが、著者は統蚈的有意性を瀺さなかったので、特にそこにはないかもしれないサンプルサむズは数十ポむントで枬定される。 さらに、1぀の皮の枠組みの䞭で、根のテロメアの長さは幎霢ずずもに増加し、テロメラヌれ掻性は䞀般に呚期的です玄1000幎のサむクル長。 芁するに、実際には、nifigaはテロメラヌれがただ機胜するこずを陀いお明確ではありたせん。


8.途方もなく倧芏暡なニュヌラルネットワヌクスパヌスゲヌト゚キスパヌトの混合局


→ オリゞナル蚘事
投皿者yane123


やる気


モデルが耇雑なサブゞェクト領域を孊習するタスクに盎面しおいる堎合、モデルには倚くのパラメヌタヌが必芁です。 ネットワヌクは倧きくなければなりたせん。 すべおの手段で倧芏暡なネットワヌク党䜓をアクティブ化するには費甚がかかりたす。 その特定のセクション条件付き蚈算のみが各瞬間に機胜/孊習するこずが望たしいでしょう。


モデル


著者は、新しいタむプの局を提案したした-疎なゲヌトりェむの䞋の専門家の混合物。 結論マネヌゞャヌずしお機胜し、それに埓属する゚キスパヌトのどれが珟圚のデヌタを凊理するかを決定するニュヌラルネットワヌクゲヌトりェむがありたす。 ゚キスパヌトは、単玔な盎接分垃ニュヌラルネットワヌクです。 それらの倚く数千がありたすが、その郜床、マネヌゞャヌが遞択するのはほんの数個です。 ゲヌトりェむず゚キスパヌトの䞡方は、逆䌝播によっお䞀緒に蚓緎されたす。


出力では、ゲヌトりェむは長さnのベクトルを生成したす。nぱキスパヌトの数です。 ゲヌトりェむアクティベヌション関数-アドオンず゜フトマックスノむズずスパヌスネス。 スパヌスネスは単玔に蚭定されたす-ベクトルkで最も明るいセルが遞択され、残りは匷制的にマむナス無限倧に蚭定されたすしたがっお、それらの゜フトマックスはれロになりたす。これは、゚キスパヌトがこのタスクを実行しなかったこずを意味したす。


難しさ


難点の1぀は、専門家が倚いほど、各専門家が持぀バッチの郚分が少なくなるこずです。 バッチを無限に増やすこずは䞍可胜です。なぜなら、 メモリサむズは限られおいるため、著者は他のアプロヌチを探す必芁がありたした。


もう1぀の埮劙な点は、゚キスパヌト間の負荷分散です。 実際には、ネットワヌクは次のように分類される傟向があるこずが刀明したした。 stè¿· 定垞状態。ゲヌトりェむは垞に同じ専門家を遞択し、他の専門家は孊習する機䌚がありたせん。 著者は、この動䜜に察するいく぀かのペナルティをコスト関数に远加するこずで問題を解決したした。 各゚キスパヌトに぀いお、このバッチを蚈算するずきに、ゲヌトりェむによっおどれだけ䞻匵されおいるかが蚈算されたした。 眰金は、すべおの専門家に平等な需芁を抌し付けたす。 付録は、滑らかな眰金の構築に専念しおいたす。


もう1぀のポむントスケヌルの初期化。 ゜フトの制限専門家による䞍均等なワヌクロヌドに察する前述のペナルティなどはすぐには機胜したせん。「同じを遞択」モヌドでネットワヌクが即座に停止しないようにする最も簡単な方法は、ゲヌトりェむの重みを同じ方法で初期化するこずです。


結果


テキスト10億語のベンチマヌクず機械翻蚳を扱うタスクのテストが行​​われたした。 圌らはそれが最良の方法に匹敵するように機胜するず蚀いたす。


9.事前の意識


→ オリゞナル蚘事
投皿者asobolev


- 4 RL- / (disentangled) , conscious ( 41 ! ! , !)


, .. , (, ), .. (conscious state), (sparse attention) , , . , , (, , , ).


, s_t ( RL) RNN' ( ), h_t — , .


, c_t : C(h_t, c_{t-1}, z_t) , h_t , c_{t-1} , (exploration).


, - . , , , t - c_t , k h_{t+k} . V(h_t, c_{tk}) , . , — .


( 100+ ?), , .


yuli_semenovaを線集しおいただきありがずうございたす。



Source: https://habr.com/ru/post/J339094/


All Articles