オンラむン教育における掚薊システム。 継続

Stepic.orgでは、適応孊習システムに぀いお匕き続き話し合っおいたす。 このシリヌズの最初の玹介はここにありたす 。


この蚘事では、掚奚システム適応性の基瀎ずなるの構築に぀いお説明したす。 ナヌザヌデヌタの収集ず凊理、遷移グラフ、ハンドラヌ、ナヌザヌの反応の評䟡、結果の生成に぀いお説明したす。


線圢回垰、正則化を思い出し、この堎合、他の回垰ではなく、リッゞ回垰を䜿甚する方が良い理由を理解したしょう。




䞀般的な蚀葉


Stepic.orgの掚奚システムは、ナヌザヌが以前興味を持っおいたものに基づいお、新しいレッスン教育コンテンツを提䟛したす。 このため、圌女はさたざたな方法を䜿甚しおコンテンツを怜玢したす。コンテンツは、ナヌザヌが既に孊習したものに䌌おいるか、䌌おいないが䞀般的には興味深いものです。


これらの各メ゜ッドは個別の関数 ハンドラヌ ずしお蚭蚈されおおり、そこに定められた原則に埓っおレッスンのリストを抜出し、ナヌザヌに合う方法に応じお重みでラベル付けしたす。 これらのハンドラヌ関数の詳现な説明を以䞋に瀺したす。


掚奚システムは、さたざたな状況に適甚できたす。 2぀の䞻なケヌス



掚奚事項に加えお、ナヌザヌには、この特定のレッスンが提䟛された理由に関する情報も衚瀺されたす。 この情報は、いく぀かの盎感が各関数ハンドラヌに埋め蟌たれおいるため、簡単に抜出できたす。そのため、掚奚の理由を埩元できたす。


ナヌザヌデヌタ


Stepic.orgの孊習プロセスでは、ナヌザヌはかなりのデゞタルフットプリントを残したす。 圌の進行状況に関する情報に加えお、さたざたなステップステップはコンテンツの基本単䜍です。ステップはより倧きなレッスンに結合されたす、問題を解決しようずしたずき、結果、およびビデオの芖聎方法速床セットに぀いおの情報も保存されたすそしお圌が止めた堎所ず巻き戻す堎所。


次の情報は、基本的なレコメンダヌシステムにずっお最も興味深いものですナヌザヌが興味を持っおいるタグ぀たり、レッスンがテストされた知識の領域、ナヌザヌが行ったレッスン、孊習したレッスン、および掚奚がコンテキストに応じおいる堎合は珟圚のレッスン。


特定のナヌザヌに関する情報に加えお、保存されたデヌタは、ナヌザヌずコンテンツずの盞互䜜甚に関する情報ず芋なすこずができたす。 この情報を集玄しお䜿甚する方法の1぀は遷移グラフであり、これに぀いおは埌で詳しく説明したす。


倉換グラフ


ナヌザヌがコンテンツをどのように孊習するか、より頻繁に、より頻繁に、䜕をスキップするか、どの玠材が戻るか、そしお重芁なこずには、どの順序で衚瀺されるかを孊ぶこずはしばしば圹立ちたす。 ナヌザヌアクションに関するログを䜿甚するず、これらの質問に簡単に答えるこずができたす。 このために、 遷移グラフ  プロセスマップ 、぀たり、頂点がコンテンツの単䜍ステップやレッスンなどになるような有向グラフを䜿甚し、アヌクの重みはこれらのコンテンツ単䜍間の遷移の数を瀺したす。


ログ内の各ナヌザヌアクションにはタむムスタンプがありたす。 アクションは、「衚瀺枈み」ステップを開いた、「成功した詊行」問題を解決した、たたは「コメントした」コメントを残したなど、さたざたなタむプにするこずもできたす。 ステップに関するナヌザヌのアクションに関心がありたす。ステップは、これらのステップが属するレッスン、さらにはレッスンをマヌクしたタグに簡単に䞀般化できたす。


芖芚的には、遷移グラフは䞀連の物質的な頂点ステップなどずしお想像でき、その間にいく぀かのアヌクがありたす。 2぀のステップの間にアヌクが存圚するずいうこずは、それらを次々ず衚瀺するナヌザヌがいるこずを意味したす。 各アヌクには、そのようなナヌザヌの数を含むラベルがありたす。 コヌス内の1぀のレッスンのステップの遷移グラフの䟋



遷移グラフを䜜成するプロセスは簡単です各ナヌザヌに぀いお、ステップに関連するすべおのアクションを考慮し、それらを時間で゜ヌトし、ステップのペアごずに、䞀方のアクションの盎埌に他方のアクションを実行した回数をカりントしたす。 次に、すべおのナヌザヌの頻床を芁玄し、共通の遷移グラフを取埗したす。


最初に、ステップバむステップのグラフを導入したした。これにより、教垫は孊生がコヌス教材をどの順序で孊習するかを知るこずができたす。 分析を簡単にするために、コヌス内のステップ間の遷移の平均頻床を蚈算し、遷移が予想よりも頻繁に発生した堎合は最終グラフの゚ッゞを緑色に、予想よりも少ない堎合は赀色に、たれな遷移も陀倖したす。


コヌスのいずれかの遷移グラフのフラグメント



このフラグメントは、T4理論のステップが通垞よりも頻繁にスキップされ、次のステップに進むこずを瀺しおいたす。


さらに、掚奚システムでこれを䜿甚するために、ステップだけでなく、レッスンずタグによっお遷移グラフを䜜成し始めたした。 レッスンの遷移グラフは、ステップの堎合ず同じ原理に基づいお䜜成されたす。ステップのアクションだけが、これらのステップが属するレッスンのアクションず芋なされたす。 タグの堎合、プロセスは同様です。ステップを含むアクションは、タグを含むアクションに倉換されたす。


ハンドラヌ


ここでは、それぞれが独自の掚奚方法を実装するハンドラヌ関数をリストしたす。 ハンドラヌはナヌザヌをパラメヌタヌずしお受け入れ、掚奚事項がコンテキストに基づいおいる堎合は、ナヌザヌが珟圚行っおいるレッスンです。 ハンドラヌはナヌザヌに戻りたす 画像 レッスンのリスト。それぞれが0〜1の重みに察応したす。重みが倧きいほど、掚奚事項は高くなりたす。 画像 。


ナヌザヌにお勧めしたい 画像 特定のタグのレッスン。ナヌザヌが孊習したレッスンの割合は 画像 。 遷移グラフがない堎合、すべおのレッスンに重みが付けられたす 画像 。 グラフがある堎合、レッスンごずに、この重みは、ナヌザヌが枡した最も近い前のレッスンたでのグラフ内の距離で陀算されたす 画像 。 このように、ナヌザヌは、遷移グラフにある資料を自分が既に孊習しおいる資料からそれほど遠くない堎所に移動するこずに興味があるずいう考えが実珟したす。



わかった よし、進みたしょう。


起業家


ナヌザヌ応答の評䟡


掚奚がどの皋床成功したかを理解するために、掚奚を衚瀺した埌、ナヌザヌがリンクをクリックしたかどうか、およびナヌザヌが最終的に孊習したレッスンの郚分0から1たでの倀を蚘録したす。 同時に、ナヌザヌはレッスンがアドバむスされた理由を芋぀けおオプションはハンドラヌに察応、掚奚事項に興味がないずマヌクする機䌚がありたす。


瀺されおいる各掚奚事項の結果ずしお、特定の番号を䞀臎させるこずができたす。 画像 掚奚事項の拒吊に察応し、 image1 -レッスンを孊習せずにリンクをクリックする、 image2 -リンクをたどっおレッスンを完了する image1 前に image2 -䞍完党なレッスン孊習、および image0 -反応の欠劂。


発行の圢成


そのため、耇数のハンドラヌからレッスンのリストを取埗したした。各レッスンには0〜1の重みがありたす。ハンドラヌが成功すればするほど、この掚奚事項が評䟡されたす。 問題は、それらをどのように組み合わせるのが最善ですか


レッスンごずに、アドバむスしたハンドラヌの重みを単玔に加算たたは乗算するこずができたす。 しかし、これは、異なるハンドラヌが同等に有甚であるず考えるこずを意味し、䞀般的に蚀えば、それはたったくそのようにはならないかもしれたせん。 掚奚事項に察するナヌザヌの反応を䜿甚しお、効甚係数を䜿甚しお各ハンドラヌを評䟡したいず思いたす。 単玔な線圢回垰はこれらの芁件を満たしたす。



回垰モデルは、さたざたなハンドラヌの掚奚事項がナヌザヌによっお評䟡された方法に関する环積デヌタを䜿甚しおトレヌニングされたす。 これに基づいお、モデルはハンドラヌの重みのベクトルを圢成したす。 さらに、生埒に䜕かを掚奚する必芁がある堎合、各レッスンの回垰モデルは、それを提䟛したハンドラヌの重みに蚓緎されたパラメヌタヌベクトルをスカラヌ倍し、各掚奚レッスンの結果の重みを䞎えたす。


玠材を深く掘り䞋げたので、回垰モデルを正匏に説明したしょう。 線圢回垰ずは䜕かをよく知っおいる堎合は、次のセクションをスキップしおください。


線圢回垰


行列があるずしたす 画像 その行 画像 芳枬ず呌ばれ、列は因子 、 タヌゲットたたは埓属倉数の倀の列 画像 。 回垰モデル 画像 どこで 画像 -モデルパラメヌタヌ、および 画像 -因子に察するタヌゲット倉数の䟝存性が線圢である堎合、すなわち、 画像 。


通垞、䟿宜䞊 画像  定数 は、芳枬行列に単䜍の列を远加するこずにより、合蚈蚘号の䞋に入力されたす。 画像 すべおのために 画像 。


画像


これらの衚蚘法を䜿甚するず、線圢回垰モデルは次のように蚘述できたす。 画像 。 この問題の解決策はコラムです 画像 、実際の倀からの予枬倀の二乗偏差の合蚈を最小化したす。 画像 。


この近䌌法は最小二乗法ず呌ばれ、線圢回垰問題を解くずいう文脈で最も広く䜿甚されおいたす。


この堎合、芳枬倀、぀たり行列の行ず芋なすこずができたす 画像 、ハンドラヌがレッスンに割り圓おたこれらの重みの芳察の芁因ずしお、およびタヌゲット倉数の倀ずしお、ナヌザヌの掚奚評䟡ずしお掚奚レッスン。


だから、レッスンのために 画像 ナヌザヌに掚奚 画像 それぞれ、およびハンドラヌ甚 画像 芳枬行列 画像 およびタヌゲット倉数の倀の列ナヌザヌ応答 画像 次のようになりたす。


画像


ベクトル 画像 、ナヌザヌの反応を予枬する際に最小限の゚ラヌを䞎えたすが、各ハンドラヌの個別の重みが含たれおおり、それによっお掚奚事項を乗算する必芁がありたす。 ハンドラヌの1぀の重量が比范的倧きい堎合、このハンドラヌは掚奚事項に積極的に貢献し、その逆も同様です。


掚奚システムが機胜するために、掚奚に察するナヌザヌの反応に関するデヌタに基づいお回垰モデルが定期的に再トレヌニングされたす。 SciPyラむブラリを䜿甚しおこの問題を解決し、列を芋぀けたす。 画像 。 このラむブラリは、線圢回垰問題の解決策を既に実装しおいたす。


わかった たあ、少し残った。


シヌル


正則化


ハンドラヌの重みの列を芋぀けた線圢回垰掚奚システムを実装した埌 画像 予枬からのナヌザヌの実際の応答の偏差の二乗を最小化する 画像 、1぀のハンドラヌの重みが埐々に無制限に増加し、残りが枛少し、最終的にこのハンドラヌの結果からほが排他的に発行が行われるこずに気付きたした。 この効果は正のフィヌドバックず呌ばれ、システムの結果の偏差がその埌の䜜業に圱響するずいう事実によっお特城付けられ、さらに、結果はこの偏差に向かっおシフトしたす。


さらに、ハンドラヌはナヌザヌアクティビティに関する非垞に類䌌した情報を䜿甚できるため、デヌタ内の因子の倚重共線性の問題が発生する可胜性があり、マトリックスの匱い分離が必芁になりたす 画像 そしお、結果ずしお、゜リュヌションの䞍安定性。


その結果、トレヌニング察象のデヌタに小さな゚ラヌを䞎え、実際のデヌタに倧きな゚ラヌを䞎える゜リュヌションが埗られたす。 この状況は、モデルの過剰適合ず呌ばれたす 。


正則化は、再トレヌニングの問題の解決策ず芋なすこずができたす。 The Elements of Statistics Learningによるず、䞻な正則化方法は、なげなわLASSO、最小絶察収瞮および遞択挔算子ずリッゞ回垰 Tikhonovの再構築、リッゞ回垰です。 これらの方法はどちらも、ベクトルのノルムにペナルティを远加するこずにより、回垰解の怜玢䞭に最小化する匏を倉曎したす 画像 。


投げ瞄正芏化の堎合に䜿甚されたす 画像 -ノルムず゜リュヌションは



リッゞ回垰の堎合、それが䜿甚されたす 画像 -芏範ず解決策は次のようになりたす



どちらの堎合でも、パラメヌタヌ 画像 最適化プロセス䞭に遞択されたす。


Lassoメ゜ッドによる正則化を䜿甚するず、すべおの重みが枛少したす 画像 、すでに比范的小さいものはれロに等しくなりたす。 したがっお、なげなわメ゜ッドは、重芁な芁玠の遞択機胜遞択に適しおいたす。


リッゞ回垰法も因子の重みを枛らしたすが、以䞋の堎合を陀き、それらをれロに枛らすこずはありたせん。 画像 。


Andrew Ngによるず、因子の数がトレヌニング芳枬の数を倧幅に超える状況では、投げ瞄正芏化はリッゞよりもうたく機胜したす。 反察の状況では、リッゞ回垰がより適切です。


したがっお、リッゞ回垰は私たちの堎合により適しおいたす。 その実装はSciPyラむブラリにも存圚し、非垞に満足しおいたす。


おわりに


この蚘事では、Stepic.orgで教育コンテンツの掚奚システムを実装する方法を芋぀けたした。 たぶん、それは簡単ではなかったかもしれたせんが、あなたは成功したした もちろん、この堎所たでスクロヌルしなかった堎合は、戻っお読むこずをお勧めしたす


掚奚システムの実際の動䜜は、 https//stepic.org/explore/lessonsで確認できたす。孊習するための掚奚レッスンがリストされおいたす。 しかし、プラットフォヌムに入るのがこれが初めおの堎合、掚奚事項は特に関係ない堎合がありたす。


このシリヌズの次の最終蚘事では、Stepicaの適応システムを盎接怜蚌し、実行された䜜業の結果予枬の粟床、ナヌザヌ蚭定、統蚈の評䟡に぀いお説明したす。


そしお最埌に、私は尋ねたいです あなたは適応型オンラむン教育を信じおいたすか 埓来のコヌスに取っお代わりたすか 最もむンテリゞェントな掚薊システムは、実際の教垫よりも優れた教育コンテンツを個人に勧めるこずができたすか



Source: https://habr.com/ru/post/J307670/


All Articles