ベイズイベント接続性評価

彼の本の中で、ネイト・シルバーは例を挙げています:あなたが確率で破産するかもしれないいくつかの企業に投資をしたいとしましょう 5\%。 リスクを評価する必要があります。 破産の可能性が高いほど、投資額は少なくなります。 逆に、破産の確率がゼロになる傾向がある場合は、制限なしで投資できます。

2つの企業が存在する場合、両方とも倒産し、すべての投資を失う可能性があります。 P=0.05 cdot0.05=0.0025。 したがって、確率の標準理論が教えています。 しかし、企業がつながり、一方の破産が他方の破産につながる場合はどうなりますか?

極端なケースは、企業が完全に依存している場合です。 二重破産の確率 P(破産1&破産2)= P(bankrupt1)、すべての投資を失う確率は P=0.05。 リスク評価手法には幅広い広がりがあります P0.05から0.0025であり、実際の値は、2つのイベントの接続性をどの程度正確に推定したかに依存します。


投資を評価する場合 N私たちには企業があります Pから 0.05前に 0.05N。 つまり、最大可能確率は大きいままです。 P=0.05、すべてのバスケットが入ったカウンターが一度に落ちた場合、「1つのバスケットに卵を入れないでください」という古い言葉は機能しません。

したがって、私たちの見積もりには大きな広がりがあり、どれだけの投資をするかは疑問のままです。 しかし、あなたは投資する前にそれを取る必要があります。 ネイトシルバーは、これらの単純な法律に対するアナリストの無知が、米国の格付け機関がリスクを評価したが、リスクの接続性を評価しなかった2008年に株式市場の暴落につながったと言います。 最初に大きなプレーヤーが倒れ、他のプレーヤーを連れ去ったとき、それは最終的にドミノ効果につながりました。

katの後に簡単な数学の問題を解いて、この問題を整理してみましょう。

2つのコインの簡単な例を使用して、ベイズ法によって2つのイベントの連結性を評価する方法を学習するために、単純化された問題を解きましょう。 もっと数学を...噛んでみて、それが自分に明らかになるようにします。

コインを2枚にします M1そして M2投げるときに0または1を与え、1回の投げで4つの組み合わせの1つが可能です:

組み合わせ1:00
組み合わせ2:01
3:10の組み合わせ
4:11の組み合わせ

ここで、最初の数字は最初のコインを指し、2番目は2番目を指します。 プレゼンテーションを簡単にするために、この表記法を導入しました。

問題の状態により、最初のコインを独立させてください。 それは P10=0.5そして P11=0.5。 そして、2番目は依存している可能性がありますが、どの程度かはわかりません。 それは P2に依存します P1

たぶん、コインを引き付けるある種の磁石があるか、投げ手はシャーピーと詐欺師であり、その数十ダースです。 無知を確率の形で評価します。


接続性を評価するには、パラメータを評価する実際の材料とモデルが必要です。 最も単純な仮定を使用して、トピックの雰囲気をつかみ、モデルを構築しましょう。

コインに一貫性がない場合、4つの組み合わせすべてが同じ確率で発生します。 ここでは、確率の標準理論から修正が行われます。この結果は、無限のキャストで達成できます。 しかし、実際にはスローの回数は有限であるため、平均からの逸脱に陥ることがあります。 たとえば、コインを投げると、3〜5匹のを偶然手に入れることができますが、平均して無限に投げると、exactlyの50%と尾の50%だけになります。 偏差は、つながりの現れとして解釈できますが、平均からの統計の規則的な偏差として解釈できます。 サンプルが小さいほど、偏差が大きくなる可能性があるため、異なる仮定を混同する可能性があります。

これがベイジアン理論の助けとなり、有限データセットから特定の仮説の確率を推定することを可能にします。 ベイズは、確率論で扱うことに慣れているプロセスとは逆のプロセスを生成します。 ベイズによると、確率は、結果の確率ではなく、推測が実際の状況と一致すると推定されます。

モデルを作成する創造的なプロセスに目を向けます。 接続性モデルには要件が課されます-少なくとも可能なオプションをカバーする必要があります。 私たちの場合、極端なオプションは、コインの完全な一貫性または完全な独立性です。 つまり、モデルには、接続性を記述する少なくとも1つのパラメーターkが必要です。

係数として説明します [0,1]の$ k \ 。 2番目のコインが常に最初のコインと完全に一致する場合、 k=1. 2番目のコインの値が常に反対の場合、 k=0。 コインが一貫していない場合、 k=0.5。 それは悪くないことが判明しました-1つの数字で多くのオプションを説明しています。 さらに、この変数の意味は、一致の確率として定義されます。

実際のデータに基づいてこの数を推定してみましょう。

特定のデータセットがあります Dから成る N=5結果:

出エジプト記1:00
結果2:01
結果3:11
4:00
結果5:11

一見、何も言われていません。 組み合わせの数:

N00=2N01=1N10=0N11=2

ベイズの公式の意味をゆっくりと整理します。 標準表記を使用します。 |別のイベントが完了したことがすでにわかっている場合、イベントが発生する確率を意味します。

Pk|D= fracPD|k cdotPkPD


k=argmaxPk|D



この場合、連続分布と離散分布の組み合わせがあります。 Pk|Dそして Pk連続分布です。 A PD|kそして PD離散的です。 ベイズ式では、このような組み合わせが可能です。 時間を節約するために、私はすべての微妙な点を描いていません。

この確率がわかれば、値を見つけることができます [0,1]の$ k \ 仮説の確率が最大になる確率。 つまり、最も可能性の高い係数を見つける k

右側には、評価する必要のある3つのメンバーがあります。 それらを分析します。

1)特定の仮説についてそのようなデータを取得する確率を知るか計算する必要があります PD|k。 結局、オブジェクトが切断されていても( k=0.5)その後、シリーズを取得 000000可能ですが、難しいです。 コインが接続されている場合、そのような組み合わせを取得する可能性がはるかに高くなります( k=1PD|k-最も重要なメンバーであり、以下で計算方法を分析します。

2)知る必要がある Pk。 ここで、繊細なモデリングの瞬間に出会います。 この機能は不明であり、仮定を行います。 追加の知識がない場合は、 k同様に、0〜1の範囲である可能性があります。インサイダー情報があれば、接続性についてより多くの情報を得て、より正確な予測を行うことができます。 しかし、そのような情報は利用できないため、 k sim[0,1]。 数量 Pk独立した k計算するとき k彼女は重要ではありません。

3) PD-すべての値がランダムである場合、そのようなデータセットを持つ確率です。 このキットは別のもので入手できます kさまざまな確率で。 したがって、セットを取得するすべての可能な方法が考慮されます D。 この段階では値はまだ不明です k、次に統合する必要があります PD= int01PD|kPkdk。 これをよりよく理解するには、ベイジアングラフが構築される基本的な問題を解決し、合計から積分に移る必要があります。 結果は式wolframalphaで、最大値を検索します kこの値は依存しないため、影響しません k

計算方法を理解しましょう PD|k。 最初のコインは独立しており、2番目のコインは依存していることに注意してください。 したがって、最初のコインの値の確率は次のようになります PM1=0、そして2番目のコインのために PM2=0|M1=0。 最初のコインと一致する確率は k、および不一致の確率は 1k

1つの結果について考えられるケースを分析します。

P00=PM1=0 cdotPM2=0|M1=0=0.5k
P01=PM1=0 cdotPM2=1|M1=0=0.51k
P10=PM1=1 cdotPM2=0|M1=1=0.51k
P11=PM1=1 cdotPM2=1|M1=1=0.5k

確認するには、確率を合計して、ユニットを P00+P01+P10+P11=0.5k+0.51k+0.51k+0.5k=1。 喜んで。

これで、最も可能性の高い値を見つけることに進むことができます kすでに上記で与えられた架空のデータセットによると D=00,01,11,00,11

そのようなセットを持つ確率
PD|k=P00 cdotP01 cdotP11 cdotP00 cdotP11
開示する
PD|k=0.5k cdot0.51k cdot0.5k cdot0.5k cdot0.5k
単純化する
PD|k=0.55 cdotk1 cdot1k4
任意のデータセットの一般化
PD|k=0.5N cdotkN00 cdotkN11 cdot1kN01 cdot1kN10
PD|k=0.5N cdotkN00+N11 cdot1kN01+N10

一致の数を示します A=N00+N11、および不一致の数 B=N01+N10

このような一般化された式を取得します
PD|k=0.5N cdotkA cdot1kB

希望する人は、異なる指数を入力してスケジュールをいじることができます: wolframalphaへのリンク

この例では PD|k=const cdotPk|D、それから直接作業します PD|k

最大値を検索するために、微分してゼロと見なします。
0=kA1 cdot1kB1 cdotAk1+Bk

作業がゼロに等しくなるには、メンバーの1つがゼロに等しくなければなりません。
興味ない k=0そして k=1、これらの点に極大値はなく、3番目の要因は極大値を示すため、
k= fracAA+B= fracAN

予測に使用できる数式を取得します。 つまり、最初のコインをさらに投げた後、2番目のコインの動作を予測しようとします。 k
結果6:1¿

新しいデータを受信すると、数式が調整され、洗練されます。 インサイダーデータを受信すると、より正確な値が得られます Pk、計算のチェーン全体をさらに絞り込むことができます。

確率を計算するため、 k平均と分散を分析することをお勧めします。 平均は、標準式を使用して計算できます。 しかし、分散については、データ量の増加に伴い、グラフ(上記のリンク)のピークがよりシャープになり、これは値のより明確な予測を意味します k

上記のデータセットでは、4つの一致と1つの不一致があります。 だから k=4/5。 80%の確率でさらに6回目の投球で、2番目のコインが最初のコインと一致します。 最初のコインで1を獲得した場合、80%があり、「結果6」は「11」、残りの20%は「結果6」が「10」であるとします。 各スローの後、式を調整し、さらに不完全な一致の確率をさらに1ステップ予測します。

これで、投稿を終えたいと思います。 あなたのコメントを歓迎します。

PS
この例は、アルゴリズムを示すために説明されています。 ここでは、実際に発生する多くのことが考慮されていません。 たとえば、現実世界のイベントを分析する場合、時間間隔の分析、因子分析の実施などが必要になります。 これはすでに専門家の関心事です。 また、この世界のすべてが相互に接続されていることを哲学的に指摘する必要があります。これらの接続のみが時々現れ、時には現れません。 したがって、すべてを完全に考慮することは不可能です。なぜなら、この世界のすべてのオブジェクトを、知らないものも含めて式に含め、非常に大量の実際の素材を処理する必要があるからです。

情報源:
1. https://ru.wikipedia.org/wiki/ベイズの定理

2. https://ru.wikipedia.org/wiki/Bayesian_output

3.ネイトシルバー、「シグナルとノイズ」

リバコフD.A. 2017年
-回答いただいた方への感謝:Arastas、AC130、koldyr

Source: https://habr.com/ru/post/J331282/


All Articles