教師なし学習または「そこに行き、どこで、どこで、それを見つけて、何を知らない」

画像 エキスパートシステム、ニューラルネットワーク、述語計算、ホーン節、収束定理...
私はあなたのことを知りません、私はこのすべての台所の喜びを持っています。 そのコンピューター(もちろん、真剣な数学で武装したプログラマーによって教えられる)が、少なくとも時々意思決定スキルのある人に近づくことができるということは素晴らしいことです。 これは、人が教える準備ができているときに特に役立ちます。

言い換えれば、AIメソッドは、コンピューターが習得しなければならない知識をより形式化するほど、うまく機能します。 たとえば、 チェスに関する以前の投稿を参照してください。

管理されていない学習、教師なしの学習
ただし、状況があり、誰も正しい答えを知らないときに多くの状況があります。 そして、答えが何であるかさえ明確ではありません。 そして、そのタスクでさえ明確ではありません。 データのみがあります。 彼らから何か役に立つことを学ばなければなりません。
同意して、タスクはもっと面白く、想像力の余地を与えますか?

通常、このようなタスクは自動分類タスクとして定式化されます 。 入り口には多くの個別のオブジェクト(たとえば、Webページや患者の履歴)があり、出口には棚にきちんと配置されたそのようなオブジェクトのグループのツリーがあります。

画像

あなたは言う-ナンセンス? タスクと結果を評価するための基準が理解できない場合はどうすればよいですか? しかし、そのような問題を解決する方法があり、それらは非常に効果的に適用されます。

これらの方法の1つは、 Kohonen自己組織化マップ (SOM、Kohonenニューラルネットワーク、データクラスタリング用のKohonenアルゴリズム)です。

最初に、すべてのデータは多次元空間のポイントとして表されます。 ポイントは、軸に沿った座標のセットによって記述され、これらの座標は通常、数百(数千および数千)です。 私たちのタスクは、この不便な多次元クラウドのグループ、接続、パターンを選び出すことです。

この方法のアイデアは、人間の脳との類推から生まれました。 1つのバージョンによると、人間の大脳皮質は約1平方の平らなシートです。 m、しわになり、頭蓋骨で立ち往生。 同時に、皮質の一部のセクションは互いに密接に隣接していますが、「フラットな座標」は互いに非常に離れています。 コホーネンは、初期の平らな皮質の点の近接は、人間の知識と思考のレベルで、より深い意味を持っていることを(未確認だが、反証されていない)示唆した。

画像

自己組織化カード方式
メソッドはどのように機能しますか? データポイントは空間にあります。 同じ空間に、ニューロンの平らなKohonenネットワークが配置されます。
すべてのデータポイントを列挙します。それぞれに最も近いネットワークポイントがあり、ネットワーク全体がこのポイントにわずかに引っ張られます。 ネットワークは、データポイントにより近いニューロンによってプルされます。 特定のニューロンが最良のものから遠くなるほど、その動きは少なくなります。

その結果、ネットワーク全体がポイントのクラスターに向かってかなり活発にクリープし、それらの間に分散され、フラットマップで多次元データをカバーします。

画像

たとえば、2次元および3次元の問題の場合、次のようになります(マップが2〜3の塊で崩壊した場合、トレーニングは意識的に終了しません)。

画像

分析と機会
プロセスの終了後、マップは「まっすぐ」になり、取得したデータグループを分析できます(多くの方法と特性があります)。

画像

次に、見つかったクラスターでターゲットフィーチャーを選択すると(たとえば、顔のフィーチャーのセットによって人の性別を判別するために)、各フィーチャーとそのグループの結果への影響をより詳細に調べることができます:クラスタリングは分析および意思決定ツールになります。

画像

結果の分類は、要件に応じて多少詳細にできます。 クラスターの数を調整したり、個々の塊の近接しきい値を設定したりして、実質的にあらゆる詳細度のマルチレベル分類を取得します。

画像

実装とデモ
3次元空間の点のセットでKohonenネットワークをトレーニングする作業を実装するデモ用のプログラムがあります。

画像ポイントは、楕円雲として定義された空間のゾーン(中心と3つの半径)に分散されます。 構成およびソースデータはxmlで指定されます。 明確にするためのプログラムは、3次元画像と座標平面上の3つの投影を表示します。 最後のトレーニングセッションでビデオを自動的に生成します。

サンプルプログラムをダウンロードする

OpenCVを使用して記述ダウンロード説明

データ分析ツールの1つとしてのKohonenネットワークは、多くの特殊なソフトウェアパッケージに含まれています。

教師がいない場合のデータ分析の方法とグループ化の明確な基準は、分析のための機能の選択、次元の低下、データマイニングのタスクで広く使用されています。

トピックに関する読み物
ロシア語で
1. コホーネンネットワークス
2. クラスター分析
他の言語で
3. www.cis.hut.fi/teuvo
4.www.shef.ac.uk/psychology/gurney/notes/l7/l7.html
5. www.len.ro/work/ai/som-neural-networks
6. www.samhill.co.uk/kohonen

Source: https://habr.com/ru/post/J51372/


All Articles