このプログラムは、単純な三目並べゲーム、4つの連続(接続4)、五目並べをプレイし、その人に勝ちます。 1つの重要なニュアンスではないとしても、何もおもしろくないように思えます-このプログラムはルールを知らないのです! より正確には、彼女は人々のゲームを取り上げた2分間のビデオを見て、それらをゼロから学びました。
パリ大学ディドロの
ルーカスカイザー (ŁukaszKaiser)は、C ++でプログラムを作成しました。このプログラムは、ビデオシーケンスをフレームに分割し、不要なもの(人の手)をすべて削除し、連続した位置のリストを取得します。
このデータに基づいて、アルゴリズム(OCaml)は、許可された動きのデータベースと勝ち/負け/未解決の位置のリストをコンパイルし、∃x1Q(x1)∧∃x0(C(x1、x0))x0 = e1)のような論理式のセットを生成します 両方のモジュールは、無料の
トスボードゲームプログラムに統合されています。
通常のラップトップでは、ゲームに応じて2分間のビデオを処理するのに28〜74秒かかります。 その後、さらに数分で一連のルールを作成します。そして、彼女はプレーする準備ができました。 確かに、勝つ方法を学ぶためには、複数のビデオを見る必要があります。 プログラムのテスト中に、彼女は三目並べのゲームの25本のビデオを処理しました。25本-連続4本、17本-ホモクです。 ゲームが単純な場合は、それ以下で十分です。
複雑なことはないように思えますが、そのようなシステムがより複雑で完全になり、
昆虫の行動を観察するだけで、より複雑なゲームや戦略を学ぶことができると想像してください。
実際、ルカシュカイザー自身は、プログラムの適用対象としてボードゲームを選んだと書いています。「ここでは、視覚的なオブジェクトの数は比較的少ないが、十分な種類のアクションがあるからです。 さらに、ゲームは現実世界の関係の多くのシナリオの自然なモデルであるため、幅広いコンテキストで結果が重要になります。
アルゴリズムの詳細については、調査論文:
記述的複雑さ (PDF)に
ガイドされたビデオからのゲームの学習 、または人工知能に関する第3回会議からの彼のプレゼンテーションのビデオを参照してください。