インテリジェント情報ネットワーク、セマンティックWeb、Web 3.0、AI ...これらの言葉は、私たちの日常生活でますます登場しています。
ユニバーサルインターネットの時代は終わりを告げています。 私たちがそれを感じ始める前に、彼女は交代し始めます。 かろうじて形成されたWeb 2.0という用語は、一見すると理解不能で神秘的な別のWeb 3.0または単に「セマンティックWeb」に置き換えられています。
この記事では、それが何であり、インターネットがどこに向かっているのかについて話したいと思いました。
現在、ネットワークは個人的なものになっています。 「インターネットは私たちについてもっと知っています。」 部分的には、ソーシャルネットワーク上で個人情報を共有し、検索エンジンを使用し、承認されることで、これに貢献しています。
つまり、すぐに検索バーに「安く髪を切りたい」と入力すると、ユーザーは、明確な質問に対する明確な回答という形で、自分の場所に最も近い美容院の形で回答を受け取ります-別の検索結果から10、20、50リンクに移動する必要はありません検索エンジンのうち、次の開いているタブがSEOスペシャリストの力によって促進された別の高価なサロンであることに再び動揺しています。
これは、家庭から世界的なものまで、人間の生活と活動のさまざまな分野に適用されます。 たとえば、車やアパートの購入、就職活動など。
さらに、検索エンジンは、どのテストドライブに興味があるか、どの車のサイトを訪問するか、どのエリア、どの価格帯でアパートを探したいかといった情報に基づいて、ユーザーがどの車を必要としているかを判断できますどんな食べ物が好きですか
セマンティックWebの開発により、ユーザーに関する特定のデータを収集した後、この技術は彼の社会人口学的な肖像画を作成できるようになります。 コンピュータは、収集されたユーザーデータを人物の肖像として理解します。
多くの点で、このような動的な動きは、サービスを簡素化し、ユーザーがコンテンツに簡単にアクセスできるようにすることで促進されます。 最近、ファッショナブルになり、ソーシャルネットワーク(Vkontakte、Facebook)による承認、特別なサービス(OpenID、OAuth)、ソーシャルネットワークのウィジェットによるコメント。
私たちの携帯電話ネットワークは個人情報に結びついています。
情報は、インターネットの将来において決定的な役割を果たすものです!主要市場のプレーヤーによって推進されているNFCテクノロジーは、携帯電話を使用して購入する機会を提供します(たとえば、地下鉄料金の支払いを含む)。SIMカード、電話、銀行カードをますます接続し、個人情報を1つのポイントに引き込みます。
それを理解しようとしますが、今のところは、小さなものから順番に始めましょう。 最初に、Intelligent Information Systems(IIS)を見てみましょう。
情報知能システム
IIS(インテリジェント情報システム)は
、知識ベースを使用して、ユーザーの特定の情報ニーズに応じてさまざまなクラスの問題を解決するためのアルゴリズムを生成するという概念に基づいた情報システムです。IPインテリジェンスの機能と兆候
情報システム(IS)は、次の機能を実行します。
- ユーザーが入力した情報要求と必要なソースデータを認識します。
- 既知のアルゴリズムに従ってシステムに入力および保存されたデータを処理し、必要な出力情報を生成します。
リストされた機能を実装するという観点から見ると、IPは、注文が情報要求であり、原材料が初期データであり、製品が必要な情報であり、ツール(機器)がデータを情報に変換する知識である情報を生産する工場と見なすことができます。
IMSの通信能力は、エンドユーザーがシステムと対話する方法(インターフェース)を特徴づけます。
知的は、特定のタイプのこれまで未解決の問題を解決するためのアルゴリズムの開発に関連するタスクです
Intellectは、特定の問題を解決するためのアルゴリズムを開発できる汎用アルゴリズムです。
IPの動作中に、プログラムの2つのコンポーネントのいずれかを変更する必要があることが明らかになった場合、それを書き換える必要があります。 これは、IP開発者のみが問題領域の完全な知識を持っているという事実によるものであり、プログラムは開発者の知識の「非思考エグゼキューター」として機能します。 この欠陥は、インテリジェント情報システムで排除されます。
IPの欠点とIISでのそれらの排除
- ユーザー情報のニーズに対する弱い適応性。
- 不十分な形式のタスクを解決できない。
これらの欠点はIISで排除されています。
以下の特徴的な機能:
- 発達したコミュニケーションスキル;
- 複雑で不十分な形式化されたタスク(半定性的および定量的記述、および十分に形式化されたタスク-完全に定量的な記述によって特徴付けられる)を解決する能力;
- 開発し、学習する能力。
IISの分類
Iクラス:インテリジェントインターフェイス(コミュニケーションスキル)を備えたシステム:
- インテリジェントDB;
- 自然言語インターフェース;
- ハイパーテキストシステム。
- コンテキストシステム
- 認知グラフィックス。
グレードII:エキスパートシステム(複雑な問題の解決):
- 分類システム;
- 補助システム。
- 変換システム;
- マルチエージェントシステム。
グレードIII:自己学習システム(自己学習能力):
- 誘導システム;
- ニューラルネットワーク;
- ユースケースシステム;
- 情報リポジトリ。
インテリジェントDB
インテリジェントデータベース -要求に応じて情報を選択する機能が通常のものと異なります。情報は明示的に保存されない場合がありますが、既存のデータベースから取得できます(たとえば、価格が業界価格よりも高い製品のリストを表示します)。
自然言語インターフェイスには、自然言語の構造を機械レベルの知識表現に変換することが含まれます。 この場合、記述された単語の認識と検証は、辞書と構文規則に従って実行されます。 このインターフェイスにより、インテリジェントデータベースへのアクセス、および制御システムでのコマンドの音声入力が容易になります。
ハイパーテキストシステムは、データベース内のキーワードによってテキスト情報を検索するように設計されています。
コンテキストヘルプシステムは、ハイパーテキストおよび自然言語システムの特殊なケースです。
コグニティブグラフィックシステムにより、ユーザーはグラフィックイメージを使用してIMSと対話できます。
セマンティックWeb
HTMLページは、Webブラウザーで情報を視覚的に表示する方法を説明するもので、コンピューターで解釈するのは困難です。 彼女にとって、インターネット上で人、プロジェクト、プログラムを見つけるといった些細な作業でさえ自動化することは不可能です。
セマンティックWebテクノロジーにより、コンピューターはWeb上の情報を人並みに解釈することができます。このために、W3C仕様であるリソース記述RDF(リソース記述フレームワーク)のグラフモデルが開発されました。
RDFを使用すると、リソースに関するステートメントを作成できます。
RDFグラフモデル
RDFモデルのリソースステートメントは、トリプルで構成されています。
リソースとプロパティは、Unicode形式のURIおよびリテラルとして表されます。 URIを使用すると、Web上のリソースを一意に識別でき、Unicodeによって多言語の問題が解決されます。
RDFスキーマはXMLスキーマではありません
RDFスキーマは、RDFステートメントで説明されています。
XMLとは異なり、スキーマはドメインのリソース(用語)を定義し、RDFの構造を制限しません。
W3C仕様のRDFスキーマリソースにはセマンティクスが割り当てられています。
RDFを使用して記述されたRDFスキーマの例
データセマンティクス-それは何ですか?
データセマンティクスとは、送信されたデータの意味を形式的に記述し、アプリケーションに依存しないようにすることを意味します。 これは、我々が検討しているインターネットの発展の見通しの文脈で特に重要です-データを持っている人が勝ちます。 多くのアプリケーション、サイト、サービスが存在する可能性がありますが、それだけではほとんど意味がありません。 ユーザーフレンドリーなコンテンツでコンテンツを提供できる人が勝ちます。
現在使用されているサービス(データベース、XMLドキュメント、ソーシャルネットワーク上のアプリケーション)に関係なく、どのデータを使用できますか? いいえ、それらのセマンティクスはプログラムロジックおよび/または仕様で非公式に保護されているためです。 明示的なセマンティクスを持つデータのみを、アプリケーションから完全に独立させることができます!
なぜRDFが必要なのですか? 悪いXMLとは何ですか?
XMLタグのネストは構文のみを運びますが、セマンティクスは運びません。 「Ivan Petrovがコンピューターサイエンスコースを教える」というステートメントをXML形式で提示するさまざまな形態を検討する場合:
<course name=""> <lecturer> </lecturer> </course> <lecturer name=" "> <teaches></teaches> </lecturer>
<teachingOffering> <lecturer> </lecturer> <course></course> </teachingOffering>
最初の形式を使用するアプリケーションは、他の2つの形式を理解できず、逆も同様です。 したがって、XMLはデータ交換の形式(構文)としてのみ有効であり、データセマンティクスを記述するためのモデルとしては適していません! 同じことが他の一般的な形式(たとえば、JSON)についても言えます。
RDFのセマンティクスはどこにありますか?
RDFモデルレベルでは、オントロジーWeb言語(OWL)オントロジーの使用によりセマンティクスが表示されます。これにより、コンピューターは、それが認識しているリソースまたはプロパティが、それが認識していない別のリソースまたはプロパティにそれぞれ関連付けられている方法を理解し、RDFステートメントを介して他の論理的結論を引き出すことができます。
オントロジーはフォーマルロジック(記述ロジック、DL)の数学的装置に基づいており、その小さなサブセットはRDFスキームでカバーされています。 DLは、1次論理の計算可能なサブセットです。
セマンティクスの使用例
foaf辞書リソースのみを理解するアプリケーションの次のステートメントをどのように解釈しますか?
<Pugofka:rybmyas_day#30032011> <Pugofka:semantic#Lector> “ ”. <Pugofka:semantic#Lector> <rdfs:subClassOf> <foaf:Person>
Pugofka:セマンティック#Lectorがfoaf:Personであることを理解し、新しいステートメントを出力します。
<Pugofka: rybmyas_day#30032011> <foaf:Person> “ ”
セマンティックストレージ
大量のRDFデータがセマンティックストレージに格納され、SQLに類似したSPARQLクエリ言語がそれらにアクセスするために使用されることが想定されています。
SPARQLでのクエリ「Pugofkaによって作成されたすべてのプロジェクトを表示」の例:
PREFIX dc: <http://purl.org/dc/elements/1.1/> PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?title WHERE { ?project foaf:name “Pugofka”. ?project dc:title ?title}
方向性の開発の例として、新しいプロジェクトの作成を挙げることができます。 たとえば、Clark&Parsia社(
http://clarkparsia.com/ )は、セマンティックWebの分野でいくつかの本格的なプロジェクトをすでに実施しており、StarDogと呼ばれるRDFデータベースのベータテストの開始は4月の初日に予定されています。
セマンティックWebレベル
進化的アプローチ
セマンティックWebは、既存のインターネットに代わるものではなく、単にその進化的発展にすぎません。 RDF / XMLは、HTMLに埋め込まれるか、URLからアクセス可能です。
この原則によれば、RDFデータはRSS、FOAF(Friend Of A Friend)、DOAP(Description Of A Project)辞書を使用してWWWで広く使用されています。
LiveJournalユーザーページのサンプルFOAFコード
セマンティックWeb-目標、タスク、例
セマンティックWebテクノロジーは、次のタスクを正常に解決します。
- アプリケーションからのデータの独立性。
- セマンティックデータ統合;
- コンピューターエージェント(サービス)の広範な使用の基盤を作成します。
- データマイニング;
- エキスパートシステム;
- 単一認証の問題*。
*いくつかの可能な認証方法を備えたリソースと、サードパーティアカウントがリンクされているサイトのアカウント(VK、FB、Twi、OpenID、Oauth ...)がある場合、それがすべて同じユーザーであることを一意に識別することを学習できます。彼について利用可能なすべての情報をバインドします。
セマンティックWebはゼロから作成されたものではありません。 基本的な基礎が組み込まれています。
- 半構造化データ(OEM、Lore)の表示用のグラフィカルモデル。
- 正式なロジック(一次ロジック、知識ベース、フレーム);
- WWWアーキテクチャ(URI、Unicode、XML、HTTP);
- 公開鍵暗号。
セマンティックWebに関係する技術
- セマンティック検索;
- 質疑応答システム。
- エージェント;
- ナレッジプーリング(データベース統合);
- 全普及コンピューティング(ユビキタス/普及コンピューティング)
テクノロジーソフトウェアサポートの例
- すべての一般的なプログラミング言語(Jena、Redland、RDFLib)のRDF言語スタックを解釈するためのライブラリ。
- オントロジーエディター(Protégé);
- オントロジー推論システム(レーサー、KAON、FACT);
- セマンティックリポジトリ(ゴマ、コワリ、YARS);
- セマンティックブラウザ(Simile、Piggy Bank、Gnowsis、Haystack);
- セマンティックデータ検索エンジン(Swoogle);
- RDF / XML(Aperture、RDFizers、D2R)との間でデータを提示するためのさまざまな形式のコンバーター。
- アプリケーションプログラム(Bibster、FOAF Explorer);
- RDFデータベースStardog。
- 例
研究分野
- 基礎
- 知識工学とオントロジー工学
- 知識表現と推論
- 情報管理
- 基本的なウェブ情報技術
- エージェント
- 自然言語処理
- セマンティックWebコアのトピック
- インフラ
- リソース記述フレームワークとRDFSchema
- 言語
- オントロジー
- ルールとロジック
- 証明
- セキュリティと信頼とプライバシー
- 用途
- セマンティックWebの特別なトピック
- 自然言語処理と人間の言語技術
- セマンティックWebの社会的影響
- ソーシャルネットワークとセマンティックウェブ
- ピアツーピアおよびセマンティックWeb
- エージェントとセナティックWeb
- セマンティックグリッド
- 業界へのアウトリーチ
- ベンチマークとスケーラビリティ
セマンティックWebのタスクと問題:
- インデックス作成と情報検索;
- メタデータの開発とメンテナンス。
- 注釈メソッドの開発とサポート。
- 大規模で相互運用可能なデータベースとしてのWebの表現。
- マシンデータマイニングの組織;
- ウェブ指向サービスの発見と提供。
- インテリジェントソフトウェアエージェントの分野での研究。
おわりに
セマンティックWebは、動的で絶えず進化している概念であり、統合された作業システムのセットではありません。
Web 3.0は非常に多面的であり、現時点ではまだ形成されていない概念です。 さまざまな視点から見ることができます。
たとえば、マシンデータ処理(セマンティックWeb)の観点から見ると、具体的かつ関連する方法でデータを保存するという考え方があり、さまざまなサービス、アプリケーションなどでさらに自動化された処理、統合、再利用の可能性もありました。
インテリジェントエージェントの観点から見ると、目標はより「機械指向の」Web、
そのため、検索スパイダー(エージェント)を最も効果的に使用して、情報を検索および処理できます。
セマンティックWebの概念は、分散データベース、知識ベースの観点から、情報を一意に識別および相関させることができる追加のメタ情報を記述、追加することです。
Web 3.0の概念は、インフラストラクチャ全体の存在を意味します。
ユーザー(コンテンツコンシューマー)にサービスを提供するという観点から見ると、Web 3.0の考え方は、ユーザーアクションを最小限に抑え、リクエストへの応答としてリクエストへの直接応答を提供することです。これにより、リクエストだけでなく、履歴、機能全体(ソーシャル心理的なポートレート)、好み、興味および他の多くの要因。
検索品質の観点から-キーワードまたはコンテキストだけでなく、コンテンツによる検索の実装。 ユーザー要求に対する正確な応答を発行します。 多くの点で、検索エンジンをエキスパートシステムとして使用します。
セマンティックWebは、Webサービスの観点から、既存の静的サイトだけでなく、動的なサイト、アプリケーション、サービス、および有用なコンテンツを含むその他のリソースへのアクセスも提供します。