セマンティックWebは開発途上にあり、地方のWebスタジオは
セマンティックと
セマンティックの言葉の価格を引き上げていないが、PHPでこの獣を操作するためのツールを見てみましょう。
英語以外の言語分野では、概念と技術全体を理解することができなかったように、ほとんどの用語が適用されなかったことは注目に値します。 一部の人にとって、セマンティックネットワークは、おいしいパンとhtml5の同義語です。一部の人にとっては、RDFの普及、ストレージとデバイスの開発です。
製品のセマンティクスのサポートは、drupal.org、ontowiki.net、semantic-mediawiki.org、talis.comによって発表または実装されています。 さらに、専門の
WYSIWYGエディターloomp.orgもあります。
現在(2012年春)、パブリックライブラリであると主張する2つのソリューションがあります。これらは
PHPと
ARC2 用のRDF APIです 。
RAPは、2008年の最新バージョンのより良い時期まで延期されます。 PHP 4バージョンのサポートがあります-これは非常に疑わしい利点ですが、おそらく誰かがそれを必要とするでしょう。 しかし、
このページの後、RAPへの関心は完全に消えました。
理論
安全にスキップしてサンドボックスに移動できる、小さな理論的な紹介コース。
用語集:
- triple、triplet-subject-predicate-objectの形式の値
- triplestore-トリプルストレージ
- RDFはメタデータ記述モデルであり、その主なアイデアは、情報リソースの関係、プロパティ、および状態を格納するためのトリプレットの使用に基づいています
- RDF / XML、RDF / JSON、RDFa-xml、json形式、およびマークアップ要素の属性でのモデルの説明
- SPARQL -RDFを使用して記述されたデータのクエリ言語
例として、「マーシャには赤い車があります」というフレーズと一連のトリプレットを考えてみましょう。
- マーシャは車を所有しています
- マーシャは男です
- 機械には色があります
- 色は赤です
一方、
man 、
machine 、および
colorの説明を続けると、4つ以上のフレーズが1つのフレーズから取得されました。 一方、これらのステートメントは、コンピューター処理にとってはるかに簡単です。
RDFは、情報リソースの統一された記述に使用されます。 任意に複雑なモデルの中心にあるのは、1つの概念です。 これにより、ストレージの実装を大幅に簡素化し、クエリの言語を標準化することができます(たとえば、「赤いマシン」の所有者を表示する)。
サンドボックスをまとめる
ARC2ライブラリはボックスとして使用され、
スターターパックは砂として機能します。
サーバーの設定には特別なものは必要ありません。ubuntuの標準のLAMPサーバーで十分です。
少なくとも、PHP 5.3用のlibxml、ソケットモジュールが必要になります。*独自のサーバーアセンブリがある場合は、リポジトリとしてMySqlが必要です。
インストールはわいせつに簡単です、あなたは両方のパッケージを展開し、ファイル
tuukka-arc2-starter-pack / config.phpにライブラリarc2へのパスを書く必要があります:
include_once(dirname(__FILE__).'/../arc2/ARC2.php');
ライブラリフォルダーの名前は
semsol-arc2-xxxxxxxからsimple arc2に、
tuukka-arc2-starter-pack-xxxxxxxからtuukka-arc2-starter-packに変更されました。
config.phpのパスに加えて、データベース設定を登録する必要があります。以下のセクションがこれを担当します。
$arc_config = array( 'db_host' => 'localhost',
スターターパッケージがWebサーバーディレクトリにインストールされている場合、
localhost / tuukka-arc2-starter-pack / endpoint.phpを要求すると、要求を送信するためのフォームが表示されます。
コンソールを介してリクエストを送信できます。そのためには、ファイル
tuukka-arc2-starter-pack / cli.php (chmod + x cli.php)の実行を有効にする必要があります
結果形式を除いて、コンソールまたはWebの下から開始することに大きな違いはありません。
WebサンドボックスはXMLを返します。
実験用ネズミは
エリック・ミラーのページになります
ページのソースコードでは、ダウンロード用のデータへのリンクが重要です。
<link rel="meta" type="application/rdf+xml" title="Contact" href="contact" />
最初に行うことは、クエリを使用してリポジトリにデータを追加することです。
LOAD <http://www.w3.org/People/EM/contact
コンソールから起動するには、
tuukka-arc2-starter-packフォルダーで次のコマンドを実行します。
./cli.php "LOAD <http://www.w3.org/People/EM/contact#me>"
答えは次のようになります。
Loaded 32 triples
Webインターフェース経由でこれ:
<?xml version="1.0"?> <sparql xmlns="http://www.w3.org/2005/sparql-results#"> <head> </head> <inserted>32</inserted> </sparql>
データのアップロードに成功しました。リポジトリのすべての名前をリクエストします。
PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name WHERE { ?x foaf:name ?name }
答えは:
name Eric Miller
技術的には、クエリ言語はSQLに多少似ていますが、1つの重要な違いがあります。
SQLはデータを含むテーブルへのクエリの言語であり 、
SPARQLはグラフへのクエリの言語です 。
リポジトリにあるすべてのニックネームと連絡先メールボックスをリクエストします。
PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?nick ?mbox WHERE { ?x foaf:name ?name . ?x foaf:nick ?nick . x foaf:mbox ?mbox }
答えは:
name nick mbox Eric Miller em mailto:em@w3.org
使い慣れた連絡先すべてのリストを取得します。
PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?knows WHERE { ?x foaf:name ?name . ?x foaf:knows ?knows }
答えは:
name knows Eric Miller http://www.w3.org/People/Berners-Lee/card#i Eric Miller http://www.w3.org/People/Connolly/#me Eric Miller http://www.w3.org/People/djweitzner/public/foaf.rdf#DJW
最後の連絡先のデータをダウンロードする-ダニエルワイツナー:
LOAD <http://www.w3.org/People/djweitzner/public/foaf.rdf
答えは:
Loaded 113 triples
おなじみの連絡先をすべて再度確認します
PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?knows WHERE { ?x foaf:name ?name . ?x foaf:knows ?knows }
答えは:
name knows Eric Miller http://www.w3.org/People/Berners-Lee/card#i Eric Miller http://www.w3.org/People/Connolly/#me Eric Miller http://www.w3.org/People/djweitzner/public/foaf.rdf#DJW Daniel Weitzner _:b279264211_arc8d9fb5 Daniel Weitzner _:b2309778025_arc8d9fb6 Daniel Weitzner _:b420706296_arc8d9fb9 Daniel Weitzner _:b2549551164_Tim Daniel Weitzner _:b2407349360_arc8d9fb10 Daniel Weitzner _:b1728586196_DanC Daniel Weitzner _:b4168748262_arc8d9fb11 Daniel Weitzner _:b1634950492_arc8d9fb12
奇妙な人格はダニエルを知っています。
ダニエルのニックネームを学びます:
PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?nick WHERE { ?x foaf:name 'Daniel Weitzner' . ?x foaf:nick ?nick }
答え
nick Danny
通常、Webソースから情報を収集するタスクは、いくつかの方法で解決されます。
- データを含むソースを見つける
- データを取得(正規表現、ツリークエリを使用)またはサイト所有者から取得(RSS、API)
- 便利なストレージに保存
- データの使用-受信と処理
このソリューションには1つの大きな欠点があります-各ソースに対してデータ収集を実装する必要があります。
その結果、実装(グラバー、ストレージ、リクエスト)の数が非常に多くなる可能性があります。
APIが存在することでプロセスが大幅に簡素化されますが、統合と標準化について考える必要はありません(さらに、APIは必ずしもデータではありません)。
セマンティックネットワークの概念は、エリックミラーの連絡先ページのようなソースの存在を前提としています。これは、コンテンツの操作に便利です。
これは今日と昨日との違いです。
戦いに
ARC2ライブラリをさらに詳しく見てみましょう。
Ericのページからデータを受け取り、生の形式で表示するコード:
include_once("arc2/ARC2.php"); $parser = ARC2::getRDFParser(); $parser->parse('http://www.w3.org/People/EM/contact#me'); print_r($parser->getTriples());
結論:
Array ( [0] => Array ( [s] => http:
トリプレット配列の構造が指定されています:
- sサブジェクト値(URI、Bnode ID、または変数)
- pプロパティまたは変数のURI
- oオブジェクトの値(URI、Bnode ID、リテラルまたは変数)
- s_type "uri"、 "bnode"または "var"
- o_type "uri"、 "bnode"、 "literal"または "var"
- o_datatypeタイプURI
- o_lang言語識別子、たとえば「en-us」
getTriples()の代わりに
getSimpleIndex()を使用すると、出力がより意味のあるものになります。
Array ( [http:
リクエスト(config.phpからコピー)の例では、サンドボックスリポジトリを使用します。
$config = array( 'db_host' => 'localhost', 'db_user' => 'root', 'db_pwd' => '', 'db_name' => 'arc2test1', 'store_name' => 'sandbox', ); $store = ARC2::getStore($config); $q = ' PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?nick WHERE { ?x foaf:nick ?nick .} '; $rows = $store->query($q); print_r($rows); print_r($store->getErrors());
結果:
Array ( [query_type] => select [result] => Array ( [variables] => Array ( [0] => nick ) [rows] => Array ( [0]=> Array ( [nick] => em [nick type] => literal ) [1]=> Array ( [nick] => Danny [nick type]=> literal ) ) ) [query_time] => 0.060401201248169 )
次に、必要に応じて配列を操作します。
興味深いことはこれで終わりではありません。ARC2ライブラリには多くの興味深い機能があり、セマンティクスについてはさらに10年間論文を書くことができますが、これはすべて記事の範囲外です。
しかし、会議が開催されたことを願っています。
ご清聴ありがとうございました!