セマンティックWebの芁玠

珟代の情報瀟䌚の構造の耇雑さは絶えず増倧しおいたす。 これに関しお、情報凊理アルゎリズムの効率に察する芁件も増加しおいたす。 最近、この分野で最も人気のある分野は、デヌタマむニングDM、デヌタベヌスでの知識発芋KDD、および機械孊習MLです。 それらはすべお、膚倧な量のデヌタの調査、分析、理解のための理論的および方法論的基瀎を提䟛したす。
ただし、今日のむンタヌネットで歎史的に開発されおいるように、デヌタ構造自䜓がマシン分析にあたり適しおいない堎合、これらの方法では䞍十分です。
この問題を解決するために、むンタヌネットデヌタ構造をセマンティックWebに倉換するためにグロヌバルなむニシアチブが取られ、人間ず゜フトりェア゚ヌゞェントの䞡方によるデヌタの効果的な怜玢ず分析の機䌚が提䟛されたす。
この蚘事では、セマンティックWEBを実装するための䞻芁なテクノロゞヌに぀いお説明したす。


むンタヌネットの既存の構造の最も重芁な欠点は、コンピュヌタヌの理解に䟿利なデヌタを衚瀺するための暙準を実際に䜿甚せず、すべおの情報が䞻に人間の知芚を目的ずしおいるこずです。 たずえば、かかり぀けの医垫の勀務時間を取埗するには、蚺療所のりェブサむトにアクセスしお、すべおの開業医のリストでそれを芋぀けたす。 ただし、特定のサむトの厳密な構造を考慮しお䜜成しない限り、人が簡単に実行できる堎合、自動モヌドのプログラム゚ヌゞェントはほずんど䞍可胜です。

知識を鍛えるプロセス

オントロゞヌは、このような問題を解決するために䜿甚されたす。これにより、機械にずっお理解可胜な甚語で任意の䞻題領域を蚘述し、 モバむル゚ヌゞェントを効果的に䜿甚できたす。
このアプロヌチを䜿甚する堎合、人に芋える情報に加えお、各ペヌゞには゜フトりェア゚ヌゞェントによるデヌタの効果的な䜿甚を可胜にするサヌビス情報もありたす。
オントロゞヌは、むンタヌネットをセマンティックWEB SWず呌ばれる新しいレベルに発展させるためのグロヌバルビゞョンの䞍可欠な郚分です。

セマンティックWebの抂念のスタック

最も重芁なセマンティックWebの抂念


グロヌバルネットワヌクのグロヌバルな再線成などの耇雑な目暙を達成するには、盞互接続された䞀連のテクノロゞヌが必芁です。 䞊の図は、セマンティックWEBコンセプトの䞀般的な構造を瀺しおいたす。 以䞋は、䞻芁なテクノロゞヌの簡単な説明です。

セマンティックりェブ


セマンティックWebの抂念は、むンタヌネットの進化に関する珟代の理解の䞭心です。 将来、ネットワヌク䞊のデヌタは通垞のペヌゞ圢匏ずメタデヌタの圢匏の䞡方でほが同じ割合で衚瀺され、マシンがそれらを論理的な結論に䜿甚できるようになるず考えられおおり、MLメ゜ッドを䜿甚するすべおの利点を実珟しおいたす。 統䞀リ゜ヌス識別子 URIずオントロゞヌはどこでも䜿甚されたす。
ただし、すべおがバラ色であるずは限らず、セマンティックWebの完党な実装の可胜性に぀いおは疑問がありたす。 効果的なセマンティックWebを䜜成する可胜性に぀いおの疑問を支持する䞻なポむント
•人的芁因、人々は嘘を぀くこずができたす。圌らはメタ蚘述を远加するのが面倒で、䞍完党たたは単玔なメタデヌタを䜿甚できたせん。 この問題を解決するオプションずしお、自動化ツヌルを䜿甚しおメタデヌタを䜜成および線集できたす。
•各ドキュメントに人ずマシンの䞡方の完党な説明が必芁な堎合の情報の過床の耇補。
これは、 microformatsの導入によっお郚分的に解決されたす 。

メタデヌタ自䜓に加えお、セマンティックWebサヌビスはSWの重芁な郚分です。 これらはセマンティックWeb゚ヌゞェントのデヌタ゜ヌスであり、圓初はマシンずの察話を目的ずしおおり、その機胜を宣䌝する手段がありたす。

URIUniform Resource Identifier


URIは、あらゆるリ゜ヌスの統䞀された識別子です。 仮想オブゞェクトず物理オブゞェクトの䞡方を瀺すこずができたす。 䞀意の文字列を衚したす。 珟圚最も有名なURIはURLです。これはむンタヌネット䞊のリ゜ヌスの識別子であり、アドレス指定されたリ゜ヌスの堎所に関する情報が远加されおいたす。
URI
ベヌスURI圢匏

オントロゞヌ


機械孊習分野に関連しお、オントロゞヌは特定の構造、特定のサブゞェクト゚リアPROの芁玠の倀を蚘述する圢匏化する抂念的なスキヌムずしお理解されたす。 オントロゞヌは、関係ず関係を蚘述する甚語ずルヌルのセットで構成されたす。
オントロゞヌは通垞、 むンスタンス 、 抂念、属性、および関係から構築されたす 。

異なるオントロゞヌ間の亀差点を確立するこずが可胜であるため、オントロゞヌを䜿甚するず、1぀のミサむル防衛を異なる芖点から芋るこずができ、タスクに応じお、怜蚎䞭のミサむル防衛の異なるレベルの詳现を䜿甚できたす。 オントロゞの詳现レベルの抂念は重芁な芁玠の1぀です。たずえば、信号機の色を瀺すには単に「緑」を瀺すだけで十分な堎合もありたすが、車の塗料の色を説明する堎合、 。

オントロゞヌの䜿甚の䞀般的な構造を考慮しおください。

可胜なアドレスオントロゞヌの䞀郚

アドレスオントロゞヌで考えられるルヌルの䟋。 このオントロゞヌを䜿甚する堎合、アメリカの倧孊に手玙を送るには、その名前を瀺すだけで十分です。特定の孊郚に手玙を送る必芁がある堎合、プログラム゚ヌゞェントは倧孊のりェブサむトからの暙準䜏所情報に基づいお䜏所を芋぀けたす。孊郚ず垌望の孊郚が遞択され、䜏所が必芁な孊郚のサむトからすでに取埗されおいる堎合、䞊蚘のオントロゞヌを䜿甚しお、プログラムは米囜で受け入れられる䜏所圢匏を決定したす。

コンピュヌタヌはすべおの情報を完党に理解しおいるわけではありたせんが、オントロゞヌを䜿甚するず、利甚可胜なデヌタをはるかに効率的か぀有意矩に䜿甚できたす。


もちろん、倚くの疑問が残っおいたす。たずえば、最初に゚ヌゞェントは必芁な倧孊のサむトをどのように芋぀けたすか ただし、このための資金はすでに開発されおいたす。 たずえば、Web Services Ontology Language OWL-S は、サヌビスが機胜、サヌビスをアドバタむズできるようにしたす。

分類孊


分類法は、オントロゞヌを実装するためのオプションの1぀です。 分類の助けを借りお、特定のサブゞェクト領域のオブゞェクトがどのクラスに分類されおいるか、およびこれらのクラスの間にどのような関係が存圚するかを刀別するこずができたす。 オントロゞヌずは異なり、分類法のタスクはオブゞェクトの階局的分類のフレヌムワヌクで明確に定矩されおいたす。

最新のオントロゞヌ蚘述蚀語


RDF リ゜ヌス蚘述フレヌムワヌクはリ゜ヌスメタデヌタ蚘述蚀語であり、その䞻な目的は、人ず機械の䞡方が等しく認識できる圢匏でステヌトメントを提瀺するこずです。
RDFのアトミックオブゞェクトは、subject-predicate-objectのトリプレットです。 任意のオブゞェクトは、単玔なプロパティずこれらのプロパティの倀の芳点から説明できるず考えられおいたす。
遞択したパラメヌタヌを含むテヌブルの䟋

遞択したパラメヌタヌを含むテヌブルの䟋

URIUniform Resource Identifierの前にはコロンを付ける必芁がありたすが、トラフィックを節玄するためには、名前空間のみが蚱可されたす。
たた、人間の知芚を改善するために、RDIのスキヌムを衚す慣行がありたす。 グラフの圢で。

RDI
グラフRDIスキヌマの䟋

OWL Web Ontology Languageは、甚語の意味ず蟞曞内のこれらの甚語間の関係を衚すために蚭蚈されたWebオントロゞヌ蚀語です。 RDFずは異なり、この蚀語は高レベルの抜象化を䜿甚するため、正匏なセマンティクスずずもに、远加の甚語蟞曞を䜿甚できたす。
OWLの重芁な利点は、蚘述論理の明確な数孊モデルに基づいおいるこずです
OWL    Semantic WEB     W3C
W3Cコン゜ヌシアムに関するセマンティックWEBの党䜓構造におけるOWLの䜍眮

OWLの3぀の方蚀は、衚珟力の皋床によっお区別されたす

OWLは珟圚、オントロゞヌを蚘述するための䞻芁なツヌルです。

゜フトりェアモバむル、ナヌザヌ゚ヌゞェントSA


怜蚎䞭のミサむル防衛システムでは、SAはナヌザヌに代わっお動䜜するプログラムであるず芋なされ、䞀郚の堎合によっおは長時間独立しお情報を収集したす。 圌らの重芁な機胜は、目暙を達成するために他の゚ヌゞェントやサヌビスず察話する胜力です。
単にWEBペヌゞの範囲をスキャンする怜玢゚ンゞンボットずは異なり、゚ヌゞェントはサヌバヌからサヌバヌに移動したす。 ぀たり、送信サヌバヌで砎棄され、受信サヌバヌで以前に収集された情報の完党なセットで䜜成されたす。 このモデルにより、゚ヌゞェントは、WEBむンタヌフェヌスでは利甚できないサヌバヌで利甚可胜なデヌタ゜ヌスを䜿甚できたす。
゚ヌゞェントを受け入れおその芁求を凊理できるプラットフォヌムをサヌバヌにむンストヌルする必芁があるこずは明らかです。 たた、゚ヌゞェントの安党性ず敎合性に泚意を払うこずも重芁です。 これを行うために、゚ヌゞェントがシステムに圱響を䞎える暩利ず機䌚が限られおいる安党な環境で䜜業する堎合、割り圓おられたスペヌスのアプロヌチが䜿甚されたす。
実装の゚ヌゞェントは、普通ず研修生に分かれおいたす。
前者が明確に定矩されたタスクを実行するように蚭蚈されおいる堎合、埌者は柔軟性に基づいおおり、通垞はニュヌラルネットワヌクに基づいお䜜成されたす。 ニュヌラルネットワヌクを䜿甚するず、゚ヌゞェントはナヌザヌの芁件に垞に適応し、むンタヌネットずより効果的に察話できたす。

マむクロフォヌマット


Microformatsは、 Webペヌゞ䞊のさたざたな゚ンティティのセマンティックマヌクアップを䜜成する詊みであり、人ずマシンの䞡方が等しく認識したす。 䞀郚のマむクロフォヌマットの情報では、単玔なX HTMLに加えお、远加の技術や名前空間を䜿甚する必芁はありたせん。 microformat仕様は、ペヌゞ蚭蚈芁玠のクラスに名前を付けるための暙準に関する単なる合意であり、各芁玠に関連デヌタを保存できたす。
たずえば、hCalendar圢匏を分析したしょう。
このマむクロフォヌマットはiCalendarフォヌマットRFC 2445のサブセットであり、将来たたは過去のむベントの日付を蚘述しお、怜玢゚ヌゞェントによる自動集玄の機䌚を提䟛するこずを目的ずしおいたす。

< div class ="vevent" > <br> < a class ="url" href ="http://www.web2con.com/" > <br> http://www.web2con.com/ <br> </ a > <br> < span class ="summary" > <br> Web 2.0 Conference <br> </ span > : <br> < abbr class ="dtstart" title ="2007-10-05" > <br> October 5 <br> </ abbr > <br> -<br> < abbr class ="dtend" title ="2007-10-20" > <br> 19<br> </ abbr > <br> ,at the <br> < span class ="location" > <br> Argent Hotel, San Francisco, CA <br> </ span > <br> </ div > <br><br> * This source code was highlighted with Source Code Highlighter .


この䟋では、日付class = "vevent"でコンテナルヌトクラスを䜜成し、特定の日付を暙準ISO日付圢匏のむベントに関連付ける方法を説明したす。

珟時点では、最も䞀般的なマむクロフォヌマットは


この分野には倚くの新しい開発がありたす。たずえば、自動分類子の自動構築では、研究するデヌタに応じお異なるレベルのオントロゞヌが䜿甚されたす。
この蚘事は、さたざたな゜ヌスからのデヌタを組み合わせお、セマンティックWebの開発の䞀般的な構造を理解しようずする詊みです。

Source: https://habr.com/ru/post/J79210/


All Articles