見出しを作成するための基礎としてグラフを使用する

定義


この記事では、グラフの構造に基づいたルーブリックを作成および使用する方法について説明します。
カテゴリ、カテゴライザ、カテゴリカタログ、サブジェクトインデックス、インデックス。 便宜上、これらの用語はすべてほぼ同じことを表していると想定しています。 そして、大きな違いがある場合、それらを明確に指し示します。
情報要素はほとんどの場合ファイルですが、一般的な場合、すべての情報は全体として表示されます。

はじめに


カテゴリは、さまざまなタスクを解決するために使用されます。


原則として、古典的なルーブリックはツリー構造に基づいています。 このような見出しの組織の主な利点は、単純さと普及率です。 各本には目次があります-これは古典的なツリー構造の例です。 この本にはいくつかのセクションがあり、各セクションは章や章などに分かれています。 見出しの深さは、本の構造の複雑さをよく反映しています。 しかし、この本は、古典的な意味で、「転送のみ」というプロパティを持つ情報の流れです。 つまり 目次を使用すると、ブック内の特定の場所を簡単に見つけることができます。次に、ブックを開き、ページごとに順番に読みます。
書籍が書籍として機能するときに問題が始まり、ルブリケーターを使用するときに、コマンドタイプ「SELECT * FROM BOOK WHERE TOPIC = 'Something Interesting'」のコンテンツへの選択的アクセスを整理しようとします。
画像
図 1インデックス

そのような試みの結果は-インデックスです。 これは、ポインターの非常に便利なビューです。 それによれば、興味のあるトピックが発生する本のテキストのセクションを簡単かつ簡単に見つけることができます。 しかし、このタイプのルーブリックの不便さの1つはここだけです。本全体に散在する結果をすぐにグループ化することは不可能です。
例:「材料表面の模倣」は4ページに記載されています。 これらのページは連続していません。 つまり、これらのページはすべて異なるセクションに属していると想定できます。 ただし、対応するセクションの名前を見つけるには、別の作業が必要です。書籍を目的のページにめくり、フッターがある場合はそのセクションの見出しを読んでください。

グラフの形で(ツリーではなく)ルブリケーターを構築する


小さな理論的余談から始めましょう:「ツリーはループを含まない接続されたグラフです」
この定義から、木の形で構築された古典的なルブリケーターは、無向グラフに基づいた本格的なルブリケーターの「剥ぎ取られた」バージョンであることがわかります。

グラフの形式で列見出しを作成する例


グラフに基づいて見出しの例を作成するために、多くの新人に近いエリア、つまり修復工事を行います。

ルートノード

グラフに「ルート」と発音されていないという事実にもかかわらず、グラフに基づいてルブリケータを作成するために、ノードの1つをルートに描画/割り当てます。 例では、これは「すべて」のノードになります。
「すべて」はグラフの頂点の1つであり、特別な目的があります。 この頂点は、rubricatorツリーのルートノードを表します。 (どのツリーもグラフで表現できるため、このような特別な目的の解釈はまったく受け入れられます)。
画像

rubricatorのルートノードの存在の必要性は、その存在の「親しみやすさ」によるものです。 このノードは、人がルブリケーターを使用するときに便利です。 会話、見出しの構造の説明は、常にメインセクションの選択から始まります。 また、このノードの存在により、「パン粉」などの便利な機能を実装できます。

コミュニケーションズ

関係は、グラフの原理に基づくルブリケーターが提供できる最も価値のあるものです。 古典的なツリーのようなルブリケーターとは対照的に、グラフは接続の指定を容易にします。接続の存在はサブジェクト領域の記述を完了するために必要ですが、ツリー構造内では設定できません。
例の列見出しの関係の編成をより詳細に検討してください。
画像
図 2列見出しのサイクル

図 2(上記)は、建設ポータルstroika.ruから取得したルブリケーターのサブセットを示しています
例では、「寄木細工の接着剤」という名前のセクションが強調表示されています。 このセクションに到達できるパスをたどると、「パーケット接着剤」ノードは、「すべて」ノードからルブリケーターの2つの異なるセクションを介して到達可能です。 「寄木張りの接着剤」ノードは、「接着剤」セクションと「寄木張り」セクションの両方に等しく適用されます。 さらに、このような態度のタスクは、グラフに基づく見出しにとっては自然です。
必要に応じて、グラフの各アークに優先度(重み)を設定することにより、このスキームを拡張できます。 そして、「寄木細工の糊」が寄木細工よりも接着剤であることを示すことが可能になります。 たとえば、次のように:
画像
図 3つの優先順位

見出しにサイクルを作成する機能は、次のカテゴリを操作する場合に非常に重要です。


複数の関係が存在することで、ルーブレーションが大幅に簡素化される例を示します。

グラフの頂点。 中間見出し

見出しグラフは、ルートノード「すべて」、ある見出しから別の見出しへの従属関係を示すグラフのエッジ、頂点(中間見出し)、および葉(ちょうど見出し)で構成されます。
厳密に記述されたルブリケーターを作成するには、グラフの頂点の物理的意味に関する質問に答える必要があります。 つまり グラフの上部にある特定の情報の所有権がどのように解釈されるかという質問に。 おそらく、場合によっては、グラフの頂点にルーブリックを割り当てることの意味を決定するよりも、グラフの頂点(葉ではなく!)の使用を完全に放棄する方が簡単です。
例を使用して、この質問をさらに詳しく検討してください。
画像
図 4シートおよびグラフの上部への情報の割り当て

情報要素「手紙」は見出し「寄木細工の接着剤」に割り当てられます。 ここでは、グラフのシートに情報が割り当てられます。 そして、これは手紙が寄木細工の接着剤を指していることを私たちに直接伝える明白な対応です。 見出しへの直接の明確な対応のオプションは、最も単純で一般的です。
より複雑なオプションは、「接着剤」セクションに割り当てられた「情報記事」要素です。 矛盾が生じる場合があります。
たとえば、見出し「接着剤」への言及は、記事が本質的に純粋に情報提供であり、一般に接着剤などの物質を説明することを意味する場合があります。 おそらく、「壁紙の接着剤」、「ゴムの接着剤」、「寄木細工の接着剤」などの詳細は言及していません。
別のオプションは、記事が特定の「寄木細工の接着剤」だけでなく「ゴムの接着剤」も説明する場合です。 この場合、「情報文字」要素のいずれかの見出し(グラフのシート)への割り当ては完全には正しくありません。
全体として、ツリー型のルブリケーターを使用する場合、グラフの頂点(中間ルブリック)を使用して情報をマークするか、それらのルビケーターの編集とナビゲーションを促進するためにのみ使用するかを決定する必要があります。
葉だけでなく、グラフの頂点も見出しとして使用することにした場合、情報の複数の見出しについて考える価値があります。

葉っぱ 終了セクション

グラフの葉は、グラフの頂点であり、1つのエッジのみでグラフの他の要素に接続されます。 見出し列に関連して、これらは最終的な見出しです。 つまり 小見出しに分割されていないルーブリック。
見出しグラフのリーフには、見出しのこの特定のセクションの選択に役立つ追加情報が含まれている場合があります。 この情報は、キーワードのセットにすることができます。
見出しグラフの頂点と葉を使用するための興味深いオプションの1つは、頂点と葉の両方が本質的にキーワードそのものである場合のオプションです。 この場合、グラフの頂点を見出しとして使用でき、葉がキーワードの役割を果たします。 rubricatorと自動rubricationアルゴリズムを構築するためのこのオプションは、次の記事で検討されます。

Source: https://habr.com/ru/post/J123934/


All Articles