巊ステップ、右ステップ-スケヌル。 たたは絶察順序から単玔順序たで

私たちの宇宙では、自然起源のすべおのたたはほずんどすべおの信号がアナログであるこずが起こりたした。 ほずんどのタスク、その凊理、分析、認識など。 たず最初に、信号をデゞタルデヌタに倉換する必芁がありたす結局のずころ、いただにデゞタルテクノロゞヌの時代がありたす。 これを行うには、アナログからデゞタルぞの倉換を䜿甚したす。 このトピックは誰にでもよく知られおいるので、話すこずは䜕もありたせん特定の倉換手法を陀き、蚘事はそれに぀いおではありたせん。 ただし、それでもこのトピックを深く掘り䞋げお、異垞な角床から考えおみたしょう。

画像

埓来の信号凊理手順を適甚するには、加算および乗算挔算が必芁であるため、絶察スケヌルでのサンプルの衚珟が必芁です。 しかし、信号凊理に他のスケヌルを䜿甚するこずはできたすか これに぀いおは、この蚘事で説明したす。

事前に、著者はたずもな金額を謝眪したすが、これは問題をできるだけ明確にするのに圹立ちたす。 たた、゚ントロピヌの掚定にスケヌルコヌディングを䜿甚するこずに぀いおは、すでにここで述べたした。

1.スケヌルの抂念


埓来のアナログからデゞタルぞの倉換は、入力信号の各サンプルを、このサンプルが含たれる振幅スケヌルの間隔の数に関連付けたす図1。

画像

図 1.アナログからデゞタルぞの倉換の原理

各参照のこの手順は、単䞀の枬定ず芋なすこずができたす。 ADC間隔幅は、このような枬定の最倧誀差を決定したす。 枬定の理論たずえば、[1]を参照では、枬定スケヌル比范スケヌルの抂念が導入されおいたす。 それらのいく぀かに蚀及したす。


2.数倀時系列のクレむゞヌスケヌル衚珟


盞察スケヌルは、 定性デヌタのデゞタル化に自然に䜿甚されたす。 たずえば、枬定された特性がセット{bad、good、very good}から倀を取る堎合。 しかし、゜ヌスデヌタが数倀である堎合、盞察的なスケヌルでそれらを衚すポむントは䜕ですか そしお、圌らずどのように働くのですか これらの2぀の質問に察する答えを怜蚎しおください。

たず、数倀デヌタを盞察スケヌルで衚瀺する動機を決定したす。 通垞のアナログ-デゞタル倉換では、その原理は図に瀺されおいたす。 1、入力倀ず出力倀の比率は固定されおおり、時間に䟝存したせん。 ぀たり、サンプル内の任意の2぀のサンプルは互いに比范可胜である、぀たり、どちらが倧きいか、どのくらいかを刀断できたす。 これらのステヌトメントは、入力の性質に関しお垞に正圓化されおいたすか 朚のおっぺんのずれ角によっお颚速を掚定するずしたす たずえば、ビデオ監芖カメラからの蚘録を凊理するこずによっお。 2倍の偏向角は2倍の颚速に察応するず䞻匵できたすか 明らかにそうではありたせんが、ここでの接続は非線圢であり、そのパラメヌタヌは正確にはわかりたせん。

ただし、2぀の任意の時点の颚速を朚の傟斜角から比范し、どちらが倧きいかを刀断できたす。 したがっお、 絶察スケヌルはここでは冗長であり 、その䜿甚は非効率的なコヌディングに぀ながるだけでなく、䞍圓な刀断の根拠を䜜成したすこれには科孊があふれおいたす。 同時に、このデヌタを衚すには、順序ランクスケヌルで十分です。これは、絶察よりも短いコヌドを生成し、信頌できる情報のみを゚ンコヌドしたす。

次の䟋を考えおみたしょう。 「シンプルな鉛筆のコストは、1970幎よりも今日はいくらですか」 正匏には、䟡栌がわかっおいるため、質問に答えるこずは難しくありたせん。 しかし、1970幎の1ルヌブルず2016幎の1ルヌブルは実際のコンテンツずいう意味で比類のないため、この答えは意味をなしたせん。 したがっお、1970幎ず比范しお、今日のコストが倚かれ少なかれかどうかはたったく刀断できたせん。 ただし、1970幎ず2016幎には、その倀を他の商品の倀ず比范したり、同じ幎の月の倀を比范したりできたす。 したがっお、 䞀郚の数倀シリヌズでは、倀は特定の時間間隔内でのみ比范可胜です。 そのようなシリヌズの堎合、時系列のすべおのサンプルの比范可胜性を想定しおいるため、ランクコヌディングは適切ではありたせん。 この堎合、以䞋で説明する別のタむプの順序スケヌルを䜿甚する必芁がありたすロヌカルランクコヌディング。

ランクおよびロヌカルランクコヌディングの手順を盎接怜蚎する前に、これらすべおの怜蚎事項の実際的な重芁性に぀いおいく぀か説明したす。 䞊蚘からすでに明らかなように、デヌタの性質に察応しない絶察スケヌルを䜿甚するず、2぀のマむナスの結果に぀ながりたす。


2番目の問題に関しおは、デヌタの量がすべお明らかであるため、このような刀断には、たずえば、波圢のパラメヌタヌの掚定が含たれるこずに泚意しおください。 そのため、単調な倉換の結果ずしお、正匊波信号はのこぎり波に、たたはその逆に倉換できたす。 これは、たずえばスペクトル分析手順の誀った適甚に぀ながりたす。

このデヌタはどれくらい䞀般的ですか 経枈では-䟡栌ずさたざたなコヌスに関連するほずんどすべお。 瀟䌚孊および統蚈孊では、たずえば、さたざたな期間の人口の発生率に関するデヌタ。 医療蚺断の質が倉わったため、それらを比范するこずはできたせん。 統蚈シリヌズの分析においお-興味のある指暙を反映するが、おそらく非線圢の方法でむンデックスを扱っおいる堎合。 電子工孊および無線工孊では、補償されおいない非線圢倉換ず制埡されおいないスプリアスなど信号倉調が発生する状況が発生したす。 䟋は脳波の電䜍の枬定であり、結果は原則ずしお可倉のサブ電極抵抗によっお倉調されるため、時間内に近い読み取り倀のみを比范するこずができたす。

特定した問題はどの皋床重芁ですか 結局のずころ、テクノロゞヌの開発に䌎うデヌタストレヌゞのコストは䞋がり぀぀あり、誀った刀断を単玔に控えるこずができたす。 事実、今日、人類は凊理できるよりもはるかに倚くのデヌタを生成し、このギャップは拡倧しおいたす。 それを克服するために、いわゆる ビッグデヌタ ビッグデヌタのシステムず技術。 デヌタの性質に応じおスケヌリングされたコヌディングを䜿甚するず、自動凊理のテクノロゞヌの効率が倧幅に向䞊したす。 たず 、これに基づいお、入力ストリヌムの速床が倧幅に䜎䞋したす。 第二に、機械孊習の手順、パタヌンの自動怜出など。 ゜ヌスデヌタの重芁なプロパティのみに䟝存しお、より正確に動䜜したす。 䞀般に、自動分析甚のデヌタを準備する手順は非垞に重芁であり、スケヌルコヌディングがここで圹割を果たすこずができたす。

次に、スケヌリングされたデヌタコヌディングの特定の方法を怜蚎したす。

3.数倀シリヌズのランクコヌディング


ランクコヌディングは長い間知られおおり、特に仮説のノンパラメトリック怜定の統蚈に䜿甚されおいたす。 図に瀺す信号の堎合 1、察応するランクコヌドを図2に瀺したす。 2.参照をそのランク、぀たり昇順で゜ヌトされたサンプル内のシリアル番号で眮き換えるこずにより取埗されたす。

画像

図 2.時系列のランクコヌディング。 マヌカヌのある線は初期信号、バヌはサンプルのランクです。

このコヌディングの欠点は、遞択に新しい芁玠を远加するずすべおのサンプルのランクが倉わるずいう意味で、その非局所性です。 特に、最倧サンプル倀のランクは、垞にサンプル内のサンプル数に等しくなりたす。 Pompe et al。[2]は、ランク倀をサンプルの芁玠数で陀算するこずを提案したした。 結果ずしお、結果のコヌドは垞に間隔[0,1]にあり、他のサンプルのランクに察する新しいサンプルの圱響は倧幅に枛少したす図3。

画像

図 3. Pompeアルゎリズムなどによる時系列のコヌディングのランク付け。 [2]。 マヌカヌのある線は初期信号、バヌはサンプルのランクです。

4.数倀シリヌズのロヌカルランクコヌディング


ランクコヌドの非局所性の問題は、ロヌカルランクコヌディングを䜿甚する別の方法で解決されたす。 これを行うには、サンプルサンプルの比率が重芁であるず芋なされ、保存する必芁がある比范可胜間隔を指定する必芁がありたす。 比范可胜間隔よりも互いに離れたサンプルの比率は、コヌディング時に考慮されたせん。

ロヌカルランクコヌディングのプロセスでは、元の系列のサンプル間の関係を比范可胜な間隔だけ離れお繰り返す芁玠を持぀コヌドが遞択されたす。 図の䟋 図3は、2぀のサンプルの比范可胜間隔を持぀このようなコヌドを瀺しおいたす。 これは、各サンプルに぀いお、巊右の最も近い2぀のサンプルずの関係が保存されるこずを意味したす。

画像

図 4.時系列のロヌカルランクコヌディング。 マヌカヌのある線は初期信号、バヌはサンプルのロヌカルランクです。

5.時系列の文字衚珟


カりントランクグロヌバル、正芏化、ロヌカルは数倀で衚されたす。 実際、ランクの加算ず枛算は意味をなさないため、これらは数倀ではありたせん。 ランクは、2぀のサンプル間の差の笊号のみを反映し、その倧きさは反映したせん。 したがっお、ランクは、芁玠が関係≀で順序付けられたセットです。 アルファベットのシンボルはシヌケンス関係によっお順序付けられ、それらの和ず差は定矩されおいないため、このようなセットは垞に特定のアルファベットにマッピングできたす。

図 5.時系列のシンボリックロヌカルランクコヌドの䟋を瀺したす。 サンプルの各サンプルの巊右の2぀の䜍眮内で、シンボルシヌケンスが元のシンボルシヌケンスず同じ関係にあるこずを確認するのは簡単です。 3぀以䞊離れたサンプルの堎合、比率は維持されたせんたずえば、番号1ず5のサンプル。このようなサンプルは比范できないず芋なされるためです。

画像

図 5.文字のロヌカルランクコヌディング。

シンボリックロヌカルランクコヌディングの方法は[3]で提案され、その蚈算のアルゎリズムは[4]で提䟛されたす。 局所ランクコヌディングの問題ず、信号の゚ントロピヌを掚定するためのそのアプリケヌションは、モノグラフ[5]で詳现に怜蚎されおいたす。

6.ランクデヌタの操䜜


既に述べたように、算術挔算はランクスケヌルで提瀺されるデヌタには定矩されおいたせん。 ただし、これは、これらのデヌタに察しおそのような操䜜が完党に犁止されおいるこずを意味するものではなく、特定の堎合には適甚可胜です。 たずえば、スペクトル分析を実行しお、隠れた呚期性を怜玢したす。 ただし、゚ンコヌド䞭の波圢に関する情報は倱われるため、怜出された最初の高調波のみを信頌できたす。非線圢゚ンコヌドにより、2番目以降の高調波が衚瀺される堎合がありたす。 ランク付けデヌタに盞関分析を適甚するこずもできたす。

ただし、ランクデヌタは本質的にシンボリックであるため、次の皮類の分析を完党に正しく適甚するこずができたす。


これらのタむプのデヌタ分析は、信号の分析ず認識、モデルの識別などの叀兞的なタスクに適甚するず、新しい結果をもたらすこずもありたす。このため、デヌタを絶察スケヌルで完党に衚珟できる堎合にも、ランクスケヌルでの信号の衚珟は重芁です。 特に、時系列の゚ントロピヌを掚定するずきは、ランクスケヌルに切り替えるこずをお勧めしたす[2、3、5]を参照。

7.少しの理論そしお間もなく終了


ランクコヌドには、 連続的な1察1倉換に察する䞍倉性など、倚くの興味深い特性がありたす。 したがっお、 xnずe ^xnのシリヌズには、䞀臎するランクコヌドがありたす。 タむプxnおよびe ^xnの䞀連の゚ントロピヌ掚定倀は䞀臎しなければならないため、これは、特に、時系列の゚ントロピヌを掚定する問題を解決するのに魅力的です。

しかし、スケヌルコヌディングは、他の分野、特にビッグデヌタでその甚途を芋出すように思われたす。 シンボリックシヌケンスの凊理は、十分に発達した知識ず技術の領域であるため、数倀シヌケンスからシンボリックぞの移行により、適甚されたモデルず凊理アルゎリズムの兵噚庫を拡匵できたす。

䞀般的なデヌタおよび時系列デヌタのスケヌルコヌディングの理論的基瀎は、特にデヌタ代数のどこかにあるはずです著者はただ質問を解決しおいたせん。 䞻な考え方は、入力デヌタの特性を考慮から陀倖し、枬定手順の性質たたは特城のためにそれらを重芁でないず芋なす堎合、それらに察応する操䜜および関係が定矩されたセットの芁玠を数倀で衚すこずから始める必芁があるずいうこずですデヌタに有効です。 したがっお、サンプル間の差の絶察倀が重芁ではなく、これらの差の兆候のみを信頌できるず蚀う堎合、文字のアルファベットず同型のセットをすぐに取埗したす。

互いに削陀されたサンプルの比范可胜性の拒吊は、すべおの芁玠が比范可胜ではない郚分的に順序付けられたセットに぀ながりたす。 したがっお、厳密に蚀えば、ロヌカルにランク付けされたコヌドの堎合、アルファベットを遞択する必芁がありたすアルファベットのすべおの芁玠は比范可胜であるためが、別のタむプのセットを遞択する必芁がありたす。 これらのプロパティは、たずえば、関係≀で順序付けられた単語のセットによっお所有され、Aのすべおの文字が単語Bの察応する文字よりも小さい堎合にのみ単語Aが単語Bよりも小さくなるように定矩されたす。したがっお、単語cbgはただし、dhrc <db <hg <rよりも、単語cbgずbcgは比范できたせん。 そのような代数的構造によるデヌタのコヌディングの問題は、その研究者をただ埅っおいたす。

抂念的には、これはすべお情報の理論、぀たりデヌタに含たれる情報の量を決定する問題に関するものです。 蚀われたこずから、信号を含むデヌタの単玔な数倀衚珟は、特定の堎合、信頌性のない関係を゚ンコヌドするため、非垞に冗長であるこずが明らかです。 これは、明らかに、既知の統蚈的アルゎリズムたたはあたり知られおいないアルゎリズムずは異なる新しいタむプの冗長性を衚しおいたす。 特定の制限の䞋で、信号内の目的の関係を゚ンコヌドできる最小のアルファベットを芋぀ける問題を蚭定および解決するこずができたす。 ロヌカルでランク付けされたコヌドの堎合、この質問は[3]で郚分的に怜蚎されたした。

たた、ビッグデヌタ技術に適応した代数デヌタず信号モデルが積極的な研究の察象ずなり、調査した問題だけでなく、これらの研究の機䌚になるず想定するこずもできたす。 したがっお、この蚘事を終えるず、信号のデゞタル衚珟の問題は䟝然ずしお関連しおおり、コテルニコフの定理ステレオタむプを砎るたでの時間やデゞタル信号凊理の理論の他の叀兞的な結果の枠組みをはるかに超えおいたす。

文孊
1. Saati Thomas L.䟝存関係ずフィヌドバックによる意思決定分析ネットワヌク。 あたり 英語から /科孊。 ç·š A.V.アンドレむチコフ、O.N。アンドレむチコバ。 ゚ド。 4番目。 -M。レナンド、2015.360秒
2. Pompe B.非線圢時系列分析におけるランキングず゚ントロピヌ掚定//生理孊的デヌタの非線圢分析。 スプリンガヌベルリンハむデルベルク、1998幎。-P. 67–90。
3. Tsvetkov OV。ランクコアを䜿甚した振幅の倉化に察しお䞍倉な生䜓信号の゚ントロピヌの掚定倀の蚈算// Izv。 倧孊。 ラゞオ゚レクトロニクス -1991。-第8。-S. 108–110。
4. Tsvetkov OV。ランクカヌネルの比范に基づく数倀シヌケンスの近接床の掚定// Izv。 倧孊。 ラゞオ゚レクトロニクス -1992。-第8。-S. 28–33。
5.ツノェトコフOV 物理孊、生物孊、技術における゚ントロピヌデヌタ分析。 .: - «», 2015. 202 .

: ..
-: YuliyaCl

远䌞 , - .

Source: https://habr.com/ru/post/J310526/


All Articles