FontCode:文字の形式によるステガノグラフィの新しい方法


1.グリフ(特定の文字の形式)のわずかな変更により、スタイルオプションの2次元マトリックスによりデジタル情報がエンコードされます。 2次元座標グリッドの各ポイントは、対応する一意のグリフを生成します

ステガノグラフィの専門家は、オープンチャネルで暗号化を隠す新しい方法を考案しました。 この場合、クリアテキストで。 本発明者によれば、知能における自然な適用に加えて、この技術は透かしなどのメタデータの秘密の実装に使用することができる。

最近、Habré で、印刷できない文字によるテキストのフィンガープリントについて説明されました 。 新しいFontCodeテクニックより洗練されていますが、本質的には似ています。 そして、ここでは隠されたメッセージを見つけるのはそれほど簡単ではなく、印刷できないスペースよりもさらに難しい。 このテキストには目に見えない文字はありませんが、文字のわずかに変更された形式は目で確認することは困難であり、エンコード/デコードの原理がわからなければ解読することは確かに不可能です。

この方法の本質は図で簡潔に概説されて、 科学論文で詳細に説明されます。



主な革新は、グリフの形状をわずかに変更することによるコーディングです。 2次元座標グリッドの各ポイントは、対応する一意のグリフを生成します。各グリフの体系的な変更により、アナログテキストに長いデジタルシーケンスを埋め込むことができます。


テクノロジーの2番目の部分は、歪んだグリフの認識です。 科学研究の著者は、グリフ認識を画像分類の問題として提示しました。 一連の歪んだグリフを含む画像を受け取った後、目標はこの文字の各入力グリフをコードブックリストからの1つとして分類することです。 この目的のために、畳み込みニューラルネットワーク(CNN)が特定のフォントの各文字でトレーニングされました。



CNNを使用して各文字の歪んだグリフを認識するために、画像は最初にニューラルネットワークのトレーニング用のデータの準備で前処理され、トレーニングデータの次元が削減されます。 各文字の領域は、光学式文字認識システムによって設定されたフレームに合わせてトリミングされます。 次に、画像領域は従来のOtsuアルゴリズムを使用して2値化されます。 このステップは、さまざまな照明条件と背景色の影響を排除するのに役立ちます。 最後に、画像領域のサイズが200×200ピクセルの正方形に変わります。 このような200×200の白黒画像は、ニューラルネットワークのトレーニングに使用されます。 訓練されたニューラルネットワークは、デジタルカメラから直接合成または受信した画像を認識できます。つまり、ユーザーがスマートフォンのカメラを隠し暗号化されたテキストに向けると、カメラをQRコードに向けます。 したがって、CNNのトレーニングデータは、合成画像と実際の写真で構成されていました。 この合成データは、さまざまな露出設定のフォトリアリスティックビジュアライザーによって作成されました。

コーディングスキームでは、テキストを5文字のブロックに分割できます。 各ブロックには、ASCIIエンコードで0から255の番号が割り当てられ、形状を変更することでグリフに埋め込まれます。 デコード時には、グリフから数字が抽出されるときに逆の手順が実行されます。



速記による数字の導入に使用するグリフを選択する場合 1700年前の遺物に関する中国の定理に基づいて、最尤推定と誤り訂正を使用したコーディングスキームが適用されます。 これにより、元のメッセージが、確立されたエラー率以下のエラー率の制限で復元されます。

ある意味で、FontCode技術はバーコードやQRコードに似ています。異なる厚さのストライプや白黒の正方形がデジタル情報をエンコードするためです。 ここでは、ほぼ同じデジタル情報がグリフの形式でエンコードされます。

FontCodeは、平文での秘密のメッセージのステガノグラフィーによる導入に加えて、暗号化の使用も許可します。 この場合、送信者と受信者は最初に秘密鍵について合意してからメッセージを復号化する必要があります。 暗号化は平文で安全に送信できます-インターネット経由または紙の印刷物の形式で。 人はプレーンテキストを表示し、OCRシステムと特別に訓練されたニューラルネットワークを備えたコンピュータは、このテキスト内の隠されたメッセージを認識します。

FontCodeテクノロジーを説明する科学研究は、カナダのバンクーバーで2018年8月に開催されるSIGGRAPH会議に向けて準備されました。

Source: https://habr.com/ru/post/J358820/


All Articles