音声明瞭度測定:主観的方法

元気?


私たちは電話で話し、スピーチやコンサートホールでのスピーチを聞きます。 誰かの会話を盗聴しようとする人もいれば、盗聴を不可能にしようとする人もいます。 ただし、上記のすべてのケースで、外来ノイズが原因で必要なものを聞くことができず、言葉が判読できなくなる状況がありました。 そのような問題を回避するために、路を操作する前に音声通信チャネルの音響検査が行われます。

チャネルまたは音声通信チャネル(または音声情報を送信するためのチャネル)は、物理媒体であり、音が送信から受信まで移動する経路です。 それは空気、電気音響、振動、パラメトリック、オプトエレクトロニックチャンネルである可能性がありますが、私たちの目標は管の品質の最も重要な基準である音声明瞭度を測定することなので、それらについては触れません。

音声明瞭度を測定する方法は、リストとして簡単に提示できます。

もちろん、ポクロフスキー、ビコフ、サポジコフのソビエトの方法もありますが、上記の方法が最良の結果を提供するため、少なくとも今のところは触れません。

もちろん、一度にすべてをカバーすることはできません。そのため、最初に客観的な方法と主観的な方法の違いを検討し、後者についてさらに詳しく説明します。

純粋な主観性


一対の話者監査人は、純粋な主観的方法を使用して音声明瞭度を評価することに関与しています。 CCIR(International Radiocommunication Advisory Committee)の推奨事項に従ってラジオ局をテストする例に関する彼らの仕事を検討することは便利です:ラジオチャネルの送信側では、アナウンサーがテキストを読み、受信側の監査人が5ポイント(または他の)スケールでパスを評価します。 このアプローチの明らかな大きな欠点、すなわち、テストする人々のスピーチとヒアリングの特性の結果に対する避けられない影響に気付かないことは困難です。

この問題の解決策は、問題自体と同じくらい明白です。

客観性


最も一般的なオブジェクト化された方法は、アーティキュレーション方法です。 これは、テストチャネルで測定を開始する前に、通常の音響条件(ノイズレベル)が作成されるという事実に基づいています。 数人の監査人が参加し、プレーンテキストの代わりにアナウンサーが特別に構成された音節表(アーティキュレーションテーブル)を読みます。 監査人は、聞いた内容を記録し、送信セッションの終わりに、テーブルをアナウンサーと比較します。 正確に聞かれる音節の総数に対する比率は、音声明瞭度の評価であり、パーセンテージまたは単位の小数で表されます。


多数の口述され、それに応じて受け入れられる音節では、さまざまな要因の影響が平均化されることに注意してください。 アナウンサーと監査人の異なるグループが試験に参加する場合、因子の影響はさらに平均化されます。 これが、関節法の客観性です。 しかし、それだけではありません。 客観的な結果を得るには、単語やフレーズを受け取ったときに、パスによって歪められた要素を考えて復元できるため、意味的な負荷のない正確に正しい組み合わせの列挙が役立ちます。

審査員に関しては、これらは特別に訓練されたチームでなければならないという意見がありますが、GOST R 50840-95は正反対を要求します。 個人的には、後者にもっと傾いています。
アーティキュレーションテーブルの例
エール強打Vyr寝るおんさアリレース乳母
inci座るsifアボほらチートパム陸地
わら番yuカフェシャイ地域ideVRA硬化
ザイムリャフ国連ねーdysyアラット何とか

利点:

短所:

客観性。 パート2


別の客観的な主観的方法を検討してください-音調法では、スピーカーは純粋なトーンジェネレーターに置き換えられます。 この人工音声は、実際にはディフューザーのない通常のスピーカーであり、異なる周波数で生成される音圧レベルがフォルマントスペクトルカーブに対応するように信号を生成します。 監査役はどこにも行きません。 現在、彼らの仕事は、特定の周波数で信号が聞こえるかどうかを判断することです。
測定周波数
25050065080099011251300150017001875
2050222524252725310035003850455061508600

フォルマントの感覚レベルは、音が聞こえなくなるまで減衰を滑らかに入力することで測定され、音が現れるまで減衰を減らす必要があります。 2つの減衰値が平均化されます-これは測定の結果です。

形式的な音声明瞭度は、表によって決定されます。
dbdbdbdbdbdb
10.04100.65191.92283.22374.28464.75
20.09110.76202.0729日3.37384.37474.78
30.14120.89212.2303.51394.46484.8
40.19131.03222.36313.64404.52494.82
50.24141.18232.5323.75414.57504.85
60.3151.32242.65333.87424.62514.88
70.37161.47252.79343.97434.66524.95
80.46171.62262.93354.08444.69
90.55181.77273.08364.18454.72
dBはトーン感覚のレベルです。 %-フォルマント音声明瞭度

フォルマントの全体的な明瞭度は、コンポーネントの合計として定義されます。


音声明瞭度の測定を完了するには、音節明瞭度を決定するだけで十分です。
ASASASASAS
552546.2457565908598
1015305550807092.59099
15263562.555817595.29599.5
203640696087.28096.2100100
A-フォルマント音声明瞭度; S-音節の読みやすさ

利点:

短所:

しかし、どうですか...


...客観的な方法と主観的な方法の違いは? 人工的な声、口、耳を測定に使用しているため、すべてが人的要因にある、またはむしろ存在しないことをすでに推測していると思います。

最も単純な客観的な方法を検討してください。

まず、テストパスの受信側で、動作条件に対応するノイズレベルが作成されます。 次に、人工耳の出力での騒音レベルが耳の臨界周波数帯域で測定されますが、この帯域の平均周波数は測定音の周波数に等しくなります。 このノイズレベルは修正する必要がありますが、まだ必要です。 その後、ノイズの代わりに、トーン信号がパス入力に送られます。 マイクでの音響インテンシティレベルは、減衰レギュレータの条件付きゼロで音圧分布がフォルマントスペクトルの曲線に対応するように取得されます。 次に、減衰制御の助けを借りて、パスの出力でのトーン信号のレベルが、以前に記録したノイズレベルと等しくなるようにします。 減衰制御の測定値は、測定の結果です。

フォルマントと音節の明瞭度を決定するために、音調法と同じ方法を使用します。

利点:

短所:

終わり


通常、これらの言葉の後には、クレジットを除いて何も表示されないはずです。したがって、私は非常に簡潔に説明します。「下のニックネーム」でした。 ご清聴ありがとうございました!

Source: https://habr.com/ru/post/J127064/


All Articles