Audiotag.info-新しい音楽認識サービス



有名なリソースwww.websound.ruの所有者であるAlexander Radzishevskyは最近、 AudioTagサービスを開始しました。このサービスを使用すると、アーティストの名前と作品の小さな断片から作品の名前を見つけることができます。

このサービスは、高度な音声認識エンジンに基づいており、 音声指紋技術と、大量の音声および音楽データを組み合わせています。 ファイルをダウンロードすると、特別なアルゴリズムがそれをいわゆる「オーディオフィンガープリント」に変換します。これはデータベースの検索に使用されます。 この認識の結果、処理されたファイルと1つまたは別の確率で一致する1つまたは複数の候補トラックが見つかります。

-アルゴリズムは、トラックを誤って認識するよりもむしろトラックを認識しません
-アルゴリズムは、ある程度の確率でトラックを認識します
-複数のオプションが見つかった場合、結果はこの確率でソートされます
-高速でノイズの多いトラックが認識されます
-音楽データベースには、ロシア語を含む100万曲以上のトラックが含まれています
-プレーヤーとの統合なし(まだ?)、オンラインのみ
-彼らはお金を取らない

著者は、キャストと音楽ベースのソースを作成するためのアルゴリズムの秘密を開示していません。 ただし、最初の点については、既に存在しています(この奇跡の仕組みはわかりませんが、形式はMD5のようなものです)。2番目の質問には、おそらく「おなじみの」オンラインストアのリソースが関係していました-結局のところ、百万トラックはたくさんあり、アレックスは彼の個人的なアーカイブにそれほど多くのポップを保持することはほとんどありません



20秒のパッセージのテスト



-
[No] - ,
[No] -


国内ポップ-良い:

-

老人はそれほどではありません:

[No] France Gall
[No] Jukka Tolonen

feat. - ,


ロッククラシック-良い:

The Byrds - Mr. Tambourine Man
Deep Purple - The Mule


エレクトロニクスは良いです:

Aphrodite - BM Funkster (drum'n'bass)
Sally Shapiro - Jackie Jackie Spend This Winter With Me
[No] Karla Sabah (brazil drum'n'bass)


一般的に、特別な希少性を期待すべきではありません。


一部の競合他社



Tunaticは、マイク入力からの音を聞くデスクトップアプリケーションです。
TrackID-特定の携帯電話モデルに限定。
GTA4の特別な電話番号-ゲームでのみ利用可能。
Musicbrainz-アレックスによると、「嘘について」。
Shazam MusicID-携帯電話にsoftinkaを与えます。これは、マイクに書き込み、キャストをサーバーに送信します。

Source: https://habr.com/ru/post/J53690/


All Articles