EchoPrint - एक खुली संगीत मान्यता प्रणाली

निश्चित रूप से आप में से बहुत से लोगों ने ट्रैकिड , शाज़म , म्यूज़िकब्रेनज़ या ऑनलाइन ऑडीओटैग.ऑफ़ जैसी म्यूज़िक आइडेंटिफिकेशन सिस्टम के बारे में सुना और जाना है , जो आपको एक गाने के रिकॉर्ड किए गए अंश से उसका नाम बताते हैं । वे सभी काफी अच्छे हैं, लेकिन एक सामान्य खामी है - बंद स्रोत और, तदनुसार, एक सीमित गुंजाइश। आप केवल Sony Ericsson फोन पर TrackID का उपयोग कर सकते हैं, फोन पर भी Shazam, हालांकि प्लेटफार्मों की एक अधिक व्यापक सूची पर, और Music Brainz आमतौर पर स्पष्ट नहीं है कि यह बिल्कुल काम करता है या नहीं।

कंपनी इको नेस्ट के लोगों ने फैसला किया कि संगीत की पहचान ईमेल या डीएनएस :) की तरह दुनिया के लिए सुलभ होनी चाहिए, और अपने दिमाग की उपज को पूरी तरह से एमआईटी लाइसेंस के तहत जारी किया। और दिमाग की उपज, मुझे कहना होगा, वे बहुत गंभीर हैं - भले ही कंपनी के संस्थापक एमआईटी मीडिया लैब से विज्ञान के डॉक्टर हैं।

कार्यात्मक जानवर जिसे उन्होंने जारी किया, वह केवल एक रिकॉर्ड किए गए मार्ग से संगीत को पहचानने तक ही सीमित नहीं है, बल्कि आपको नकल संगीत की खोज, बड़े पैमाने पर पहचान और संगीत संग्रह में टैग भरने, किसी विशेष सामग्री की सामग्री के लिए ऑडियो / वीडियो की जाँच करने की अनुमति देता है। , विभिन्न संगीत स्थानों से संग्रह के सिंक्रनाइज़ेशन (iTunes <-> Last.fm <-> Spotify, उदाहरण के लिए) और भी बहुत कुछ।


यह कैसे काम करता है?


संक्षेप में - क्लाइंट की ओर से, कोड जनरेटर लॉन्च किया जाता है, जो गाने के रिकॉर्ड किए गए भाग का एक अनूठा फिंगरप्रिंट बनाता है, और इसे मान्यता के लिए सर्वर पर भेजता है।

ग्राहक

क्लाइंट, उर्फ इकोप्रिंट-कोडगेन , एक क्रॉस-प्लेटफॉर्म लाइब्रेरी और बाइनरी के रूप में आता है। यहां एक विशिष्ट उपयोग उदाहरण दिया गया है - 10 वें सेकंड से शुरू होने वाले एमपी 3 फ़ाइल से 20 सेकंड की जांच करें:
echoprint-codegen। / record.mp3 10 20 | \
curl -F "query = @ -" http: // developer.echonest.com / api / v4 / song / पहचान? api_key = MY_API_KEY
{ "प्रतिक्रिया" : { "स्थिति" : { "संस्करण" : "4.2" , "कोड" : 0 , "संदेश" : "सफलता" } ,
"गीत" : [ { "टैग" : 0 , "स्कोर" : 66 , "शीर्षक" : "रेंगना" , "संदेश" : "ओके (मैच प्रकार 6)"
"Artist_id" : "ARH6W4X1187B99274F" , "artist_name" : "Radiohead" , "id" : "SOPQLBY12A6310E992" } ] } }

और अगर आप इसे अपने प्रोग्राम में उपयोग करना चाहते हैं, तो यह भी आसान है:
कोडजेन * pCodegen = नया कोडजेन ( कॉन्स्टैट फ्लोट * pcm, uint numSamples, int start_offset ) ;
string code = pCodegen - > getCodeString ( ) ;

जैसा कि यह स्पष्ट हो गया है, इसे अपनी पसंदीदा भाषा / परियोजना में पेंच करना बिल्कुल भी मुश्किल नहीं है - बस पर्याप्त कल्पना करना। वैसे, सबसे सक्रिय लोगों के लिए, उन्होंने सबसे दिलचस्प और अभिनव संगीत एप्लिकेशन के लिए $ 10,000 के पुरस्कार के साथ एक प्रतियोगिता भी आयोजित की जो कि इकोनेस्ट एपीआई का पूरा फायदा उठाती है। और उनके पास जो एपीआई है वह काफी व्यापक है, सभी संगीतमय रचनाओं को संगीतमय रचनाओं से जोड़ता है - मुख्य भौगोलिक स्थिति और कलाकार के जन्म के वर्ष से लेकर नृत्य रचना के स्तर तक।

एक गीत का डिजिटल फिंगरप्रिंट प्राप्त करने के लिए, अपने स्वयं के एल्गोरिथ्म का उपयोग किया जाता है, द इको नेस्ट म्यूजिकल फिंगरप्रिंट उर्फ ​​ENMFP , जिसे कंपनी ने लंबे समय तक और सफलतापूर्वक अपनी अन्य सेवाओं के लिए उपयोग किया है - जैसे कि समान गाने की खोज करना, बीपीएम की गिनती करना और बहुत कुछ। लोग खुद कहते हैं कि उन्होंने गानों के विश्लेषण पर कुत्ते को खा लिया (न केवल लगता है, बल्कि संगीत रचनाएं)।
आप डेवलपर पोर्टल पर एपीआई के बारे में अधिक जान सकते हैं।

सर्वर

सर्वर साइड कोड भी सार्वजनिक रूप से जीथब पर उपलब्ध है , इसलिए यदि आप चाहें, तो आप अपना खुद का सर्वर बढ़ा सकते हैं - इको नेस्ट ने पहले से संसाधित किए गए कई गीगाबाइट डेटा भी साझा किए। सर्वर इंजन अपाचे सोलर सर्च सर्वर पर आधारित है, जो टोक्यो टायरेंट को डेटाबेस के रूप में उपयोग करता है।

अब तक, उनके सर्वर पर अपेक्षाकृत कम डेटा है - लगभग 150,000 गाने, लेकिन कंपनी के अनुसार, वे मल्टी-मिलियन डॉलर 7digital संग्रह का आयात करते हैं, MusicBrainz के साथ सक्रिय रूप से सहयोग करते हैं (जिन्होंने अपने डेटा के साथ एकीकृत करने के लिए अपने इकोप्रिंट सर्वर को भी उठाया), और डाउनलोड करने के लिए कार्यक्षमता भी प्रदान करते हैं। उपयोगकर्ताओं द्वारा नए गाने।

के उपयोग



बेशक, उपयोग का एक मुख्य कार्य अभी भी आपके द्वारा सुने जाने वाले संगीत को पहचान रहा है। मैंने एक अच्छा गाना सुना, फोन निकाला, एक बटन दबाया - और पता चला कि कौन गा रहा था। मैंने जल्दी से Maemo / Meego के लिए एक इकोप्रिंट क्लाइंट लिखा, और परीक्षण करते समय मैं निम्नलिखित कह सकता हूं:

इसके अलावा, वे यह भी दावा करते हैं कि एल्गोरिथ्म आपको समान संस्करण खोजने की अनुमति देता है - जैसे लाइव प्रदर्शन या समान कवर।
अब तक, निश्चित रूप से, इकोप्रिंट शाज़म के हत्यारे को कॉल करना जल्दबाजी होगी, लेकिन यह केवल समय की बात है। इस तरह की परियोजनाएं, जब जारी की जाती हैं, तो तीव्रता के क्रम को विकसित करना शुरू हो जाता है।

निष्कर्ष

इस अद्भुत ओपन-सोर्स परियोजना के एक साधारण अवलोकन के अलावा, मुख्य बात जो मैं बताना चाहूंगा, वह यह है कि कंपनी वास्तव में कुछ महत्वपूर्ण (सभी के लिए नहीं, निश्चित रूप से) बनाती है। यह केवल "एक और संगीत प्रसंस्करण एल्गोरिथ्म" नहीं है, यह संगीत का एक पूरा विश्वकोश है जो आपको सभी जारी की गई रचनाओं को खोजने, वर्णन करने और संयोजित करने की अनुमति देता है। शाज़म के विपरीत, इको नेस्ट डेटाबेस में कम ज्ञात बैंड के बारे में जानकारी हो सकती है - कम से कम अपने स्वयं के गाने अपलोड करें। इसके अलावा, परियोजनाओं में से एक, जिसका नाम रोसेटा स्टोन है, का उद्देश्य विभिन्न पहचानकर्ता स्थानों को संयोजित करना है - उदाहरण के लिए, एक ही म्यूज़िकब्रेनज़ आईडी या नेपस्टर आर्टिस्ट आईडी।

सामान्य तौर पर, एक प्रकार का संगीत विकिपीडिया, जो खुलेपन के लिए धन्यवाद, कुछ सही मायने में भव्यता में विकसित होने का वादा करता है।

Source: https://habr.com/ru/post/In122969/


All Articles