OpenCV परियोजना का एक संक्षिप्त इतिहास

Itseez में विकास दल के नेता किरिल कोर्न्याकोव द्वारा पोस्ट किया गया।

हेलो, हेब्र!

छवि

इस प्रविष्टि के साथ , हम इटसेज़ कंपनी ब्लॉग खोलते हैं (अंग्रेजी से यह देखता है - "यह देखता है!")। कंपनी की स्थापना कंप्यूटर दृष्टि अनुयायियों द्वारा की गई थी जिन्होंने इस क्षेत्र में 13 से अधिक वर्षों तक काम किया है, जिनके बीच अपने अस्तित्व के पहले दिन से OpenCV परियोजना में भाग ले रहे हैं। हमारी रणनीति "विजन है कि काम करता है!" के तहत कंप्यूटर दृष्टि के क्षेत्र में प्रौद्योगिकियों और उत्पादों के विकास से संबंधित है। हमारे ग्राहक विलो गैराज , एनवीडिया, इंटेल, माइक्रोसॉफ्ट, कई कम प्रसिद्ध कंपनियां और स्टार्टअप हैं। आज, इटसेज़ टीम 40 इंजीनियरों और शोधकर्ताओं की एक टीम है, कई कर्मचारी शैक्षिक गतिविधियों में सक्रिय रूप से शामिल हैं: वे विश्वविद्यालय में पढ़ाते हैं, पत्रिकाओं में प्रकाशित करते हैं और सम्मेलनों में बोलते हैं, और कंप्यूटर विज़न स्कूल भी संचालित करते हैं।

ब्लॉग के पन्नों पर हम इस बारे में बात करना चाहेंगे कि हमारे आसपास के वास्तविक और साइबर स्पेस में, साथ ही साथ कंप्यूटर विज़न की दुनिया में क्या दिलचस्प है। हमें उम्मीद है कि प्रकाशित सामग्री मशीन लर्निंग, रोबोटिक्स, कम्प्यूटेशनल फोटोग्राफी, बुद्धिमान वीडियो निगरानी प्रौद्योगिकियों और संवर्धित वास्तविकता के साथ-साथ विज्ञान और प्रौद्योगिकी के संबंधित क्षेत्रों के लोगों के लिए रुचि होगी। इटसेज़ की एक महत्वपूर्ण विशेषता यह है कि हमारे कई विकास खुले स्रोत हैं, इसलिए हम वास्तविक कोड के उदाहरणों के साथ अपने शब्दों को सुदृढ़ करने का प्रयास करेंगे।

चूंकि यह हमारे ब्लॉग में पहली प्रविष्टि है, इसलिए मैं कुछ दिलचस्प साझा करना चाहूंगा, इसलिए हम कंपनी के प्रमुख प्रोजेक्ट के बारे में बात करेंगे - कंप्यूटर विज़न एल्गोरिदम की ओपनसीवी लाइब्रेरी का विकास ( आरओएस (रोबोट ऑपरेटिंग सिस्टम) और पीसीएल (प्वाइंट क्लाउड लाइब्रेरी) में हमारे योगदान के बारे में। चुप रहते हुए)। एक प्रशिक्षित पाठक शायद यह पूछने के लिए आश्चर्यचकित होगा: "लेकिन इंटेल / विलो गैरेज द्वारा ओपनसीवी विकसित किया जा रहा है!" और यह सही होगा, लेकिन केवल आंशिक रूप से। वास्तव में, हर कोई नहीं जानता कि अधिकांश प्रमुख ओपनसीवी डेवलपर्स रूस में, निज़नी नोवगोरोड के शहर में रहते हैं और काम करते हैं, और इत्सेज़ के कर्मचारी हैं। इसलिए, गलतफहमी को खत्म करने के लिए, हमने ओपनसीवी के इतिहास के एक संक्षिप्त सारांश के लिए पहली पोस्ट समर्पित करने का फैसला किया। इसके अलावा, इस अवसर पर, निष्कर्ष में हम परियोजना के भविष्य के बारे में कुछ अंदरूनी जानकारी साझा करेंगे।

इसलिए, यदि आप कंप्यूटर विजन में लगे हुए हैं, तो आपने शायद ओपनसीवी के बारे में सुना है, जिसका पूरा नाम ओपन सोर्स कंप्यूटर विजन लाइब्रेरी जैसा लगता है। पुस्तकालय काफी लोकप्रिय है, वर्तमान में केवल 5 मिलियन डाउनलोड (रिपॉजिटरी से सीधे डाउनलोड की गिनती नहीं) है, और हाल ही में कंप्यूटर विजन ( http://www.khronos.org/vision ) के लिए क्रोनोस मानक के आधार के रूप में प्रस्तावित किया गया था।

2000 से 2008 तक, OpenCV को मुख्य रूप से Intel द्वारा विकसित और समर्थित किया गया था, और शुरुआत से ही निगम की निज़नी नोवगोरोड शाखा ने पुस्तकालय के रूप को आकार देने में अग्रणी भूमिका निभाई। अपने अस्तित्व के पहले वर्षों में, OpenCV ने तेजी से चौड़ाई में विस्तार किया, बुनियादी कार्यक्षमता के साथ ऊंचा हो गया, जैसे कि बुनियादी डेटा संरचनाएं, छवि प्रसंस्करण एल्गोरिदम, बुनियादी कंप्यूटर दृष्टि एल्गोरिदम, चित्र और वीडियो का इनपुट और आउटपुट। पहले से ही उस समय, मानव चेहरे (कैस्केडिंग क्लासिफायर), स्टीरियो मिलान, ऑप्टिकल प्रवाह, और अन्य का पता लगाने के लिए एल्गोरिदम लागू किए गए थे। हालांकि, 2004 में, इंटेल ने वास्तव में लाइब्रेरी का समर्थन करना बंद कर दिया था। परियोजना में कई प्रतिभागी, जो उस समय तक कंप्यूटर विज़न के क्षेत्र में पहले से ही विशेषज्ञ के रूप में विकसित हो चुके थे, कंपनी से पीछे नहीं हटना चाहते थे और कंपनी छोड़ चुके थे। वास्तव में, ऐसा इत्सेज़ के बारे में हुआ, जिसकी गतिविधियाँ काफी हद तक ओपनसीवी के विकास के दौरान प्राप्त अनुभव पर आधारित हैं।

विलो गैराज के आगमन के साथ प्राप्त परियोजना के विकास के लिए दूसरा शक्तिशाली प्रोत्साहन, जिसका मुख्य लक्ष्य एक व्यक्तिगत रोबोट बनाना है। OpenCV ROS (रोबोट ऑपरेटिंग सिस्टम) का एक महत्वपूर्ण हिस्सा बन गया है, और इसके आधार पर PR2 रोबोट के लिए कई घटक बनाए गए थे, लेकिन हम इस बारे में बाद में बात करेंगे। इस अवधि की शुरुआत 2008 में वाडिम पिसारेव्स्की (उर्फ ओपनसीवी ज़ार) द्वारा इंटेल से इटसे में संक्रमण के साथ हुई। विलो के समर्थन से, एक टीम का गठन किया गया था जिसने पुस्तकालय का पर्याप्त संशोधन शुरू किया। इन प्रयासों का परिणाम था कि ओपनसीवी ने सी ++ और पायथन एपीआई, फीचर 2 डी मॉड्यूल, नई वास्तुकला, सीएमके पर आधारित निर्माण प्रणाली, बिल्डबॉट पर आधारित निरंतर एकीकरण प्रणाली , बेहतर प्रलेखन, उत्कृष्ट ट्यूटोरियल और कई अन्य नवाचारों का अधिग्रहण किया।

आज हम लाइब्रेरी के जीवन में तीसरे महत्वपूर्ण चरण के बारे में बात कर सकते हैं, जो एनवीडिया के आगमन के साथ आया था। 2010 में, इस कंपनी ने लाइब्रेरी के एक CUDA- अनुकूलित संस्करण के निर्माण का समर्थन किया , जो कि इटसेज़ इंजीनियरों द्वारा भी किया गया था। पहला सार्वजनिक परिणाम स्टीरियो मिलान एल्गोरिथ्म का कार्यान्वयन था, जो फुलएचडी रिज़ॉल्यूशन (1920x1080 पिक्सल) में वास्तविक समय वीडियो प्रसंस्करण में सक्षम था। तिथि करने के लिए, opencv_gpu एक पूर्ण विशेषताओं वाला मॉड्यूल है जिसने कई औद्योगिक अनुप्रयोगों में आवेदन पाया है। 2011 के बाद से, कार्यों की सूची का विस्तार हुआ है, और इटसेज़ ने एनवीडिया के साथ मिलकर, एंड्रॉइड के लिए लाइब्रेरी का एक संस्करण विकसित करना शुरू कर दिया है, एनवीडिया टेग्रा प्लेटफॉर्म के लिए अनुकूलन के साथ। OpenCV4Android पहले ही कई रिलीज़ों से बच गया है, और उसने अपने उपयोगकर्ता समुदाय का अधिग्रहण कर लिया है । इसके अलावा, ओपनसीवी को जावा एपीआई (अब तक केवल एंड्रॉइड के लिए), एक एकीकृत प्रदर्शन परीक्षण प्रणाली और कई सुधारों के साथ समृद्ध किया गया है। जो लोग GPU और मोबाइल प्रोसेसर के लिए OpenCV के अनुकूलन के परिणामों में रुचि रखते हैं, वे हाल ही में प्रकाशित लेख "OpenCV के साथ वास्तविक समय कंप्यूटर विज़न" , साथ ही GTC 2012 सम्मेलन के पोस्टर: "टेग्रा GPU के साथ त्वरित कंप्यूटर विजन" , "GPU को पढ़ने " की सिफारिश कर सकते हैं। विजन"



इस प्रकार, पुस्तकालय का आधुनिक रूप एक लंबे विकास का परिणाम है। परियोजना कंप्यूटर दृष्टि के तेजी से विकासशील क्षेत्र के साथ बनी हुई है। कई विश्व स्तरीय कंपनियों ने पुस्तकालय के निर्माण में भाग लिया, और इसके विकास के पूरा होने के बारे में बात करना जल्दबाजी होगी। हाल ही में, परियोजना ने एक नया कार्य ट्रैकर प्राप्त किया है , गतिविधि केवल गति प्राप्त कर रही है, हाल ही में 5M डाउनलोड की सालगिरह हुई है, और हम आशा करते हैं कि हमारे पास आपके साथ साझा करने के लिए दिलचस्प सामग्री का एक टन होगा।

अब सक्रिय OpenCV उपयोगकर्ताओं के लिए कुछ जानकारी। सबसे पहले, 4 जून को, रिलीज़ 2.4.1 को रिलीज़ किया गया था, मुख्य रूप से 2.4.0 के लिए सुधार ले रहा था (आंद्रेई कामदेव और अलेक्जेंडर शिश्कोव के लिए विशेष धन्यवाद!)। दूसरे, यह जल्द ही अपनी खुद की लाइब्रेरी वेबसाइट लॉन्च करने की योजना है, जो opencv.org (अब एक रीडायरेक्ट पर काम कर रही है) पर उपलब्ध होगी। यह साइट उन लोगों के लिए विशेष रूप से उपयोगी होगी जो सिर्फ पुस्तकालय के साथ काम करना शुरू कर रहे हैं। इसके अलावा, अपने स्वयं के क्यू एंड ए फोरम को स्टैकऑवरफ्लो-जैसे इंजन पर तैनात किया जाएगा। तीसरा, ओपनसीवी फाउंडेशन के निर्माण पर काम चल रहा है, एक गैर-लाभकारी फाउंडेशन जो पुस्तकालय के विकास के लिए धन जुटाएगा और इसके विकास को व्यवस्थित करेगा। डेवलपर्स के लिए, इसका अर्थ और भी अधिक कार्यक्षमता, प्रलेखन, नमूने और प्रदर्शन है! हम वास्तव में आशा करते हैं कि यह सब इस वर्ष होगा, हम सभी को सूचित करने का प्रयास करेंगे!

अंत में, हम OpenCV 2.4.0 (अधिकतम रिज़ॉल्यूशन में घड़ी!) पर काम करते समय रिपॉजिटरी में गतिविधि के दृश्य से खुद को परिचित करने के लिए सभी को आमंत्रित करना चाहते हैं।



OpenCV 2.5 की अगली प्रमुख रिलीज़ 1 नवंबर के लिए निर्धारित है, और काम जोरों पर है!

Source: https://habr.com/ru/post/In146434/


All Articles