प्रगति अभी भी खड़ी नहीं है, सब कुछ बदल जाता है - मोबाइल उपकरणों के बारे में हमारा विचार, वे पतले हो जाते हैं, और अधिक उत्पादक, उनके साथ बातचीत करने के तरीके बदलते हैं, टचपैड और सेंसर ने कीबोर्ड और माउस को बदल दिया, जिसे
अवधारणात्मक कम्प्यूटिंग द्वारा बदल दिया गया है।
अवधारणात्मक कंप्यूटिंग क्या है? यह एक नई तकनीक है जो उपयोगकर्ता को अपने मोबाइल डिवाइस के साथ आवाज, हाथ, चेहरे, यानी के माध्यम से बातचीत करने की अनुमति देगा। मानव संपर्क के लिए और अधिक प्राकृतिक तरीके।
वर्तमान में, इंटेल इस दिशा में काम कर रहा है; पिछले साल अक्टूबर में, PerC SDK का पहला संस्करण कंपनी की वेबसाइट पर दिखाई दिया, जिसने निम्नलिखित विशेषताओं का समर्थन किया:
- हथेलियों के खुलेपन के स्तर, हाथों, उंगलियों की स्थिति की पहचान
- चेहरे की स्थिति को ट्रैक करना, चेहरे के नियंत्रण बिंदु (होंठ, नाक, आंख), पहचान ("मान्यता") की परिभाषा
- 2-आयामी और 3-आयामी वस्तुओं की स्थिति को ट्रैक करना
नवंबर के अंत में, एक नया संस्करण (
बीटा 2 ) दिखाई दिया - बग को ठीक करने और अनुकूलन पर काम करने के अलावा, डेवलपर्स ने आवाज के साथ काम करने की क्षमता भी जोड़ी। यह एसडीके में
Nuance ड्रैगन सहायक मॉड्यूल के शामिल किए जाने से संभव हुआ।
बीटा 2 वर्तमान में नवीनतम संस्करण है, लेकिन इसमें पहले से ही कई विशेषताएं शामिल हैं जो डेवलपर को अपने सॉफ़्टवेयर में उपयोगकर्ता के साथ बातचीत करने के नए तरीके जोड़ने में मदद कर सकती हैं।
PerC SDK की विशेषताओं के बारे में बेहतर जानकारी प्राप्त करने के लिए, आप एक वीडियो देख सकते हैं कि यह
SDK पृष्ठ पर उपलब्ध कई अनुप्रयोगों को प्राप्त करने पर कैसे काम करता है।
कैमरा
शुरुआत करने के लिए, यह समझाने के लिए कि यह सब कैसे काम करता है, मैं विशेष रूप से कैमरे के बारे में बात करना चाहूंगा।
वास्तव में, इस डिवाइस को शायद ही कोई कैमरा कहा जा सकता है, बल्कि यह सेंसर का एक सेट है। इसमें दो माइक्रोफोन शामिल हैं, जो वाक् पहचान की गुणवत्ता में काफी सुधार कर सकते हैं, सेंसर में अंतर्निहित आरजीबी और अवरक्त कैमरे भी हैं।
विनिर्देश
- सेंसर RGB रिज़ॉल्यूशन: 720p (1280 x 720)
- IR गहराई सेंसर रिज़ॉल्यूशन: QVGA (320 x 240)
- देखने के कोण (डिग्री): 73
- कार्य की आवृत्ति (फ्रेम प्रति सेकंड): 30
- दूरी: 15 सेमी से 1 मीटर तक
- पावर: यूएसबी 2.0 (<2.5 वाट)
सिस्टम आवश्यकताओं
- 2 जनरेशन इंटेल कोर प्रोसेसर
- यूएसबी 2.0 पोर्ट
- विंडोज 7 SP1 और उच्चतर
एसडीके वास्तुकला
एसडीके आर्किटेक्चर नीचे की छवि में दिखाया गया है।
शीर्ष पर एसडीके की क्षमताओं का उपयोग करने वाले अनुप्रयोग हैं। अगले मॉड्यूल कार्यक्षमता के लिए जिम्मेदार हैं, इनपुट-आउटपुट मॉड्यूल, कैमरा और हार्डवेयर प्लेटफ़ॉर्म के साथ काम करने के लिए ड्राइवर।
मॉड्यूल
जैसा कि आप देख सकते हैं, प्रत्येक अवसर को एक अलग मॉड्यूल के रूप में प्रस्तुत किया जाता है, यह आपको कर्नेल में महत्वपूर्ण बदलाव किए बिना प्लेटफ़ॉर्म की क्षमता को बढ़ाने की अनुमति देता है, लेकिन बस एक नया मॉड्यूल जोड़कर। एसडीके एक एपीआई प्रदान करता है जो आपको उच्च स्तर पर काम करने की अनुमति देता है - इशारों को पहचानने के लिए अंतर्निहित एल्गोरिदम का उपयोग करना, हाथों की स्थिति, चेहरे, आवाज, और अनुप्रयोगों में निम्न स्तर पर - एसडीके को अपने खुद के मॉड्यूल और एल्गोरिदम बनाना और जोड़ना।
इनपुट / आउटपुट मॉड्यूल
एक एप्लिकेशन जो एसडीके का उपयोग करता है वह सीधे कैमरे के साथ काम नहीं करता है, आई / ओ मॉड्यूल ऐसा करता है, जो एक साथ एसडीके का उपयोग करते हुए कई अनुप्रयोगों के एक साथ संचालन की अनुमति देता है, जो कि, उदाहरण के लिए, वेब कैमरा के साथ काम करते समय असंभव है, जब आवेदन को विस्तारित एक्सेस के साथ काम करना प्रतिबंधित होता है, जो इसके साथ काम करता है। अन्य अनुप्रयोगों के लिए कैमरा।
ड्राइवर
यह सीधे कैमरे के साथ काम करता है, एसडीके को गति देने के लिए हार्डवेयर प्लेटफॉर्म की क्षमताओं का उपयोग करता है, जो आपको न केवल गति में, बल्कि बिजली की खपत में भी जीतने की अनुमति देता है।
समर्थित प्रोग्रामिंग भाषाओं और चौखटे
PerC SDK C ++, C # में लिखे एप्लिकेशन में अपनी क्षमताओं का उपयोग करने के लिए आवश्यक फाइलें (हेडर, लाइब्रेरी) प्रदान करता है।
एकता गेम इंजन के लिए समर्थन,
ओपनफ्रेमवर्क , प्रोसेसिंग फ्रेमवर्क भी एसडीके में शामिल हैं।
सिंडर ढांचे के लिए एक
तृतीय-पक्ष पुस्तकालय भी उपलब्ध है।
आप चाहें तो C ++, C # में लाइब्रेरी, रैपर बनाकर किसी अन्य प्लेटफॉर्म, प्रोग्रामिंग लैंग्वेज के लिए सपोर्ट जोड़ सकते हैं। एक उदाहरण के रूप में, मैं
Google Chrome के लिए अपना
एक्सटेंशन लाना चाहता हूं, जो HTML5 अनुप्रयोगों को मान्यता प्राप्त इशारों की सूचनाएं प्राप्त करने की अनुमति देता है। इसे काम करने के लिए, एक्सटेंशन को पूर्व-स्थापित PerC SDK और क्रिएटिव से एक कैमरा की आवश्यकता होती है।
कहां से शुरू करें
सिद्धांत रूप में, एसडीके के साथ काम करना क्रिएटिव से कैमरे के बिना भी संभव है, हालांकि इस मामले में केवल भाषण मान्यता मॉड्यूल और स्थिति और फेस मार्कर उपलब्ध होंगे। कैमरे को ऑर्डर करने के लिए आवश्यक सभी सुविधाओं का लाभ उठाने के लिए, आप इसे
इस पृष्ठ पर कर सकते हैं, रूस सहित कई देशों के लिए वितरण कार्य।
SDK को
आधिकारिक Intel PerC SDK पृष्ठ पर डाउनलोड किया जा सकता है, इसमें हाव-भाव, ट्रैकिंग के साथ काम करने के लिए सभी मॉड्यूल शामिल हैं, भाषण मान्यता के लिए मॉड्यूल के अपवाद के साथ, जो अलग से स्थापित है और वहां डाउनलोड के लिए उपलब्ध है। एसडीके में कई उदाहरण शामिल हैं, जो दोनों बायनेरिज़ और स्रोतों के रूप में उपलब्ध हैं।
आवेदन क्षेत्रों
पहली चीज जो दिमाग में आती है, वह है, बेशक। यहां, एप्लिकेशन केवल डेवलपर की कल्पना द्वारा सीमित है, आप उपयोगकर्ता को गेम ऑब्जेक्ट्स, वर्णों को नियंत्रित करने, उंगलियों, हाथों, इशारों का उपयोग करके अंतरिक्ष में नेविगेट करने की अनुमति दे सकते हैं।
एक खेल का एक उदाहरण जिसमें एक उपयोगकर्ता अपने हाथों से फेंकने वाली बंदूक को नियंत्रित कर सकता है।
गेमप्ले और यूजर इंटरफेस एक उदाहरण के रूप में
कुंग पाव केविन का उपयोग करके नियंत्रित करता है
चेहरे की पहचान यहां भी उपयोगी है, उदाहरण के लिए, आप चेहरे की पहचान का उपयोग करके एक उपयोगकर्ता प्रोफ़ाइल अपलोड कर सकते हैं।
चेहरे, मार्करों की स्थिति के बारे में जानकारी का उपयोग करके, आप वास्तविक समय में "फिटिंग रूम" बना सकते हैं, जिससे उपयोगकर्ता को हेयर स्टाइल, टोपी, चश्मा, मेकअप आदि बदलने का अवसर मिल सकता है।
व्यावसायिक अनुप्रयोगों में, एसडीके भी आवेदन पा सकता है, उदाहरण के लिए, इशारों, आवाज, फिर से उपयोगकर्ता की पहचान का उपयोग करके आवेदन में नेविगेशन।
बच्चों के लिए शैक्षिक अनुप्रयोगों में, उदाहरण के लिए, गिनती सीखना, आप उंगलियों की सही संख्या दिखाकर सही उत्तर देने के लिए कह सकते हैं।
एक और दिलचस्प अनुप्रयोग - कैमरा किसी भी जटिल एल्गोरिदम का उपयोग किए बिना, पृष्ठभूमि घटाव करने में मदद करता है। नीचे दी गई तस्वीर देखें - अवरक्त कैमरा का परिणाम, इस जानकारी को पृष्ठभूमि से उपयोगकर्ता की छवि को अलग करने के लिए उपयोग करना मुश्किल नहीं है।
मैं खुद भी कैमरे के साथ प्रयोग करना पसंद करता था, यह वास्तव में अवरक्त है, ऐसा तब होता है जब आप कैमरे को बिल दिखाते हैं।
अंधेरे में, वह अच्छी तरह से देखती है।
कमरे में प्रकाश की अनुपस्थिति में चित्र लिया गया था, लैपटॉप स्क्रीन बंद कर दी गई थी।
जैसा कि मैंने ऊपर कहा - संभावनाएं व्यापक हैं, मुख्य बात यह है कि कल्पना को शामिल करना। निम्नलिखित लेखों में मैं एक साधारण अनुप्रयोग के उदाहरण के रूप में एसडीके का उपयोग करने के बारे में बात करूंगा।