भाषण तकनीक। आईवीआर सिस्टम के एक उदाहरण के रूप में डमी के लिए निरंतर भाषण की मान्यता

सभी को नमस्कार।
मेरी पेशेवर गतिविधि की प्रकृति से, मैं भाषण प्रौद्योगिकियों के आधार पर परियोजनाओं को लागू कर रहा हूं। ये संश्लेषण और भाषण मान्यता, वॉयस बायोमेट्रिक्स और भाषण विश्लेषण हैं।
कुछ लोगों को आश्चर्य है कि ये तकनीकें हमारे जीवन में पहले से ही कैसे मौजूद हैं, हालांकि हमेशा नहीं - जाहिर है।
मैं आपको यह समझाने की कोशिश करूंगा कि यह कैसे काम करता है और इसकी आवश्यकता क्यों है।
मैं भाषण मान्यता के साथ विस्तार से शुरू करूंगा, यह रोजमर्रा की जिंदगी के करीब एक ऐसी चीज है जो हम में से कई लोगों को मिली है, और कुछ पहले से ही लगातार उपयोग कर रहे हैं।

लेकिन पहले, आइए यह पता लगाने की कोशिश करें कि कौन सी भाषण प्रौद्योगिकियां सामान्य हैं और वे क्या हो सकती हैं।

- भाषण का संश्लेषण ( भाषण को पाठ)।
इस तकनीक के साथ, हमें वास्तविक जीवन में कम सामना करना पड़ता है। या बस उसे नोटिस मत करो।
आईओएस और एंड्रॉइड के लिए विशेष "पाठक" हैं जो उन पुस्तकों को जोर से पढ़ सकते हैं जिन्हें आप डिवाइस पर डाउनलोड करते हैं। वे काफी अच्छी तरह से पढ़ते हैं, एक या दो दिन बाद आप ध्यान नहीं देते हैं कि पाठ रोबोट द्वारा पढ़ा जा रहा है।
कई कॉल सेंटरों में, डायनेमिक जानकारी सब्सक्राइब की हुई आवाज से सब्सक्राइबर्स को आवाज दी जाती है, क्योंकि किसी व्यक्ति द्वारा अग्रिम में ली गई सभी ध्वनि क्लिपों को रिकॉर्ड करना काफी मुश्किल है, खासकर अगर जानकारी हर 3 सेकंड में बदल जाती है
उदाहरण के लिए, सेंट पीटर्सबर्ग मेट्रो में, स्टेशनों पर कई सूचनात्मक संदेश एक संश्लेषण द्वारा पढ़े जाते हैं, लेकिन लगभग कोई भी इसे नोटिस नहीं करता है, क्योंकि पाठ बहुत अच्छा लगता है।

- वॉयस बायोमेट्रिक्स (आवाज द्वारा पहचान और खोज की पुष्टि)।
हां, हां - एक व्यक्ति की आवाज एक फिंगरप्रिंट या रेटिना की तरह अद्वितीय है। सत्यापन की विश्वसनीयता (दो उंगलियों के निशान की तुलना) 98% तक पहुंच जाती है। इसके लिए, 74 आवाज मापदंडों का विश्लेषण किया जाता है।
रोजमर्रा की जिंदगी में, प्रौद्योगिकी अभी भी बहुत दुर्लभ है। लेकिन रुझानों से संकेत मिलता है कि जल्द ही यह व्यापक होगा, खासकर वित्तीय कंपनियों के कॉल सेंटरों में। इस तकनीक में उनकी रुचि बहुत बड़ी है।
वॉयस बायोमेट्री में 2 अनूठी विशेषताएं हैं:
- यह एकमात्र तकनीक है जो आपको दूर से अपनी पहचान की पुष्टि करने की अनुमति देती है, उदाहरण के लिए, फोन द्वारा। और इसके लिए, विशेष स्कैनिंग उपकरणों की आवश्यकता नहीं है।
- यह एकमात्र ऐसी तकनीक है जो मानव गतिविधि की पुष्टि करती है, अर्थात कि एक जीवित व्यक्ति फोन पर बात कर रहा है। मुझे तुरंत कहना होगा कि उच्च-गुणवत्ता वाले वॉइस रिकॉर्डर पर रिकॉर्ड की गई आवाज काम नहीं करेगी - यह साबित हो गया है। अगर कहीं ऐसा रिकॉर्ड "पास" होता है, तो इसका मतलब है कि सिस्टम में शुरू में "विश्वास" की कम सीमा है।

- भाषण विश्लेषण।
कुछ लोगों को पता है कि आवाज से आप किसी व्यक्ति की मनोदशा, उसकी भावनात्मक स्थिति, लिंग, अनुमानित वजन, जातीयता आदि का निर्धारण कर सकते हैं।
बेशक, कोई भी मशीन तुरंत यह नहीं कह सकती है कि कोई व्यक्ति दुखी या खुश है (यह संभव है कि उसके पास हमेशा जीवन की यह स्थिति है: उदाहरण के लिए, एक इतालवी और फिन के औसत भाषण स्वभाव में बहुत भिन्न होते हैं), लेकिन बातचीत के दौरान आवाज में बदलाव से, यह पहले से निर्धारित करने के लिए। काफी वास्तविक।

- भाषण मान्यता (भाषण का पाठ में अनुवाद)।
यह हमारे जीवन में सबसे आम भाषण तकनीक है, और सबसे पहले - मोबाइल उपकरणों के लिए धन्यवाद, क्योंकि कई निर्माताओं और डेवलपर्स का मानना ​​है कि स्मार्टफोन के लिए कुछ कहना एक व्यक्ति के लिए एक छोटे स्क्रीन कीबोर्ड पर एक ही टेक्स्ट टाइप करने के लिए बहुत अधिक सुविधाजनक है।
पहले मैं इस बारे में बात करने का प्रस्ताव करता हूं: हम जीवन में भाषण मान्यता तकनीक के साथ कहां मिलते हैं और हम इसके बारे में कैसे जानते हैं?

हममें से ज्यादातर लोग कुछ कॉल सेंटर, जैसे कि रूसी रेलवे, एअरोफ़्लोत इत्यादि में वॉयस कंट्रोल के साथ सिरी (आईफ़ोन), गूगल वॉयस सर्च, कभी-कभी आईवीआर सिस्टम को तुरंत याद करेंगे।
यह कुछ ऐसा है जो सतह पर है, और आप आसानी से अपने लिए कोशिश कर सकते हैं।

कार के सिस्टम में निर्मित वाक् पहचान (एक फोन नंबर, रेडियो नियंत्रण को डायल करना), टीवी पर, सूचना फोन (मोबाइल ऑपरेटरों के लिए पैसे स्वीकार करने वाली चीजों के समान)। लेकिन यह सामान्य नहीं है और कुछ निर्माताओं के "चिप" के रूप में अधिक अभ्यास किया जाता है। यह तकनीकी सीमाओं और काम की गुणवत्ता का मामला नहीं है, बल्कि उपयोग और लोगों की आदतों में आसानी है। मैं ऐसे व्यक्ति की कल्पना नहीं करता जो हाथ में रिमोट कंट्रोल होने पर टीवी प्रोग्राम पर एक आवाज के माध्यम से फ़्लिप कर रहा हो।

So. भाषण मान्यता प्रौद्योगिकी। वे क्या पसंद हैं?
मैं तुरंत कहना चाहता हूं कि लगभग मेरा सारा काम टेलीफोनी से संबंधित है, इसलिए नीचे दिए गए पाठ में कई उदाहरण वहां से लिए जाएंगे - कॉल सेंटरों के अभ्यास से।

बंद व्याकरणों द्वारा मान्यता।
शब्दों की सूची (आधार) से एक शब्द (वॉयस कमांड) की पहचान।
शब्द "बंद व्याकरण" का अर्थ है कि सिस्टम का एक निश्चित परिमित शब्द आधार है जिसमें ग्राहक द्वारा शब्द या अभिव्यक्ति को खोजा जाएगा।
इस मामले में, सिस्टम को ग्राहक को इस तरह से एक स्पष्ट उत्तर प्राप्त करने के लिए प्रश्न को एक शब्द से मिलकर रखना चाहिए।

एक उदाहरण:
सिस्टम प्रश्न: "सप्ताह के किस दिन में आपकी रुचि है?"
सब्सक्राइबर का जवाब: "मंगलवार"

इस उदाहरण में, प्रश्न को इसलिए रखा गया है ताकि सिस्टम को सब्सक्राइबर से बहुत विशिष्ट उत्तर की उम्मीद हो।
उपरोक्त उदाहरण में शब्दों के डेटाबेस में निम्नलिखित उत्तर विकल्प हो सकते हैं: "सोमवार, मंगलवार, बुधवार, गुरुवार, शुक्रवार, शनिवार, रविवार।" डेटाबेस में निम्नलिखित उत्तर भी दिए और दिए जाने चाहिए: "मुझे नहीं पता," "वैसे भी," कोई भी, "आदि। - ये ग्राहक प्रतिक्रियाएँ पूर्वनिर्धारित संवाद परिदृश्य के अनुसार, अलग-अलग सिस्टम द्वारा प्रदान और संसाधित की जानी चाहिए।

निर्मित व्याकरण।
यह एक तरह का बंद व्याकरण है।
अक्सर अनुरोधित मानक अभिव्यक्तियों और अवधारणाओं को पहचानें।
"बिल्ट-इन व्याकरण" की अवधारणा का अर्थ है कि सिस्टम में पहले से ही व्याकरण हैं (अर्थात, इसे "अलग से सिखाया" जाने की आवश्यकता नहीं है), जो ग्राहक के विशिष्ट विषयगत वाक्यांशों को पहचानने में सक्षम हैं। संवाद स्क्रिप्ट लिखते समय, आपको केवल एक विशिष्ट अंतर्निहित व्याकरण को संदर्भित करना होगा।

एक उदाहरण:
प्रणाली का प्रश्न: "फिल्म आपके लिए किस समय दिलचस्प है?"
सदस्य का जवाब: "15.30 बजे"

उपरोक्त उदाहरण में, समय के मूल्यों को मान्यता दी जाती है। समय की मान्यता के लिए सभी आवश्यक व्याकरण पहले से ही सिस्टम में एम्बेडेड है।
अंतर्निहित व्याकरण का उपयोग वॉइस मेनू के विकास को सरल बनाने के लिए किया जाता है जब आप मानक सार्वभौमिक ब्लॉकों का उपयोग कर सकते हैं।

खुले व्याकरणों द्वारा मान्यता।
सब्सक्राइबर द्वारा पूरे वाक्यांश की मान्यता।
यह सिस्टम को सब्सक्राइबर से एक खुले प्रश्न पूछने और मुफ्त में तैयार किए गए उत्तर को प्राप्त करने की अनुमति देता है।
"ओपन व्याकरण" की अवधारणा का अर्थ है कि सिस्टम सब्सक्राइबर से सुनने की उम्मीद करता है न कि एक विशिष्ट शब्द / कमांड, लेकिन पूरे शब्दार्थ वाक्य जिसमें सिस्टम प्रत्येक शब्द में रुचि रखेगा।

एक उदाहरण:
सिस्टम प्रश्न: "आप क्या रुचि रखते हैं?"
सब्सक्राइबर का जवाब: "ऋण के लिए कौन से दस्तावेज आवश्यक हैं?"

इस उदाहरण में, प्रत्येक शब्द ग्राहक की प्रतिक्रिया में पहचाना जाता है और ऊपर का सामान्य अर्थ सामने आता है। प्रस्ताव में मान्यता प्राप्त खोजशब्दों और अवधारणाओं के आधार पर, डेटाबेस के लिए एक अनुरोध उत्पन्न होता है और ग्राहक जवाब "" एकत्र किया जाता है - संदर्भ जानकारी प्रदान की जाती है।

निरंतर भाषण की मान्यता सिस्टम को सब्सक्राइबर के साथ बातचीत की प्रक्रिया को स्वचालित करने के लिए कई और अवसर देती है। साथ ही, सब्सक्राइबर द्वारा सिस्टम के उपयोग की गति और आसानी बढ़ जाती है। लेकिन ऐसी प्रणालियों को लागू करना अधिक कठिन है। यदि समस्या के समाधान में सब्सक्राइबर के मोनोसैलिक उत्तर शामिल हो सकते हैं, तो बंद व्याकरण का उपयोग करना बेहतर होता है।
वे अधिक मज़बूती से काम करते हैं, ऐसे सिस्टम को लागू करने के लिए सरल हैं और उन ग्राहकों के लिए अधिक परिचित हैं जो DTMF डायलिंग (टोन मोड में डायलिंग का उपयोग करके नेविगेशन) का उपयोग करने के लिए उपयोग किए जाते हैं।
लेकिन भविष्य, निश्चित रूप से, निरंतर भाषण मान्यता के साथ है। धीरे-धीरे, उपयोगकर्ताओं को इसकी आदत हो जाएगी और 5-10 सेकंड के लिए "हैंग" नहीं करेंगे, जब सिस्टम उन्हें इसके साथ एक खुली बातचीत में प्रवेश करने की पेशकश करता है।

निरंतर भाषण मान्यता के साथ एक आईवीआर प्रणाली कैसे काम करती है?
VoiceNavigator सॉफ्टवेयर, संश्लेषण और IVR प्रणाली के लिए रूसी भाषण की मान्यता के उदाहरण पर।

! ध्यान से। आगे समझने के लिए और अधिक कठिन पाठ होगा।

छवि

1. तुरंत इस तथ्य पर ध्यान दें कि कॉलर का कॉल कॉल सेंटर में आया था और उसे आवाज प्लेटफॉर्म पर स्थानांतरित कर दिया गया था। वॉइस प्लेटफ़ॉर्म सॉफ्टवेयर है जो सिस्टम के साथ ग्राहक के संवाद के पूरे तर्क को काम करता है, अर्थात आवाज मंच पर आईवीआर मेनू काम करता है। सबसे लोकप्रिय वॉयस प्लेटफार्म अवाया, जेनेसिस, सिस्को और एस्टेरिस्क हैं।
तो, वॉयस प्लेटफॉर्म ग्राहक के फोन के माइक्रोफोन से वॉयसनावीगेटर तक ध्वनि पहुंचाता है।

2. ध्वनि भाषण मान्यता मॉड्यूल (एएसआर) में प्रवेश करती है, जो मानव भाषण को अलग से रचित शब्दों के अनुक्रम के रूप में पाठ में परिवर्तित करती है। परिणामी शब्दों का अभी तक सिस्टम के लिए कोई अर्थ नहीं है।

ट्रेन शेड्यूल के विषय पर एक ग्राहक की आवाज वाक्यांश का उदाहरण:

छवि

3. इसके अलावा, पाठ पहचान व्याकरण एसएसएम मॉड्यूल में गिर जाता है (मैं इस पर ध्यान केंद्रित नहीं करता कि यह क्या है, मैं इसे खुद पा सकता हूं जो विषय में गहराई से जानना चाहता है। यह पाठ में नीचे दिए गए अन्य शब्दों पर भी लागू होगा), जहां प्राप्त शब्दों का विश्लेषण किया जाता है। उच्चारण के विषय (जिस विषय से संबंधित वाक्यांश संबंधित है)। हमारे उदाहरण में, मान्यता प्राप्त वाक्यांश इस विषय को संदर्भित करता है: "लंबी दूरी की ट्रेनें" और इसकी अपनी विशिष्ट पहचानकर्ता है।

4. जब विषय पहचानकर्ता के साथ पाठ स्लॉट सूचना आवंटन मॉड्यूल (मजबूत पार्सर) को प्रेषित किया जाता है, जिसमें कुछ अवधारणाएं और अभिव्यक्तियां जो किसी दिए गए विषय क्षेत्र (उपयोगकर्ता के कथन का अर्थ) के लिए महत्वपूर्ण हैं, पर प्रकाश डाला गया है। इस मॉड्यूल में, सिस्टम "समझता" है कि ग्राहक ने क्या कहा और विश्लेषण करता है कि क्या यह जानकारी ज्ञान के आधार पर अनुरोध बनाने के लिए पर्याप्त है या प्रश्नों को स्पष्ट करने के लिए आवश्यक है।

छवि

स्लॉट सूचना निष्कर्षण मॉड्यूल कुछ पैरामीटर उत्पन्न करता है, जो कि पहचाने गए शब्दों के साथ संवाद प्रबंधक को और प्रेषित किया जाता है।

5. संवाद प्रबंधक ग्राहक के साथ IVR प्रणाली के संवाद के पूरे तर्क (एल्गोरिथम) को संसाधित करने में लगा हुआ है। पारित किए गए मापदंडों के आधार पर, संवाद प्रबंधक ग्राहक को प्रतिक्रिया देने के लिए ज्ञानकोष (ग्राहक के भाषण में सभी जानकारी शामिल है) के लिए अनुरोध भेज सकता है या ग्राहक से अतिरिक्त जानकारी का अनुरोध कर सकता है, अनुरोध को परिष्कृत कर सकता है (ग्राहक के भाषण में सभी जानकारी शामिल नहीं है)।

6. सब्सक्राइबर के प्रति प्रतिक्रिया उत्पन्न करने के लिए, संवाद प्रबंधक ज्ञानकोष से संपर्क करता है। इसमें विषय क्षेत्र की सभी जानकारी है।

7. इसके बाद, सिस्टम नॉलेज बेस से जानकारी के आधार पर और डायलॉग मैनेजर से संवाद परिदृश्य के अनुसार सब्सक्राइबर को एक प्रतिक्रिया देता है।

8. सब्सक्राइबर को प्रतिक्रिया देने के बाद, आईवीआर सिस्टम काम करना जारी रखने के लिए तैयार है।

भाषण मान्यता के आधार पर आईवीआर सिस्टम बनाते समय कहां से शुरू करें?

सतत भाषण मान्यता प्रणाली सीखना।
1. निरंतर भाषण की मान्यता का आधार सांख्यिकी है। इसलिए, निरंतर भाषण मान्यता का उपयोग करके आईवीआर प्रणाली को लागू करने की कोई भी परियोजना आंकड़ों के संग्रह से शुरू होती है। आपको यह जानने की जरूरत है कि ग्राहकों की रुचि क्या है, वे सवाल कैसे तैयार करते हैं, शुरू में उनके पास क्या जानकारी होती है, जवाब में वे क्या सुनते हैं, आदि

सूचना का संग्रह सीसी ऑपरेटरों के साथ ग्राहकों की बातचीत के वास्तविक रिकॉर्ड को सुनने और उनका विश्लेषण करने से शुरू होता है। इस जानकारी के आधार पर, सांख्यिकीय तालिकाओं का निर्माण किया जाता है, जिससे यह स्पष्ट हो जाता है कि ग्राहकों के कौन से वॉयस अनुरोधों को स्वचालित करने की आवश्यकता है, और यह कैसे किया जा सकता है।

2. यह जानकारी भविष्य के आईवीआर मेनू का एक सरलीकृत प्रोटोटाइप बनाने के लिए पर्याप्त है। आईवीआर मेनू प्रश्नों के अधिक प्रासंगिक ग्राहकों के उत्तरों को एकत्र करने और उनका विश्लेषण करने के लिए ऐसा प्रोटोटाइप आवश्यक है, क्योंकि जिस तरह से सब्सक्राइबर CC ऑपरेटर्स के साथ और IVR स्पीच मेनू के साथ संवाद करते हैं, वह बहुत अलग है।

बनाया गया प्रोटोटाइप आईवीआर मेनू कंपनी के आने वाले फोन नंबर पर रखा गया है। यह अधिकतम सरलीकृत किया जा सकता है या निगमित कार्यक्षमता को बिल्कुल भी काम नहीं करता है, क्योंकि इसका मुख्य कार्य सांख्यिकीय सामग्री (ग्राहकों से सभी प्रकार के उत्तर) को संचित करना है, जो एक विशिष्ट विषय के उद्देश्य से सांख्यिकीय भाषा मॉडल (एसएलएम) के गठन का आधार होगा। एक विशिष्ट विषय क्षेत्र के लिए भाषा मॉडल का लचीलापन मान्यता की गुणवत्ता में सुधार करता है।

प्रोटोटाइप IVR मेनू का एक उदाहरण कार्यान्वयन:
सिस्टम प्रश्न: "आप किस सेवा में रुचि रखते हैं?"
सब्सक्राइबर का जवाब: "मैं ऋण लेना चाहूंगा"
सिस्टम प्रतिक्रिया: "कॉल संपर्क केंद्र ऑपरेटर को हस्तांतरित किया जाएगा"
सिस्टम एक्शन: सब्सक्राइबर के किसी भी जवाब के साथ CC ऑपरेटर को ट्रांसफर करें।

प्रोटोटाइप आईवीआर मेनू का उपयोग करके, डेवलपर सिस्टम का एक अनुकरण बनाता है और ग्राहकों की प्रतिक्रियाओं (फोनोग्राम्स का संग्रह) के वास्तविक रिकॉर्ड एकत्र करता है, जिसके अनुसार प्रणाली को बाद में प्रशिक्षित किया जाएगा।
इससे कोई फर्क नहीं पड़ता कि ग्राहक सिस्टम के सवाल पर क्या कहेंगे, कॉल किसी भी स्थिति में संपर्क केंद्र ऑपरेटर को स्थानांतरित किया जाएगा। इस प्रकार, ग्राहक को असुविधा के बिना सेवा दी जाएगी, और आईवीआर मेनू के डेवलपर्स को वास्तविक संवाद के उदाहरण का उपयोग करके इस विषय पर सभी संभावित उत्तरों का एक डेटाबेस प्राप्त होगा।
परियोजना के कार्यान्वयन के लिए फोनोग्राम की आवश्यक संख्या कई हजार तक पहुंच सकती है, और फोनोग्राम एकत्र करने का समय कई महीनों तक ले सकता है। यह सब परियोजना की जटिलता पर निर्भर करता है।

3. फिर एकत्रित वार्तालाप रिकॉर्ड्स को स्थानांतरित कर दिया जाता है। प्रत्येक प्रविष्टि को एक विशेषज्ञ द्वारा ऑडिशन दिया जाता है और पाठ में अनुवादित किया जाता है। प्रेषित वाक्यांशों में विराम चिह्न और विशेष वर्ण नहीं होने चाहिए। साथ ही, सभी शब्दों और संक्षिप्तीकरणों को पूर्ण रूप से लिखा जाना चाहिए, क्योंकि वे ग्राहक द्वारा उच्चारित किए जाते हैं। इस काम में बहुत समय लगता है, लेकिन विशिष्ट ज्ञान की आवश्यकता नहीं होती है, इसलिए, कई कर्मचारी आमतौर पर एक ही समय में शामिल होते हैं।

4. ट्रांसमिटेड फाइल्स का इस्तेमाल ट्रेनिंग फाइल (शब्दों और भावों का एक शब्द, कॉन्फ़िगरेशन पैरामीटर) बनाने के लिए किया जाता है, जो एक XML डॉक्यूमेंट है। विषय क्षेत्र के लिए प्रशिक्षण फ़ाइल जितनी बड़ी होगी, मान्यता उतनी ही बेहतर होगी।
प्रशिक्षण फ़ाइल आपको एक भाषा मॉडल (एसएलएम) बनाने की अनुमति देती है, जो निरंतर भाषण की मान्यता का आधार है।

इसके लिए, एमडीजी कंपनी द्वारा विकसित एक विशेष उपयोगिता में प्रशिक्षण फ़ाइल लोड की जाती है (यह वह है जो वॉयसनावीगेटर सॉफ्टवेयर के लेखक हैं) - एएसआर कंस्ट्रक्टर, जो भाषा मॉडल का निर्माण करता है। फिर भाषा मॉडल को VoiceNavigator सॉफ़्टवेयर में लोड किया जाता है।

आईवीआर भाषण मेनू के निर्माण पर काम के इस चरण में, सिस्टम एक ग्राहक के भाषण को अलग-अलग बनाए गए शब्दों के रूप में पहचानने में सक्षम है जो एक दूसरे से संबंधित नहीं हैं।

छवि

5. फिर, शब्दों की मान्यता प्राप्त सूची में, ग्राहक की अपील (एसएसएम मान्यता व्याकरण) के विषय की पहचान करना और स्लॉट जानकारी (रोबस्ट पारसर) का चयन करना आवश्यक है। इसके लिए उपयुक्त प्रशिक्षण फ़ाइलों का उपयोग करके अतिरिक्त सिस्टम प्रशिक्षण की आवश्यकता होती है।
पहले से प्राप्त की गई फ़ाइलों के आधार पर प्रशिक्षण फ़ाइलें बनाई जा सकती हैं। लेकिन एक भाषा मॉडल प्राप्त करने के कार्य के विपरीत, एसएसएम व्याकरण और रोबस्ट पार्सर के लिए उपयुक्तता के अनुरूप, संशोधित फ़ाइलों को उपयुक्त रूप से संशोधित किया जाना चाहिए।

ठीक है, लेख की शुरुआत उन लोगों को समझने के लिए काफी सरल हुई जो भाषण प्रौद्योगिकियों से बिल्कुल परिचित नहीं हैं। और फिर मैंने वास्तविक स्वर स्व-सेवा प्रणाली बनाने की सूक्ष्मताओं में सिर झुका दिया। मैं ऐसे कायापलट के लिए माफी मांगता हूं।

इस विषय में कौन रुचि रखता है, और वह आवाज नियंत्रण के साथ आईवीआर सिस्टम के निर्माण के बारे में अधिक जानना चाहता है, मैं एक विशेष विकी साइट पर जाने की सिफारिश करना चाहता हूं - www.vxml.ru
यह इंटरैक्टिव भाषा VoiceXML में आईवीआर सिस्टम के विकास के लिए समर्पित है, जो इस काम में मुख्य है।

आपका धन्यवाद

Source: https://habr.com/ru/post/In184832/


All Articles