NOC: दोष प्रबंधन का परिचय



घटनाएँ और दुर्घटनाएँ नेटवर्क ऑपरेशन का एक अभिन्न हिस्सा हैं। हर सेकंड हजारों घटनाएं दर्ज की जाती हैं, ऑपरेशन सेवा लगातार कई दुर्घटनाओं को खत्म करने में व्यस्त रहती है, शायद कहीं और कई दुर्घटनाएं होती हैं, लेकिन अभी तक पता नहीं चला है और निदान नहीं किया गया है। ऑपरेशनल डायग्नोस्टिक्स और दुर्घटनाओं का पता लगाना एक बहुत ही मुश्किल काम है जिसे केवल संगठनात्मक और तकनीकी उपायों के द्वारा हल किया जा सकता है। और दुर्घटनाओं का पता लगाने और प्रसंस्करण के स्वचालित साधनों द्वारा इसमें कम से कम भूमिका नहीं निभाई जाती है।

कई मॉनिटरिंग सिस्टम हैं जो आईसीएमपी और एसएनएमपी प्रोटोकॉल का उपयोग करके नेटवर्क और नेटवर्क सेवाओं को सक्रिय रूप से स्कैन करते हैं। त्वरित और गलत उत्तर स्पष्ट है। यह एक जादू निगरानी प्रणाली स्थापित करने के लिए पर्याप्त है, और पूर्ण खुशी आएगी। इस त्रुटि के सभी छल को समय के साथ समझा जाता है। सबसे पहले, यह पता चला है कि दुर्घटनाओं का पता केवल उन सेवाओं पर होता है जिनकी निगरानी की जाती है। ठीक है, अगर आप कम से कम बुनियादी सेवाओं को कवर करने में कामयाब रहे। बाकी, अफसोस, कड़वे अनुभव के परिणामस्वरूप और एक बेल्ड प्रतिक्रिया की कीमत पर नजर रखी जाएगी। थोड़ी देर बाद, रहस्यवाद शुरू होता है। कुछ स्पष्ट रूप से गलत काम कर रहा है, शिकायतें हैं, लेकिन निगरानी प्रणाली का कहना है कि सब कुछ क्रम में है। क्या कारण है?

इसका कारण यह हो सकता है कि सेवाओं का सर्वेक्षण समय पर असतत है और एक निश्चित अंतराल पर होता है, और सेवा लगातार प्रदान की जाती है। समस्याएं भी पैदा होती हैं और लगातार दूर होती जाती हैं। यदि आप भाग्यशाली हैं, तो उन्होंने इस समस्या का पता लगाने की कोशिश की, लेकिन उसने खुद को छोड़ दिया। परिणाम अजीब है: ग्राहक शिकायत करता है, लेकिन हम कुछ भी नहीं देखते हैं। मतदान अंतराल को छोटा करना संभव होगा, लेकिन साथ ही, उन सेवाओं पर लोड, जिन्हें हम मॉनिटर करते हैं, और सर्वोत्तम परंपराओं में, क्रैश का पता लगाने के लिए डिज़ाइन किया गया सिस्टम, खुद ही उन्हें उत्पन्न करना शुरू कर देता है।

लगभग बीच में समझ में आता है कि गंभीर दुर्घटनाओं के मामले में, एक सक्रिय नुकसान निगरानी प्रणाली अच्छे से अधिक हो जाती है, क्योंकि यह बहुत अधिक जानकारी देती है और वास्तविक समस्या का पता लगाने से रोकती है। बेशक, सक्रिय निगरानी प्रणाली उपयोगी हैं और उनके कार्य को पूरा करती हैं। लेकिन यह स्पष्ट है कि वे एक चांदी की गोली नहीं हैं और उन पर पूरी तरह से भरोसा करना अदूरदर्शी है। फाल्ट मैनेजमेंट सिस्टम (एफएमएस) बचाव के लिए आते हैं। पहले सन्निकटन में, ये घटनाओं के विश्लेषण और प्रसंस्करण के लिए सिस्टम हैं। सामान्य प्रवाह में, दुर्घटना के बारे में जानकारी के साथ संभवतः कई घटनाएं होती हैं। एफएमएस का पहला काम अतिरिक्त को फ़िल्टर करना और केवल उसे छोड़ना है, जिस पर तत्काल ध्यान देने की आवश्यकता है। आमतौर पर, बहुत अधिक जानकारी अभी भी शेष है और ऑपरेटरों के पास इसे संसाधित करने का समय नहीं है। इसलिए, एफएमएस प्रणाली को सबसे महत्वपूर्ण लोगों को उजागर करने के लिए पता लगाए गए दुर्घटनाओं को प्राथमिकता देनी चाहिए। इसके अलावा यह पता चलता है कि घटनाएँ स्वतंत्र नहीं हैं, और उनमें से कुछ आपस में जुड़ी हुई हैं। घटनाओं के सहसंबंध के परिणामस्वरूप, एफएमएस विफलताओं के बीच एक संबंध स्थापित करता है और अनावश्यक जानकारी को छुपाता है। तब सबसे कठिन सवाल यह उठता है: बदलती गंभीरता की बहुत सारी दुर्घटनाएँ पाई गईं, जिसका कारण क्या है? उदाहरण के लिए, एक गिरा हुआ लिंक सैकड़ों एमपीएलएस एलएसपी, दर्जनों बीजीपी सत्रों को तोड़ सकता है, जिससे टोपोलॉजी को आईजीपी में फिर से बनाया जा सकता है और थोड़ी देर के लिए दुर्गम हजारों सर्वरों का एक खेत प्रदान किया जा सकता है। कुछ एफएमएस सिस्टम रूट-कारण विश्लेषण करते हैं। नतीजतन, ऑपरेटर को सभी प्रेरित दुर्घटनाओं का असली कारण दिखाया जाएगा और समय बर्बाद किए बिना तुरंत समस्या निवारण शुरू करना संभव होगा।

चलो शब्दावली को परिभाषित करते हैं:


एफएमएस के मुख्य लाभ सक्रिय निगरानी प्रणालियों की तुलना में हैं। कुछ समय के लिए, वे निष्क्रिय हैं, वे नेटवर्क उपकरणों पर एक अनावश्यक भार नहीं बनाते हैं, वे बस लॉग और एसएनएमपी जाल को सुनते हैं, जो हार्डवेयर को बाहर निकालते हैं। इसके अलावा, उनके पास एक और उल्लेखनीय गुणवत्ता है - घटनाओं के प्रवाह के तुरंत बाद आपात स्थिति पर नजर रखना शुरू हो जाता है, और सिस्टम को इंगित करने की कोई आवश्यकता नहीं है कि इसे देखने की क्या आवश्यकता है। पहली बार में परिणाम केवल चौंकाने वाला है: सिस्टम लंबे समय से मृत बिजली की आपूर्ति, असफल ट्रांससीवर्स, ब्लिंकिंग लिंक में चुटकुले और हर तरह से जाम को ठीक करने के लिए प्रेरित करता है।

तकनीकी रूप से, एफएमएस एक वास्तविक समय विशेषज्ञ प्रणाली है। सिस्टम का दिल एक ज्ञान का आधार है, जिसमें विशिष्ट नेटवर्क पर शोध के परिणामस्वरूप सामान्यीकृत विदेशी अनुभव और नए ज्ञान दोनों प्राप्त होते हैं। यह एफएमएस और निगरानी प्रणालियों के बीच मुख्य अंतर है। मॉनिटरिंग सिस्टम केवल वही करता है जो इसे इंस्टॉलेशन के दौरान सिखाया गया था, जबकि एफएमएस न केवल अन्य ऑपरेटिंग नेटवर्क के कई वर्षों के अनुभव का उपयोग करता है, बल्कि स्वयं नेटवर्क को सीखने और अनुकूलित करने में भी सक्षम है।

ज्ञान के आधार के संगठन के आधार पर, एफएमएस को 4 मुख्य श्रेणियों में विभाजित किया जा सकता है:
  1. नियम आधारित: सबसे सीधा प्रकार। ज्ञानकोष में नियमों का एक समूह होता है जिसका उपयोग अनुमान के लिए किया जाता है
  2. कोडबुक: उन घटनाओं के सेट को संभालती है जिनसे दुर्घटना हो सकती है
  3. तंत्रिका नेटवर्क: ज्ञान का आधार एक पूर्व प्रशिक्षित तंत्रिका नेटवर्क है


प्रत्येक प्रकार की प्रणाली के अपने फायदे और नुकसान हैं। नियम-आधारित प्रणालियाँ कुछ हद तक सोल्डन के सीधे दृष्टिकोण के लिए प्रवण होती हैं, दूसरी ओर - वे यथासंभव पूर्वानुमान योग्य हैं और आप हमेशा समझ सकते हैं कि किस आधार पर प्रणाली ने कोई निष्कर्ष निकाला है। कोडबुक वेक्टर कभी-कभी कम जिद के कारण बेहतर परिणाम दिखाता है, लेकिन कभी-कभी वे गलतियां करते हैं। तंत्रिका नेटवर्क शोर स्थितियों में या घटनाओं के एक खोए हुए हिस्से के साथ सीखने, बेहतर काम करने में सक्षम हैं। दूसरी ओर, कभी-कभी यह समझना मुश्किल होता है कि सिस्टम किस तरह की अंतर्दृष्टि के साथ एक ठोस निष्कर्ष पर आया था। सामान्य तौर पर, यह ऑपरेटर और सिस्टम के बीच कुछ युद्ध क्षमता और आपसी अविश्वास को जन्म देता है। इसके अलावा, सभी तंत्रिका नेटवर्क की तरह, इस प्रकार के एफएमएस अचानक खुद के बारे में जागरूक हो जाते हैं और दुनिया भर में सत्ता को जब्त करने की कोशिश करते हैं।

पाठक के पास एक बहुत ही उचित प्रश्न हो सकता है - अगर ऐसी अद्भुत प्रणालियां हैं, तो वे पारंपरिक निगरानी प्रणालियों के रूप में व्यापक क्यों नहीं हैं? क्यों, विशेष रूप से बजट प्रतिष्ठानों में, हर कोई नाग / जिबिक / कैक्टि लगाने के लिए उत्सुक हैं, लेकिन आमतौर पर वे एफएमएस के बारे में याद नहीं करते हैं? इस सवाल का जवाब बेहद सरल है - कीमत! एफएमएस कभी भी एक सस्ता इलाज नहीं रहा है। एफएमएस, वास्तव में, एक परिष्कृत विदेशी अनुभव है, और अनुभव बहुत लायक है। उच्च कीमत का दूसरा कारण डेवलपर्स के अनुभव के अलावा, आपको इंटीग्रेटर्स का अनुभव भी खरीदना होगा, क्योंकि यह अत्यधिक संभावना है कि आपको एक विशिष्ट नेटवर्क के लिए एफएमएस को और अधिक अनुकूलित करना होगा।
एक सामान्य एफएमएस कार्यान्वयन बजट में आमतौर पर छह या अधिक शून्य होते हैं, जो स्वचालित रूप से उन्हें बड़े नेटवर्क का हिस्सा बनाता है। एक चौकस पाठक निश्चित रूप से कहेगा - ठीक है, लेकिन हमारे पास खुला स्रोत है! वाक्यांश खुला स्रोत, बेशक, एक मंत्र के रूप में दोहराया जा सकता है, लेकिन यह मुंह में मीठा नहीं होता है। हम मान सकते हैं कि ओपन-सोर्स में एफएमएस की दिशा का प्रतिनिधित्व नहीं किया जाता है।

पिछले लेख में वर्णित नेटवर्क प्रबंधन के एकीकृत दृष्टिकोण के भाग के रूप में, हम भी एक तरफ नहीं खड़े हुए और एनओसी के ढांचे के भीतर एक पूर्ण एफएमएस लागू किया। एनओसी के ढांचे के भीतर एफएमएस परियोजना का मुख्य उद्देश्य एक ओपन-सोर्स प्रोजेक्ट के ढांचे के भीतर वाणिज्यिक प्रणालियों का एक पूर्ण एफएमएस स्तर बनाना है।

मूल विचार जिसने हमें ओपन-सोर्स एफएमएस बनाने के लिए प्रेरित किया वह काफी सरल है: एफएमएस अनुभव है। नेटवर्क स्वेच्छा से ओपन-सोर्स उत्पादों का उपयोग करते हैं और उन्हें विकसित करने के लिए समान रूप से तैयार हैं। तो क्या उन्हें अपने अनुभव को औपचारिक रूप देने और सहकर्मियों के साथ साझा करने से रोकता है? नतीजतन, सिस्टम कुछ अप्रत्याशित गुणों को प्राप्त करता है, जो पहले से ही सामाजिक नेटवर्क के करीब हैं। सिस्टम की सीखने की प्रक्रिया वितरित हो जाती है। कोई व्यक्ति एक दुर्घटना में भाग गया जिसके बारे में सिस्टम को पता नहीं था, यह सीखा, नए नियम सामान्य डेटाबेस में प्रवेश किए और निम्नलिखित अपडेट के साथ सभी में फैल गए। फिलहाल, सिस्टम लगभग 40 विभिन्न प्रकार के दुर्घटनाओं (विवरण यहां पाया जा सकता है ) को पहचान सकता है। सिस्टम ट्रेनिंग को जुनिपर, Force10, Cisco, f5, DLink, Zyxel उपकरणों के आधार पर निर्मित नेटवर्क पर किया जाता है और हार्डवेयर समर्थन लगातार विस्तार कर रहा है। योजनाओं के अनुसार, एनओसी 0.7 सितंबर में जारी किया जाएगा, जिसमें ठोस ज्ञान आधार के साथ एक नया एफएमएस शामिल होगा। मुझे उम्मीद है कि समय के साथ, एफएमएस बड़े नेटवर्क के लिए बंद हो जाएगा और अधिक व्यापक हो जाएगा।

एनओसी में एफएमएस के कार्यान्वयन की सुविधाओं का खुलासा निम्नलिखित लेखों में अधिक विस्तार से किया जाएगा।

Source: https://habr.com/ru/post/In126051/


All Articles