☎️ 😳 🤽🏿 नेटवर्क जासूस: ट्रैफिक जाम और लोड के कारणों की तलाश 🤛🏿 ✅ 🛵

मान लीजिए कि हमारे पास संचार चैनल लोड करने की यह तस्वीर है:

किस कारण से यातायात में उछाल आया? संचार चैनल में क्या हुआ?

कार्रवाई एक बड़े डेटा सेंटर में होती है, उदाहरण के लिए, एक बैंक। और चैनल में परीक्षण सेवाओं, या एक दर्जन व्यावसायिक सेवाओं में से एक के साथ-साथ डेटाबेस का बैकअप भी समान सफलता के साथ शामिल हो सकता है।

यदि व्यवस्थापक पूरी तरह से कुटिल नहीं है, और स्थिति बहुत मुश्किल नहीं है, तो 10 मिनट में समस्या पैदा करने वाले विशिष्ट कारणों की पहचान करना संभव होगा, और समस्या का विश्लेषण करने के लिए एक और 15-20 मिनट। यदि स्थिति अधिक जटिल है (हम नीचे एक और उदाहरण पर विचार करेंगे), तो आप ट्रैफ़िक व्यवहार में विसंगतियों के लिए दिनों की तलाश कर सकते हैं। इस तरह की विसंगतियों का पता लगाने के लिए उपकरणों के साथ, इस उदाहरण में समस्या को खोजने में 1 मिनट लगेगा।

यहाँ एक सरल उदाहरण है। संचार चैनल में ट्रैफ़िक में उछाल था, जिसके कारण उपयोगकर्ता अनुप्रयोगों पर ब्रेक थे।

हम यह समझना चाहते हैं: संचार चैनल में कौन से एप्लिकेशन / सेवा ट्रैफ़िक संचारित हैं और किस कारण से बढ़े हैं?

हाँ, मैं देख रहा हूँ ... CIFS - कुल यातायात का 92%।

हमें पता चलता है कि वहां कौन काम करता है (जो मेजबान और उपयोगकर्ता हैं)।

पहली क्लाइंट-सर्वर जोड़ी ने संचार चैनल को 99% CIFS के माध्यम से लोड किया।

यदि हमारे पास सक्रिय निर्देशिका के साथ एक नैदानिक प्रणाली एकीकरण है, तो हम यह पता लगा सकते हैं कि यह कौन है। हम कोशिश करते हैं।

हमारे पास इस तरह के जॉन स्मिथ हैं। समस्या का एक अंतिम नाम है। और यह सब 1 मिनट में।

मैं जोड़ना चाहता हूं कि उदाहरण में बनाई गई रिपोर्टों के बीच सभी बदलाव सही माउस बटन पर क्लिक करके और प्रकट होने वाले संदर्भ मेनू से एक रिपोर्ट का चयन करके किया जाता है।

अब आइए एक उदाहरण को और अधिक जटिल देखें जब पूरी ईआरपी प्रणाली धीमी हो जाती है।

तो, ऐसी तस्वीर है:

ईआरपी धीमा, उपयोगकर्ताओं की शिकायत क्यों? कहाँ देखना है? कहाँ देखना है?

बेशक, आप मैन्युअल रूप से कारणों की तलाश कर सकते हैं। यह दिलचस्प है, लेकिन अगर कई दसियों समस्याएं हैं, तो यह थका देने वाला और लंबा है। साथ ही, आपको ट्रैफ़िक का विश्लेषण करने, एकत्र करने और ट्रैफ़िक का मूल्यांकन करने के लिए अपने स्वयं के या तीसरे पक्ष के कई मॉड्यूल का उपयोग करने की आवश्यकता है। सौभाग्य से, हमारे पास एक उपकरण है जो आपको एक बार और एक ही स्थान पर सभी डेटा प्राप्त करने की अनुमति देता है। यह रिवरबेड कैस्केड है।

सामान्य कार्य

माना कि यह केवल एक समस्या नहीं है, बल्कि व्यावसायिक सेवाओं के क्षरण के विश्लेषण के विभिन्न कार्यों का एक पूरा समूह है। एक नियमित नेटवर्क में, "बुद्धि" के साथ हमें समझने की आवश्यकता है:

कब तक सर्वर उपयोगकर्ता के अनुरोधों का जवाब देता है?
नेटवर्क के माध्यम से पैकेट कितनी तेजी से चलते हैं?
क्या डेटा कहाँ जाना है?
ट्रैफ़िक एक्सचेंज की प्रकृति क्या है (उदाहरण के लिए, कई छोटे लगातार अनुरोध या बड़े अनुरोध, अप-डाउन लोडिंग प्रोफ़ाइल, एक संभावित कैश में प्लेसमेंट या प्लेसमेंट)?
नेटवर्क और सर्वर देरी क्या और कहाँ बनाई जाती हैं?
यह ट्रैफ़िक कैसे चिह्नित किया गया है (सही?)
सर्वर एक दूसरे के साथ कैसे बातचीत करते हैं?
एप्लिकेशन मॉड्यूल कैसे जुड़े हैं?

रिवरबेड कैस्केड का उपयोग करना

पूर्ण समाधान में साढ़े तीन भाग होते हैं:

प्रोफाइलर डेटा विश्लेषण के लिए जिम्मेदार है। पायलट कंसोल वर्कस्टेशन ऐड-ऑन - सेंसर पर दर्ज पैकेट प्रतियां (टीसीपी डंप) के तेजी से प्रसंस्करण और विश्लेषण के लिए प्रोफाइलर सहायक। सरल शब्दों में, पायलट सभी ज्ञात Wireshark के लिए एक ग्राफिकल इंटरफ़ेस है।
गेटवे - प्राथमिक स्रोतों से डेटा संग्रह जैसे स्विच, राउटर, और इसी तरह। गेटवे सभी प्रवाह प्रकारों को स्वीकार करता है, डेटा को काट दिया जाता है और विश्लेषण के लिए प्रोइलर को भेजा जाता है।
मिरर डेटा को देखते हुए सेंसर, देरी को मापते हैं। संवेदक समस्याओं के ऐतिहासिक विश्लेषण के लिए एकत्र किए गए पैकेजों को भी संग्रहीत करते हैं। विश्लेषण के लिए प्रोफाइलर को आंकड़े भेजे जाते हैं।

एक विशिष्ट डेटा सेंटर के लिए उदाहरण: सभी तीन मॉड्यूल स्थापित हैं। शार्क सेंसर सर्वर फ़ार्म स्विच से प्रतिबिंबित डेटा प्राप्त करता है, वर्चुअल शार्क वर्चुअल मशीनों के बीच बातचीत का विश्लेषण करता है - गेटवे राउटर और ऑप्टिमाइज़र से प्रवाह प्राप्त करता है। फिर सभी आंकड़े प्रोफाइलर के पास जाते हैं। पायलट शार्क सेंसर पर संग्रहीत यातायात की एक प्रति के साथ काम करता है

व्यापक सर्वर

हम एक समस्या के साथ ईआरपी पर लौटते हैं।

हम यह समझना शुरू करते हैं कि अंत उपयोगकर्ताओं और वेब-सर्वर के बीच खंड पर क्या हुआ, सिस्टम ने इसके बारे में संकेत क्यों दिया।

हम डेस्कटॉप पर अर्ध-प्रणाली को चालू करते हैं। यह देखा जा सकता है कि कंपनी की सभी दूरस्थ शाखाओं के लिए एक समस्या है। हम इस समस्या पर घटनाओं को देखते हैं। हम एक विस्तृत विश्लेषण के लिए आगे बढ़ते हैं - यह स्पष्ट है कि हमने सर्वर से प्रतिक्रिया समय बढ़ा दिया है। नीचे दिए गए ग्राफ़ और टेबल एक रिपोर्ट में बनाए गए हैं।

ग्राफ़ के निचले भाग में मौजूद हरे रंग की लाइन सर्वर का सामान्य प्रोफाइल है। यह स्थिर सर्वर ऑपरेशन के साथ होना चाहिए।

ग्राफ पर, सर्वर प्रतिक्रिया समय के वास्तविक मूल्यों को नीले रंग में दिखाया गया है। नीचे रिपोर्ट को स्क्रॉल करें।

हम क्लाइंट और सर्वर के इंटरैक्शन को देखते हैं। यह देखा जा सकता है कि सभी ग्राहकों को एक डिग्री या किसी अन्य के लिए समस्याएं हैं। हालाँकि, सर्वर क्लस्टर से केवल एक सर्वर में कोई समस्या है।

समस्या सर्वर के आंकड़ों पर विचार करें।

हम सर्वर के मैक पते, स्विच के आईपी पते और सर्वर से जुड़े स्विच के पोर्ट को देखते हैं। पाइरॉश - पायलट कंसोल के लिए ग्राफिकल शेल में समस्या सर्वर के लेनदेन पर विचार करें।
ऑब्जेक्ट्स द्वारा सर्वर रिस्पांस टाइम रिपोर्ट से पता चलता है कि केवल एक ऑब्जेक्ट प्रदान करने का समय बढ़ाया गया है।

यहाँ वह है: complex.psp

हम जांच करते हैं। हम लेन-देन इंटरैक्शन आरेख का निर्माण कर रहे हैं। हम जाँच करते हैं:

हाँ, यह बात है।

यदि कोई अभी भी इस पर विश्वास नहीं करता है, तो इसे जांचने दें - हम उसी लेनदेन के विंडशार्क में मैन्युअल बैच विश्लेषण के लिए आगे बढ़ते हैं।

इसलिए, हमें ईआरपी सेवा के वेब सर्वर के साथ उपयोगकर्ता के संपर्क की एक व्यापक तस्वीर मिली, जिसने हमें एक खराब वेब सर्वर, या बल्कि, सर्वर पर एक खराब वस्तु खोजने की अनुमति दी।

स्तरित अनुप्रयोगों के साथ समस्याओं का स्थानीयकरण

हम सभी घटकों को दिखाते हुए एक बहु-स्तरीय अनुप्रयोग की तस्वीर देखते हैं, जिसमें ट्रैफ़िक लोड बैलेंसर्स शामिल हैं। सिस्टम नेत्रहीन तुरंत यह स्पष्ट कर देता है कि किस खंड पर समग्र रूप से सेवा की गिरावट का विश्लेषण करना आवश्यक है: ट्रैफ़िक बैलेंसर के वीआईपी पते तक पहुंचने पर एंड-यूज़र सेगमेंट को लाल रंग में चिह्नित किया गया है। फिर आप इस सेगमेंट में ट्रैफ़िक के विस्तृत विश्लेषण और ट्रैफ़िक बैलेंसर के प्रदर्शन के विश्लेषण के लिए आगे बढ़ सकते हैं। मैन्युअल रूप से एक बहुस्तरीय एप्लिकेशन के प्रत्येक खंड का विश्लेषण करने की आवश्यकता नहीं है और यह समझने के लिए कि इस एप्लिकेशन के घटक एक-दूसरे के साथ कैसे बातचीत करते हैं: जब आप पहली बार एप्लिकेशन घटकों के इंटरैक्शन मैप को देखते हैं, तो नेत्रहीन सब कुछ स्पष्ट हो जाता है।

यातायात अनुकूलक संगतता

पिछली पोस्ट में, मैंने पहले ही ट्रैफ़िक ऑप्टिमाइज़र उपकरणों के बारे में लिखा था जो डेटा चैनलों को पूरी तरह से संपीड़ित कर सकते हैं और अक्सर बैंकों, टेलीकॉम ऑपरेटरों और अन्य बड़ी कंपनियों द्वारा उपयोग किए जाते हैं, साथ ही साथ मध्यम और बड़े व्यवसाय संचार चैनल का अधिक कुशलता से उपयोग करने और अनुप्रयोगों को गति देने की मांग करते हैं। इसलिए, चूंकि ऑप्टिमाइज़र एक ही निर्माता के उत्पाद हैं, इसलिए रिवरबेड कैस्केड मॉनिटरिंग सिस्टम का उपयोग करके उनसे नेटवर्क आंकड़े भी एकत्र किए जा सकते हैं। दो समाधान पूरी तरह से (और सस्ते में, महत्वपूर्ण रूप से) गठबंधन करते हैं, जो व्यापक रूप से कंपनी के आवेदन के प्रदर्शन की समस्याओं को हल करता है।

ये रिवरबेड कैस्केड द्वारा एकत्र किए गए ट्रैफ़िक ऑप्टिमाइज़ेशन मीट्रिक हैं:

अनुकूलन के साथ LAN ट्रैफ़िक (नीला ग्राफ़) और WAN ट्रैफ़िक (हरा ग्राफ़) का अनुपात। आप स्पष्ट रूप से देख सकते हैं कि संचार चैनल में यातायात की मात्रा कितनी घट गई है

अनुप्रयोग द्वारा यातायात का अनुकूलन और उनमें से प्रत्येक के बैंडविड्थ उपयोग में कमी का प्रतिशत

रिपोर्ट

समाधान का उपयोग किया जाता है, ज़ाहिर है, न केवल आवेदन ट्रैफ़िक के व्यवहार में समस्याओं और विसंगतियों को स्थानीय बनाने के लिए। बुनियादी ढांचे के विकास की योजना के लिए, उदाहरण के लिए, रिपोर्ट बनाना बहुत सुविधाजनक है। उदाहरण के लिए, शाखाओं द्वारा यातायात की मात्रा और इसके प्रकारों पर एक रिपोर्ट आपको सिटी को उस ट्रैफ़िक की ओर ले जाने और इस दिशा के अनुकूलन के लाभों का मूल्यांकन करने की अनुमति देती है।

आप ऐतिहासिक दृष्टि से और वास्तविक समय में उनकी उपस्थिति (और यहां पर आपको बहुत ख़ुशी होगी कि इस तरह के एक शक्तिशाली क्षेत्र में) दोनों समस्याओं की तलाश कर सकते हैं।

विशेषज्ञ प्रणाली

रिवरबेड समाधान में एक और शानदार विशेषता है - व्यवहार विश्लेषण। जैसा कि आप जानते हैं, सबसे महत्वपूर्ण कार्यों में से एक है समय-समय पर हितधारकों को व्यावसायिक सेवाओं की गिरावट के बारे में सूचित करना। आमतौर पर, सिस्टम आपको एप्लिकेशन प्रदर्शन मैट्रिक्स के लिए केवल निश्चित सीमा निर्धारित करने की अनुमति देता है। उन्हें स्वयं प्रशासक द्वारा आविष्कार किया जाना चाहिए।

यहां रिवरबेड कैस्केड सभी प्रतियोगियों को बेहतर बनाता है: यह दर्जनों मीट्रिक लेता है और प्रत्येक मीट्रिक के सामान्य व्यवहार के प्रोफाइल बनाता है। आपको थ्रेशोल्ड मान सेट करने की आवश्यकता नहीं है, सिस्टम ऐतिहासिक आंकड़े एकत्र करेगा, और थ्रेशोल्ड मान इसके आधार पर उत्पन्न होंगे। और यदि आप आदर्श से विचलित होते हैं, तो सिस्टम व्यवस्थापक या उसके प्रबंधक को सूचित करेगा।

एप्लिकेशन प्रदर्शन एनालिटिक्स के अलावा, सिस्टम में सुरक्षा एनालिटिक्स कार्यक्षमता शामिल है। अर्थात्: सिस्टम प्रशासक को चेतावनी देगा यदि:

उपयोगकर्ता नेटवर्क को स्कैन करता है।
उपयोगकर्ता खुले बंदरगाहों को स्कैन करता है।
नेटवर्क पर एक नया होस्ट दिखाई देता है।
होस्ट नए पोर्ट का उपयोग करता है।

और यहां तक कि अगर स्थापित एंटी-वायरस सिस्टम नेटवर्क पर नए वायरस के प्रसार को नहीं देखते हैं, तो रिवरबेड कैस्केड दिखाई देने वाले असामान्य ट्रैफ़िक में "वर्म" के प्रसार का पता लगाएगा।

सवाल

हमने इस समाधान को (ट्रैफ़िक ऑप्टिमाइज़ेशन के साथ पूरा) एक सोने की खनन कंपनी के लिए, भौगोलिक रूप से वितरित बैंक के लिए, एक रसद कंपनी, एक ऊर्जा कंपनी के लिए एक परियोजना और दर्जनों और छोटी परियोजनाओं के लिए पूरा किया। हर डाटा सेंटर में ऐसी चीज की जरूरत होती है, जैसा कि मुझे लगता है। सामान्य तौर पर, यदि आपके कोई प्रश्न हैं, तो AVrublevsky@croc.ru पर या टिप्पणियों में पूछें। मैं मेल में आपके इन्फ्रास्ट्रक्चर के लिए कीमतों का नाम भी बता सकता हूं।

नेटवर्क जासूस: ट्रैफिक जाम और लोड के कारणों की तलाश