द्रव डेटा: बिग डाटा संग्रहण में एक "छोटा" विजय - भाग 2

पिछले भाग में, हमने नई द्रव डेटा तकनीक की शुरुआत की, जो वास्तव में बड़े डेटा से निपटने वालों के जीवन को बेहतर बनाने के लिए डिज़ाइन की गई थी। कुछ, लेकिन सभी नहीं, इस समाधान के फायदे भी एक उदाहरण के रूप में डेल कम्पेलिटरी स्टोरेज सिस्टम का उपयोग करके विश्लेषण किए गए थे। खैर, बिना देर किए, हम आपके परिचित को जारी रखने का सुझाव देते हैं।

सर, अपना बचाव करें! और बैक अप!


Admins को दो प्रकारों में विभाजित किया जाता है: वे जो अभी तक बैकअप नहीं लेते हैं, और जो पहले से करते हैं। आप शायद इस मजाक की दाढ़ी के साथ पृथ्वी को कई बार लपेट सकते हैं, लेकिन यह अभी भी अपनी प्रासंगिकता नहीं खोता है। आज, किसी कंपनी के लिए व्यावसायिक प्रक्रिया की निरंतरता कभी-कभी बहुत महत्वपूर्ण होती है, जिसका अर्थ है कि एक अच्छी भंडारण प्रणाली को संभावित समस्याओं का समाधान प्रदान करना चाहिए। क्या "मुसीबतों" लोहे की उम्मीद कर सकते हैं? कम से कम एक शक्ति आउटेज, मानव कारक (उपयोगकर्ता त्रुटियां), वायरस, आदि। हालांकि, डेटा की सुरक्षा और पुनर्स्थापना के लिए पारंपरिक दृष्टिकोण समय के साथ निर्णायक रूप से "अतिवाद" जमा हो गए हैं: उन्हें बहुत अधिक डिस्क स्थान की आवश्यकता शुरू हुई, जबकि विश्वसनीयता और गति के संकेतक चमक नहीं रहे। उदाहरण के लिए, स्नैपशॉट की पीढ़ी काफी प्रभावी रूप से डेटा की सुरक्षा करती है (बेशक, बशर्ते कि लगातार दो स्नैपशॉट के बीच का समय काफी छोटा हो)। हालांकि, आपको अक्सर एक पूर्ण दर्पण कॉपी और संपूर्ण वॉल्यूम के क्लोन का उपयोग करना होगा। लेकिन RAID भी है, जो कार्य को बिल्कुल भी सुविधाजनक नहीं बनाता है। क्षमता के इस अक्षम आवंटन में जोड़ें, जिसके बारे में हमने पिछले लेख में बात की थी, और आपको एक गतिरोध मिलता है: आप तस्वीरें ले सकते हैं, लेकिन उनमें से एक बड़ी संख्या बस स्टोर करने के लिए कहीं नहीं है। और यहां आपको या तो लगातार दो रिकवरी बिंदुओं के बीच समय बढ़ाना होगा, या थोड़े समय के लिए वापस रोल करने में सक्षम होना चाहिए। जाहिर है, दोनों एक केक नहीं हैं।

इसलिए, डेल इंस्टेंट सिस्टम में उपयोग किया जाने वाला समाधान, जिसे डेटा इंस्टेंट रिप्ले कहा जाता है, काफी स्वाभाविक और तार्किक है। इसका सिद्धांत कुछ हद तक अधिकांश ऑनलाइन गेमों के व्यवहार की याद दिलाता है - खेल की दुनिया में बदलावों के बारे में केवल जानकारी सर्वर को दी जाती है, न कि वीडियो / साउंड / चैट / मैट ... जैसा कि डेटा बैकअप पर लागू होता है, इसका मतलब है कि दर्पण की प्रतियां और उसके बाद के क्लोनों को पूरा करने से इनकार करना। पिछले स्नैपशॉट के बाद से केवल डेटा परिवर्तन रिकॉर्ड करता है। ऐसा दृष्टिकोण अनिवार्य रूप से डिस्क स्थान में बचत की ओर ले जाएगा, और गतिशील क्षमता के साथ संयोजन में, यह दोहरे नुकसान का लाभ देगा।

छवि


खैर, इस तरह के एक लाभदायक उपकरण प्राप्त करने और दो शॉट्स के बीच के समय को कम करने के लिए, आपको प्रक्रिया के स्वचालन का ध्यान रखना होगा। हर 15 सेकंड में खुद बटन दबाएं न? यह, बोलने के लिए, फ़ॉक्सकॉन की स्माइक्स। फिर भी, यह तुच्छ कार्य एक कम तुच्छ निर्मित अंतर्निहित अनुसूचक स्थापित करके हल किया गया है जो आपको "प्रतिकृति" प्रक्रिया को स्वचालित रूप से शुरू करने की अनुमति देता है।

यह केवल जीवन से कुछ उदाहरण देने के लिए बनी हुई है (चित्र की गिनती नहीं है), तकनीक की "उपयोगिता" साबित होती है। कल्पना करें कि कार्य नए अनुप्रयोगों या सेवाओं का परीक्षण करना है जो कंपनी संभवतः भविष्य में लागू करने की योजना बना रही है। इस बात की क्या गारंटी है कि परीक्षण के दौरान सब कुछ "बिना अड़चन के, बिना अड़चन के" जाएगा? डेटा इंस्टेंट रिप्ले के साथ, यह डेटा हानि या भ्रष्टाचार के किसी भी जोखिम के बिना किया जा सकता है।

Admins ने दोहराया, दोहराया, लेकिन दोहराया नहीं गया



और अब मैं उन कंपनियों के लिए विशिष्ट स्थिति पर विचार करना चाहूंगा जिनके पास कई बड़े प्रतिनिधि कार्यालय हैं जो भौगोलिक रूप से एक दूसरे से दूर हैं, लेकिन जिन्हें समान जानकारी तक पहुंच की आवश्यकता है। इसी समय, जानकारी स्वयं सभी के लिए प्रासंगिक होनी चाहिए और किसी भी परिवर्तन के मामले में तुरंत अपडेट की जानी चाहिए। कई समाधान हैं। उदाहरण के लिए, आप "बादलों में" सब कुछ चला सकते हैं। लेकिन क्या होगा यदि आपको दूरस्थ साइट पर डेटा बैकअप को व्यवस्थित करने की आवश्यकता है?

अब यह दृष्टिकोण, कहना चाहिए, संगठन में इसकी लागत और जटिलता के कारण बहुत लोकप्रिय नहीं है। उदाहरण के लिए, कभी-कभी दोनों साइटों पर समान उपकरण की उपस्थिति की आवश्यकता होती है। और फिर भी, इस "अच्छे" को सिंक्रनाइज़ करने के लिए एक उच्च गति संचार चैनल के संगठन द्वारा अतिरिक्त खर्च लाया जाएगा।

लेकिन किसने कहा कि इन समस्याओं को सस्ती कीमत पर हल नहीं किया जा सकता है? डेल ने निश्चित रूप से नहीं कहा। और उन्होंने "पतली" प्रतिकृति (मूल। पतली प्रतिकृति) की तकनीक विकसित की जिसे रिमोट इंस्टेंट रिप्ले कहा जाता है। इसकी विचारधारा ऊपर वर्णित बैकअप बनाने की विधि के समान है: भविष्य में साइटों के प्रारंभिक सिंक्रनाइज़ेशन के बाद, केवल संचार चैनलों के माध्यम से चलने वाले डेटा में परिवर्तन होता है।
लाभ स्पष्ट हैं:
• उपकरण की लागत में कमी;
• संचार चैनलों के लिए लागत और बैंडविड्थ आवश्यकताओं को कम करना;
• सूचना वसूली की गति बढ़ाना।

इसके अलावा, प्रौद्योगिकी के सापेक्ष "सर्वव्यापीता" को निश्चित रूप से फायदे में लिखा जाना चाहिए, अर्थात, बैकअप साइटों पर आप अपने चैनल बैंडविड्थ को खोए बिना कम लागत वाले एसएएस और एसएटीए डिस्क का उपयोग कर सकते हैं। फाइबर चैनल-टू-iSCSI कनवर्टर डेल कम्पेलिटिव सिस्टम में एकीकृत है, और भी दक्षता में वृद्धि कर सकता है, जिससे आप प्रोटोकॉल रूपांतरण के बिना अपने मूल आईपी नेटवर्क के साथ प्राप्त कर सकते हैं।

ज्यादा खुशी कभी नहीं होती



अंत में, हम एक और जरूरी समस्या पर ध्यान केन्द्रित करते हैं जो जल्द ही या बाद में किसी भी सफल व्यवसाय को प्रभावित करती है। हम सूचना संस्करणों में अपरिहार्य वृद्धि के बारे में बात कर रहे हैं। भंडारण के लिए, यह समस्या एक स्केलेबिलिटी आवश्यकता में बदल जाती है। मुसीबत यह है कि समाधान प्रदाता मूर्ख भी नहीं हैं और पैसा कमाना चाहते हैं। एक सरल सादृश्य: एक निर्माता में 64 जीबी के लिए सस्ती कीमत पर फ्लैश ड्राइव का उत्पादन करने की क्षमता है। लेकिन अगर वह "लोकप्रियता के चरम पर" 8 जीबी के क्षण में ऐसा क्यों करेगा? हां, और फिर 1, 2 और 4 जीबी के लिए फ्लैश ड्राइव के साथ क्या करना है? जाहिर है, धीरे-धीरे उपभोक्ता को "बेहतर जीवन" में पेश करना आवश्यक है - यह उत्पादकों और विक्रेताओं दोनों के लिए फायदेमंद है (केवल स्वयं उपभोक्ता के लिए फायदेमंद नहीं है)। इसलिए, पहले 16 के लिए समाधान होगा, फिर 32 के लिए, और उसके बाद ही प्रतिष्ठित 64 जीबी।

यह भंडारण से कैसे संबंधित है? सबसे सीधे तरीके से। "क्लासिक" मामले में, निर्माता कृत्रिम रूप से अपने समाधान की संभावनाओं को सीमित करते हैं, उन्हें तेजी से अप्रचलन के लिए एक आंख के साथ पूर्व-डिजाइन करते हैं।

डेल में, यह विश्वास करें या नहीं, हमने इस सिद्धांत से दूर जाने का फैसला किया। डेल कम्प्रेसर स्टोरेज सिस्टम एक लंबे जीवन चक्र के लिए डिज़ाइन किया गया है। "भूख" बढ़ने के साथ ही प्लेटफॉर्म को दो से हजार टेराबाइट क्षमता तक बढ़ाया जा सकता है। इसी समय, FC और iSCSI सर्वर इंटरफेस और प्रयुक्त डिस्क (SSD, FC, SAS और SATA) दोनों के चर संयोजनों की अनुमति है। तुम भी एक ही डिस्क शेल्फ में विभिन्न क्षमताओं और गति के एसएएस ड्राइव स्थापित कर सकते हैं।

दूसरी ओर, विफलताओं के खिलाफ सुरक्षा पर विशेष ध्यान दिया जाता है। गुच्छेदार नियंत्रक, प्रत्येक निरर्थक प्रशंसकों और बिजली की आपूर्ति से लैस है, साथ में इष्टतम सिस्टम प्रदर्शन प्रदान करते हैं। हालांकि, प्रत्येक नियंत्रक स्वतंत्र रूप से डिस्क अलमारियों से जुड़ा होता है और विफलता के एक बिंदु को समाप्त करने के लिए डिस्क। और नियंत्रक बंदरगाहों का वर्चुअलाइजेशन और सर्वर और ड्राइव के बीच I / O चैनल को डुप्लिकेट करने से अतिरिक्त सॉफ़्टवेयर की आवश्यकता समाप्त हो जाती है।

अंतभाषण



पारंपरिक भंडारण प्रणालियों के "शिकारी" दृष्टिकोण के साथ मत डालो, ग्राहक को स्पष्ट रूप से अप्रचलन और सीमित संगतता समाधानों की पेशकश करते हैं। डेल कम्पेंसेरी गतिशील वर्चुअलाइज्ड स्टोरेज प्रदान करता है जो आसानी से निरंतर परिवर्तन के लिए अनुकूल होता है।
मुख्य विशेषताएं लिखी जा सकती हैं:
• डेटा भंडारण प्रक्रिया का अनुकूलन, जो आपको डिस्क स्थान को प्रभावी ढंग से आवंटित करने की अनुमति देता है;
• अंतर्निहित बुद्धिमान डेटा प्रबंधन कार्य और उन्हें स्वचालित करने की क्षमता;
• तत्काल स्नैपशॉट के लिए बेहतर तकनीक;
• मालिकाना प्रौद्योगिकियों और विशिष्ट निर्माताओं से बंधे बिना दीर्घावधि के लिए प्रारंभिक प्रणाली का डिजाइन।

जोड़ने के लिए क्या है? यदि आप अच्छा प्रदर्शन करना चाहते हैं, तो इसे डेल के साथ करें।

Source: https://habr.com/ru/post/In154449/


All Articles