NoSQL और बिग डेटा - श्रमिकों को धोखा?

छवि हम हाल ही में खुले MySQL डेटाबेस इंजन के मूल संस्करण के लेखक, महान विनी - माइकल विडेनियस के साथ बातचीत करने में कामयाब रहे, जो वर्तमान में अपनी शाखा मारियाबीडी पर काम कर रहा है। (वैसे, ये दोनों डेटाबेस Jelastic में समर्थित हैं।)

जैसा कि आप जानते हैं, दुनिया अधिक से अधिक डेटा (तथाकथित बिग डेटा घटना) का उत्पादन और प्रसंस्करण करती है। यह आमतौर पर स्वीकार किया जाता है कि अब इतना डेटा है कि पारंपरिक डेटाबेस और सॉफ़्टवेयर विधियों का उपयोग करके उन्हें संसाधित करना मुश्किल या असंभव है। इससे गैर-संबंधपरक डेटाबेस (NoSQL) की लहर पैदा हुई, जो उच्च मापनीयता पर जोर देती है। डेटाबेस विशेषज्ञ, मोंटी ने एसक्यूएल, नोएसक्यूएल और बिग डेटा की वर्तमान और भविष्य की स्थिति पर अपने विचार हमारे साथ साझा किए। उनके कुछ उत्तर कुछ अप्रत्याशित थे, इसलिए हम यहां अपनी बातचीत के प्रतिलेख का रूसी अनुवाद प्रदान करके खुश हैं:

क्या आप हमें NoSQL के इतिहास और बड़े डेटा के बारे में थोड़ा बता सकते हैं? यह विषय हाल ही में इस तरह के हित में क्यों रहा है?

यह सब "नया NoSQL आंदोलन" ट्विटर कर्मचारियों के एक ब्लॉग पोस्ट के साथ शुरू हुआ जिन्होंने सोचा कि MySQL उनके लिए पर्याप्त नहीं था। उन्हें कैसंड्रा जैसी "कुछ बेहतर" की जरूरत थी।

MySQL के साथ ट्विटर समस्याओं का मुख्य कारण डेटाबेस का दुरुपयोग है। इसके अलावा, उनके द्वारा प्रस्तावित समाधान MySQL में जितनी आसानी से Cassandra में लागू किया जा सकता था।

मुझे मूल लेख नहीं मिल रहा है, लेकिन मुझे थोड़ा बाद में उल्लेख मिला कि कैसंड्रा MySQL की जगह लेगा

आज (3 साल बाद), ट्विटर अभी भी ट्वीट के लिए MySQL को अपनी प्राथमिक रिपॉजिटरी के रूप में उपयोग कर रहा है। कैसंड्रा अंततः MySQL को बदलने में विफल रही।

NoSQL की लोकप्रियता का मुख्य कारण यह है कि SQL के विपरीत, आप इसे बिना किसी अतिरिक्त विकास के उपयोग करना शुरू कर सकते हैं। वास्तव में, NoSQL के साथ शुरू करना बहुत सरल है, लेकिन आप बाद में इसके लिए भुगतान करेंगे जब आप अपने डेटा का नियंत्रण खो देंगे।

इस प्रकार, मुख्य लाभ (कम से कम मारियाडीबी के आगमन तक) अधिकांश NoSQL समाधान हैं:
• डेटा तक त्वरित पहुँच (यदि सभी डेटा रैम में रखा गया है),
• कई नोड्स के बीच डेटा की तेजी से प्रतिकृति / वितरण,
• लचीला लेआउट (आप तुरंत नए कॉलम जोड़ सकते हैं)।

आप व्यक्तिगत रूप से NoSQL / Big Data के भविष्य के बारे में क्या सोचते हैं? आपके पूर्वानुमान क्या हैं?

मेरा मानना ​​है कि ज्यादातर लोग NoSQL का उपयोग मुख्य रूप से इस तकनीक के आसपास "प्रचार" के कारण करते हैं। अधिकांश कंपनियों के पास वास्तव में बड़ी मात्रा में डेटा नहीं है, जैसे कि फेसबुक और Google, और वे डेटाबेस को स्थापित करने और लगातार विकसित करने के लिए विशेषज्ञों को काम पर रखने में सक्षम नहीं होंगे।

रिलेशनल डेटाबेस - SQL - कहीं भी नहीं जाएगा। NoSQL बस उन्हें प्रतिस्थापित नहीं कर सकता। डेटा का उपयोग करने के लिए लगभग सभी को शामिल होना चाहिए।

हालांकि, ऐसी स्थितियां हैं जहां NoSQL का उपयोग करना समझ में आता है। मुझे लगता है कि भविष्य में, हम अधिक संयुक्त समाधान देखेंगे जिसमें SQL और NoSQL शामिल हैं।

यही कारण है कि हम मारकडीबी की कार्यक्षमता का विस्तार कर रहे हैं ताकि कैसेंड्रा और लेवलबीडी जैसे नोएसक्यूएल डेटाबेस तक पहुंच सकें।

यदि केवल दुर्लभ मामलों में NoSQL की आवश्यकता होती है, तो लोग अभी भी इसका उपयोग क्यों करते हैं? मुख्य कारण क्या हैं?

क्योंकि NoSQL के साथ शुरू करना हमेशा बहुत आसान होता है। इससे पहले कि आप इसका उपयोग शुरू करें, आपको SQL स्कीमा सीखने और डेटाबेस स्कीमा को परिभाषित करने की आवश्यकता नहीं है। कुछ लोग NoSQL का उपयोग करते हैं क्योंकि उनका मानना ​​है कि यह SQL से बेहतर है।

क्या SQL आउटपरफॉर्म NoSQL कर सकता है? क्या अनोखे लाभ SQL को NoSQL से बेहतर बनाते हैं?

ऐसे मामलों में जहां डेटा मेमोरी में फिट नहीं होना शुरू होता है, SQL आमतौर पर NoSQL से बेहतर है।

कई अन्य चीजें भी हैं जो NoSQL बस नहीं कर सकती हैं। अधिकांश NoSQL समाधान एकल-कुंजी पहुंच के लिए अनुकूलित हैं। कुछ और के लिए, आपको एक कार्यक्रम लिखने की आवश्यकता है। इस मामले में, जटिल कार्यों के लिए SQL ऑप्टिमाइज़र को पार करना बहुत मुश्किल है, विशेष रूप से चयन जो उपयोगकर्ता के अनुरोधों के आधार पर स्वचालित रूप से उत्पन्न होते हैं (अधिकांश वेबसाइटों को इसकी आवश्यकता होती है)।

SQL एकल मशीन के साथ काम करते समय NoSQL को बेहतर बना सकता है। एक क्लस्टर में जहां सब कुछ स्मृति में है, इसके विपरीत, NoSQL आमतौर पर मुख्य प्रश्नों में SQL से आगे है।

वाणिज्यिक होदोप के लिए नवीनतम क्लोउडर निवेश की घोषणा के बारे में आप क्या सोचते हैं?

Hadoop के साथ मुख्य समस्या यह है कि कोई भी ज्ञात व्यवसाय मॉडल नहीं है जो निवेशकों को अपेक्षित दस गुना लाभ की गारंटी देगा। इस संबंध में, मेरे लिए यह समझना मुश्किल है कि लंबे समय में क्लाउडरा कैसे जीवित रह सकता है।

बस एक अच्छा उत्पाद पर्याप्त नहीं है, आपको उस पर पैसा कमाने में सक्षम होने की आवश्यकता है।

वर्तमान में बिग डेटा और NoSQL के सबसे सक्रिय प्रवर्तक कौन हैं?

सभी NoSQL विक्रेताओं;)

अगर यह सब सिर्फ एक धोखा है, तो इतना प्रचार क्यों?

यह हर किसी के लिए एक धोखा नहीं है। कई बड़ी कंपनियां और परियोजनाएं हैं जो बिग डेटा से लाभान्वित हो सकती हैं।

हालाँकि, मैं यह कहना चाहता हूं कि बिग डेटा या NoSQL की सबसे अधिक आवश्यकता नहीं है, क्योंकि यह लंबे समय में अधिक खर्च होगा जब आप अंततः पाएंगे कि NoSQL आपके व्यवसाय की सभी जरूरतों को हल नहीं कर सकता है।

और अंत में, मारियाबडी इस सब में कैसे फिट होती है?

हम NoDB और SQL के बीच MariaDB पुल का एक प्रकार बनाने का प्रयास करते हैं। इसलिए हमने कैसंड्रा सपोर्ट को पहले जोड़ा और वर्तमान में लेवलबीडी सपोर्ट को जोड़ने पर काम कर रहे हैं।

हम जानते हैं कि NoSQL कुछ वास्तव में महत्वपूर्ण जरूरतों को पूरा करने की कोशिश कर रहा है, और इसीलिए हमने डायनेमिक कॉलम (जो SQL स्कीमा को अधिकांश NoSQL स्कीमा के रूप में लचीला बनाता है) और तेजी से प्रतिकृति जोड़ा।

MariaDB 10.0 में, प्रतिकृति और भी तेज़, अधिक लचीली और अधिक लचीली होगी।

मारियाबीडी में मल्टी-मास्टर समाधान प्रदान करने के लिए हम गैलेरा के साथ मिलकर काम करते हैं।

यह सब एक बदलती दुनिया के लिए बेहतर अनुकूलन करने और लोगों की मौजूदा जरूरतों को पूरा करने के लिए - शायद बहुत दूर की जरूरतों;)

कृपया हमें नए मारियाडीबी फंड के बारे में बताएं। डेवलपर्स के लिए इसका क्या मतलब है?

मारियाबीडी फाउंडेशन बनाया गया था ताकि कई स्वतंत्र कंपनियां एक साझा लक्ष्य पर एक साथ काम कर सकें, एक खुले स्रोत परियोजना के रूप में मारियाबीडी को सक्रिय रूप से विकसित करने के लिए। फाउंडेशन डेवलपर्स को सभी असेंबली करने, क्वालिटी कंट्रोल करने, पैच चेक करने आदि के लिए हायर करता है, जो प्रोजेक्ट को आगे बढ़ाने के लिए जरूरी है।

बहुत बहुत धन्यवाद, मोंटी! Jelastic प्लेटफ़ॉर्म के उपयोगकर्ताओं के बीच MariaDB बहुत लोकप्रिय है। ऑल द बेस्ट!

Source: https://habr.com/ru/post/In166845/


All Articles