बैक्टीरियल जीनोम का विश्लेषण। विस्तार

पिछले एक लेख में , चर्चा बहुत शोर से भरी हुई थी। लेकिन हमने अपनी साइट खोली और अधिक उन्नत जानकारी होगी (जहां? - पत्र लिखें)। मैंने अपने प्रयोग के बारे में एक सीक्वल लिखने का वादा किया, इसलिए जो लोग विकासवादी पेड़ों के निर्माण में रुचि रखते हैं - कृपया, बिल्ली के नीचे।

नंबर 1। सभी सजातीय क्रमों (परगनों) का चयन


पिछले लेख में, हमने 16S और 23S जीन पर निर्मित विकासवादी पेड़ों की तुलना की। मेरा तरीका इस मायने में अलग है कि यह जीवों में उत्परिवर्तित नहीं होने की तुलना करने की पेशकश करता है। हैबर के शुरुआती लेखों में, मैंने tRNA का उपयोग करने का सुझाव दिया, क्योंकि ये सबसे अधिक रूढ़िवादी अनुक्रम हैं। लेकिन इससे ज्यादा जानकारी नहीं मिली। इसलिए, मैंने अपने आप से पूछा - मैं उन सभी दृश्यों को कैसे खोज सकता हूं जो जीवों में उत्परिवर्तित नहीं हुए हैं? वास्तविक समय में ऐसा करने के लिए, मैं थोड़ी चाल के लिए चला गया। तथ्य यह है कि किसी भी डीएनए अनुक्रम को विरासत में प्राप्त करने से पहले, यह निश्चित रूप से (यदि यह उपयोगी है) जीनोम में कई प्रतियों में प्रतिनिधित्व किया जाएगा। यानी यह परगनों के बारे में है।

यदि एक एकल जीव के भीतर, क्रोमोसोमल उत्परिवर्तन के परिणामस्वरूप, एक जीन का दोहरीकरण होता है, तो इसकी प्रतियों को पैरलोग्स कहा जाता है।

इसलिए, यदि आप सभी जीवों को एक जीव में पाते हैं, तो यदि वंशानुक्रम हुआ तो उन्हें अन्य जीवों में स्थानांतरित कर दिया गया। हमें केवल उन लोगों का चयन करने की आवश्यकता है जिनके पास उत्परिवर्तित करने का समय नहीं था।

यानी हम निम्नलिखित कार्य करते हैं:
1. हम प्रत्येक डीएनए (शरीर के जीनोम) की तलाश कर रहे हैं, जिसमें आमतौर पर 50 से 150 अक्षरों के डुप्लिकेट होते हैं
2. प्रत्येक डुप्लिकेट के लिए, हम इसकी घटना के सभी जीवों की खोज करते हैं, अर्थात हम आधार को पहचानते हैं और संकलित करते हैं, क्योंकि शरीर के कई जीनोमों में से सभी में शामिल हैं

(ऐसा करने के सार से विचलित न होने के लिए, मैं या तो एक अलग लेख में बताऊंगा या इसके बजाय, यदि आप रुचि रखते हैं, तो मैं समय के साथ हमारी साइट पर एक लेख लिखूंगा)

नंबर 2। वास्तव में एक विकासवादी पेड़ का निर्माण


मेरी पद्धति के अनुसार एक विकासवादी वृक्ष का निर्माण कैसे करें, मैंने पहले ही बता दिया है । इसलिए, हम क्रॉस-वैलिडेशन के परिणामों पर ध्यान केंद्रित करेंगे। मैं आपको याद दिलाता हूं कि 23S rRNA जीन का उपयोग करके निर्मित और 16S rRNA जीन का उपयोग करके निर्मित दो पेड़ों का क्रॉस-चेक , जो कि द ऑल-स्पीशीज़ लिविंग ट्री प्रोजेक्ट का नवीनतम परिणाम है, निम्न त्रुटि वितरण प्राप्त करता है (पिछले लेख की तुलना में, इसे प्रजातियों की कुल संख्या के प्रतिशत के रूप में माना जाता है। ):



मैं उम्मीद कर रहा था कि मेरा दृष्टिकोण बेहतर परिणाम देगा, लेकिन अफसोस, यह गुणवत्ता में समान है - लेकिन संक्षेप में अलग है। पहले, गुणवत्ता के बारे में, फिर इस तरह से क्रॉस-चेकिंग की गई। चूंकि यह शरीर के जीनोम में परगनों की एक लाख घटनाओं के बारे में पाया गया था, अर्थात्। चूँकि "डीएनए अनुक्रम आईडी जैसे कि फार्म का एक लाख रिकॉर्ड है और इस तरह के और ऐसे शरीर में प्रवेश करता है," क्रॉस-चेकिंग के लिए मैंने इस सेट को बेतरतीब ढंग से दो नमूनों में विभाजित किया है। मैंने उन पर पेड़ बनाए और उसी तरह से बनाए गए पेड़ों की तुलना की। यह निम्नलिखित निकला:



इस प्रकार, वास्तव में, इन पेड़ों पर भरोसा उसी के बारे में है। 50% के लिए वह और दूसरा दोनों लगभग सही हैं।

बेशक, मुद्दा यह है कि जीनोम में इतनी अधिक जानकारी नहीं है कि केवल आधे नमूने में समानता हो सकती है। इसलिए, मैंने इस बारे में सोचा कि मैं उपलब्ध जानकारी को यथासंभव आर्थिक रूप से कैसे प्रबंधित करूंगा। और मुझे लगा कि इस तरह का क्रॉस-विश्लेषण किया जा सकता है। एक पूर्ण पेड़ बनाने के लिए सभी उपलब्ध जानकारी लें, और आधे पेड़ों के साथ तुलना करें। यानी पूरे मिलियन रिकॉर्ड ले लो और पहले एक आधा मिलियन के साथ उनकी तुलना करें, और फिर दूसरे के साथ। नीचे दिए गए आंकड़े में, पेड़ों की छवियों (और पूर्ण संकल्प में संदर्भ) का निर्माण पूर्ण नमूने में किया गया है, और जो नोड्स काफी स्थिर हैं, वे लाल रंग में प्रदर्शित होते हैं - अर्थात्। क्रॉस-विश्लेषण ने एक से अधिक गलती नहीं दी।

जैसा कि आप देख सकते हैं, सब कुछ इतना बुरा नहीं है, शाखाओं का हिस्सा पूरी तरह से लाल है, लेकिन जड़ के करीब, कम जानकारी और पेड़ में प्रजातियों की स्थिति परीक्षण पास नहीं करती है।

लेकिन दिलचस्प बात यह है कि मैंने तब मेरे द्वारा प्राप्त वृक्ष और द ऑल-स्पीशीज़ लिविंग ट्री परियोजना के पेड़ की तुलना की (उसी रचना में कम होने के बाद)। यह पता चला कि वे केवल 25% से मेल खाते हैं।

और मेरे पास व्याख्या का एक महत्वपूर्ण प्रश्न था, क्या कोई मुझे बता सकता है कि इसका क्या मतलब हो सकता है। यह पता चला है कि आप पेड़ों के निर्माण की मेरी पद्धति पर भरोसा कर सकते हैं और जाहिरा तौर पर आप ऑल-स्पीशीज़ लिविंग ट्री परियोजना में इस्तेमाल की जाने वाली शास्त्रीय पद्धति पर भरोसा कर सकते हैं। वे संयोग की दृष्टि से बहुत भिन्न नहीं हैं। लेकिन वे संयोग क्यों नहीं करते? वे दिखाने के लिए बाहर आते हैं, जैसे कि यह एक ही चीज के दो संस्करण थे। लेकिन दो अर्ध-सत्य एक ही समय में केवल 25% कैसे मेल कर सकते हैं?


पूर्ण आकार का प्रारूप यहाँ और यहाँ देखा जा सकता है

मैंने यह भी सोचा कि विसंगतियां गैर-आयामी दिखाई देती हैं, और कहीं-कहीं जीवों के परिवारों के स्तर पर भी। पेड़ की छवि के दूसरे संस्करण में, यह देखा जा सकता है कि प्रजातियों को समूहों में विभाजित किया जाता है, और समूह के भीतर कई संयोग होते हैं, जबकि समूहों की स्थिति स्वयं गलत होती है।

दो विकल्प हैं - या वास्तव में अब तक बहुत कम डेटा, कुछ अनुक्रमित मध्यवर्ती प्रजातियां। या, फिर भी, वास्तव में, परिवारों के ऊपर एक स्तर पर उनके पास एक सामान्य पूर्वज नहीं है, और विकास डार्विन के अनुसार नहीं है? कम से कम अभी तक हमारे पास विश्वसनीय डेटा नहीं है कि सामान्य तौर पर एक सामान्य पूर्वज था।

Source: https://habr.com/ru/post/In168593/


All Articles