एक सफल अध्ययन विकसित करने की खोज में महत्वपूर्ण कदम आगे बढ़ाता है डीएनएडिजिटल डेटा के लिए आधारित भंडारण प्रणाली।
डिजिटल तिथि गैजेट्स पर हमारी निर्भरता के कारण आज तेजी से विकास हो रहा है और इसके लिए मजबूत दीर्घकालिक भंडारण की आवश्यकता है। डेटा भंडारण धीरे-धीरे चुनौतीपूर्ण होता जा रहा है क्योंकि वर्तमान डिजिटल तकनीक समाधान प्रदान करने में सक्षम नहीं है। एक उदाहरण यह है कि पूरे इतिहास की तुलना में पिछले दो वर्षों में अधिक डिजिटल डेटा बनाया गया है कंप्यूटर्सदरअसल, दुनिया में हर दिन 2.5 क्विंटिलियन बाइट {1 क्विंटिलियन बाइट = 2,500,000 टेराबाइट्स (टीबी) = 2,500,000,000 गीगाबाइट्स (जीबी)} डेटा बनाया जा रहा है। इसमें सोशल नेटवर्किंग साइटों का डेटा, ऑनलाइन बैंकिंग लेनदेन, कंपनियों और संगठनों के रिकॉर्ड, उपग्रहों से डेटा, निगरानी, अनुसंधान, विकास आदि शामिल हैं। यह डेटा बहुत बड़ा और असंरचित है। इसलिए, डेटा के लिए विशाल भंडारण आवश्यकताओं और इसकी तेजी से वृद्धि से निपटना अब एक बड़ी चुनौती है, खासकर उन संगठनों और निगमों के लिए जिन्हें मजबूत दीर्घकालिक भंडारण की आवश्यकता होती है।
वर्तमान में उपलब्ध विकल्प हार्ड डिस्क, ऑप्टिकल डिस्क (सीडी), मेमोरी स्टिक, फ्लैश ड्राइव, और अधिक उन्नत टेप ड्राइव या ऑप्टिकल ब्लूरे डिस्क हैं जो लगभग 10 टेराबाइट्स (टीबी) डेटा तक स्टोर करते हैं। इस तरह के भंडारण उपकरणों का हालांकि आमतौर पर उपयोग किया जा रहा है, लेकिन इसके कई नुकसान हैं। सबसे पहले, उनके पास कम से मध्यम शेल्फ जीवन होता है और उन्हें कई दशकों तक चलने में सक्षम होने के लिए आदर्श तापमान और आर्द्रता की स्थिति में संग्रहीत करने की आवश्यकता होती है और इस प्रकार विशेष रूप से डिज़ाइन किए गए भौतिक भंडारण स्थानों की आवश्यकता होती है। इनमें से लगभग सभी बहुत अधिक बिजली की खपत करते हैं, भारी और अव्यवहारिक हैं और एक साधारण गिरावट में क्षतिग्रस्त हो सकते हैं। उनमें से कुछ बहुत महंगे हैं, अक्सर डेटा त्रुटि से ग्रस्त हैं और इस प्रकार पर्याप्त मजबूत नहीं हैं। एक विकल्प जिसे संगठन द्वारा सार्वभौमिक रूप से स्वीकार किया गया है, उसे क्लाउड कंप्यूटिंग कहा जाता है - एक ऐसी व्यवस्था जिसमें एक कंपनी मूल रूप से अपनी सभी आईटी और डेटा भंडारण आवश्यकताओं को संभालने के लिए एक "बाहरी" सर्वर को काम पर रखती है, जिसे "क्लाउड" कहा जाता है। क्लाउड कंप्यूटिंग के प्राथमिक नुकसानों में से एक सुरक्षा और गोपनीयता के मुद्दे और हैकर्स द्वारा हमला करने की भेद्यता है। अन्य मुद्दे भी हैं जैसे उच्च लागत शामिल, मूल संगठन द्वारा सीमित नियंत्रण और प्लेटफ़ॉर्म निर्भरता। क्लाउड कंप्यूटिंग को अभी भी लंबी अवधि के भंडारण के लिए एक अच्छा विकल्प माना जाता है। हालांकि, ऐसा लगता है कि दुनिया भर में उत्पन्न होने वाली डिजिटल जानकारी निश्चित रूप से इसे स्टोर करने की हमारी क्षमता से आगे निकल रही है और भविष्य में भंडारण की जरूरतों को ध्यान में रखने के लिए स्केलेबिलिटी प्रदान करते हुए इस डेटा जलप्रलय को पूरा करने के लिए और भी मजबूत समाधान की आवश्यकता है।
क्या डीएनए कंप्यूटर स्टोरेज में मदद कर सकता है?
हमारे डीएनए (डीऑक्सीराइबोन्यूक्लिक एसिड) को डिजिटल डेटा भंडारण के लिए एक रोमांचक वैकल्पिक माध्यम माना जा रहा है। डीएनए यह लगभग सभी जीवित जीवों में मौजूद स्व-प्रतिकृति सामग्री है और यही हमारी आनुवंशिक जानकारी का निर्माण करती है। एक कृत्रिम या सिंथेटिक डीएनए एक टिकाऊ सामग्री है जिसे व्यावसायिक रूप से उपलब्ध ऑलिगोन्यूक्लियोटाइड संश्लेषण मशीनों का उपयोग करके बनाया जा सकता है। डीएनए का प्राथमिक लाभ इसकी दीर्घायु है डीएनए सिलिकॉन (सिलिकॉन-चिप - निर्माण के लिए उपयोग की जाने वाली सामग्री) की तुलना में 1000 गुना अधिक समय तक चलता है कंप्यूटर्स) आश्चर्यजनक रूप से, केवल एक घन मिलीमीटर डीएनए एक क्विंटलियन बाइट्स डेटा रख सकता है! डीएनए यह एक अल्ट्राकॉम्पैक्ट सामग्री भी है जो कभी ख़राब नहीं होती है और इसे सैकड़ों शताब्दियों तक ठंडी, सूखी जगह पर संग्रहीत किया जा सकता है। भंडारण के लिए डीएनए का उपयोग करने का विचार बहुत पहले से ही 1994 से चला आ रहा है। मुख्य कारण यह है कि कंप्यूटर और हमारे कंप्यूटर में जानकारी किस प्रकार संग्रहीत की जाती है। डीएनए - चूँकि दोनों ही सूचना के ब्लूप्रिंट संग्रहीत करते हैं। एक कंप्यूटर सभी डेटा को 0s और 1s के रूप में संग्रहीत करता है और डीएनए चार आधारों - थाइमिन (टी), गुआनिन (जी), एडेनिन (ए) और साइटोसिन (सी) का उपयोग करके एक जीवित जीव के सभी डेटा को संग्रहीत करता है। इसलिए, डीएनए को एक कंप्यूटर की तरह एक मानक भंडारण उपकरण कहा जा सकता है, यदि इन आधारों को 0s (आधार A और C) और 1s (आधार T और G) के रूप में दर्शाया जा सकता है। डीएनए मजबूत और लंबे समय तक चलने वाला होता है, सबसे सरल प्रतिबिंब यह है कि हमारा आनुवंशिक कोड - डीएनए में संग्रहीत हमारी सभी जानकारी का खाका - एक पीढ़ी से दूसरी पीढ़ी तक बार-बार कुशलतापूर्वक प्रसारित होता है। सभी सॉफ्टवेयर और हार्डवेयर दिग्गज डेटा के दीर्घकालिक संग्रह को हल करने के अपने लक्ष्य को प्राप्त करने के लिए बड़ी मात्रा में भंडारण के लिए सिंथेटिक डीएनए का उपयोग करने के इच्छुक हैं। विचार यह है कि पहले कंप्यूटर कोड 0s और 1s को डीएनए कोड (ए, सी, टी, जी) में परिवर्तित किया जाए, परिवर्तित डीएनए कोड का उपयोग डीएनए के सिंथेटिक स्ट्रैंड का उत्पादन करने के लिए किया जाता है जिसे बाद में कोल्ड स्टोरेज में रखा जा सकता है। जब भी आवश्यकता होती है, डीएनए स्ट्रैंड्स को कोल्ड स्टोरेज से हटाया जा सकता है और डीएनए अनुक्रमण मशीन का उपयोग करके उनकी जानकारी को डिकोड किया जा सकता है और डीएनए अनुक्रम को अंततः कंप्यूटर पर पढ़ने के लिए 1s और 0s के बाइनरी कंप्यूटर प्रारूप में वापस अनुवादित किया जाता है।
यह दिखाया गया है1 कि केवल कुछ ग्राम डीएनए क्विंटिलियन बाइट डेटा संग्रहीत कर सकता है और इसे 2000 वर्षों तक बरकरार रख सकता है। हालाँकि, इस सरल समझ को कुछ चुनौतियों का सामना करना पड़ा है। सबसे पहले, डीएनए पर डेटा लिखना काफी महंगा है और बेहद धीमा भी है यानी 0s और 1s का डीएनए बेस (ए, टी, सी, जी) में वास्तविक रूपांतरण। दूसरे, एक बार जब डेटा डीएनए पर "लिखा" जाता है, तो फ़ाइलों को ढूंढना और पुनः प्राप्त करना चुनौतीपूर्ण होता है और इसके लिए एक तकनीक की आवश्यकता होती है डीएनए अनुक्रमण - एक के भीतर आधारों के सटीक क्रम को निर्धारित करने की प्रक्रिया डीएनए अणु - जिसके बाद डेटा को 0s और 1s पर वापस डिकोड किया जाता है।
हाल का अध्ययन2 माइक्रोसॉफ्ट रिसर्च और वाशिंगटन विश्वविद्यालय के वैज्ञानिकों ने डीएनए भंडारण पर "यादृच्छिक पहुंच" हासिल की है। "रैंडम एक्सेस" पहलू बहुत महत्वपूर्ण है क्योंकि इसका मतलब है कि जानकारी को स्थान से या (आमतौर पर एक मेमोरी) से स्थानांतरित किया जा सकता है जिसमें हर स्थान, चाहे वह क्रम में कहीं भी हो और सीधे पहुँचा जा सकता है। रैंडम एक्सेस की इस तकनीक का उपयोग करते हुए, फाइलों को पहले की तुलना में चुनिंदा तरीके से डीएनए स्टोरेज से पुनर्प्राप्त किया जा सकता है, जब इस तरह की पुनर्प्राप्ति के लिए एक संपूर्ण डीएनए डेटासेट को अनुक्रमित करने और कुछ फाइलों को निकालने और निकालने की आवश्यकता होती है। "रैंडम एक्सेस" का महत्व तब और बढ़ जाता है जब डेटा की मात्रा बढ़ जाती है और बड़ी हो जाती है क्योंकि यह अनुक्रमण की मात्रा को कम कर देता है जिसे करने की आवश्यकता होती है। यह पहली बार है जब इतने बड़े पैमाने पर रैंडम एक्सेस दिखाया गया है। शोधकर्ताओं ने डेटा त्रुटियों के प्रति अधिक सहनशीलता के साथ डेटा को अधिक कुशलता से डिकोड करने और पुनर्स्थापित करने के लिए एक एल्गोरिदम भी विकसित किया है जिससे अनुक्रमण प्रक्रिया भी तेज हो गई है। इस अध्ययन में 13 मिलियन से अधिक सिंथेटिक डीएनए ऑलिगोन्यूक्लियोटाइड्स को एन्कोड किया गया था जो कि 200MB आकार का डेटा था जिसमें 35 फाइलें (वीडियो, ऑडियो, चित्र और टेक्स्ट युक्त) थीं, जिनका आकार 29KB से 44MB तक था। इन फ़ाइलों को बिना किसी त्रुटि के व्यक्तिगत रूप से पुनर्प्राप्त किया गया था। इसके अलावा, लेखकों ने नए एल्गोरिदम तैयार किए हैं जो डीएनए अनुक्रमों को लिखने और पढ़ने में अधिक मजबूत और त्रुटि सहिष्णु हैं। में प्रकाशित यह अध्ययन प्रकृति जैव प्रौद्योगिकी एक प्रमुख प्रगति में डीएनए भंडारण और पुनर्प्राप्ति के लिए एक व्यवहार्य, बड़े पैमाने पर प्रणाली दिखा रहा है।
डीएनए भंडारण प्रणाली बहुत आकर्षक लगती है क्योंकि इसमें उच्च डेटा घनत्व, उच्च स्थिरता है और इसे संग्रहीत करना आसान है लेकिन इसे सार्वभौमिक रूप से अपनाए जाने से पहले स्पष्ट रूप से कई चुनौतियां हैं। कुछ कारक डीएनए का समय और श्रम-गहन डिकोडिंग (अनुक्रमण) और संश्लेषण भी हैं डीएनए. तकनीक के लिए अधिक सटीकता और व्यापक कवरेज की आवश्यकता होती है। हालाँकि इस क्षेत्र में प्रगति हुई है, फिर भी सटीक प्रारूप जिसमें डेटा को दीर्घकालिक रूप में संग्रहीत किया जाएगा डीएनए अभी भी विकसित हो रहा है. माइक्रोसॉफ्ट ने सिंथेटिक डीएनए के उत्पादन में सुधार करने और पूरी तरह से परिचालनात्मक डिजाइन तैयार करने की चुनौतियों का समाधान करने की कसम खाई है डीएनए 2020 तक स्टोरेज सिस्टम
***
{आप उद्धृत स्रोतों की सूची में नीचे दिए गए डीओआई लिंक पर क्लिक करके मूल शोध पत्र पढ़ सकते हैं}
स्रोत (रों)
1. एर्लिच वाई और ज़िलिंस्की डी 2017. डीएनए फाउंटेन एक मजबूत और कुशल भंडारण वास्तुकला को सक्षम बनाता है। विज्ञान। 355(6328)। https://doi.org/10.1126/science.aaj2038
2. ऑर्गेनिक एल एट अल। 2018 बड़े पैमाने पर डीएनए डेटा स्टोरेज में रैंडम एक्सेस। प्रकृति जैव प्रौद्योगिकी। 36. https://doi.org/10.1038/nbt.4079