Столкнувшись с экспоненциальным ростом объема данных, традиционные технологии хранения данных сталкиваются с узкими местами с точки зрения емкости и срока службы. Хранение ДНК, в котором в качестве носителя информации используется синтетическая дезоксирибонуклеиновая кислота, считается многообещающим решением для хранения информации следующего поколения. Он основан на теоретически чрезвычайно высокой плотности хранения, сроке хранения в сотни тысяч лет и чрезвычайно низком энергопотреблении при обслуживании, что дает новую идею для решения глобального кризиса хранения данных.

Каковы основные преимущества технологии хранения ДНК?

Основное преимущество хранилища ДНК заключается в том, что оно имеет более высокую плотность хранения, чем любое другое. Теоретически один грамм ДНК может хранить примерно 455 эксабайт (ЭБ) данных. Этот объем данных эквивалентен хранению десятков миллионов часов видео высокой четкости. Графически говоря, всего один килограмм ДНК может хранить все текущие данные в мире. Эта сверхвысокая плотность обусловлена ​​двойной спиральной структурой самой молекулы ДНК и плотным расположением оснований.

ДНК обладает удивительной химической стабильностью и чрезвычайно длительным сроком хранения. В идеальных условиях, позволяющих избежать воздействия влаги и ультрафиолетовых лучей, ДНК может стабильно сохраняться в течение сотен тысяч лет. Некоторым ученым даже удалось извлечь и интерпретировать древние последовательности ДНК, которые сохранялись в течение 2 миллионов лет в мерзлой почве Гренландии. Кроме того, хранилище ДНК практически не требует энергии для хранения данных. Это резко контрастирует с традиционными центрами обработки данных, которые требуют непрерывного электропитания и регулярной миграции данных, и в большей степени соответствует требованиям устойчивого развития.

Почему современному обществу отчаянно необходимо хранилище ДНК

Глобальные данные растут с беспрецедентной скоростью. Согласно отчету Национального бюро данных, только в 2024 году общий объем производства данных в Китае достиг 410,06 зеттабайт (единица ZB) и увеличился на 25% в годовом исчислении по сравнению с предыдущим годом. Даже Международная корпорация данных, также известная как IDC, предсказала, что к 2025 году глобальный объем данных достигнет 175 ЗБ. Темпы роста емкости существующих сегодня носителей информации, таких как ленты и жесткие диски, трудно сравнить с чрезвычайно высокой скоростью, с которой генерируются данные.

В то же время срок службы традиционных носителей информации ограничен, обычно он составляет от нескольких лет до десятилетий, а аппаратное и программное обеспечение быстро устаревает, в результате чего долговременные архивированные данные рискуют оказаться недоступными для чтения. Потребление энергии в центрах обработки данных составляет более 1% от общего потребления энергии в мире. Поэтому поиск решения для хранения архивов со сверхвысокой плотностью, сверхдолгим сроком службы и низким энергопотреблением стал актуальной глобальной задачей. Это также основная причина, почему технология хранения ДНК высоко ценится в разных странах.

Как данные записываются и читаются из ДНК

Основной процесс помещения данных в ДНК можно разделить на несколько этапов: кодирование, синтез (запись), хранение, секвенирование (чтение) и декодирование. Во-первых, двоичный цифровой файл (состоящий из 0 и 1) должен быть скомпилирован в последовательность ДНК на основе четырех оснований A (аденин), T (тимин), C (цитозин) и G (гуанин) на основе определенного алгоритма. Этот шаг должен быть тщательно продуман, чтобы предотвратить ошибочные комбинации баз.

Химические методы используются для искусственного синтеза молекул ДНК на основе закодированной последовательности для записи информации. Синтезированные фрагменты ДНК, известные как олигонуклеотиды, хранятся должным образом. Когда возникнет необходимость прочитать данные, технология секвенирования следующего поколения будет использоваться для секвенирования ДНК для получения базовой последовательности, а затем с использованием алгоритма декодирования для восстановления последовательности до исходных двоичных данных, а затем восстановления файла. Коды, исправляющие ошибки, должны вводиться на каждом этапе всего процесса для устранения ошибок, которые могут возникнуть во время синтеза, хранения и секвенирования.

Каковы основные проблемы, с которыми в настоящее время сталкивается хранение ДНК?

Хотя перспективы чрезвычайно широки, хранение ДНК по-прежнему сталкивается со многими препятствиями на пути к крупномасштабному коммерческому использованию. Первое, с чем придется столкнуться – это высокая стоимость. В настоящее время синтез всего 2 мегабайт (МБ) данных ДНК стоит около 7000 долларов США и еще 2000 долларов США — для чтения данных. Хранение фильма размером 1 ГБ может стоить миллионы долларов.

Прогресс в письме и скорочтении был необычайно медленным. Современная технология синтеза ДНК заключается в последовательном добавлении оснований одно за другим. Эта ситуация не позволяет удовлетворить потребности в хранении данных в реальном времени. Кроме того, точность считывания данных также нуждается в дальнейшем повышении. Ошибки в процессе синтеза и ошибки в процессе секвенирования повлияют на точность восстановления данных. В конечном счете, как быстро и точно получить произвольный доступ к определенным блокам данных из чрезвычайно большого пула молекул ДНК без секвенирования каждый раз всей библиотеки — это тоже техническая проблема, которую необходимо решить.

Каковы последние технологические прорывы в области хранения ДНК?

Чтобы преодолеть упомянутые выше трудности, исследователи, занимающиеся научными исследованиями по всему миру, активно изучают новые технологические подходы. Команда китайских учёных добилась значительного прогресса. Например, система HELIX, разработанная командой Тяньцзиньского университета, успешно сохранила и восстановила 60 МБ данных медицинских изображений. Команда Пекинского университета предложила инновационную стратегию хранения «кажущихся битов».

Существует революционная технология, которая больше не полагается на дорогостоящий и медленный «синтез de novo» нитей ДНК. Вместо этого, подобно «молекулярной печати подвижным шрифтом», она выбирает существующие цепи ДНК в качестве носителей и параллельно кодирует информацию, осуществляя модификации метилирования на определенных основаниях. Эти методы значительно повысили эффективность записи и снизили затраты, открыв новый путь для быстрого и недорогого крупномасштабного хранения молекулярных данных.

Каковы будущие перспективы применения хранения ДНК?

Он заключается в долгосрочном и безопасном архивировании больших объемов данных, что является наиболее очевидной перспективой применения хранения ДНК. Например, документы и архивы внутри стран и учреждений, необработанные данные, полученные в результате научных экспериментов, а также цифровые резервные копии культурного наследия и т. д. — это «холодные данные», которые необходимо хранить в течение сотен лет или даже дольше, и к которым не часто осуществляется доступ. Они являются идеальными мишенями для хранения ДНК. В стране и за рубежом были созданы некоторые базы данных биологических последовательностей, и их стратегии долгосрочного сохранения предоставляют образцовые чертежи и знаки препинания для архивирования данных ДНК.

С точки зрения промышленного развития хранение ДНК было включено в список передовых технологий в «14-м пятилетнем плане» Китая, а тенденция развития сотрудничества между промышленностью, университетами и исследованиями сформировалась в Пекине, Шанхае, Тяньцзине и других местах. Для достижения конечной цели коммерциализации все еще необходимо снизить затраты, увеличить скорость работы, повысить точность, а также реализовать эффективный произвольный доступ и другие базовые технологии. Благодаря постоянному развитию синтетической биологии, микрофлюидики и других технологий в будущем могут появиться устройства хранения ДНК с высокоавтоматизированными характеристиками, что приведет к постепенному переходу этой технологии из лаборатории в конкретные сценарии применения.

Для новых потребностей в хранении данных, которые могут возникнуть в будущем, таких как приложения в конкретных биомедицинских сценариях или миниатюризации, профессиональная и надежная техническая поддержка и каналы закупок продукции станут чрезвычайно важными. Изучая передовые технологические решения,. Предоставляйте глобальные услуги по закупкам слабых текущих интеллектуальных продуктов! , чтобы обеспечить поддержку для создания информационной инфраструктуры следующего поколения.

Итак, по вашему мнению, какая конкретная отрасль или сценарий станет первой возможностью широкомасштабного применения технологии хранения ДНК в будущем? Это национальный цифровой архив или резервное копирование данных астрономических наблюдений, которым занимаются научно-исследовательские учреждения? Поторопитесь и поделитесь своими мыслями в области комментариев.

Posted in

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *