Ученые в 3200 раз повысили скорость чтения данных, сохраненных на ДНК — 10 минут вместо нескольких дней

25 марта, 08:28, 2025

Исследователи Израильского технологического института (Technion) разработали метод на основе ИИ, который ускоряет поиск данных, сохраненных в ДНК, на три порядка и одновременно улучшает точность.

Молекула ДНК отвечает за сохранение генетического кода живых организмов и состоит из последовательности особых органических соединений — нуклеотидов. Они классифицируются по четырем типам, обозначенным буквами A, C, G и T. В отличие от традиционных вычислений, где данные кодируются только двумя цифрами (0 и 1), хранение в ДНК базируется на последовательностях из четырех букв, что значительно увеличивает количество возможных комбинаций.

Размещение данных в ДНК может дать действительно длительное хранение информации (сотни тысяч лет) и плотность данных в 100 млн раз большую, чем имеющееся цифровое хранение. Для хранения данных по этой технологии нужен синтез ДНК — создание молекул ДНК на основе последовательностей, кодирующих информацию. Чтобы прочитать сохраненные данные, требуется секвенирование ДНК

Ученые в 3200 раз повысили скорость чтения данных, сохраненных на ДНК — 10 минут вместо нескольких дней - Фото 2

Метод определения первичной структуры неразветвленных биополимеров, как ДНК. Также этим термином называют определение первичной структуры других типов данных..

Хранение информации на ДНК связано с несколькими технологическими проблемами. Синтез и секвенирование являются длительными процессами, подверженными ошибкам удаления, вставки и замены. Из-за ограничений процесса синтеза создается несколько копий каждой молекулы ДНК, кодирующей данные. Эти копии хранятся вместе, без какого-либо порядка. Во время секвенирования возникает много ошибочных копий этих молекул — большинство из них содержат ошибки, а некоторые полностью исчезают.

Оригинальная иллюстрация исследования / Technion

Новое исследование, опубликованный в журнале Nature Machine Intelligence, представляет комплексное вычислительное решение для поиска и исправления ошибок в сложных системах хранения на основе ДНК. Используя усовершенствованные алгоритмы и методы кодирования, исследователи продемонстрировали, что их решение сокращает время поиска и чтения данных с нескольких дней до 10 минут.

Разработанный в Technion метод DNAformer базируется на модели трансформера, обученной на смоделированных данных, генерируемых с помощью симулятора, который также был разработан в Technion. Метод реконструирует точные последовательности ДНК из ошибочных копий. Он включает специальный код исправления ошибок, адаптированный для ДНК.

Спецпроекты

Механизм дополнительного запаса безопасности обнаруживает наиболее шумные последовательности ДНК (нежелательные сигналы или ошибки, возникающие во время процесса секвенирования, которые могут мешать точной интерпретации данных) и применяет алгоритмические инструменты для более эффективной обработки. В конце процесса данные переводятся в цифровую информацию.

Новый метод позволяет считывать 100 МБ данных со скоростью, которая в 3200 раз превышает самый точный существующий метод, без потери точности. По сравнению с ранее известными быстрыми методами, DNAformer также улучшает точность до 40%. Это было продемонстрировано на наборе данных размером 3,1 МБ, который включал 24-секундную аудиозапись слов астронавта Нила Армстронга на Луне, письменный текст обсуждения преимущества ДНК как перспективного метода хранения данных, случайные данные.

Исследователи планируют разработать индивидуальные версии DNAformer, адаптированные к различным потребностям. Они подчеркивают, что их технология является масштабируемой и адаптируемой, то есть ее можно оптимизировать для крупномасштабных программ хранения данных, в ответ на требования рынка.

Источник: TechXplore

Ученые в 3200 раз повысили скорость чтения данных, сохраненных на ДНК — 10 минут вместо нескольких дней - Фото 3

Теги по теме

Технологии

Источник материала

ITC

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

Инопланетные цивилизации могут общаться как светлячки у всех на виду, считают ученые

Фокус

7 января 2026

У "Резерв+" появились уведомления о бумажных повестках: считается ли это официальным вручением

UAToday

7 января 2026

Мы излучаем свет, пока живы: ученые сделали шокирующее открытие

TSN

7 января 2026

Новый портативный король? PlayStation 6 Portable будет вдвое энергоэффективнее устройств на базе Intel Panther Lake — инсайдер

GameMag

5 минут назад

В Австралии заблокировали 550 тысяч детских аккаунтов после запрета соцсетей

Комсомольская правда

14 минут назад

Создатель Yakuza Тосихиро Нагоси поблагодарил игроков за тёплые отзывы после анонса Gang of Dragon — проект не разочарует

GameMag

17 минут назад

В сети появились видео со смартфоном, который Xiaomi не выпустит

Лига

26 минут назад

Масса в 1 млн Солнц и черная дыра в качестве "сердца": астрономов озадачил темный объект

Фокус

53 минуты назад

Для бизнеса, продуктивности и игр: MSI представила новые ноутбуки серии Prestige, Raider, Stealth и Crosshair

GameMag

59 минут назад