Цифровая эпоха привела к взрывному росту данных всех видов. Традиционные методы хранения данных, такие как жесткие диски, начинают сталкиваться с проблемами из-за ограниченной емкости хранилища. С ростом спроса на хранение данных альтернативные носители хранения данных становятся все более популярными и необходимыми.
ДНК является одним из новых решений для хранения данных благодаря своей физической плотности, долговечности данных и способности шифрования данных. Любая информация, которая может храниться на жестком диске, например тексты, изображения, звуки и фильмы, также может быть преобразована в последовательности ДНК.
Но хотя ДНК является многообещающим решением, помогающим удовлетворить потребности в хранении данных , выполнение поиска внутри цепи ДНК может быть обременительным и трудным.
«Архивирование информации в синтетической ДНК стало привлекательным решением для борьбы с бурным ростом данных в современном мире. Однако количественный запрос данных, хранящихся в ДНК, по-прежнему остается сложной задачей», — говорит Чанчунь Лю, профессор кафедры биомедицины. Инженерное дело в UConn Health.
В Nature Communications Лю и группа исследователей открыли способ простого и эффективного поиска данных, хранящихся в ДНК, с помощью количественной поисковой системы с кластерными, регулярно расположенными короткими палиндромными повторами (CRISPR).
В статье Лю представляет функцию поиска, обеспечиваемую ферментативным распознаванием ключевых слов (SEEKER), которая использует CRISPR-Cas12a для количественной идентификации ключевого слова в файлах, хранящихся в ДНК.
«ДНК является многообещающей средой для хранения данных из-за ее стабильности и высокой плотности информации. Теоретически один грамм ДНК может хранить 215 петабайт данных, размер данных примерно 100 миллионов фильмов. Подобно жесткому диску, который хранит информацию в двоичных данных. ДНК хранит информацию в последовательностях четырех нуклеиновых оснований — аденина (А), тимина (Т), цитозина (С) и гуанина (G).
«Развитие технологий синтеза ДНК и секвенирования нового поколения превращают хранение данных ДНК в реальность», — объясняет Цзюнъюй Чжан, аспирант лаборатории Лю и первый автор статьи.
Лю использовал свой опыт в технологии CRISPR, чтобы найти лучшее решение для поиска в цепи ДНК.
CRISPR — это приобретенный иммунный механизм, который может идентифицировать конкретную инфекционную последовательность ДНК в клетке, перегруженной мешающими генами, аналогично поиску по ключевым словам в базе данных.
SEEKER, использующий CRISPR, быстро генерирует видимую флуоресценцию или свет, когда присутствует ДНК-мишень, соответствующая интересующему ключевому слову. SEEKER способен успешно выполнять количественный поиск текста, поскольку скорость роста интенсивности флуоресценции пропорциональна частоте ключевых слов.
В статье исследователи успешно идентифицировали ключевые слова в 40 файлах на фоне около 8000 нерелевантных терминов.
«В целом, SEEKER обеспечивает количественный подход к проведению параллельного поиска, включая поиск метаданных, по всему контенту, хранящемуся в ДНК, с простой реализацией и быстрой генерацией результатов», — объясняет Лю.







