Ciencia en tus manos

Primeros documentos codificados en ADN en los Archivos Nacionales

No hay comentarios Share:

A partir de la observación de que las tecnologías de almacenamiento digital tienen ciertos límites, los investigadores de la Universidad de la Sorbona y el CNRS se han embarcado en un proyecto para almacenar información digital en el ADN. Basado en la tecnología DNA Drive desarrollada por el equipo, este medio de retención de datos podría ser la respuesta a la cantidad exponencial de datos producidos en el mundo.

Los Archivos Nacionales albergaron el 23 de noviembre los primeros archivos digitales codificados en ADN. “El corazón de nuestra misión es asegurar la transmisión de estos documentos, mantenerlos para su posterior consulta”, anunció Bruno Ricard, Director del Archivo Nacional desde el 1 de septiembre de 2019. “Es un verdadero desafío para el papiro., Pergamino, papel, pero también digital ”. Hoy en día, ya se conservan más de 70 TB de archivos digitales, ya sean de audio o video, y se espera que el crecimiento de estos datos sea exponencial.“ Pronto nos acercaremos a los 200 TB de datos. «Para ello, los investigadores de la Universidad de la Sorbona y el CNRS, Stéphane Lemaire y Pierre Crozet, están trabajando en un proyecto patentado para el almacenamiento de información digital en ADN. Con el objetivo de dar respuesta a un problema claro: el de lo estable, sostenible y conservación ecológica de datos. Prueba del concepto de su tecnología: la codificación de dos textos de la historia de Francia, la Declaración de los Derechos del Hombre y del Ciudadano (1789) y la Declaración de los Derechos de la Mujer y del Ciudadano ( 1791).

Estas cápsulas de aluminio contienen la Declaración de los Derechos del Hombre y del Ciudadano (1789) y la Declaración de los Derechos de la Mujer y del Ciudadano (1791) codificadas en ADN. (Crédito: Stéphane Lemaire / CNRS – Universidad de la Sorbona)

“Los datos son el combustible de la inteligencia artificial. La esfera de datos está creciendo exponencialmente y debería llegar a 175 Zo en 2025 ”, explica Stéphane Lemaire, director de investigación del CNRS en el Laboratorio de Biología Computacional y Cuantitativa. En 2020, esto representó 45 Zo. Los medios de almacenamiento actuales tienen varios inconvenientes importantes: son frágiles, voluminosos y consumen mucha energía. Su impacto, proporcional a la cantidad de datos, tiende a aumentar. Si bien el 70% de los datos globales son archivos, observamos que desde 2010 la demanda ha superado la oferta, lo que ha llevado a un replanteamiento completo del almacenamiento de datos. Para desarrollar este proyecto, el equipo de investigadores fundó una start-up, Biomemory, que tiene como objetivo desarrollar y comercializar la tecnología DNA Drive. Esto proporcionaría una capacidad de almacenamiento ilimitada, con nuevos enfoques biológicos como la copia o la edición, y se puede almacenar en cápsulas metálicas en miniatura.

Proyectos concretos ya existentes

Utilizando la biología, el equipo de investigadores explotó el ADN, conocido por su estabilidad durante decenas de miles de años, como medio para almacenar datos. Denominada DNA Drive, esta tecnología de almacenamiento tiene serias ventajas sobre la cinta y el disco óptico: duradera, también energéticamente eficiente, extremadamente compacta, también es compatible con todo tipo de información digital y puede codificar todos los sistemas. archivos. Concretamente, los investigadores transformaron el 0 y el 1 en una serie de letras que constituyen la base molecular de nuestro ADN: adenina (A), timina (T), guanina (G) y citosina (C). La síntesis química de la secuencia de ADN se genera luego en fragmentos de ADN llamados oligonucleótidos. Durante la formación de una molécula, estas letras en secuencia crean un código que le dice al organismo cómo formarse. Todas las moléculas de ADN forman el genoma y, por lo tanto, el cuerpo humano. «45 Zo pueden caber en 100 g de ADN», especifica Stéphane Lemaire, y agrega que el ADN encapsulado y liofilizado está protegido del agua, la luz y el aire. Para la decodificación de las secuencias de ADN, es necesario abrir la cápsula, agregar una gota de agua para rehidratarla. Para releer la información codificada, parte del ADN se deposita en un secuenciador. La tecnología DNA Drive, y más precisamente su algoritmo, se utiliza para convertir la secuencia obtenida en información binaria, es decir, el mismo sistema de codificación pero invertido.

Cada cápsula puede contener una cantidad de ADN liofilizado correspondiente a 5.000 TB de datos digitales. (Crédito: Philippe Tran)

La idea fue mencionada por primera vez en 1959 por el físico Richard Feynman, luego en 2016 por George Church, químico, genetista e ingeniero en biología molecular. Esto demuestra de manera significativa, por primera vez, que es posible utilizar la síntesis química para codificar información digital sobre el ADN. Al otro lado del Atlántico, otros investigadores ya están trabajando en este tema: este es el Laboratorio Nacional de Los Alamos. Los investigadores de este laboratorio han desarrollado un software de traducción, ADS Codex (Adaptive DNA Storage Codec). Entonces es posible decodificar bits digitales en nucleótidos y luego viceversa si es necesario. El sistema de transformación es el mismo que se utilizó para el proyecto DNA Drive. Otros gigantes ya están trabajando en esta traducción de datos, como Microsoft, que ya estaba demostrando en 2019 su avance en un sistema similar totalmente automatizado.

Una tecnología que tiene sus límites

El trabajo de investigación sobre ADS Codex permitiría a corto plazo escribir 1 TB y leer 10 TB en 24 horas por la suma de 1000 dólares. El de DNA Drive, actualmente tarda varios días en codificarse y aproximadamente 1 hora en leerse; la parte de lectura ya no se puede utilizar después. También tiene un coste muy elevado, 1.000 dólares por 1 MB. El proyecto, que ha contado con financiación de la Sorbonne University, CNRS y SATT Lutech (la Sorbonne Alliance University), generó unos costes estimados en 600.000 euros.

Los dos textos históricos almacenados en ADN y encapsulados son una novedad para una institución pública. “Cada cápsula contiene más de 100 mil millones de copias del archivo en forma de ADN”, explica Stéphane Lemaire. El equipo abrió cápsulas varias veces, secuenció el ADN contenido y verificó que el archivo pudiera recuperarse con un 100% de fidelidad. Cabe señalar que el proyecto también se benefició de la asociación con Twist Bioscience, una empresa estadounidense especializada en síntesis de ADN, y con Imagene, una empresa francesa especializada en la conservación (encapsulación) de ADN a largo plazo.

También te puede gustar