L'ère du stockage de données numériques dans des brins d'ADN est peut être (enfin) pour bientôt. Alors que cela fait plusieurs années que des recherches dans ce domaine sont menées, des chercheurs se sont dits impressionnés par la quantité de données qu'ils ont pu coder et décoder sur l'ADN synthétique. Les travaux menés par des chercheurs de Microsoft et de l'Université de Washington ont également étonné par l'espace occupée par le brin d’ADN contenant les données. Une fois codée, la place utilisée par les données dans le tube à essai est inférieure « à la pointe d'un crayon », a déclaré Douglas Carmean, l’architecte associé de Microsoft qui a supervisé le projet. Même dans des conditions difficiles, le stockage ADN a une demi-vie de 500 ans. Comme pour les matières radioactives, la demi-vie de l'ADN détermine le temps qu’il met à se dégrader ou le temps qu'il faut avant que la moitié de ses fils commencent à se casser.
Globalement, c’est un grand pas en avant. « Imaginez toutes les données d’un datacenter stockées dans quelques cubes de la taille d’un morceau de sucre ou toutes les données de l’Internet publique dans une boîte à chaussures ! C’est ce que permettrait l’usage de l'ADN quand les scientifiques pourront adapter la technologie et surmonter une série d'obstacles techniques », a déclaré Microsoft dans un blog. Sur l'ADN moléculaire, les chercheurs ont notamment stocké des images numériques de plusieurs œuvres d'art, un clip vidéo en HD du groupe OK Go !, la Déclaration universelle des droits de l'homme dans plus de 100 langues, les 100 meilleurs livres du Projet Guttenberg et la base de données sur les semences mise à jour par l’ONG Crop Trust.
Une réponse à la prolifération du volume de données
L’ADN est bon support de stockage et pourrait permettre de résoudre la question du stockage des données dont le volume croit de façon exponentielle. Le stockage au niveau moléculaire est beaucoup plus dense que les disques durs, les disques SSD (SSD) ou que des technologies comme la mémoire à changement de phase. « Par ailleurs, ces systèmes se dégradent après quelques années ou quelques décennies, alors que l'ADN peut conserver les informations de manière fiable pendant plusieurs siècles », ont déclaré les chercheurs de l'Université de Washington (UW) dans un communiqué. « L'ADN est bien adapté aux applications d'archivage, mais convient moins pour l’accès immédiat aux fichiers ».
L’équipe de chercheurs de l'UW et de Microsoft est la deuxième à démontrer la capacité à accéder de manière aléatoire aux données à partir d'un pool de molécules. Selon leur description, le processus équivaut à reconstruire le chapitre d'une histoire à partir d'une bibliothèque de livres déchirés. Les chercheurs affirment que leur approche pour convertir les longues chaînes de 1 et de 0 en données numériques dans les quatre blocs de base des séquences d'ADN – adénine (As), guanine (Gs), cytosine (Cs) et thymine (Ts) – est « tout à fait nouvelle ». Pour accéder aux données stockées, les chercheurs codent des séries de chiffres qui ressemblent à des codes postaux et l’équivalent d’adresses de rue dans les séquences d'ADN. Des techniques de réaction en chaîne par polymérisation (PCR) - utilisées couramment en biologie moléculaire – leur permettent d’identifier plus facilement les « codes postaux » qu'ils recherchent.
Le stockage ADN quasi indestructible
L’ADN a une limite théorique d'un exabyte par millimètre, soit huit fois plus dense qu’une bande magnétique. Le stockage ADN a également l'avantage d’être quasi indestructible: « Tant qu'il y a de la vie basée sur l'ADN, il y a de bonnes raisons de décoder et de manipuler l'ADN », ont déclaré les chercheurs dans un document de recherche publié er avril. Selon l’enquête « Digital Universe » réalisée actuellement par IDC et EMC, la quantité de données devrait dépasser les 16 zettabytes (ZB) en 2017. Selon l’enquête, l'Internet des objets devrait doubler la quantité de données numériques tous les deux ans. C’est à dire que d’ici 2020, la quantité de données atteindra 44 milliards de gigaoctets (44ZB).