L'ADN stocke des informations dans une séquence d'adénine, de cytosine, de guanine et de thymine sur un squelette de deux molécules de désoxyribose, qui s'entrelacent en une double hélice. Dans la nature, ces informations sont lues par les molécules d'ARN et transformées en protéines.
Il est possible d'encoder des données numériques utilisées par les humains en ADN synthétique et de les relire. Étant donné que les quatre bases de cet ADN synthétique sont directement mappées sur des séquences de bits utilisées par les humains, il s'agit d'un processus relativement simple.
Cependant, dans un organisme vivant complexe, la lecture des informations contenues dans l'ADN est beaucoup plus compliquée. L'ADN est lu par l'ARN messager, ou ARNm, qui est utilisé par l'ARN de traduction, ou ARNt, pour créer les acides aminés et les protéines dont dépend la vie. Ce processus est largement compris, et les séquences d'ADN qui sont responsables de quels acides aminés sont également connues. Cependant, la partie de l'ADN qui est utilisée pour créer l'ARN et finalement les protéines dépend de ce qu'est la cellule et de ses conditions environnementales immédiates. Déterminer le résultat physique de ces protéines, comme la création et le développement d'organes, nécessite une analyse et une observation complexes. Par conséquent, traduire le code génétique brut en la forme physique et les attributs d'un organisme sans créer réellement l'organisme en question est extrêmement difficile.