Chaque cellule d'un organisme vivant contient un ensemble d'instructions qui explique comment construire les différents composants de la plante, de l'animal, du champignon ou de la bactérie. L'ADN est la substance que les êtres vivants utilisent pour transmettre ces instructions. L'ADN se regroupe en grappes discrètes qui fournissent le code d'un trait donné. Les scientifiques appellent chacun de ces groupes des gènes.
L'ADN est une longue molécule qui, dans tous les organismes à l'exception des virus et de certaines bactéries, prend la forme d'une double hélice. Cette structure ressemble à une échelle torsadée qui a de nombreux barreaux. L'un des quatre produits chimiques, à savoir l'adénine, la thymine, la guanine et la cytosine, forme chaque côté de chaque barreau individuel. L'ordre de ces quatre produits chimiques fonctionne comme un alphabet, permettant aux organismes de créer des codes très longs et compliqués. Le brin d'ADN entier est long de milliards de paires de bases, ou barreaux. Heureusement, les organismes n'ont pas besoin de lire et d'interpréter l'intégralité du brin d'ADN chaque fois qu'ils ont besoin de construire des protéines supplémentaires. Au lieu de cela, l'organisme n'a besoin d'accéder qu'à une petite partie de l'ADN, un gène, pour construire la protéine dont il porte le code. Certains gènes ne comptent que quelques centaines de paires de bases, tandis que d'autres peuvent avoir plusieurs millions de paires de bases.