Les empreintes ADN fournissent des informations qui peuvent déterminer le moment où un organisme s'est séparé de son espèce ancestrale, permettant sa classification par cladistique. La différence quantifiable d'ADN entre deux espèces identifie leur distance évolutive.
La cladistique place les organismes dans des clades - des arbres généalogiques composés de l'espèce en fonction de ses ancêtres et descendants. Les branches de la ligne directe deviennent de nouveaux clades. Un cladogramme capture ces informations dans une représentation graphique des lignées et des ramifications.
La vitesse à laquelle le séquençage de l'ADN identifie les organismes dépasse les approches traditionnelles de taxonomie basées sur les espèces. La cladistique positionne les organismes sur une carte génomique mais ne tient pas compte de la présence d'espèces de nouveaux organismes ni de l'enregistrement de leur profil génomique. Le codage génétique fournit une méthode pour capturer l'information génétique avant que la preuve de l'identification de l'espèce ne soit disponible. Ces données agissent comme un code à barres biologique, identifiant l'organisme génétiquement indépendamment des modifications apportées aux systèmes de taxonomie.
Les sources multiples d'informations existantes et la probabilité de nouveaux types d'informations à l'avenir nécessitent un système capable de s'adapter aux conditions changeantes. Les nouveaux domaines de la cybertaxonomie et de l'informatique de la biodiversité répondent à ces préoccupations en construisant un schéma de taxonomie et d'autres ressources pour les définitions d'espèces en ligne. Maintenir l'accès aux ressources en ligne au fil du temps est un problème critique.