On estime que le corps humain peut contenir plus de deux millions protéines codées par seulement 20.000 - 25.000 gènes. Le nombre total trouvé dans les organismes biologiques terran est susceptible de dépasser dix millions, mais personne ne le sait vraiment. Les données sont disponibles sur un peu plus d'un million d'entre eux, pris principalement à partir de l'information trouvée dans les plus de 100 génomes qui ont été entièrement séquencés.
Le champ qui analyse les protéines en général et vise à caractériser exhaustivement tous ceux dans le corps humain est appelée la protéomique . Beaucoup voient dans la prochaine étape logique après l'achèvement de la Human Genome Project pour être l lancement d'un projet de protéome humain. L'Organisation du protéome humain a été fondée à poursuivre cet objectif.
Les protéines sont de longues chaînes moléculaires réalisés à partir des 20 blocs de construction de base de la vie, des acides aminés . La plus connue une, titine, également connu sous le nom connectin, contient 26 926 acides aminés. Titin se trouve dans les muscles et contribue à sa rigidité passive. Parce que les 20 acides aminés peuvent être connectés dans séquences arbitraires, l'espace total de protéines possibles est exponentiel, avec une valeur d'environ 20 50.000 - un très grand nombre. Dans cet espace il peut y avoir des remèdes pour chaque maladie ou affection, mais en les situant dans un si grand nombre est un défi informatique et théorique profonde.
La protéine mot vient du grec PROTA, qui signifie «de première importance». Il s'agit d'un nom approprié, car leur importance centrale dans le corps humain ne peut pas être surestimée. Tous les organismes biologiques peuvent être considérés comme fondamentalement les structures protéiques remplis d'eau et parfois pris en charge par les tissus minéralisés appelés os. Pour presque tout le monde, il y a un autre qui peut le décomposer. Ils fusionnent parfois dans des unités de coopération mutuelle appelés complexes, qui remplissent des fonctions biologiques utiles. Chaque section de l'information génétique utile, trouvée dans l'ADN et des ARN , codant pour une protéine correspondant qui continue à jouer un rôle biologique utile.