Le vocabulaire contrôlé est un concept dans l'informatique et la programmation informatique qui consiste à utiliser uniquement préalablement convenus ou des termes approuvés lors de la construction de bases de données relationnelles, recherche de métadonnées ou d'autres systèmes dont les mots lisibles sont utilisés pour marquer les informations pour une utilisation ultérieure. La méthodologie de l'utilisation d'un vocabulaire contrôlé pour classer l'information est en contradiction directe avec le concept du vocabulaire du langage naturel, dans lequel il n'y a pas d'accord sur tous les termes et les mots qui sont utilisés sont plutôt reliés par des relations pondérés. En plus des mots de haut niveau qui sont utilisés dans un vocabulaire contrôlé, appuyant les mots peuvent être utilisés pour des synonymes ou d'autres termes qui sont fortement associées à l'expression de haut niveau peuvent déclencher l'utilisation du mot de haut niveau. Les principales différences qui sont mesurées entre les systèmes de langage naturel et des systèmes de vocabulaire contrôlé sont de la pertinence des résultats d'une requête à l'aide des mots, le volume des informations renvoyées, et la facilité d'utilisation globale du système.
Il existe de nombreux cas dans lesquels une collection de mots ou expressions sont utilisées pour rendre l'information qui est arbitraire, en constante évolution ou désorganisé plus accessibles aux utilisateurs. Les termes de recherche dans un moteur de recherche Internet, une base de données d'entreprise, et même une bibliothèque de recherche numérique sont tous des exemples d'applications à travers laquelle l'information peut être classé avec les termes de métadonnées, par opposition à une structure hiérarchique stricte.Les mots utilisés pour décrire un objet dans de telles situations construisent une sorte d'index de recherche de la plus grande piscine de l'information.
Un exemple de l'utilisation d'un vocabulaire contrôlé peut être vu lorsque l'on considère un système de classement pour une entreprise. Les fichiers doivent être classés d'une manière si elles sont facilement accessibles et prévisible. Si l'on traite de fichiers avec des voitures, alors il pourrait être déposé en vertu de la catégorie "voitures". Si une autre personne a également un dossier qui traite de voitures, sans un vocabulaire contrôlé, le fichier peut être placée sous la rubrique «automobiles», ce qui rend les deux fichiers difficiles à trouver en une seule recherche. Lorsque les catégories sont contrôlés, puis tous les dossiers des voitures seraient placés sous une seule rubrique convenu.
L'avantage d'utiliser un vocabulaire contrôlé est que l'information est strictement décrit d'une manière prévisible. Cela signifie que toute personne qui a connaissance du vocabulaire pourra efficacement et avec précision recherche d'information. Une complication avec le vocabulaire, cependant, est que les termes de recherche sont plus difficile, voire impossible, de générer automatiquement et nécessitent généralement une intervention humaine, ce qui en fait une grande tâche de convertir les bases de données existantes pour utiliser un vocabulaire contrôlé. Si le vocabulaire n'est pas assez grand, alors il y a aussi la possibilité d'une seule requête élever un tel volume d'informations qu'il devient impossible de trier sans l'utilisation d'une autre méthode d'interrogation.