«L'intégration sémantique» est un terme utilisé dans plusieurs contextes à travers différents domaines de l'informatique conception, la programmation, la gestion et l'administration. En général, il s'agit de regrouper les informations d'une ou plusieurs sources disparates dans le but de créer un système dans lequel l'information est organisée d'une manière qui fait sens pour un utilisateur. Intégration sémantique traite souvent de définir et d'établir des connexions de métadonnées, ou des relations, entre les différentes parties des différentes sources de données afin qu'ils puissent être structurées logiquement. Cela pourrait impliquer la création de connexions relationnelles entre deux bases de données distinctes, la construction d'un graphique de la façon dont des portions de différents sites Web liés les uns aux autres, ou intégrer des données factuelles à partir, un format arbitraire inconnu dans une structure d'enregistrement concise. De nombreuses applications pratiques pour un système d'intégration sémantique pleinement mis en œuvre existent, y compris les bibliothèques ou réseaux de recherche, les algorithmes des moteurs de recherche plus organiques qui peuvent extrapoler contexte d'une recherche et, finalement - grâce à l'utilisation de la publication des métadonnées - l'intégration harmonieuse des différents systèmes informatiques pour l'échange de données .
Le but ultime de l'intégration sémantique dans la plupart des cas, est de pouvoir associer des informations de manière dynamique. Dans un exemple très simple, cela pourrait signifier être capable d'associer des champs dans une base de données avec les champs dans une autre base de données, en dépit du fait qu'ils ne sont pas les correspondances exactes, telles que concernant un champ nommé «taille» à un champ nommé "hauteur".Cette association pourrait être réalisée grâce à des règles définies par l'utilisateur qui lient spécifiquement les deux, ou il pourrait être fait avec des algorithmes qui comparent les données numériques des champs et déterminer une correspondance probable. Les mots «taille» et «hauteur» deviennent alors des termes de métadonnées que d'autres systèmes d'intégration sémantique externes pourraient être en mesure d'utiliser pour trouver des informations pour un utilisateur sans avoir à connaître précisément comment un seul système stocke les données.
Dans les systèmes d'intégration sémantiques complexes, tels que ceux destinés à la recherche, la publication de métadonnées et le partage est un élément clé pour l'opération.Les métadonnées peuvent être extraites de documents pour former de grandes structures de données relationnelles qui peuvent aider dans les requêtes. Cela signifie que les documents de recherche sur n'importe quel sujet peuvent être intégrés dans un système qui mesure et enregistre la fréquence des mots, et ces mots peuvent aider dans les recherches des utilisateurs de l'information, permettant des sujets liés à inscrire à partir de n'importe quelle source sans avoir besoin de conversions spécifiques.
L'un des défis auxquels sont confrontés les concepteurs de systèmes d'intégration sémantique est de savoir comment agréger les données. Utiliser les humains pour classer et rendre les relations entre les données provenant de diverses sources peut prendre beaucoup de temps et, finalement, très dépendants des expériences individuelles de la personne. Quand algorithmes sont utilisés pour fabriquer automatiquement des associations, certaines relations pourraient être négligés en raison d'une différence mineure que l'algorithme est incapable de résoudre. Une méthode de mise en œuvre de l'intégration sémantique sur une grande échelle utilise des algorithmes basés sur l'apprentissage en relation avec la gestion des règles de base de l'homme et, dans certains cas, l'homme réel de prise de décision au cours du processus.