AnnoTag
SAFE
Les bibliothèques numériques sont construites sur la classification des contenus en capturant leur sémantique et (éventuellement) en alignant la description avec un schéma de catégorisation sous-jacent. Ce processus repose généralement sur l’intervention humaine, soit du créateur du contenu, soit d’un gestionnaire. En tant que telle, cette procédure est hautement chronophage et donc coûteuse. Afin d’accompagner l’humain dans la gestion des données, nous introduisons un système d’étiquetage sous forme d’annotations appelé AnnoTag. Le but d’AnnoTag est de fournir des annotations de contenus concises en utilisant des analyses au niveau des entités afin d’obtenir des descriptions sémantiques sous forme d’étiquettes. En particulier, nous générons des « étiquettes sémantiques LOD » (Linked Open Data) qui permettent une inter-connexion des étiquettes obtenues avec le nuage LOD. En s’appuyant sur une évaluation qualitative des articles d’actualités du Web, nous prouvons la viabilité de notre approche et la haute qualité des informations extraites automatiquement.
Contributeur
Marc Spaniol