Laboratoire sur la Gestion Electronique de Documents -LabGED- Welcome

Google

Yahoo

CARI-info

MESRS

Université Badji Mokhtar-Annaba

Welcome

Menu principal

Infinite Menus, Copyright 2006, OpenCube Inc. All Rights Reserved.

Nous contacter
Tel: 0021338872678
Fax: 0021338872436

---------------------------------
LabGED
Université Badji Mokhtar
BP 12 - 23000 -  Annaba
Algérie

Directeur: Dr. Farah Nadir

farah@labged.net

 

      

        


Algorithme pour la fusion d'ontologies sous protege a l'aide de plug-in en java

 

 


 

Faiz Maazouzi et Khadir Med Tarek

 


1. Les objectifs du système proposé

Le processus de fusion entre ontologies a pour objectif de mettre en correspondance les concepts d'une des ontologies, dite ontologie source (OSrc), avec les concepts d'une autre ontologie, dite ontologie cible (OTar). Pour simplifier la présentation générale des différents travaux référencés, nous considèrerons que chaque ontologie O ne comprend qu'un ensemble de concepts C et un ensemble de relations R entre ces concepts.

Etant donné que l'objectif de fusion est d'arriver à une ontologie multi-point de vue et non pas à une seule ontologie "monolithique", les techniques de fusion les plus appropriées dans notre cas sont celles qui établissent des liens entre concepts.

2. Définition de fusion d'ontologies

 

La définition de la notion de fusion d'ontologies peut etre donnée comme suit: "Ontology merging is the process of generating a single, coherent ontology from two or more existing and different ontologies related to the same subject". La fusion d'ontologies représente la création d'une nouvelle ontologie à partir de deux ontologies ou plus. L'ontologie résultante unifie et remplace les ontologies d'origine (Voir la figure 1). Cette définition ne précise pas comment l'ontologie résultante est reliée aux ontologies originales pour laisser ouvert le problème du choix de la méthode de fusion. Les approches les plus courantes utilisent l'union ou l'intersection. Dans l'approche par union, l'ontologie résultante contient l'union des entités provenant des ontologies originales et suppose résolues les différences de représentation d'un même concept.

Dans l'approche de type intersection, l'ontologie résultante ne contient que les parties communes des ontologies originelles.   Figure 1 : Le principe de la fusion d'ontologies

 

3. Les approches de fusion d'ontologies

Plusieurs approches existent pour la fusion d'ontologies. Parmi ces approches, on distingue la Fusion des ontologies par classification hiérarchique et PROMI (Platform for the reuse of ontologies through merging and integration), qui consiste à fusionner deux ontologies pour obtenir une seul ontologie avec les moins d'erreurs, et Prompt qui commence par chercher les appariements possibles par similarité lexical, mais se base surtout sur la structure et vérifie par l'utilisateur pour détecter des conflits éventuels.

4. Les approches de calcul des similarités

Il existe 4 approches de calcul des similarités, approches terminologiques ou lexicales (chaînes de caractères ou ressources linguistiques), approches sémantiques, approches structurelles (internes ou hiérarchiques), approches d'extension (ou d'instances). La classification de ces approches se fait selon concepts ou classes, propriétés ou attributs, relations, instances et axiomes. Mais  dans notre algorithme en a utiliser l'approche terminologique qui consiste a comparé les labels des entités. Elle est décomposée en approches purement syntaxiques et celles utilisant un lexique. L'approche syntaxique effectue la correspondance à travers les mesures de dissimilarité des chaînes (e.g., EditDistance). Tandis que, l'approche lexicale effectue la correspondance à travers les relations lexicales (e.g., synonymie, hyponymie, etc.) .

5. L'algorithme propose

 

L'algorithme se base sur une comparaison entre les concepts afin d'identifiés les candidats à la fusion, ensuite PROMPT identifie un ensemble d'opérations pour la fusion d'ontologies (fusion des classes, fusion de slots, fusion des liens, etc.) et un ensemble de conflits possibles consécutifs à l'application de ces opérations (conflits de nom, redondance dans la hiérarchie des classes). L'algorithme proposé est donné par la Figure 2.

Figure 2: Le flux de l'algorithme F-Merge sous PROMPT.

 La couleur et le cadre gris indiquent les actions accomplies par l'algorithme Faiz Projet sous PROMPT, et les cases blanches indiquent l'action exécutée par l'utilisateur.

5.1. Les ocomparaisons utilisées

5.1.1. Comparaison  Exact : Cette comparaison consiste à trouver les concepts du même nom ou leurs noms se ressemblent, cette comparaison utilise l'algorithme EqualDistance  (e.g., la classe  30B et la classe 30B pour le cas étudié (Turbine a vapeur) ).

5.1.2. Comparaison approximative :

Cette comparaison est plus intéressante car elle consiste à trouver les noms des concepts synonymes et les noms des concepts approximatifs. La méthode est basée sur l'hybridation des algorithmes de fusion (N-Gram, SubString Equivalence, HammingDistance, Edit Distance Algorithm (Levenshtein Distance) ) avec un dictionnaire des synonymes, (e.g., les concepts 30P et 30PA, le nom du concept 30P fait partie du nom du concept 30P dans le cas de la Turbine a vapeur).

5.1.3. Comparaison Similaire :

La comparaison similaire est une comparaison manuelle, l'utilisateur entre les noms des concepts qu'il suppose similaire, (e.g., l'utilisateur entre les concepts 30B et 30C comme similaire).

8. Présentation de quelques interfaces du système.

La figure 3 représente  l'interface graphique de plug-in (Faiz Projet).  

Figure 3 :L'interface graphique de Plug-in (Faiz Projet)

Figure 4  : Résultat des classes fusionner  

9. Evaluation  des résultats

Les résultats de mesures de performances obtenus sont :

Algorithme

Rappel

Précision

 

Algorithme proposé

91.87

90.90

 

Lexical Matching

87.22

82.43

            

 

 

 

 

 


 

 

 

Plugin et Installation

 

1. Intégration de PROMPT dans Protege2000 :

Téléchargement: Plugin allignement FaizProject

Pour pouvoir utiliser PROMPT dans protégé 2000, on doit suivre les étapes ci-dessous :

Créer une copie du fichier (edu.stanford.smi.protegex.prompt) et placer dans le répertoire :

Protégé_3.1/plugins/ edu.stanford.smi.protegex.prompt.

Ouvrire l'ontologie à configurer avec le plug-in PROMPT, aller à configure dans le menu Project et cocher la case PromptTab.

 

    

Figure 5 : l'activation de PromptTab

 

Une fois ces étapes achevées, on peut voir la

Figure 6  : console Prompt dans Protege.

 

2. Intégration de plug-in crée  dans PROMPT :

 

Apres l'activation de PromptTab nous avons ajouté notre plug-in à PROMPT, Pour pouvoir ajouter et utiliser le Plugin crée  dans PROMPT, on doit suivre les étapes ci-dessous :

Créer une copie du fichier edu.stanford.smi.protegex.promptx.FaizProjet et placer dans le répertoire :                                                                                      C:\ProgramFiles\Protege_3.4.1\plugins\edu.stanford.smi.protegex.prompt\plugins

 Figure 7 :Intégration de Plugin « FaizProjet » dans PROMPT

Ouvrir protégé2000 et cliquer sur la console PROMPTE et choisir Faiz Projet algorithme de comparaison. et choisir Faiz Projet algorithme de comparaison.

 

Figure 8: le  plug-in crée (Faiz Projet) dans PROMPT.

 

        
 

© 2011- Laboratoire sur la Gestion Electronique de Documents
Tous droits réservés - All rights reserved -