« Le sémanticien | Page d'accueil | La sociographie s'expose »
26 avril 2006
Les arbres phylogénétiques
Le blog "Technologies du langage" de Jean Véronis propose deux très intéressants arbres phylogénétiques :
- 2007: L'arbre des thèmes
- 2007: L'arbre des prétendants
et d'autres suivront probablement...
La technique de représentation utilisée est "celle qu'utilisent les biologistes pour représenter les parentés entre organismes vivants à partir des séquences d'ADN (arbre phylogénétique)". Chaque branche de cet arbre correspond une nouveauté évolutive (apparition, disparition ou transformation d'un caractère).
Dans le cas des deux exemples ci-dessus, l'analyse se base sur la proximité de certain mots dans les pages web, le caractère étant le mot considéré. Donc autant de branches que de mots.
Ce qui est vraiment séduisant c'est de pouvoir corréler cette distance "physique" entre des mots et leur distance sémantique. Et cela marche ! Ces cartes sont tout simplement admirables. Bien entendu, le choix des mots est également important pour la pertinence globale de l'ensemble.
Donc bravo Jean Véronis !
Voici doc l'arbre des prétendants aux prochaines élections présidentielles emprunté au blog "Technologies du langage" :
13:23 Publié dans cartographies | Lien permanent | Commentaires (0) | Trackbacks (0) | Envoyer cette note
Trackbacks
Voici l'URL pour faire un trackback sur cette note : http://neocogit.blogspirit.com/trackback/737809










