Testant Twine depuis plus d'une semaine, j'y ai trouvé à l'intérieur une recommandation automatique par le moteur sémantique de ce qui me semble relever d'un "billet-pépite" écrit cette semaine par Hrafn Thorrisson, un beta-testeur très averti :
Why I Migrated Over to Twine (And Other Social Services Bit the Dust)
De mon point vue, c'est l'une des plus belles introductions lues récemment. Et ce surtout si vous faites partie des chanceux en train de tester Twine, une application très prometteuse pour utiliser le web sémantique dans la vraie vie et gagner en productivité dans l'InfoBésité ambiante.
Notes :
- Ce billet est sous copyright et publié sous Fair-Use. Seul le lien original fait référence. (En attente d'autorisation de l'auteur).
- Cette traduction avait été initialement publiée sur mon autre blog chez LiveJournal : elle a rippé ici tout simplement parce que le bookmarklet "Twine This+" ne fonctionnait pas à cette heure sur LJ :(
Hrafn Thorisson : Pourquoi J'ai Migré sur Twine (Et Comment d'Autres Services Sociaux Vont Mordre La Poussière)
Durant les derniers mois, j'ai été un membre actif de Twine.com ; une application de web sémantique en version beta criblée d'Intelligence Artificielle pour nous aider à organiser, partager et découvrir l'information. La beta est encore en construction, mais à cette heure, j'ai complètement migré mon Del.icio.us, mes wikis personnels et autres services en ligne équivalents vers Twine.
Plusieurs raisons à cela, dont certaines que je détaillerai en-dessous — et pour finir pourquoi ce service est pertinent malgré le fait qu'il soit toujours en beta sur invitation.
Pour la recherche d'un résumé facile, nous résumerons les fonctionnalités de Twine sur une liste à puces :
- Service de Signets Sociaux
- Stockage centralisé pour les documents, images, vidéos et autres données (provenant de votre machine ou du web)
- Médias visibles à l'intérieur de Twine, bookmarké ou uploadés. (vidéos, images, etc.)
- Plateforme Collaborative avec un éditeur de texte intégré comme sur un wiki
- Gestion de Groupes créés par les Utilisateurs avec forums de discussion
- Analyse intelligente du contenu ajouté (plus à venir en dessous)
- Un moteur de recommandation pour aider à découvrir de l'information que les personnes trouvent pertinentes pour vous et vos centres d'intérêts
Remarquez cependant que cette liste n'est pas exhaustive, elle ne fait que lister les fonctionnalités les plus proéminentes sur la façon dont j'utilise Twine. Comme je l'évoquais, je suis en train de m'éloigner des autres services en ligne du fait que cela me fournit tout en un seul endroit. Un endroit étant un aspect vraiment important — je voulais que mes données soient accessibles en un seul endroit au lieu d'avoir à visiter tous les services en ligne. Et le fait de construire activement un web sémantique par l'usage n'est pas qu'un petit avantage. C'est une vision et une addition nécessaire pour le web. (Et pour la boîte à outils de l'humanité.)
Ce Qu'est Twine & Ce Qu'il Fait
L'équipe de Twine a créé un nouveau Twine Tour public qui couvre le but et les fonctions de Twine. Les détails spécifiques sont présentés au minimum car ils demeurent en développement et changent à une allure régulière. (Twine est en “vraie” version beta, voir en-dessous).
Le tour guidé couvre les fondamentaux et je recommande de le lire en plus de ce billet. Mais voici un aperçu d'une des choses qui au début m'a le plus épatée. Le Bookmarklet.
Exemple de Bookmarklet
Si vous avez déjà utilisé un service de signet social, vous êtes familier avec le fait d'ajouter un lien vers la barre d'outils de vos navigateurs, et puis de cliquer dessus pour mettre la page dans vos favoris afin de pouvoir y accéder facilement plus tard. Ici c'est le même concept, si ce n'est que quand vous cliquez sur le lien du favori, la belle fenêtre ci-dessous apparaît au coin de la fenêtre de votre navigateur.
Les champs “Add to”, “Title” et “Summary” sont affichés tronqués.
Ils s'étirent automatiquement au moment de cliquer.
Il n'y a là absolument aucune information qui fût saisie à la main. Le résumé contient le texte spécifié dans les métadonnées de l'article générées par Wordpress, et il en est de même concernant les tags et le titre — en outre Twine génère une image-vignette de la page. (Et ce n'est pas tout ce que fait Twine, comme vous pourrez le découvrir au fur et à mesure que nous avancerons).
Ainsi les choses sont auto-extraites ; avec l'option de pouvoir les ajouter ou les modifier manuellement (vous pouvez si vous le souhaitez sélectionner manuellement une image à partir de la page). Tout ce que nous devons faire est de cliquer sur "save".
Ceci s'est avéré pour moi comme un gain de productivité énorme, car l'information supplémentaire ajoutée facilite le fait de retrouver les items.
L'Extraction Varie Selon le Type d'Item
L'extraction fonctionne sur toutes les pages — mais selon le type d'item étant bookmarké, l'extraction est gérée différemment. Par exemple, le fait de mettre un produit Amazon en favori (Snow Crash, dans ce cas) produit un item à l'intérieur de Twine qui ressemble à ça :
Le bookmarklet extrait les données importantes (prix, auteur, éditeur, couverture du livre, etc.) — identifant les auteurs sous un genre “person”, le livre sous un genre “book”, etc. Ceci facilite l'extraction, la visualisation et l'organisation. Et il en de même pour les vidéos YouTube ; l'information est extraite et vous pouvez visualiser la vidéo à l'intérieur de Twine. Une fois de plus, le bénéfice est qu'avec toute l'information extraite, cela devient bien plus facile de retrouver l'item. Je ne me souviens jamais de mes bookmarks sur del.icio.us et dois toujours naviguer sur de longues listes. Ainsi ceci s'est avéré comme une fonctionnalité en or.
En outre, je trouve que pouvoir visualiser toute l'information à l'intérieur de Twine est une aide géniale. Je n'ai plus besoin de rassembler les vidéos YouTube dans une galerie pour les visiter (ou y envoyer mes amis), il en est de même pour les livres, — je peux désormais produire une liste des livres à lire, des livres que j'ai lus, etc. et visualiser toute l'information sur le même site. Et oh, sans oublier aussi les films de l'IMDB.
Parsage Automatique du Texte (la face technique des choses)
Le champ marqué "summary" est parsé automatiquement par les systèmes d'intelligence artificielle de Twine pour identifier les personnes, les lieux et autres. Ainsi, par exemple, quand Stanley Kubrick est mentionné dans les champs du bookmarklet, ou dans le document que vous uploadez, ou dans l'e-mail que vous envoyez à Twine — le système l'analysera et l'identifiera comme une person (et non pas comme un mot-clé de plus). Ceci s'appelle l'extraction d'entité et s'applique à tous les textes sur Twine.
Sous le capot, une personne est définie dans une ontologie plus grande en relation avec d'autres “choses”. Voici un exemple d'une toute petite portion de mon propre graphe dans Twine :
On pourra ne pas trouver ce point très clair. Aussi pour expliquer : tout comme le HTML permet aux ordinateurs d'afficher des données — ce balisage sémantique supplémentaire (RDF, OWL, etc.) permet aux ordinateurs de comprendre quelle est la données qu'ils affichent. En outre, de comprendre quelles choses sont en relation avec d'autres choses.
Exemple de Recherche
Par exemple, quand nous cherchons “Stanley Kubrick” sur des moteurs de recherche normaux, les mots “Stanley” et “Kubrick” sont généralement considérés comme de simples mots-clés : une série de lettres sur laquelle que le moteur de recherche essaierai alors de trouver des pages avec cette série de lettres. Mais dans le monde du web sémantique, les moteurs savent que “Stanley Kubrick” est une person. Ceci aboutira à bien moins d'items sans rapport dans les résultats de la recherche.
Stanley Kubrick peut ne pas être l'exemple le plus clair ; imaginez que le terme cherché soit “Suzuki” : cherchons-nous des motos, ou la personne qui a créé les motos, Michio Suzuki ?
(J'ai Utilisé Deux Fois Twine Au Moment de Rédiger ce Billet)
Voici de véritables cas d'usages utilisés pendant que j'ai écrit cet article.
- J'avais écrit le texte en-dessous sur l'intelligence de Twine un peu plus tôt pour répondre à un journaliste sur Twine. Je ne me souvenais plus où je l'avais écrit. Pour trouver le commentaire, j'ai saisi le mot “Wikipedia” et spécifié que ce devrait être du type “comment”, créé par “Hrafn Thórisson”. Commentaire trouvé.
- J'ai écrit un commentaire sur un billet en ligne pour le maintenir à l'abri ; ainsi j'ai créé une note pour lui sur Twine, en lui ajoutant quelques mots-clés. Le processus était similaire à celui au-dessus. Chercher, spécifier, trouver.
Un Jardin Sémantique, Ouvert (Un peu plus sur la technique)
Si vous n'en aviez pas déjà conscience, les systèmes que j'ai décrits au-dessus sont les concepts fondamentaux du web sémantique : Encapsuler des données dans une nouvelle couche d'information traitable par les machines pour nous aider à chercher, trouver et organiser l'océan débordant et toujours croissant d'images, de vidéos, de textes et de toues les choses que nous créons.
Avec chaque item créé, uploadé ou bookmarké, Twine reçoit des dizaines d'informations allant de personnes automatiquement reconnues jusqu'aux produits, buildings, etc. Au fur et à mesure que Twine grandit, le potentiel de réutiliser les piles de données auto-extraite grandit. Twine apprend commen les utilisateurs travaillent, et ce que veulent dire les choses.
Et ce qui est important pour moi est que ces structures de données suivent des standards pour le balisage du web sémantique. Et Twine, ou ses créateurs Radar Networks, feront que la donnée sera ouverte de manière à ce que d'autres puissent construire des applications qui en feront usage. J'ai généré le graphe au-dessus en accédant aux données de Twine avec un autre outil (RDFGravity).
Pour un exemple de croissance plus approfondie et d'inter-twinning avec d'autres parties du web, je crois que Twine utilise l'apprentissage machine & pour référence 300 000 catégories taxonomiques de Wikipedia. Une collaboration plus approfondie avec les services sémantiques ouverts est aussi sur le radar.
Avec ce type de donnée en place, nous pavons le chemin vers un web plus intelligent. Un web qui sait qu'un acteur est rattaché à des films est que c'est un type de personne, et qu'une personne est un type d'animal ; nous ouvrant aisi une kyrielle de possibilités pour innover dans la recherche avec bien plus d'efficacité. Et nous l'espérons pour un adieu aux méthodes ingrates de recherche que nous utilisons aujourd'hui. Quand Twine a été présenté, j'ai écrit un article et l'ai décrit ainsi :
Si Twine délivre ce qu'il veut bien dire, nous aurons [un site qui nous permettra de voir toutes nos données en ligne en un seul endroit], avec un glaçage intelligent plus une jolie tasse chaude de Cappuccino de QI. Tout cela pour ne pas oublier que son succès produirait une belle éclaboussure dans le développement du web sémantique, ajoutant une pierre jaune à la route nous éloignant des méthodes de-moins-en-moins-productives de la recherche moderne et de l'organisation des données.
Deus ex machina pour la Découverte de Contenu ? Pas encore.
Ce n'est toujours pas une promenade dans le parc. C'est une beta après tout,beaucoup de choses ont besoin d'être réparées et sont en construction. Beaucoup de choses ne sont pas encore produites. Par exemple, l'auto-extraction ne fonctionne pas correctement sur toutes les pages. L'interface a besoin d'un sérieux remaniement et plusieurs autres fonctionnalités nécessaires sont encore en développement.
Il y a Plus à Venir
Le mot-clé “beta” est souvent (malheureusement) (mal-)utilisé pour signifier une pré-excuse face à une gêne potentielle des utilisateurs. Ce n'est pas le cas ici. Radar Networks a déclaré que l'interface et les fonctionnalités sont en train d'être travaillées activement (comme j'ai pu en être témoin), et que par “Beta” ils veulent dire un produit incomplet.
Comme j'en faisais part sur un commentaire en ligne à propos d'une critique négative : Twine n'est pas présenté comme un produit fini. Ni même fermé. C'est un produit en cours de fabrication ; ils recherchent des utilisateurs actifs et leurs réactions pour aider à produire des améliorations. Mais une fois de plus, au moment de Googler quelque chose et de se retrouver frustré sur des résultats hasardeux, je me suis retrouvé moi-même à plus d'une occasion en train de déplacer instinctivement la souris pour spécifier le type-item dans la barre latérale du filtre.
Nous devons encore voir à quoi ressemblera le produit public finalisé. Encore quelques mois (ça plane autour de l'été prochain). Le potentiel futur de son infrastructure et de son usage est immense. En considérant la grande image : construire des métadonnées n'est pas tâche facile ; mais le système Twine, selon moi, est un moyen génial pour aller en ce sens. Tellement plus que toutes les autres applications de web sémantique en alpha ou beta que j'ai pu explorer. Mais les choses géniales n'arrivent pas pendant la nuit. Comme je l'évoquais plus haut, c'est la première vague des applications du web sémantique et je suis heureux de supporter l'effort via des demandes de fonctionnalités et une critique constructive. Tout spécialement parce que je la trouve déjà utile.
En ayant lu l'article au-dessus : si vous en aviez la chance — seriez-vous intéressé(e) pour utiliser Twine ? Si la réponse est Oui, gardez un œil sur Think Artificial. Si la réponse est Non, continuez de jeter un œil sur ThinkArtificial.
Lien & Référence
- Radar-Networks Dévoile Twine. Un billet du même auteur en cours de traduction sur un vieux wiki-personnel.
Mots-clés : twine, Web Sémantique, radarnetworks
Why I Migrated Over to Twine (And Other Social Services Bit the Dust) | Think Ar : "Pourquoi J’ai Migré sur Twine (Et Comment d’Autres Services Sociaux Vont Mordre La Poussière) — Christophe G. Ducamp’s French translation of this article"