Magazine

Wikimedia simplifie l’accès à ses données pour les utilisateurs et développeurs d’IA

Wikimedia simplifie l'accès à ses données pour les utilisateurs et développeurs d'IA
écrit par Christophe

Wikidata : une révolution dans le stockage et l’accès à l’information

Douglas Adams au cœur de Wikidata

Bien que le regretté écrivain anglais Douglas Adams soit principalement connu pour son livre de 1979, The Hitchhiker’s Guide to the Galaxy, son héritage ne se limite pas à cela. Des informations plus variées sur Adams, telles que ses œuvres littéraires et les codes sous lesquels elles sont cataloguées dans les bibliothèques, peuvent être découvertes dans un recoin souvent négligé du mouvement Wikimedia : Wikidata.

Dans Wikidata, on trouve des images, des textes, des mots-clés et d’autres informations liées à Adams, disponibles de manière lisible pour l’homme, mais également dans des formats tels que JSON, conçus pour les machines.

Wikidata Embedding Project : de nouvelles possibilités pour l’IA

Aujourd’hui, Wikidata introduit une nouvelle base de données optimisée pour l’intelligence artificielle. Issue de l’initiative Wikidata Embedding Project de Wikimedia Deutschland, cette base de données transforme les données structurées en vecteurs permettant de capturer le contexte et le sens des entrées.

Lydia Pintscher, responsable du portefeuille Wikidata, illustre le concept : « Dans ce format vectorisé, l’information ressemble à un graphe avec des points et des lignes interconnectées. Adams serait ainsi lié à “humain” ainsi qu’aux titres de ses livres. »

« Au bout du compte, le vecteur que nous calculons est comme une idée générale d’un élément, donc si une petite modification a été faite sur Wikidata, cela ne va pas être super pertinent », a déclaré Philippe Saadé, chef de projet IA Wikidata.

Faciliter l’accès pour les développeurs IA

L’objectif de ce projet est de démocratiser l’accès aux données pour les développeurs IA en dehors des grandes entreprises technologiques. Selon Pintscher, des sociétés comme OpenAI et Anthropic ont déjà les ressources pour vectoriser Wikidata. Ce sont les petites structures qui profiteront le plus de cette nouvelle accessibilité.

Govdirectory est un exemple de projet utilisant les vastes données de Wikidata pour offrir des informations sur les réseaux sociaux et adresses email de responsables publics à travers le monde.

Impact sur les chatbots et la technologie IA

En rendant l’accès à Wikidata plus facile, l’équipe espère que cela se traduira par des systèmes d’IA mieux informés sur des sujets de niche souvent sous-représentés sur Internet. Cela pourrait représenter une façon plus efficace d’intégrer des informations dans des outils comme ChatGPT, que de simplement attendre une mise à jour de ce dernier.

Technologie derrière le projet

Pour concrétiser cela, l’équipe a utilisé un modèle de l’entreprise IA Jina AI pour convertir les données structurées recueillies jusqu’au 18 septembre 2024 en vecteurs. DataStax, filiale d’IBM, fournit gratuitement l’infrastructure nécessaire au stockage de cette base de données vectorielle.

Les développeurs sont invités à donner leur avis sur cette base de données avant qu’elle ne soit mise à jour avec les nouvelles informations ajoutées au cours de l’année écoulée. Bien que cette base ne comprenne pas encore les informations les plus récentes, Saadé est convaincu que des ajustements mineurs ne réduiront pas sa pertinence.

Ce travail met en lumière comment l’innovation peut ouvrir la voie à de nouvelles applications technologiques, tout en rendant accessible l’exploration et l’exploitation des données par tous.

5/5 - (4 votes)
No. 9
Porte-Clés en Bois Gravé Personnalis...
  • IDÉE CADEAU INFORMATICIEN QUI FAIT PLAISIR À COUP SÛR : porte-clés en bois de hêtre unique gravé « Un...
  • CADEAUX GEEK TECH IDÉAL POUR TOUTES LES OCCASIONS : anniversaire, Noël, pot de départ, merci ou simplement...
  • PORTE-CLÉ EN BOIS DE HÊTRE UNIQUE ET INTEMPOREL : gravure profonde qui dure toute une vie, format poche, le...
No. 10
Programmeur Développeur Informaticien...
  • Est-ce que votre cœur bat pour programmeurs, ordinateurs, scientifiques, nerd, HTML, C++, PHP, Phyton...
  • Ce programmateur cool au design rétro a un look vintage tendance. Un cadeau spécial pour tous les fans de...
  • Léger, Coupe classique, manche à double couture et ourlet à la base

A propos de l'auteur

Christophe

Laisser un commentaire