Mesurez l’impact de votre portail de données avec OpenDataSoft Analytics

Il n’est plus possible de lâcher des jeux de données dans la nature en espérant que quelque chose de positif arrive. Que vous soyez une collectivité ou une administration engagée dans la transparence ou une entreprise travaillant à développer vos relations avec vos clients et partenaires, vous avez déjà des objectifs et des indicateurs de performance à suivre. Pour continuer à accompagner la croissance de l’activité de votre portail, nous venons de rendre disponible une nouvelle suite d’outils pour analyser les interactions de vos utilisateurs avec vos données et l’impact de votre portail de données.

Imaginez que chaque jour, chaque semaine ou chaque mois, vous puissiez, en un simple clic, répondre aux trois questions :

  1. Qui sont les personnes qui utilisent vos données et avec quelle intensité ?
  2. Quelle est la répartition de la popularité parmi vos jeux de données ?
  3. Qu’est ce que vos utilisateurs cherchent à faire avec vos données ?

Imaginez alors que vous pourriez comparer ces réponses sur différentes plages de temps, et que vous pourriez les partager avec vos collègues.

Impact Portails Open Data – Tableau de bord utilisateurs

OpenDataSoft Analytics vous aide à comprendre l’impact de votre portail de données

Les trois tableaux de bords présentent sept indicateurs (c’est une bonne pratique, au delà de 8, l’information devient plus compliqué à retenir). Il y a toujours un lien vers le jeu de données complet de tous les appels API. Cela vous permet d’avoir toujours la possibilité de revenir aux données de bases pour définir vos propres graphiques correspondant à vos propres indicateurs de performance. Nous pensons toutefois que ces nouveaux tableaux de bord vous apporteront une vision nouvelle de votre portail et vous aideront à encore mieux valoriser vos données !

Une liste exhaustive de tous les indicateurs et de leurs interprétation est disponible sur notre documentation, mais penchons nous quand même plus en détail sur trois d’entre eux.

Activité

Impact Portails Open Data – Activité

L’indicateur d’activité donne plusieurs axes de lecture. Tout d’abord vous pouvez mieux appréhender vos utilisateurs. Ici, par exemple, le portail est utilisé essentiellement durant la semaine. Cela indique un usage plutôt professionnel des données. Ensuite, l’intérêt principal de l’indicateur est de suivre l’utilisation du portail et lier cette observation à toutes vos actions pour encourager cette utilisation. Pouvez vous lier cette activité à une campagne de communication récente ? Y-a-t’il eu une publication d’article sur vos données ce jour là ? Quel a été l’impact de ce passage sur une radio locale ? Le département des Hauts-de-Seine a constaté une multiplication par 10 de leurs trafic après la publication des Archives de la Planète. Suivre l’activité de vos utilisateurs est la première étape si vous voulez comprendre l’impact des actions que vous menez.

Popularité des thèmes

Impact Portails Open Data – Popularité des thèmes

Le treemap de la popularité des thèmes vous donne la répartition des appels API (et donc l’activité) par thème. Cette répartition est un bon indice pour comprendre quelles données intéressent vos utilisateurs et ce qui est important pour eux. Cela peut aussi refléter une meilleure configuration de certains jeux de données par rapport à d’autres.

De plus, dans la plupart des organisations, comme l’administration d’une ville par exemple, la méta-donnée theme correspond à un département administratif.

Recherches textuelles sans résultat

Impact Portails Open Data – Recherches textuelles sans résultat

La liste des recherches textuelles sans résultat vous donne de précieuses informations. Soit vos utilisateurs ne trouvent pas des données qui sont déjà dans votre catalogue, ce qui veut dire que vous pouvez envisager d’ajouter de nouveaux mots clés, ou de compléter le titre et la description ; soit ils cherchent des données qui ne sont pas en ligne. Dans ce cas, cela peut être un aperçu des prochains jeux de données sur lesquels travailler.

C’est exactement ce que fait le projet d’ACTA Data & Services pour l’Agriculture, API-AGRO, qui publie des données à destination du monde de l’agriculture. Ils utilisent les recherches ne donnant pas de résultat pour mettre en lumière ce que leurs utilisateurs cherchent et ensuite, cherchent à collecter et diffuser des données correspondantes.

Deux observations empirique sur l’impact des portails de données

  • Rien d’absolument certain pour l’instant, mais plus nous analysons des portails de données ouvertes, plus il apparait que la popularité des jeux de données suit une distribution de loi de puissance. Nous en avons déjà parlé, et nous sommes en train de nous pencher plus profondément sur la question en ce moment. Néanmoins nous pensons qu’il est d’ores et déjà possible d’en tirer des réflexions intéressantes. Plus concrètement, ce qu’une distribution de loi de puissance dit c’est qu’un certain nombre de jeux de données (1 ou 2 par portail) sont des succès impressionnants. Ce sont les jeux de données qui tirent le trafic du portail et qui représentent la majorité de la réutilisation des données. Cela implique aussi qu’il y ait une longue queue de jeux de données moins performants mais qui intéressent aussi beaucoup de monde. De la même façon qu’Amazon a deux stratégies différentes pour ses produits les plus populaires et ceux qui le sont moins, vous pouvez imaginer prévoir des processus de travail ou de communication différents dans les deux cas.

    Impact Portails Open Data – Loi de puissance de la popularité des jeux de données

    Gardez à l’esprit que lorsqu’on parle de loi des 80-20 (ce qui est synonyme d’une loi de puissance), cela implique aussi que 1% des jeux de données peuvent représenter 50% du trafic et des réutilisation des données. Il devient difficile de ne pas en tenir compte.

  • Une autre règle empirique revient souvent quand nous analysons des portails de données : l’utilisation des données tombe presque exclusivement dans une des trois catégories Recherche, Géo ou Analyse. Prenez l’exemple du graphe ci-dessous. Nous utilisons notre portail public pour mettre à votre disposition des jeux de données référentiels ouverts. Le catalogue est très varié. Comme vous pouvez le constater, la recherche est de loin l’usage principal du portail. Nous nous y attendions puisque l’objectif du portail est de faire découvrir des données. Si vous utilisez OpenDataSoft pour créer des tableaux de bord ou si vous travaillez avec beaucoup de données géographiques, l’indicateur devrait être différent. Et si vous n’y avez pas encore beaucoup réfléchi, cela peut être un premier pas vers une meilleure compréhension de l’usage que font vos utilisateurs de votre portail et de comment en profiter pour aller vers vos objectifs.

    Impact Portails Open Data – Répartition des actions

De tout ça découle le fait que nous sommes en train de travailler à la définition d’un score de popularité de l’Open Data. Il est aujourd’hui assez compliqué de travailler avec à la fois un nombre de téléchargements et un nombre d’appels à l’API et avec leurs évolutions dans le temps. Il est aussi assez difficile de comparer deux portails de données entre eux ou l’usage des données de deux secteurs différents. Faire partie du réseau OpenDataSoft ce n’est pas simplement avoir accès à tous les jeux de données ouverts du réseau, sans avoir à les télécharger ou à les ré-indexer. C’est aussi un moyen pour nous de partager avec vous toute la connaissance qui peut émerger de ce réseau.

Vous ne savez que faire de vos données ouvertes ?

Recevez votre guide gratuit maintenant ! Il réunit les 10 étapes essentielles pour bien amorcer votre projet Open Data.







Source : ADEC - Open data