Nous travaillons sur Québec Ouvert
Les données ouvertes, qu'est-ce que c'est?
Abonnez-vous au Google Groupe pour suivre les projets!

Ce billet est écrit par Stéphane Guidoin de l’organisation Nord Ouvert.

La STM ouvre ses données de transport

Après quelques mois de suspens, la Société de Transport de Montréal a finalement levé le voile sur ses données de transport au format GTFS. La légende voulait que le STM proposait ses données à Google depuis plusieurs années, permettant ainsi au moteur de recherche de proposer des trajets en transport en commun en exclusivité. D’ailleurs, aujourd’hui encore, la STM et l’Agence Métropolitaine de Transport réfèrent à celui qui dit ne pas être le diable pour avoir des calculs multi-modaux en transport en commun.

Le jeu de données de la STM était la pierre manquante pour couvrir l’ensemble de la métropole montréalaise. En effet, les trois autres sociétés de transport, l’AMT, la Société de Transport de Laval  et le Réseau de Transport de Longueuil proposaient déjà leur jeu de données. La STM faisait face à un défi un peu plus élevé du fait de la taille de son réseau; pour se donner une idée, le fichier de la STM est 10 fois plus volumineux que celui de la STL.

La standardisation des formats

Cette publication met de nouveau en avant la force de la standardisation dans les données ouvertes. Rappelons que le format GTFS, initialement créé par TriMet (la société de transport de Portland, Oregon) et Google est désormais utilisé par des dizaines de société de transport à travers le monde. Sur base de ce standard, un ecosystème propère et rend disponibles à tous des outils utiles. Pour le public, un des éléments visibles est la multitude d’applications mobiles qui se sont développées. Tandis que chaque réseau de transport a tendance à développer une application qui lui est propre, les applications tierses, se basant sur les données ouvertes, peuvent virtuellement couvrir le globe au complet. À titre d’exemple, alors que les applications mobiles de la STL et de la STM sont chacune limitée à leur réseau, d’autres applications comme Stopango n’ont pas de limite géographique. Ceci évite donc une fragmentation du marché ainsi qu’une multiplication inutile des applications pour les utilisateurs.

Du coté des utilisations moins visibles, les données GTFS permettent aussi l’utilisation d’outils comme OpenTripPlanner, une application open source de calcul de trajet multimodal. Lors du TranspoCamp en décembre dernier, un pilote avait été réalisé avec les données existantes. Maintenant il suffit d’ajouter les données de la STM pour avoir une couverture complète. Grâce à un format de données reconnu de tous et  à la logique open source, il est ainsi possible d’avoir un calculateur de multimodal de qualité pour quelques heures (ou journées) d’installation, le genre d’outil qui coutait une fortune à acheter ou à développer il n’y a pas si longtemps. Le fameux calculateur Tous Azimuts de la STM semble bien loin!

Si on peut remercier la STM pour cette démarche, il faut aussi savoir qu’il reste du chemin à faire, notamment avec les données en temps réel. Là encore, on peut regretter une absence de concertation entre les agences. La STL a d’ores et déjà opté pour une solution alors que la STM est actuellement en appel d’offre pour iBus (un système nettement plus complet que le suivi en temps réel) qui sera implémenté en 2014. Mais l’avantage des formats standards et ouverts, c’est que du moment que le format est respecté, peu importe comment on s’y rend!

Et la standardisation de la licence?

Principal bémol au tableau: les conditions d’utilisation. Tout comme pour les formats, il existe de quelques standards de publication des données (principalement la ODbL) ou à tout le moins de guides. Malheureusement, comme bien des acteurs, la STM a choisie d’appliquer des conditions faites maison. Selon LiberTIC, ces conditions violent plusieurs principes de base des données ouvertes. Mais surtout ces conditions rendent difficiles et hypothétique l’intégration de ces données: on y parle d’inscription obligatoire (qui n’est pas implémenté d’ailleurs, de suspension de compte discrétionnaire et de règles d’utilisation tout sauf claires.

La normalisation des formats de données permet, en théorie, d’utiliser les données de manières automatisée du moment que l’emplacement des données est connu. Cependant, ceci n’est possible que si on a un certain degré de confiance qu’on a le droit de le faire. En faisant appel à des licences standards, les développeurs d’application peuvent rapidement comprendre ce qu’ils peuvent faire ou non (les licences ouvertes faisant suite à Creative Commons ayant fait de nombreux efforts pour être accessibles au commun des mortels). A contrario, des conditions d’utilisation impliquent quasiment de faire appel à un avocat pour chaque nouvelle licence, surtout si on est une entreprise qui veut développer un modèle d’affaire sur des données de ce type. Au total on retombe, au niveau légal, dans le piège que l’on essaie d’éviter au niveau technologique en faisant de la standardisation.

Les citoyens-bidouilleurs n’hésitent pas à se faufiller dans les zones grises, mais pour une entreprise en développement, la question est nettement plus délicate. Si elle aboutit à une condamnation, la poursuite intentée par Poste Canada contre Geolytica pourrait rendre le monde beaucoup plus précautionneux, au détriment de l’innovation.