Nous travaillons sur Québec Ouvert
Les données ouvertes, qu'est-ce que c'est?
Abonnez-vous au Google Groupe pour suivre les projets!

La semaine dernière, basé sur des données de la ville, un nouveau service en ligne pour les Montréalais a été lancé. Le développeur, Kent Mewhort, nous a contactés et nous avons pu en apprendre plus sur son projet en lui posant quelques questions. (Texte traduit de l’anglais par Montréal Ouvert).

Déchets Montréal, qu’est ce que c’est?

J’ai décidé de créer le site web de Déchets Montréal pour rendre les horaires des collectes d’ordure et de recyclage plus accessibles et dans un format compatible avec des calendriers fréquemment utilisé (iCal, Google Calendar et Outlook). Mon but est de faciliter la vie des citoyens montréalais en créant un outil qui peut servir d’aide-mémoire. Le projet sert aussi d’exemple de la possibilité d’ajouter une nouvelle valeur aux données de la ville lorsqu’elles sont rendues disponibles sans contraintes.

Quel a été le processus de développement?

Le développement du site a été un processus relativement facile. J’ai pu profiter de logiciels à code source libre et d’APIs ouvertement accessibles. Pour trouver les adresses dans la ville, j’ai utilisé le Geocoder API produit par Google. L’interface du site web est basé sur Drupal et le plugin à code source libre Calendar. Avec quelques ajustements mineurs, j’ai été capable d’afficher les horaires de collectes de déchets et de générer un fichier compatible avec les calendriers les plus fréquemment utilisés.

En ce qui a trait au format des données, que peut faire la ville pour encourager le développement d’applications comme la vôtre?

C’est formidable que la ville offre en ligne les données sur les ordures et le recyclage. C’est un excellent point de départ. Cependant, j’aimerais souligner l’importance de l’ouverture de données dans des formats qui peuvent être facilement lus par un logiciel. De loin, la partie la plus pénible du développement du site de Déchets Montréal a été la création d’un grattoir (ou « scraper » en terminologie informatique) pour traduire  les données affichées sur le site web de la ville dans un format utilisable. Pour la plupart des arrondissements, les horaires sont dans le format suivant :

Collection des déchets ménagers

La collecte a lieu tous les mardis et vendredis. Laissez les déchets à l’endroit approprié (sur le bord de la rue ou de la ruelle) entre 8:00 et 16:00 la journée même de la collecte.

L’information sur les différentes collectes – recyclage, déchets biodégradables et déchets encombrants – est aussi affichée sur la même page web. Il faut donc identifier et analyser chaque type d’horaire de collectes et les catégorisé par quartiers. Ensuite, il est nécessaire de créer un code spécifique correspondant aux différentes composantes du texte pour chacune des journées de la semaine. Dans certains cas, l’horaire des différentes collectes est présenté par date et non par journée de la semaine. Il est important d’analyser cette information présentée dans un format alternatif.

Et si l’information n’est pas mise à jour?

Ce qui est problématique, à part de ces complexités d’implémentation, c’est que le format d’horaires à base de texte sur le site Internet de la ville pose d’autres restrictions. J’organise toutes les données pour limiter la charge sur le serveur de la ville, mais il n’y a aucune façon de déterminer quand les données sont actualisées. Je dois régulièrement récupérer et ré-analyser les informations. De plus, en parlant de la charge du serveur, tout le monde est perdant si les développeurs doivent recourir à la gratture de texte. C’est un processus intensif de ressources sur mon serveur et cela implique une quantité importante de données à télédécharger du serveur de la ville.

D’autres enjeux concernant les données?

Le format actuel pose aussi des obstacles pour créer des services bilingues. Même si j’ai réussi à faire en sorte que la plupart du site est bilingue, les détails des horaires sont, en grande partie, seulement disponibles en anglais. Fournir ces détails dans les deux langues exigerait encore plus de grattage et d’analyse du texte dans chaque langue. Cependant, si les données étaient disponibles par l’intermédiaire d’un portail de données ouvertes et dans un format directement exploitable, la tâche serait beaucoup plus facile. Je pourrais alors simplement écrire le texte en anglais et en français et enficher les dates, les heures et les instructions spéciales.

Des derniers commentaires sur les données ouvertes et la ville de Montréal ?

Je suis encouragé de voir que la Ville de Montréal affiche de plus en plus des données en ligne… Maintenant nous avons seulement besoin de pouvoir y avoir accès dans des formats et sur un portail ouvert!

Est-ce que c’est un projet à code source-ouvert?

Oui, le code source est complètement disponible à http: // github.com/kmewhort/DechetsMontreal.

Les commentaires et les suggestions sont toujours bienvenues. Vos lecteurs peuvent me contacter en m’écrivant à l’adresse suivante : kmewhort@gmail.com

Le site web de DéchetsMontreal est http: //www.dechetsmontreal.ca

C’est excitant parce que malgré les barrières qui existent actuellement, les développeurs trouvent des façons d’ajouter de la valeur aux données de la ville et de créer des services pour le bénéfice des résidents de la ville. Merci Kent et nous espérons que la ville commence à faciliter le processus de développement d’applications comme la tienne.