lundi 30 mai 2011

Le calendrier des événements touristiques

Summary: keeping a calendar of tourism information uptodate can time consuming, A calendar need to be updated quickly with information coming from different sources, often at the last time. In the same time, e-tourists wish to access a convenient search interface.
This article points to an online demo which analyses full text event descriptions and transform them into calendar entries ...and viceversa.  
"Ca serait bien que les internautes puissent choisir une date et avoir la liste des manifestations correspondant à cette date sur mon territoire."

C'est simple, un formulaire pour que l'agent saisisse les événements, un champs de saisie pour que l'internaute indique la date, et le tour est joué.

Il faudra probablement affiner un peu, voire beaucoup : la manifestation doit commencer avant la date indiquée ou le même jour, se terminer après ou le jour même, les marchés tous les dimanches, mercredi et jours fériés nécessitent qu'on se penche un peu sur la question, de même que les tous les premiers dimanche de mai à septembre ...

Tout cela nécessite un petit travail d'analyse en amont, le format Tourinfrance fournit des indications sur la façon de représenter ces données, qu'il faut savoir prendre en compte... ou pas, en fonction de la réalité du territoire.

"Ah oui, mais des événements, on en a beaucoup, ça change tout le temps, les organisateurs du concours de pétanque nous donnent l'information au dernier moment, il faut qu'on puisse saisir l'information le plus rapidement possible, voire simplement copier/coller l'email que l'on vient de recevoir."

Aïe, le cercle, et sa quadrature, pointe son nez ! Structure des données vs saisie libre, autrement dit information structurée vs information non-structurée(i) . D'un coté, les événements sont décrits "en texte libre", venant de sources différentes, sans normalisation, et de l'autre, on souhaite proposer à l'internaute une recherche par date (voire par type d'événement, par lieu, ou autres critères...).

Une solution réside peut être dans les travaux de recherche d'un jeune doctorant, Charles Teissedre, qu'il poursuit dans le cadre de son contrat CIFRE avec Mondeca.

Il a en effet conçu et développé un programme qui analyse les descriptions d'événements, et en extrait les dates, heures. Le programme est bilingue et comprend l'anglais et le français.

L'interface de démonstration propose de saisir un texte et d'en obtenir l'analyse. Une zone de texte permet de saisir une phrase (en français ou en anglais selon le choix que l'on a fait) et un simple clic met à jour le calendrier. On peut également exporter un fichier rdf qui montre l'analyse effectuée.

Les résultats de la phrase de démonstrations sont assez bluffants :
Open Monday to Friday, 9am through 6pm. Latenight thursday until 10pm,

A tester directement sur http://client2.mondeca.com/AccessPeriodEditor/.

A vos claviers !


(i) on pourra lire "Valorisation de l'information non-structurée" à télécharger ici

Aucun commentaire: