mardi 21 août 2012

GramLab Corpus Manager


Le consortium GramLab annonce la sortie de GramLab Corpus Manager, environnement open source pour la création de ressources dédiées à l’analyse de contenus


GramLab Corpus Manager est un environnement OpenSource gratuite dédié à la gestion des documents électroniques en vue de la création de ressources linguistiques pour le traitement automatique des langues. Cet environnement permet la collecte, la conversion, les recherche et l’extraction de documents présents en ligne ou sur le poste de travail.
GramLab Corpus Manager est un outil puissant qui permet d’initialiser le processus de création d’applications d’analyse de contenu. Il fournit aux linguistes et aux knowledge  workers la possibilité de créer et de maintenir des corpus documentaires,  étape essentielle à la création de grammaires d’analyse de textes libres utilisées dans des solutions de valorisation de contenu.
GramLab Corpus Manager est un des outils mis à disposition dans le cadre du projet GramLab, dédié à l’analyse de contenus et la valorisation de l’information numérique. Les champs d’application de ces outils sont variés, et vont du développement de solutions de recherche d’information, de gestion de contenu, ou de gestion de données Open ou Big data.
Le projet GramLab : Le projet GramLab a pour objectif de mettre à disposition des entreprises, et plus particulièrement des PME, des modules et des ressources Open Source et gratuites de Traitement automatique des langues. Le projet GramLab vise à fournir notamment :
-          GramLab IDE, environnement dédié à la création et à la maintenance de grammaires et de ressources linguistiques pour l’analyse automatique ;
-          des ressources linguistiques – corpus, grammaires et dictionnaires – d’exemple (GramLab linguistic Resources) ;
-          GramLab Annotators :  un annotator UIMA générique permettant d’intégrer les fonctions d’analyse linguistique dans un chaîne de traitement documentaire.
Le Consortium GramLab : le Consortium GramLab est composé de 4 editeurs, un laboratoire de recherche académique et une association professionnelle :
-          Actimos, éditeur de Wipolo, “the trip companion
-          Aproged, Association des professionnels pour l’économie numérique
-          Kwaga , éditeur d’une plateforme d’analyse sémantique des emails, fournisseur du service WriteThat.name
-          LIGM, Laboratoire de recherche public de l’Université Paris-Est Marne-La-Vallée
-          Lingway, éditeur d’un moteur de recherche et d’analyse linguistique
-          Qwam, fournisseur de contenu pour portail intranet d'entreprise et de solutions professionnelles de veille stratégique

GramLab Corpus Manager peut être téléchargé gratuitement depuis la forge GramLab Forge à l’adresse sourceforge.net/projects/GramLab/
Vous trouverez plus d’informations sur le www.GramLab.org et vous inscrire au programme de béta test.
Le projet GramLab est supporté par le fonds FEDER et a été labélisé par Cap Digital.

jeudi 29 septembre 2011

Des ordinateurs comprenants au service du tourisme

J'ai déjà eu l'occasion de parler ici d'un moteur d'analyse de calendriers touristiques : à partir d'une description en texte libre d'un événement, le moteur reconnaît les dates et les informations temporelles et est ainsi capable, notamment, de mettre à jour un calendrier automatiquement. L'intérêt d'un tel outil réside dans le fait qu'il associe facilité de saisie d'une part et facilité de consultation d'autre part.

J'aimerais aujourd'hui parler d'un moteur d'analyse de textes, à la fois proche et complémentaire de celui-ci. J'ai le plaisir, dans le cadre de l'APIL, de participer au projet Gramlab, qui a pour ambition de mettre des outils d'analyse linguistique à disposition des non-spécialistes (enfin, des geeks quand même). Ces outils sont, de plus, disponibles sous licence OpenSource.

Repérer les communes
Ce projet en est à ses débuts, une première version d'un premier démonstrateur est cependant déjà disponible en téléchargement. Ce CityAnnotator prend, justement, en entrée un texte libre d'événements touristiques (fourni par le Gal Othe Armance); y repère les noms de villes et retourne le code postal correspondant.

On voit bien l'intérêt d'un tel outil, notamment couplé à celui mentionné précédemment, car le nombre de fêtes, manifestations et autres festivités peut être important sur un territoire et tout ce qui permet de faciliter la mise à jour d'un calendrier tout en permettant une consultation aisée est le bienvenu.

C'est pas si facile !
Et la tâche n'est pas si triviale qu'il y paraît à première vue car, en s'y penchant un peu, on s'aperçoit que tout cela est fort ambigu.
Que penser de ces noms propres qui se prennent pour des noms communs, parfois avec une certaine poésie comme Contes, Folies, Racines, Feux, Fêtes, Val, et même .... Paris.
Que penser également de ces villes qui hésitent entre plusieurs départements : Lignière, c'est dans l'Aube, le Cher, le Loir et Cher, la Somme... et Auxon, l'Aube ou la Haute-Saône.. ?
Ou encore, et ils sont nombreux, de tous ces Saints qu'il faut savoir voir ?

A vous de jouer
Le moteur d'analyse est disponible actuellement en version Alpha que vous pouvez tester pour peu que vous ayiez de bonnes compétences en informatique.
A défaut, vous pouvez, par exemple, jouer au jeu des jumelages :

Pourquoi ne pas jumeler Bougon et Crèche, tous les deux dans les Deux-Sèvres, Sonchamp avec un des nombreux Villeneuve, Les Arcs avec La Flèche...
Avec quoi allez vous jumeler Piano (en Corse !) ?.

lundi 26 septembre 2011

La cartographie au service du e-tourisme : Lancement du portail Internet touristique du Groupe d'Action Locale Othe-Armance


Ervy le Chatel, le 22 Septembre 2011. Le GAL Othe Armance annonce le lancement officiel du portail Internet touristique Othe Armance en Champagne, fruit du rapprochement entre les offices du tourisme du Val d'Armance, du Pays d'Othe - Vallée de la Vanne et du Chaourçois, sous l'initiative et la coordination du Groupe d'Action Locale Othe-Armance.

Ce portail Internet offre aux touristes de précieux renseignements à l'échelle de 89 communes du sud-est de l'Aube, faisant la promotion de plus de 220 prestataires touristiques. Patrimoine, sport et loisirs, manifestations annuelles, produits du terroir, hébergement-restauration et informations pratiques y sont scrupuleusement répertoriés.

L'originalité de la démarche est la présentation des différents prestataires et activités touristiques sur une même carte interactive dès la page d'accueil, permettant un accès rapide à toutes les informations souhaitées.

Le GAL Othe-Armance met en œuvre le programme européen LEADER 2007-2013 qui vise à développer durablement le tourisme sur les Pays d'Othe et d'Armance.

L'ensemble des sites permet de constater que le patrimoine bâti en Pays d'Othe et d'Armance mérite la visite, et que de véritables trésors artistiques sont à l'abri d'églises non moins intéressantes. Les itinéraires découverte des musées, châteaux et moulins, le patrimoine naturel, les nombreux artistes mais aussi les bases de loisirs, les plans d'eau, les activités équestres, le quad et le paint-ball, le golf, le tennis, les plans d'eau et rivières où l'on peut pêcher, les circuits de randonnée ainsi que les produits du terroir invitent les touristes à venir découvrir et admirer les nombreuses spécificités du territoire Othe-Armance.