Recherche Éveillée Logo

Ensemble, récoltons
les informations justes

N98

 

Afin de favoriser le partage d’informations entre leurs adhérents, les trois secteurs «Veille et recherche sur Internet», «Coopération-Développement» et «Education-Enseignement» de l’ADBS ont organisé en juin dernier une matinée sur le thème «Quels outils de veille pour quelles pratiques ?».

Centrée sur les retours d’expérience, cette matinée avait pour objectif de permettre à des professionnels de l’information appartenant à des domaines divers, d’expliquer leur démarche dans la mise en place de leur veille et dans le choix des outils, et de présenter les atouts et limites des solutions choisies.

Nous tenterons dans cet article de mettre en avant le fonctionnement des différentes cellules de veille, tel qu’il est apparu dans les témoignages, et de confronter ce qui peut être fait –ou non – avec des outils de veille gratuits (agrégateurs de flux RSS comme Google Reader, outil de partage de signets comme Diigo…) et avec des plateformes payantes (AMI, Digimind, KBCrawl…).

HAUT

Du lecteur de flux RSS à la plateforme de veille AMI EI 6.0

Mathilde Fourquet, Arkema

Si Mathilde Fourquet occupe depuis peu le poste de Responsable Actionnariat individuel et information financière, auprès de la Direction Communication Financière d’Arkema, c’est de son expérience de chargée de veille stratégique et concurrentielle qu’elle était venue parler, poste qu’elle a occupé pendant plus de dix ans au sein du service InfoDoc d’Atofina d’abord puis, après la fermeture du service InfoDoc en 2007, auprès de la Direction Stratégie d’Arkema.

Depuis la fermeture du service InfoDoc, la fonction Veille chez Arkema est assurée par le réseau des professionnels de l’information. Il n’existe plus de structure dédiée à la l’information «business» au siège, les centres de recherche se chargeant de la veille scientifique. Il n’y a pas non plus de réelle fonction veille centralisée dans les Business Units.

Au sein de la direction Stratégie en revanche, le chargé de veille envoie quotidiennement des livrables de veille aux directions stratégie et communication financière (sept personnes) et réalise une synthèse hebdomadaire pour la direction générale et le comité exécutif (8 personnes).

Contrairement aux centres de recherche, qui accordent une grande importance à la veille brevets, la veille destinée à la direction générale couvre essentiellement l’actualité des sociétés (concurrents, clients, cibles d’acquisition, autres acteurs…) et des thématiques pouvant être stratégiques, opérationnelles ou sur les modes de gouvernance.

La mise en place de cette veille s’est faite en 2008 avec un agrégateur de flux RSS gratuit – Newzie –, qui permettait notamment de surveiller des pages web, et qui offrait un «tableau de bord» très convivial (voir Netsources n°67). Newzie a été remplacé en 2010 par RSSOwl, qui disposait de fonctionnalités supplémentaires dans le paramétrage des flux et permettait de mettre en place des filtres relativement puissants sur des mots, des balises meta, etc.

Mais les besoins en matière de veille ont peu à peu évolué d’une veille quotidienne vers une veille en temps quasi-réel, surtout après l’entrée en bourse d’Arkema en 2006. Les marchés financiers ont en effet fait basculer la demande vers le temps réel, les veilleurs devant être en phase avec les analystes, qui ont accès aux flux d’information de Thomson, Bloomberg, etc.

Les outils gratuits ont alors montré leurs limites, la principale étant que les filtres utilisés avec des agrégateurs de flux RSS ne se font que sur la source RSS (le plus souvent titre, URL, chapô) et non sur le texte intégral de la page ; des articles pertinents paraissant dans une source surveillée pouvaient ainsi ne pas être identifiés par l’outil.

Une étude a donc été lancée en 2011 pour choisir une solution ayant des fonctionnalités en termes de :

  • sourcing : identification automatique de sources, paramétrage de sources non RSS
  • crawling : afin de disposer de l’intégralité des contenus surveillés
  • capitalisation : pour conserver la base des informations identifiées et avoir la possibilité de rechercher sur le texte de l’ensemble des pages
  • et diffusion : interfaces personnalisées, livrables de veille

Après une analyse des offres des différents acteurs, c’est la plateforme AMI Enterprise Intelligence 6.0 (de AMI Software) qui a été choisie, pour plusieurs raisons :

  • AMI EI 6.0 est avant tout un moteur de recherche, qui a ajouté une approche orientée métier / processus de veille, ce qui correspondait à l’approche d’Arkema
  • le paramétrage des sources est transparent
  • il est possible d’interroger via AMI une base de données accessible avec mot de passe, et d’indexer les nouveaux résultats répondant à une question
  • la plateforme offre de nombreux traitements de l’information : tags, statistiques…

Dans un premier temps, c’est un fonctionnement en mode hébergé qui a été choisi, avec une seule licence administrateur veilleur et plusieurs licences lecteurs. Les centres de recherche auront la possibilité de se rajouter dans un deuxième temps. Après un an environ d’utilisation, le bilan dressé est le suivant :

  • le paramétrage de la plateforme est une étape exigeante qui a nécessité le transfert manuel de la centaine de flux RSS, la définition du plan de classement, des attributs, des statuts, des favoris…, le paramétrage des envois d’emails et des collectes, la création des portails personnalisés pour les différents clients, l’alimentation de la base des connaissances, etc.
  • la veille perd un peu en matière de «temps réel», de par les contraintes du crawling et le manque de tableau de bord très réactif ;
  • la recherche à géométrie variable est très puissante : sur les contenus capitalisés, tagués et classés, mais aussi sur l’intégralité des sources connectées, sur les bouquets de sources d’actualité fournis dans l’outil, etc. ;
  • l’analyse est facilitée par les statistiques, la représentation graphique, les tags et la base de connaissances ;
  • concernant les sources, l’outil offre une grande diversité dans les modes de connexion, mais le monitoring reste complexe ; l’importance est donnée aux informations et aux contenus des documents ;
  • la «prise en main» de l’outil est relativement lourde, de par la complexité des paramétrages et l’étape de structuration de la base ;
  • l’outil peut être utilisé en mode collaboratif, mais il est bien sûr nécessaire d’organiser les équipes et de définir des rôles. Il permet alors une bonne intégration de la veille et des analyses dans les processus de décision.

HAUT

La mise en place d’un dispositif de veille décentralisé avec Digimind

Cédric Joseph-Julien, Agence Française de Développement (AFD)

Établissement public, l’Agence Française de Développement (AFD) agit depuis soixante-dix ans pour combattre la pauvreté et favoriser le développement dans les pays du Sud et de l’Outre-mer. Elle met en œuvre la politique définie par le Gouvernement français.

Présente sur quatre continents où elle dispose d’un réseau de 70 agences et bureaux de représentation dans le monde, dont 9 dans l’Outre-mer et 1 à Bruxelles, l’AFD finance (au moyen de prêts ou subventions) et accompagne des projets qui améliorent les conditions de vie des populations, soutiennent la croissance économique et protègent la planète : scolarisation, santé maternelle, appui aux agriculteurs et aux petites entreprises, adduction d’eau, préservation de la forêt tropicale, lutte contre le réchauffement climatique…

Constituée de 1600 agents (dont 1000 au siège à Paris et 600 dans le réseau), l’AFD a besoin de mutualiser et de capitaliser ses connaissances. En effet, les chargés de mission, très autonomes en matière de recherche d’information, sont soumis à mobilité et changent de poste tous les trois ou quatre ans.

Responsable depuis 2009 du pôle documentation de l’AFD – qui se trouve au sein de la Division AGC (Appui à la gestion des connaissances) et comprend trois documentalistes et deux aide-documentalistes –, Cédric Joseph-Julien s’est vu confier en 2011 la mission de mettre en place un dispositif de veille.

L’activité veille existait certes déjà, mais elle était faite le plus souvent avec des outils gratuits et, faute de moyens humains et logiciels, ne permettait pas de répondre aux demandes des agences et des opérationnels. La solution choisie devait permettre :

  • de répondre aux besoins de veille de l’AFD
  • de gérer les flux d’information non structurés sur internet
  • de traiter de façon automatisée, structurée et efficace des tâches répétitives
  • d’orienter directement l’information vers l’utilisateur
  • et d’alimenter en information les agences du réseau.

La structure documentaire ne pouvant pas devenir une structure de veille centralisée, et les différents agents souhaitant par ailleurs s’approprier l’outil, le choix s’est porté vers une solution de veille décentralisée, permettant également de capitaliser les données.

Après un benchmark des solutions disponibles et à la suite d’un appel d’offres, c’est la plateforme Digimind qui a été retenue et paramétrée, afin de devenir «AFD Watch».

Le dispositif est le suivant :

  • l’administration de l’outil de veille est confiée à la cellule de veille de l’AFD, constituée du responsable du pôle documentation, d’un veilleur, du documentaliste juridique (appartenant à la division Juridique) et d’un chef de projet «assistance à maîtrise d’ouvrage» ;
  • dans le processus de mise en place du dispositif de veille, un sourcing a été réalisé avec les entités pilotes sélectionnées pour le projet. Il a permis de constituer un catalogue de 540 sources, structurées par type (presse, académique…), langue, thématique et zone géographique, de façon à faciliter la création de «packs de veille» (pour surveiller uniquement, par exemple, les sources institutionnelles, académiques et bancaires concernant le Brésil). 160 agents de surveillance ont été constitués ;
  • la cellule de veille administre la plateforme, intègre les sources et livre les tableaux de bord aux veilleurs ;
  • les veilleurs (une quinzaine, appartenant aux cinq entités pilotes) sont chargés de l’analyse des alertes ; ils centralisent les informations dans les dossiers d’un plan de classement, qui a été élaboré avec deux entrées : thématique et géographique ;
  • les analystes reçoivent les informations validées par les veilleurs, les traitent (ajoutent de commentaires…) et génèrent (automatiquement ou manuellement) des livrables (newsletters, rapports…) pour les clients internes et les décideurs. Le veilleur et l’analyste peuvent être la même personne.

La phase pilote se termine à la fin de l’été 2012.

Au final, la mise en place d’AFD Watch a pour objectif de doter l’AFD d’un outil permettant à la fois de réduire les risques (pour le suivi de la réglementation bancaire et juridique par exemple), de prospecter (détection des opportunités, etc.), d’aider à la prise de décision (suivi des actualités et analyses économiques sur les pays d’intervention), tout en capitalisant et en mutualisant les connaissances, de façon à faire profiter les autres agents de l’AFD d’une information validée.

Avec l’assistance de la maîtrise d’ouvrage, Cédric Joseph-Julien a calculé le ROI (retour sur investissement) d’AFD Watch, en fonction des besoins des entités pilotes, et du temps consacré auparavant à la recherche d’information. L’ambition est qu’AFD Watch permette aux agents de l’AFD de dégager près d’un tiers de leur temps pour des tâches à plus haute valeur ajoutée, mais également d’internaliser des produits de veille réalisés par des prestataires extérieurs.

HAUT

Utilisation de KB Crawl par la cellule de veille du CIEP

Héloïse Nétange, CIEP

Créé en 1945, le CIEP (Centre international d’études pédago-giques) est un établissement public national depuis 1987. Il est opérateur public des ministères chargés de l’Education et de l’Enseignement supérieur et fonctionne autour de deux pôles d’activité : l’éducation (enseignement général, professionnel et supérieur, reconnaissance des diplômes) et les langues (langue française, évaluation et certifications en français, langues étrangères et mobilité).

Pour mieux surveiller les opportunités de marché, une cellule de veille stratégique a été créée en 2007, au sein du centre de ressources, avec pour principales missions :

  • de repérer et diffuser les appels d’offres relatifs aux grands domaines d’expertise du CIEP : enseignement scolaire et supérieur, formation professionnelle, langue française à l’étranger et langues étrangères en France… ;
  • d’effectuer des recherches documentaires et des synthèses permettant aux chargés de programme de mieux connaître leur environnement (stratégies des bailleurs, des pays, des partenaires, etc.) ;
  • d’administrer la base de données d’appui à la réponse aux appels d’offres, qui rassemble les CV d’experts, les informations sur les partenaires potentiels, les projets remportés, etc..

En termes de sources d’information, la cellule de veille interroge (directement ou via un courtier) des bases de données payantes, et utilise KB Crawl pour surveiller de façon «semi automatisée» près de 300 sources nationales (sites gouvernementaux, journaux officiels…) et internationales (banques multi-latérales de développement, institutions communautaires, organismes des Nations Unies, etc.).

Les informations identifiées sont ensuite validées et enregistrées dans une base de données Cindoc, puis envoyées aux destinataires par CindocWeb.

Plusieurs raisons ont justifié le choix de KBCrawl :

  • la nécessité de disposer d’une veille quotidienne sur un grand nombre de sites, pas toujours équipés de flux RSS ;
  • la simplicité du paramétrage et la réception des alertes par email
  • la possibilité qu’offre KB Crawl d’indexer le Web invisible : il est possible d’interroger de façon automatisée des bases de données, accessibles avec mot de passe ;
  • la fiabilité de l’outil et son faible coût, en licence monoposte.

La surveillance est quotidienne, et génère environ 80 alertes chaque jour. La possibilité qu’offre KBCrawl de paramétrer des mots-clés, et de les surligner dans les résultats, est donc précieuse.

Les alertes sont envoyées par mail aux quatre veilleurs de la cellule, qui fonctionnent en alternance, pour éviter la discontinuité. Mais ces veilleurs disposent d’une boîte mail commune.

Les veilleurs effectuent une sélection dans les alertes, enregistrent les appels d’offres retenus dans Cindoc, et utilisent Cindoc pour envoyer les documents aux chargés de programme.

Le bilan de l’utilisation de KBCrawl est globalement très positif. Le paramétrage de la veille peut être affiné constamment, pour être en adéquation avec les besoins des départements. La V4 de KBCrawl s’avère très conviviale, même si certaines macros peuvent être difficiles à paramétrer sans assistance technique – et dans ce cas, le service assistance de KBCrawl se montre réactif–.

Néanmoins, si la formule choisie (logiciel monoposte) a pour avantage d’avoir un faible coût, elle présente le risque d’être liée à un seul poste (en cas de problèmes informatique…) ; pour pallier ce risque, une sauvegarde est faite manuellement sur un serveur.

KBCrawl a d’autre part décidé de privilégier désormais les solutions Saas (utilisation du logiciel par abonnement et accès distant) et a annoncé l’arrêt de la maintenance de la version monoposte pour 2014.

La nouvelle version sera plus complète … mais plus coûteuse. La question du choix de l’outil de veille se reposera alors.

HAUT

Quand Google Reader complète KB Crawl

Lynne Sergeant & Asuncion Valderrama, IIPE – Unesco

L’Institut international de planification de l’éducation (IIPE) a été créé en 1963 au sein de l’Unesco, pour améliorer la planification et la gestion des systèmes éducatifs en renforçant les capacités des pays.

Sa principale mission est donc d’aider les pays à développer leurs systèmes éducatifs, en formant des planificateurs et des gestionnaires de l’éducation. Mais entrent également dans ses activités la recherche – l’IIPE réalise des études de cas pour offrir aux décideurs des supports méthodologiques et techniques –, l’assistance technique et le partage des connaissances.

Au sein de l’IIPE, le centre de documentation, constitué de cinq personnes, est en charge de :

  • gérer la collection physique des ouvrages mis à disposition du personnel et des stagiaires ;
  • faire de la veille pour le personnel selon leurs thèmes de recherche («embedded librarian») ;
  • alimenter les bases de données et blogs gérés par l’IIPE, parmi lesquels le Catalogue du centre, Planipolis, ETICO, Clearinghouse sur le VIH et sida, le blog du centre de documentation et les plateformes Netvibes – trois dashboards Netvibes sont ainsi proposés, à Paris, en Argentine, et au Maroc.

La présentation de Lynne Sergeant et d’Asuncion Valderrama complétait parfaitement celle d’Héloïse Nétange, du CIEP, puisque les deux professionnelles ont expliqué pourquoi et comment, en complément de KB Crawl, le centre de documentation de l’IIPE avait décidé d’utiliser l’agrégateur de flux RSS Google Reader, notamment pour ses capacités de «taguage» et de diffusion.

Google Reader est utilisé ici uniquement pour les sites web qui contiennent un flux RSS, ce qui représente environ 200 abonnements.

Parmi ceux-ci, on trouve essentiellement les tables des matières de périodiques, les sites d’organismes (agences de développement nationales et internationales, ministères…), des sites de presse et des portails comme Eldis.org, Zunia.org, etc.

Le compte Google Reader a été mis en place il y a trois ans environ, et est partagé pour toute l’équipe. Chaque documentaliste trie entre 50 et 200 alertes par jour, et attribue des tags aux articles retenus. Un même flux peut être suivi par des personnes différentes (selon leur spécialité) et des personnes différentes peuvent taguer des articles pour un même projet ou utilisateur. Des mots-clés ont été définis pour les pays, les thèmes et les projets en cours, et les articles sont tagués avec ces mots-clés selon les besoins des pays, des chercheurs ou de la stratégie globale.

Cette solution a été choisie pour son côté «pratique», car elle permet par exemple de dépouiller et de classer aisément un grand nombre d’informations issues de la presse, sans utiliser de nomenclature ou de plan de classement. Pour le centre de documentation, Google Reader représente donc en quelque sorte «l’arrière cuisine» de la veille…

L’outil a également été choisi pour les options de partage qu’il propose.

Google Reader offre en effet la possibilité:

  • d’envoyer directement des documents par mail au(x) destinataire(s) de son choix ;
  • de créer un flux RSS à partir d’un tag, et de permettre l’abonnement aux nouveaux articles sélectionnés ;
  • de publier directement les articles tagués sur un site, que ce soit le blog du centre de documentation, les plateformes Netvibes, etc

L’usage de cet agrégateur par l’équipe évite ainsi la duplication entre collègues et offre la possibilité d’utiliser une même information de différentes façons. Il permet d’avoir une veille plus approfondie, et complète les informations fournies par KB Crawl, qui a été mis en place pour surveiller plus spécifiquement les sites des ministères et Etats membres (qui n’utilisent pas les flux RSS).

Le principal problème – c’est l’inconvénient des outils gratuits – réside dans la dépendance des évolutions de Google Reader.

La nouvelle version de Google Reader, lancée en novembre 2011, a ainsi vu un certain nombre de fonctionnalités de partage disparaître, pour favoriser la diffusion des informations vers Google+. S’il est toujours possible de créer un flux RSS pour un dossier regroupant plusieurs flux (ou de partager les résultats sur une page), en passant par l’option «Créer un thème», Google Reader ne propose plus de créer directement un flux RSS pour un tag donné ; les flux RSS précédemment créés fonctionnent en revanche toujours.

Des astuces existent cependant pour pallier cette disparition, mais nécessitent l’utilisation d’applications spécifiques, comme GreaseMonkey.On trouvera p.9 la description de l’une des astuces, trouvée dans le blog Bibliothèques [Reloaded].

HAUT

Les pratiques de veille 2.0 au sein de la Délégation générale à l’Outre-mer

Christelle Chetkowski, DéGéOM

La dernière intervention de la matinée était celle de Christelle Chetkowski, responsable du Pôle documentation de la DéGéOM (Délégation générale à l’Outre-mer), qui a présenté les différents outils gratuits que son équipe (trois personnes) utilisait, pour effectuer quotidiennement une veille collaborative à destination des 150 agents et du cabinet ministériel.

Christelle Chetkowski avait déjà eu l’occasion de présenter ses pratiques lors d’un précédent atelier organisé par le secteur veille de l’ADBS, et nous nous en étions fait l’écho dans l’article «Mettre en place une veille avec les outils du Web 2.0 : quelques retours d’expérience», paru dans le n°93 de Netsources (juillet/août 2011).

Nous ne reviendrons donc pas sur le détail de son intervention, mais nous évoquerons simplement le dispositif qu’elle a mis en place pour la veille, dispositif qui a d’ailleurs légèrement évolué depuis l’article précédent :

  • un dashboard public Netvibes a été créé et rassemble les flux RSS des sources d’actualité du domaine, classées dans une quinzaine d’onglets. Si la veille se faisait au départ depuis ce dashboard, celui-ci est depuis devenu uniquement un espace «vitrine» ;
  • les documentalistes effectuent aujourd’hui leur veille essentiellement à partir de Google Reader, qui rassemble environ 140 abonnements ;
  • un plugin FirefoxUpdate Scanner – est utilisé en complément, pour effectuer une veille sur les sources non prises en compte par Google Reader ;
  • 30 à 50 articles sont sélectionnés chaque jour et sont sauvegardés dans un groupe privé diigo ; trois groupes ont été créés et concernent la veille quotidienne, la veille bibliographique et les revues de sommaires. Les articles retenus sont «tagués» avec le nom du destinataire et sont envoyés quotidiennement par email, grâce à la fonction «Generate Report» de Diigo. Des fils RSS sont par ailleurs générés à partir des groupes Diigo et alimentent le portail Netvibes.
HAUT

Ces différentes interventions illustrent la diversité des pratiques de veille dans les entreprises.

Des solutions gratuites existent et peuvent se révéler efficaces ; mais alors, la veille se fait quasi-exclusivement sur les sources gratuites du Web visible et nécessite le plus souvent l’emploi de différents outils.

Le veilleur est d’autre part soumis au «bon vouloir» de l’éditeur du logiciel ou du service utilisé, qui est susceptible de changer brusquement de politique et de décider :

  •  de rendre payant ce qui était jusqu’alors gratuit ; c’est ce qu’a fait par exemple Diigo pour certaines de ses fonctionnalités, comme la surbrillance, la fonction cache…, aujourd’hui proposées sur une version payante ;
  • de supprimer certaines fonctionnalités, comme la génération d’un flux RSS à partir des tags, dans Google Reader ;
  • voire de disparaître, ou de mettre fin à son service.Google a ainsi annoncé la fermeture du service iGoogle –concurrent direct de Netvibes – en novembre 2012. Le moteur laisse ici le temps à ses clients de trouver une solution de remplacement, mais ce n’est pas toujours le cas.

Et une disparition brutale peut s’avérer dramatique pour une entreprise, si elle n’a pas sauvegardé régulièrement les flux suivis…

Parallèlement aux outils gratuits, de nombreuses plateformes de veille existent.

Leurs fonctionnalités, comme leur gamme de prix, sont ici très variables, certains outils étant spécialisés sur la surveillance des pages et sites web (ajouts, modifications…), d’autres apportant une aide au veilleur tout au long du processus de veille (sourcing, collecte, analyse, diffusion…).

En permettant de confronter des usages souvent différents d’un même outil, mettant en avant leurs atouts et leurs limites, les matinées d’échanges et de retours d’expérience, organisées notamment par l’ADBS et ses différents secteurs (manifestations gratuites, et réservées aux adhérents) trouvent ici toute leur richesse.

Béatrice Foenix-Riou

Publié dans le n°98 de NETSOURCES (Mai-Juin 2012)