Recherches sur Internet : Y a-t-il une vie sans Google
Secteur Veille de l’ADBS – Matinée du 4 décembre 2013 |
Pour sa dixième manifestation, le secteur Veille et recherche sur Internet de l’ADBS a organisé un atelier sur la thématique « Recherches sur Internet : Y a-t-il une vie sans Google ? Quelques pistes pour les professionnels de l’information ».
Preuve que cette question est au cœur de nos problématiques, la manifestation – gratuite mais réservée aux adhérents de l’ADBS – a fait salle comble, et a rassemblé près de 110 personnes, dans l’auditorium de l’Ifag.
La matinée, qui était animée par Nathalie Douville (SNCF), était construite autour de deux conférences :
– j’intervenais en première partie, avec un panorama d’outils de recherche disponibles gratuitement sur le Net, offrant une part importante d’informations scientifiques en accès libre ;
– Marie-Madeleine Salmon, de Publicis, présentait quant à elle différentes méthodes qui permettent aux professionnels de l’information de créer de la valeur : recherche dans les grands serveurs professionnels et dans des bases de données quelquefois gratuites, etc.
L’objectif de ces deux conférences était de fournir aux professionnels un certain nombre de pistes, pour apporter la valeur ajoutée indispensable à leurs prestations de recherche d’informations, à l’heure où Google est devenu pour beaucoup synonyme de recherche sur Internet…
Recherche d’informations scientifiques : tirer parti des alternatives à Google
En matière de recherche d’informations sur Internet, interroger Google est aujourd’hui devenu le premier réflexe de la plupart des internautes (92% de parts de marché en octobre 2013, en France !).
Si ce moteur reste performant pour répondre à un certain nombre de questions, les professionnels de l’information ne peuvent s’en contenter, et fournir à leurs clients des réponses issues d’un outil qu’ils ont vraisemblablement déjà interrogé…
J’ai donc présenté un certain nombre d’alternatives à Google, dans le domaine scientifique et technique, en reprenant le fil conducteur adopté lors de mon intervention aux Journées du RNDH, mais avec un autre exemple, et davantage d’outils (le temps qui m’était imparti étant plus important ici…).
Pour éviter la longue énumération des alternatives, et donner plus de sens à la présentation, j’ai abordé le sujet par familles d’outils de recherche, à savoir :
1. les moteurs de recherche « verticaux », spécialisés sur la littérature scientifique
On trouve dans cette catégorie des moteurs qui possèdent leur propre index, réalisé essentiellement à partir de la littérature universitaires et académiques, dans tous les domaines : sites universitaires, archives ouvertes, mais aussi banques de données reconnues (Refdoc…).
Ils offrent le plus souvent des possibilités de recherche relativement sophistiquées. L’accès aux références bibliographiques est en accès libre, mais le document primaire est, selon les sources, gratuit ou payant.
On citera parmi ces moteurs :
le « Co-author Graph » de Microsoft Academic Search |
– Scirus.com, créé en 2001 par Elsevier, mais qui va malheureusement être abandonné en janvier 2014, faute d’avoir su se démarquer de ses concurrents ;
– Google Scholar, lancé par Google en 2004, qui représente l’un des principaux points d’accès à l’information scientifique et technique française. Son principal défaut est l’opacité de sa couverture…
– Microsoft Academic Search, lancé en 2009 par Microsoft. Malgré une couverture restreinte, il peut se révéler précieux pour identifier des réseaux de chercheurs, grâce à son outil de visualisation.
2. les portails scientifiques multidisciplinaires,
qui fonctionnent sur le principe du métamoteur et effectuent des recherches fédérées sur des bases de données et des portails scientifiques :
– Science.gov, lancé en 2002 par Science.gov Alliance, qui donne accès aux ressources scientifiques officielles américaines ;
– ScienceResearch.com, développé par Deep Web Technologies en 2005, dont la clusterisation des résultats, souvent très pertinente, peut aider l’internaute à affiner sa requête ;
– WorldWideScience, un portail mondial et multilingue d’accès à l’information scientifique, créé en 2007 par la WorldWide Science Alliance.
3. les moteurs de recherche multidisciplinaires sur les ressources en open access.
Cette famille regroupe à la fois :
– des moteurs personnalisables, réalisés avec Google Custom Search Engine (Google CSE), et qui indexent spécifiquement les serveurs d’archives ouvertes. On peut interroger ces outils en utilisant la syntaxe de Google (intitle:…), mais seules les 100 premières réponses peuvent être affichées :
– OpenDOAR, maintenu par l’université de Nottingham, qui est à la fois un annuaire des serveurs d’archives ouvertes (il en recense plus de 2200) et un moteur sur le contenu de ces archives ;
– ROAR, créé par l’université de Southampton, qui fonctionne sur le même principe qu’OpenDoar (il recense 3400 serveurs et permet de les interroger grâce à Google CSE) ;
– FreeFullPDF, développé par la société française Knowmade, qui interroge plus de 80 millions de documents PDF, issus de 15 000 sources scientifiques ;
– Jurn, réalisé en 2009, qui permet d’interroger plus de 4500 revues académiques en open access, en SHS ;
– des « moissonneurs OAI », interrogeant les serveurs d’archives ouvertes selon le protocole OAI-PMH (Open Archive Initiative Protocol for Metadata Harvesting) :
BASE (Bielefeld Academic Search Engine) |
– BASE, un moteur de recherche dédié aux ressources académiques, développé par l’université de Bielefeld ; donne accès à +50 millions de documents, via une interface très agréable offrant de nombreuses possibilités de recherche…
– OAIster, développé en 2009 par l’université du Michigan. Donne accès à plus de 30 millions de documents ;
– DOAJ : créé par la bibliothèque de l’université de Lünd. recense près de 10 000 revues scientifiques avec comité de lecture. Permet une recherche sur +5600 d’entre elles ;
– SOAJ, qui utilise la technologie Deep Web Technologies.
4. des moteurs de recherche spécialisés sur un domaine
L’offre étant très abondante, la présentation a été limitée à trois domaines, avec un outil par domaine :
– SHS : Isidore, l’accès aux données et services numériques de SHS. Mis en œuvre par le CCSD du CNRS. Moissonnage de +2100 sources : bases de données, revues scientifiques, etc.
– Biomédical : Quertle, un moteur lancé en 2009, qui utilise la sémantique dans ses algorithmes ;
– Economie : Econbiz : développé par la German National Library of Economics (ZBW). Interroge des bdd allemandes et internationales dans le domaine de l’économie ;
5. des moteurs de recherche spécialisés sur un type de document
Les exemples ont été limités à trois types de documents, avec pour chacun un outil :
– Thèses : Theses : moteur de recherche des thèses de doctorat français, lancé en 2011 par l’Abes. Signale près de 310 000 thèses, dont +25 000 disponibles en texte intégral ;
– Rapports : Lara : accès au texte intégral de +1900 rapports scientifiques et techniques français : rapports de recherche, d’activité, institutionnels…. Réalisé par l’Inist ;
– Brevets : Esp@cenet, bdd gérée par l’OEB. Accès gratuit à plus de 80 millions de documents brevets du monde entier.
Pour offrir un rapide aperçu de ces différents outils en un temps malgré tout limité, j’ai choisi de partir de la problématique « comment obtenir des informations scientifiques sur les airbags »(références bibliographiques, texte intégral d’articles, etc), et de simplement comparer la première page de résultats obtenue via Google et via les autres moteurs avec le mot « airbags » ; l’objet n’était pas ici de comparer les possibilités de recherche des outils, mais plutôt le type d’information obtenu…
On trouvera dans le support ci-dessous des copies d’écran des différents outils, en réponse à cette question. Ce support n’a pas été utilisé lors de la conférence, car je lui préfère le « direct live », mais il permettra à ceux qui n’était pas là de voir les points qui ont été abordés, et à ceux qui y étaient d’en avoir un rappel.
Il ne prétend pas toutefois à l’exhaustivité des sources.
Ma conférence avait comme objectif de proposer aux participants des pistes pour apporter de la valeur à leurs recherches d’information, en élargissant la gamme des sources interrogées.
Après un break sympathique de discussions autour de cafés, Marie-Madeleine Salmon a animé la deuxième conférence, en présentant des méthodes permettant aux chargés de veille de mettre en valeur leurs savoir-faire, au sein de leur organisation.
Comment créer de la valeur par des recherches d’information hors Google
Pour illustrer la valeur ajoutée que peut apporter le professionnel de l’information, Marie-Madeleine Salmon est partie d’une question-test et a présenté la méthodologie appliquée pour obtenir des réponses satisfaisantes.
Cette question, à laquelle Google était bien en peine de répondre, était celle de l’étude d’une génération, à savoir la génération des 40 ans, également dénommée « quadras », « quarantenaires, etc. L’objectif était d’identifier des informations permettant de mieux connaître cette tranche d’âge : attentes, consommation, enfants, investissements, etc.
Dans une question comme celle-ci, la première étape consiste à faire une étude du vocabulaire sur le sujet, à partir de différents outils comme le dictionnaire de synonymes du Crisco, le Reverso, etc..
Une fois le vocabulaire défini, vient la phase recherche, qui doit se faire sur des ressources que seuls les professionnels de l’information interrogent. Nombre d’utilisateurs finaux sont en effet « googleisés », et interrogent le moteur de recherche avant même de poser la question au service d’information… Il est donc indispensable de leur fournir des réponses qui ne seront pas remontées via Google…
Ces ressources peuvent être classées en trois familles :
1. les grands agrégateurs, qui permettent le plus souvent de repérer des travaux et articles sur le sujet, non indexés par Google. Sur cette question, on pourra interroger notamment :
– Europresse
– Pressedd
– Factiva
– LexisNexis
2. des plateformes bibliographiques, telles que :
– Generalis
– Delphes
– Cairn
3. d’autres types de plateformes, parmi lesquels
– Theses
– ReportLinker : un agrégateur d’études qui propose de faire des recherches sur des études en accès libre ou non ;
– Sofres.
La politique des éditeurs en matière de diffusion de contenus a permis le développement de multiples plateformes d’informations professionnelles.
Le professionnel de l’information et le veilleur se doivent de maîtriser la recherche dans ces plateformes, qui apportent une réelle valeur ajoutée à leurs prestations de recherche.
Cela étant, comme l’a justement souligné Marie-Madeleine, cette valeur ajoutée n’est pas toujours visible par les commanditaires.
Pour mettre en évidence la valeur du travail de recherche documentaire, il est nécessaire d’appliquer une politique de diffusion utilisant les techniques de communication.
Il faut mettre en valeur les informations, en mettant les informations en page, en facilitant leur lecture, en les diffusant auprès de cibles…
Ainsi, la qualité du travail et les fonctions d’un chargé de veille ont fondamentalement évoluées.
La valeur d’un chargé de veille tient avant tout à :
– sa maîtrise des différents systèmes d’information (moteurs de recherche et bases de données professionnelles) ;
– sa maîtrise du temps : savoir quelles ressources interroger selon le temps dont il dispose ;
– mais aussi sa capacité à communiquer sa valeur…
Au final, il est clair qu’il y a une vie sans Google, une vie permettant aux fonctions d’information – fonctions support dans les entreprise et les organisations – de faire monter en puissance les capacités de leur service, de créer de la valeur, et d’apporter une vraie valeur concurrentielle à leur entreprise…
Comptes-rendus des précédentes manifestations du Secteur Veille de l’ADBS :
– Les nouveaux métiers de la veille ; le cas des veilleurs en e-réputation (31 mai 2013)
– Quand le secteur Veille de l’ADBS partage des astuces et méthodes (mars 2012) ;
– Compte-rendu de la matinée « Réseau social d’entreprise » (novembre 2011) ;
– Riche rencontre pour les secteurs Veille et Education de l’ADBS (septembre 2011) ;
– Mettre en place une veille avec les outils du Web 2.0 (juin 2011)
– Des recherches boostées à Lyon (avril 2011)
Pingback: php bloginfo('name'); ?> php wp_title(); ?>