Identifier la date de publication d’une page ou d’un site web

Lorsque l’on navigue sur le Web et que l’on découvre de nouvelles ressources, on s’interroge souvent sur leur date de mise en ligne, a fortiori lorsque l’on souhaite communiquer sur ses découvertes… Si ces questions trouvent aisément des réponses sur les blogs ou les sites d’actualités, qui indiquent en général la date de publication des billets et articles, il est en revanche plus difficile de savoir quand a été lancé un site web, lorsqu’aucune information n’est donnée dans la rubrique «A propos…». Nous verrons dans cet article un certain nombre de méthodes et astuces qui, si elles ne fonctionnent malheureusement pas pour tous les sites, peuvent néanmoins s’avérer efficaces dans de nombreux cas, et peuvent aider à se faire une idée de la date – même approximative – à laquelle a été lancé un site, ou ajouté une page. Nous avons identifié trois méthodes susceptibles de donner des indications sur la date de mise en ligne d’une page ou d’un site web. Chacune de ces méthodes possède des atouts et des limites, et il est souvent nécessaire de tester plusieurs de ces pistes pour recouper les informations obtenues. Nous illustrerons les résultats que peuvent donner ces pistes en tentant de répondre à la question «à quelle date (approximative) a été lancé le site de FLA Consultants, accessible à l’adresse www.fla-consultants.com ?».   En naviguant sur le site de FLA Consultants, on trouve dans la rubrique Nous connaître >Nos consultants > François Libmann, dirigeant de FLA Consultants des informations sur la date de création de la société (1977), mais rien n’est indiqué sur la date de lancement du site web. Des premières indications sur cette date pourront être obtenues via les bases whois. Interroger une base «Whois» Consulter les «Archives» du Web On signalera enfin qu’il existe des extensions Firefox permettant de simplifier l’interrogation de ces deux outils. Après l’installation du plugin SEOpen (seopen.com/firefox-extension/) par exemple, il suffit d’un clic droit sur une page web pour ouvrir, dans une nouvelle fenêtre, les résultats d’une recherche sur cette page dans une base whois (DomainTools.com) et dans Archive.org. La recherche par date des moteurs Si Google est capable, dans certains cas, d’identifier la date de mise en ligne d’un site ou d’une page, les informations proposées ne sont néanmoins pas toujours exactes. Les différents tests que nous avons effectués nous montrent en effet que : Google a souvent une très bonne réactivité, et pour de nombreux sites, la date indiquée correspond – à quelques jours près – à la date de création du nom de domaine, telle qu’elle est mentionnée dans des bases whois telles que Domaintools.com ; lorsque le site a connu une refonte majeure, la date indiquée est celle de la mise en ligne de la nouvelle interface ; il peut donc y avoir des écarts très grands avec la date de première mise en ligne du site. Une recherche sur l’adresse «www.fla-consultants.com» par exemple, avec comme période «depuis 01.01.2001», nous indique comme date de lancement 22 novembre 2011. Or, le site a été lancé en octobre (ou novembre) 2002.  La date indiquée par Google est en fait celle du lancement de la troisième version. Une information qui vient compléter les renseignements trouvés dans les bases whois et dans Archive.org… lorsque le site contient des articles clairement datés, cette date est quelquefois prise en compte par Google dans l’estimation de la date de mise en ligne.Bases Publications a ainsi lancé en avril 2012 le blog Bases-Netsources.com, qui contient les articles de Bases et de Netsources de plus d’un an (voir Netsources n°97). Sous chaque article, figure la mention du numéro et de la date à laquelle l’article a été publié (sous forme papier), comme par exemple «Publié dans le n°86 de Netsources (Mai/Juin 2010)». Dans ce cas, la date indiquée par Google n’est pas la date de mise en ligne de l’article sur le Web, mais sa date de publication sous forme papier ; pour un article paru dans le n°86 de Netsources par exemple, Google indique 15 juin 2010. En revanche, les pages de présentation du blog sont correctement datées du 18 avril 2012 (date de mise en ligne). A condition de rester vigilant et de recouper les informations (en interrogeant les base whois…), on peut donc utiliser ces méthodes de façon efficace, pour connaître la date de mise en ligne d’une page ou d’un site. On signalera enfin que cette recherche de date de publication peut être demandée à Google directement depuis la page de résultats, sans utiliser la colonne d’outils, en saisissant directement à la fin de l’URL la commande « &as_qdr=y15 » (le 15 signifiant « depuis 15 ans »). Béatrice Foenix-Riou Publié dans le n°99 de NETSOURCES (Juillet-Août 2012)