Nov 022007
 

Paris, Statin RER B Denfert Rochereau, (c) Yves Traynard 2007Les moteurs de recherche ont constitué des bases de données gigantesques rassemblant une large part des pages accessibles sur internet. Leur existence nous est devenue tellement familière qu’on néglige de noter les adresses barbares des sites qu’on nous recommande puisque que trois mots-clefs bien choisis tapotés sur Google suffisent à les retrouver. Il est tentant d’exploiter toutes ces informations détenues par les moteurs de recherche. Voici deux outils publics qui s’y essaient.

  • Le Nébuloscope(*) analyse le contenu des pages pour en déduire des agrégats lexicaux,
  • Google Trends(**) partant des termes que nous formulons lors de nos requêtes permet une analyse comparative et chronologique de nos comportements de recherche.

Deux applications de ces outils en rapport à mon sujet.

Que recouvrent les notions de tourisme et de vacances sur le Web français ?

Nebuloscope du terme tourisme (c) Nebuloscope 2007Nebuloscope du terme voyages(c) Nebuloscope 2007A la lumière des nuages produits par le Nébuloscope, on peut déduire que le terme tourisme tel qu’il est utilisé dans les pages web renvoie aux vacances et à la France des régions (le Sud et la Bretagne en particulier) tandis que l’on parle plus volontiers voyages que tourisme quand on pense à l’étranger ; l’univers lexical s’enrichit alors de l’avion et de destinations phares telles que Tunisie et Maroc.
Autre constat, l’office de tourisme et l’agence de voyage semblent jouer un rôle lexical symétrique. Enfin en voyage le prix, les promotions, le discount, le dégriffé deviennent cruciales. Ce qui ne semble pas le cas du tourisme où l’offre est plus ciblée : gastronomie, restaurants, patrimoine, randonnée, importance de la découverte
Voilà des indications pour mieux définir ce que recouvrent ces vocables.

Quand nous préoccupons-nous du tourisme et des vacances ?

Jetons un œil cette fois sur les mêmes termes analysés par Google Trends. Que constate-t-on ? Nous tapotons ces termes sur Google :

  • Tous les ans aux mêmes périodes,
  • En juillet, mais peu en août, le pic de fin juillet retombant assez vite,
  • Peu en automne saison plus morte que l’hiver et le printemps,
  • Très peu le samedi,
  • Surtout le lundi et le mardi, peut-être pour chasser le blues du lundi.

Google Trends sur Tourism et holidays (c) Google Trends 2007Enfin on note sur 4 ans un affaiblissement sensible et continu du terme tourisme au profit de voyages. Le vieux débat de l’infâme touriste et du noble voyageur trouverait-il une issue ?
Si l’on applique l’analyse sur les USA par exemple (tourism, holidays) les résultats sont loin d’être identiques. Les vacances américaines sont une affaire d’automne par ex.

Vous voulez jouer vous aussi sur des termes qui vous sont chers ?
Foncez sur Google Trends et le Nébuloscope. Comparez par exemple les lexiques associés à Noël, l’Aid el-Kebir et Hannoucca comme le fait Jean Véronis sur son site ou devinez dans quel pays on se pose le plus la question du sexe sur Google et même dans quelle région de ce pays et à quoi correspond le creux annuel… Mais ne comptez pas en tirer de grandes théories.
Les multiples imperfections de nos langues pour nommer un concept (homonymie , synonymie, langues différentes…), l’inégale représentativité des pays sur internet, la distorsion entre contenu du web et réalité des termes obligent à la plus grande prudence dans l’exploitation des résultats. D’autant que les algorithmes au cœur des ces outils sont du plus grand secret et visiblement pour de bonnes raisons. Ces informations stratégiques en marketing sont hautement monnayables. Celui qui détient ces statistiques possède un peu la clef de nos désirs… de consommateurs. La valeur de l’action Google a été multipliée par 8 depuis son introduction en bourse en 2004… Allez rejouez-moi « foule sentimentale » d’Alain Souchon !


(*) Le Nébuloscope édité par Jean Véronis (animateur du blog Technologies du langage) avec Aixtal et dir.com, le moteur de recherche d’Iliad.
(**) Google Trends édité par Google.
Nota : Il existe de nombreux outils autour des contenus web. Voir le recensement de l’ADBS.