lundi 20 août 2012

Recherches

Parlons un peu des recherches que l'on peut faire avec notamment notre meilleur ami Google.

Le sujet du jour est ce qu'on appelle les "Google Dorks". Pour faire simple, il s'agit d'outils intégrés au moteur de recherche qui permettent d'affiner  une expression.

Par exemple, si vous recherchez le mot "gouvernement", il est probable que l'un des premiers résultats propose la composition de celui-ci.
Imaginons que, pour une raison quelconque, vous ne voulez pas que Google ramène les résultats propres à la composition gouvernementale, il faudra lors ajouter le signe moins : "gouvernement -composition". Et hop !
En bref, Google comprend les symboles "+" et "-" pour forcer la recherche ou non sur un mot.

Autre exemple, la recherche d'expression littérale. Si vous voulez que les résultats soient des sites dont le texte contient une expression précise, il suffit de saisir la-dite expression entre guillemets. Par exemple, si vous recherche l'expression suivante : "Ces artifices sont souvent faciles à repérer dans les horoscopes", vous tomberez sur un article de ce blog. En enlevant les guillemets, les résultats de la recherche seront totalement différents !

On peut aussi spécifier le nom de domaine sur lequel s'effectuera la recherche, au moyen de l'expression : site:<extension de domaine>. Si on reprend l'expression littérale recherchée ci-dessus, on peu ajoute run filtre pour ne voir que les site en .fr. L'expression de recherche est donc la suivante :
"Ces artifices sont souvent faciles à repérer dans les horoscope" site:fr
 Surprise, le résultat n'est plus le même ! En effet, ce présent blog possède une extension en .com (on passe par blogspot.com ... malgré l'affiche du site en .fr !), donc le filtre .fr empêche de le sélectionner dans les résultats !

Pour finir, on peut aussi rechercher sur le type de fichier. Vous avez sûrement remarquer qu'il arrive que Google retourne parmi les résultats des fichiers Word, PDF, Excel ... L'extension (au sens système) de ces fichiers est, respectivement, .doc, .pdf et .xls. On peut spécifier à Google cette valeur par "filetype:<extension>.
Ainsi, si vous recherchez un document contenant la phrase "taille des rosiers", ceci au format PDF uniquement, il suffira de saisir comme expression de recherche :
"taille des rosiers" filetype:pdf

Au final, pourquoi tout ceci ? Tout simplement pour rappeler qu'un moteur de recherche indexé, tel que Google, se charge de parcourir tout votre site pour permettre à ses utilisateurs des recherches au plus près de leur demande. Et par indexation, il faut bien comprendre TOUT ce qui est accessible par le moteur sur votre site.
Je vous laisse tester par exemple cette expression de recherche :  
"strictement confidentiel" filetype:pdf site:fr

En bonus, voici un lien vers un moteur de recherche un peu particulier, Wolfram Alpha
Vuos pouvez lui poser une vraie question (en anglais). Contrairement à Google qui ramène des pages web, Wolfram Alpha tente de vous fournir la réponse directement.
A titre de comparaison, essayez la recherche suivante dans les deux moteurs, pour avoir le taux de précipations en France pendant le mois d'avril 2012 :
"precipitation april 2012 France"


Quand Google retourne une série de sites évoquant vaguement le sujet, Wolfram Alpha indique directement le tableau des précipitations.

Aucun commentaire:

Enregistrer un commentaire