Aide:Recherche avancée
Fonctionnement détaillé de la recherche interne
Le moteur de recherche interne est Cirrus Search. Un « index » de la base de données est créé et mis à jour très régulièrement, et la recherche porte sur cet index. En créant l'index, certaines parties sont ignorées, d'autres sont converties (accents, majuscules, translittérations) ; les mots et les nombres sont séparés et indexés. Lors de la recherche, le moteur trouve les pages correspondant aux critères puis les trie en leur attribuant un « score ».
Contenu ignoré
Lors de la construction de l'index pour la recherche, l'intégralité des titres et du contenu des pages est inclus, sauf :
- Les noms de modèles (mais leurs paramètres sont inclus) ;
- Les paramètres des images comme
thumb
ou200px
(mais la légende et le nom de l'image sont inclus) ; - Les URL des liens externes (utiliser Spécial:Recherche de lien pour les chercher) ;
- Le code XML ;
- Les paramètres des tableaux.
Lexémisation
Les mots, lors de la construction de l'index, sont lexémisés, c'est-à-dire réduits à l'état de radicaux[1]. Ceci permet de rechercher les formes infléchies des verbes et des noms assez facilement, de même que les féminins et les pluriels. Exemple : chercher « aimé
» cherchera également les formes « aimée », « aimés », etc. La forme recherchée a toutefois priorité dans les résultats.
Il est possible de préciser que l'on veut le mot exact, en l'encadrant de guillemets droits doubles comme ceci : "aimé"
.
Restreindre la recherche
Rechercher dans un titre seulement
Le filtre intitle:expression
restreint la recherche aux pages contenant dans leur titre le terme indiqué.
Les redirections dont le titre correspond au terme sont aussi renvoyées.
Des expressions régulières peuvent êtres utilisées avec la syntaxe intitle:/regex/
.
La recherche est insensible à la casse, sauf en cas d'utilisation d'expressions régulières.
Recherche | Description | Trouvera |
---|---|---|
intitle:parc
|
Pages dont le titre contient le terme « parc ». |
|
intitle:"parc naturel"
|
Pages dont le titre contient l'expression exacte « parc naturel ». |
|
intitle:parc naturel
|
Pages dont le titre contient le terme « parc », ainsi que le terme « naturel » dans le texte ou le titre. |
|
intitle:parc OR intitle:naturel
|
Pages dont le titre contient le terme « parc » et/ou le terme « naturel ». |
|
intitle:parc -intitle:naturel
|
Pages dont le titre contient le terme « parc », et ne contient pas le terme « naturel ». |
|
intitle:parc*
|
Pages dont le titre contient un mot commençant par « parc ». |
|
intitle:parc~
|
Pages dont le titre contient approximativement « parc ».
Voir mw:Help:CirrusSearch#Words,_phrases,_and_modifiers pour plus de détails sur l'opérateur |
|
intitle:/"parc-"/
|
Pages dont tout ou partie du titre correspond exactement, caractères spéciaux compris, à « parc- ».
|
|
intitle:/"parc-"/i
|
Pages dont tout ou partie du titre correspond exactement, excepté la casse (notez le /i à la fin), mais caractères spéciaux compris, à « parc- ».
|
|
intitle:/par[ck]/
|
Pages dont tout ou partie du titre correspond au motif de l'expression régulière « /par[ck]/ ».
|
|
intitle:/par[ck]/i
|
Pages dont tout ou partie du titre correspond au motif de l'expression régulière « /par[ck]/i ».
|
|
Discussion: intitle:"parc national" intitle:/\/Article de qualité/
|
Affiche toutes les sous-pages « /Article de qualité » de l'espace de noms Discussion: (propositions au label Article de qualité), dont le titre contient le terme « parc national ».
|
|
Modèle: intitle:/\/Documentation\/./
|
Recherche toutes les sous-sous-pages de documentation (cas particuliers) dans l'espace de noms Modèle: .
|
|
Rechercher dans des pages commençant par...
Le mot-clé « prefix:
» permet de rechercher un mot seulement dans les pages dont le titre commence par ce qui suit « prefix:
». Exemple : rechercher « chicon prefix:Wikipédia:Le Bistro
» recherche toutes les pages dont le titre commence par « Wikipédia:Le Bistro » et qui contiennent le mot « chicon ». Fonctionne aussi avec « endive », « pain au chocolat », etc.
Rechercher dans un espace de noms
Pour chercher une page dans un espace de noms donné, utiliser la syntaxe suivante :
- Rechercher «
Utilisateur:Truc
» pour trouver toutes les pages contenant « Truc » dans l'espace « Utilisateur: ». - Pour chercher dans plusieurs espaces de noms, les séparer avec une virgule : rechercher «
Utilisateur,Aide,Discuter:Machin
» va trouver les pages contenant « Machin » dans les espaces Utilisateur: Aide: et Discuter:. - On peut aussi utiliser les numéros des espaces de noms, entre crochets : rechercher «
[1,2,4]:machin
» va trouver les pages contenant « machin » dans les espaces Discuter: (1), Utilisateur: (2) et Wikipédia: (4). - On peut utiliser des raccourcis[2], comme «
wp:machin
» pour «Wikipédia:machin
». - Le préfixe « tous: » sert à rechercher dans tous les espaces de noms en même temps (on peut aussi utiliser « tout: » ou « all: »[3]) ; exemples :
«tout:trucmuche
»
«all:trucmuche
».
Sans précision, la recherche porte sur les espaces de noms que vous avez défini dans vos préférences, onglet « Recherche ». Pour les utilisateurs non enregistrés, la recherche ne porte, par défaut, que sur les articles (espace 0). Vous pouvez aussi utiliser les cases à cocher en bas de page.
Rechercher dans un modèle de contenu
Le mot-clé contentmodel:
permet de restreindre la recherche à certaines pages techniques, en indiquant un modèle de contenu (contentmodel).
Exemple : all: contentmodel:"sanitized-css"
permet de rechercher, dans tous les espaces de noms, toutes les feuilles de style en cascade (CSS) gérées par l'extension TemplateStyles (extension permettant l'ajout sécurisé de feuilles de style aux modèles).
Les différents modèles de contenus existants sont disponibles sur mw:Content_handlers/fr.
L'outil de recherche avancée
L'outil est accessible par la page Spécial:Recherche.
Après avoir effectué une recherche infructueuse grâce à la boîte de recherche située en haut à droite, une nouvelle page apparaît ; cliquez sur « Recherche avancée », le haut de la nouvelle page qui apparaît est représenté dans la copie d'écran ci-contre.
Cet outil permet de rechercher des informations dans différents espaces de noms, sans avoir à taper l'espace de noms dans lequel on souhaite rechercher le document. Pour cela, il suffit de cocher les espaces de noms dans lesquels on souhaite effectuer la recherche.
Combiner tout ça
Il est possible de combiner tout ça pour faire des recherches vraiment poussées. Par exemple, « chicon AND endive intitle:juin prefix:Wikipédia:Le Bistro
» (soit toutes les pages du bistro d'un mois de juin contenant à la fois endive et chicon), ou encore « incategory:"Naissance en 1922" intitle:Smith
» (tous les Smith nés en 1922).
Les catégories
Recherche d’une catégorie
Il existe plusieurs méthodes et plusieurs outils pour rechercher une catégorie.
- La catégorie d’accueil est l’équivalent de la page d’accueil pour les catégories. Elle présente une série de catégories clés pour faciliter la navigation.
- Une catégorie peut être trouvée via l’habituelle fonction « rechercher » située en haut à droite de chaque page : il faut faire précéder sa recherche du suffixe « Catégorie: ».
- Dans le moteur de recherche avancé de Wikipédia, vérifiez que la case « Catégorie » est bien cochée, puis recherchez la catégorie que vous désirez.
l'Arbre des catégories
- L'outil Spécial:ArbreCatégorie permet de connaître facilement toutes les sous-catégories d'une catégorie donnée (voir ci-contre)
Incategory
On peut limiter la recherche à une seule catégorie, en utilisant le préfixe « incategory: »[4], suivi du nom exact de la catégorie. Par exemple, rechercher « Smith incategory:"Naissance en 1723"
» trouvera les pages contenant « Smith » (dans le titre ou le contenu) et se trouvant dans la catégorie Naissance en 1723. Le nom exact de la catégorie doit être utilisé (le mieux étant de le copier-coller).
Avec les opérateurs (« AND » et « OR »), il est possible de croiser des catégories : « incategory:"Bateau des années 1960" OR incategory:"Bateau des années 1970"
» trouve les bateaux construits dans les années 1960 ou 1970.
Recherche croisée
- (fr) « incategory » (voir ci-dessus) : « incategory » se contente de comparer les catégories principales qui ont été spécifiées, ce qui oblige à agglomérer manuellement les sous-catégories avec des "OR" ( « ou » logique).
- (fr) « CatScan2 »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?), outil de recherche d'articles par croisement de leur classement. Il est plus complet mais plus complexe. On peut croiser une catégorie avec un modèle, en fonction de la date, en incluant ou excluant des catégories, etc.
Voir le mode d'emploi sur Meta.
Recherche dans le wikicode
Il est possible d'effectuer une recherche dans le wikicode des pages avec la commande insource:expression
. Des expressions régulières (regex) peuvent aussi être utilisées.
Attention : Une recherche de ce type est très lente et demande beaucoup de ressources aux serveurs, il est donc fortement recommandé de restreindre d'abord le périmètre de la recherche dans la mesure du possible. Cela peut être fait en rajoutant un mot ou un terme comme parc
qui est présent dans le code des pages voulues ou, par exemple, via hastemplate:"Infobox Île"
, qui n'effectuera la recherche précisée avec insource:expression
que dans les pages contenant le modèle {{Infobox Île}}.
Recherche | Description | Trouvera |
---|---|---|
hastemplate:"Infobox Île" insource:"statut parc"
|
Recherche de mots, insensible à la casse, les caractères spéciaux sont ignorés et considérés comme des espaces. |
|
hastemplate:"Infobox Île" insource:/"statut=Parc"/
|
Recherche le texte exact indiqué, espaces et caractères spéciaux compris, sensible à la casse. |
|
hastemplate:"Infobox Île" insource:/"statut=parc"/i
|
Recherche le texte exact indiqué, espaces et caractères spéciaux compris, insensible à la casse. |
|
hastemplate:"Infobox Île" insource:/statut *= *\[?\[?[Pp]arc/
|
Recherche le texte correspondant à l'expression régulière (regex) indiquée, sensible à la casse. |
|
hastemplate:"Infobox Île" insource:/statut *= *\[?\[?parc/i
|
Recherche le texte correspondant à l'expression régulière (regex) indiquée, insensible à la casse. |
|
Il est préférable d'utiliser, dans la mesure du possible, les variantes sensibles à la casse (/
au lieu de /i
à la fin), qui sont plus rapides.
Particularités avec les expressions régulières
Les séquences d'échappement \n
(nouvelle ligne) ou \r
(retour chariot) ne sont pas prises en charge (cf. mw:Help:CirrusSearch/fr#Regular expression searches). Pour rechercher une nouvelle ligne, il est possible de se servir d'une classe de caractères négative ([^...]
) afin d'exclure tout ce que l'on ne veut pas.
Par exemple, pour rechercher dans l'espace de nom Modèle:
les palettes de navigation avec des retours à la ligne entre la fin de la palette et la balise <noinclude>
(ce qu'il faut éviter), il est possible d'utiliser la recherche suivante, avec très peu de faux-positifs : modèle: intitle:"Palette" insource:/\}\}[^{}\[\]<>|]+\<noinclude\>/
Recherche par moteur externe
Quand la recherche interne ne donne pas les résultats souhaités, utilisez un moteur externe. Ces moteurs n'apparaissent que si vous avez activé JavaScript dans votre navigateur. Voici une brève description de quelques moteurs proposés :
- Google est le moteur le plus utilisé actuellement.
- Bing est le principal concurrent de Google.
- Yahoo! est un autre concurrent de Google.
- Exalead dispose d'une fonction spéciale pour Wikipédia. Il permet de prévisualiser les pages trouvées, il extrait les mots-clés et les catégories (visibles dans le cadre de droite), et permet des recherches avancées de façon intuitive.
- Wikiwix est un moteur conçu spécialement pour Wikipédia. Il permet de chercher facilement des images, dispose d'une fonction « Atlas » et peut extraire les mots-clés, les catégories, les portails, les liens externes de Wikipédia, les interprojets. Il est le plus prompt pour la mise à jour de son index : 10 minutes.
Si ces moteurs peuvent donner des résultats plus pertinents que la recherche interne, ils ont aussi leurs limites : leur index peut mettre plusieurs semaines avant d'être mis à jour ; leur algorithme de classement est rarement public ; et ils ne « lisent » pas la syntaxe wiki, uniquement le rendu final, contrairement au moteur interne qui analyse le code wiki et permet donc la recherche par catégories ou par espace de noms, prend en compte les redirections, etc.
Le moteur que vous avez utilisé en dernier sera retenu grâce à un cookie (à condition, bien-sûr, que vous ne les ayez pas proscrits dans les préférences de votre navigateur ou une extension de ce dernier, comme pour javascript) : ainsi, quand vous vous rendez sur la page de recherche, vous n'avez plus qu'à cliquer sur « Rechercher » pour utiliser votre moteur favori.
Il existe encore d'autres possibilités : d'autres moteurs généralistes existent (voir Métamoteur) et des outils spéciaux pour Wikipédia existent aussi (voir l'encadré « Autres outils » en haut de la page de recherche).
Références
- L'algorithme détaillé se trouve sur cette page.
- Administrateurs : ils sont définis dans MediaWiki:Searchaliases.
- Administrateurs : cet alias est défini dans MediaWiki:Searchall. Mettre chaque alias sur une nouvelle ligne.
- Administrateurs : on peut définir des alias dans MediaWiki:Searchincategory, chaque alias sur une nouvelle ligne. Ne pas utiliser « catégorie », qui serait en conflit avec le préfixe pour cet espace de nom.