|
Note sur la recherche dans le corpus
Le mot est recherché dans le corpus suivant la méthode sélectionnée :
- chaîne littérale : la séquence de lettres est recherchée
telle qu'elle a été saisie.
- correspondance phonétique : le mot est d'abord converti en
sa représentation phonétique à l'aide d'un phonétiseur. C'est cette
représentation phonétique qui est recherchée, ce qui permet de ne pas
tenir compte de l'orthographe des auteurs.
- correspondance dialectale : le mot est converti en une
forme abstraite (lemme dialectal) qui neutralise la variation
dialectale du picard. Ceci permet de le retrouver sous d'autres formes
dialectales.
- expression rationnelle étendue : comme les deux
précédentes, cette option permet de chercher d'autres variantes, mais
en contrôlant leur étendue grâce à un langage de programmation
spécifique. Cette option est à réserver aux utilisateurs expérimentés.
Avertissement :Les
options 2 à 4 peuvent produire des résultats inattendus. Ceux-ci
peuvent être dûs à deux types de problèmes inhérents aux algorithmes
utilisés :
- « bruit » : la recherche retourne trop de résultats. Ceci
est particulièrement à attendre pour une recherche par correspondances
dialectales, car nous avons prévu de nombreuses variantes possibles.
Ex.: la recherche de "tchair" (tomber) retourne des occurences de
"coér" (encore), "quart", etc. (le système tend à ignorer les différences de voyelles).
- « silence » : la recherche ne retourne pas certains
résultats attendus. Ceci peut être dû, par exemple, dans une recherche
par correspondances phonétiques, à des graphies non conformes aux
règles du français. Ex.: la recherche de "keurir" (courir) ne retourne
pas la forme "ceurir" utilisée par certains auteurs, car elle est
interprétée comme [soerir].
Le
mot recherché (et ses variantes éventuelles) est présenté dans un
contexte de quelques mots avec mention de l'auteur. Le symbole
<p> représente un saut de paragraphe.
|