Présentation des corpus et méthodologie [Les variétés de français de l'Ouest canadien]

Présentation des corpus et méthodologie

Afin de démontrer que l'usage de [tʊt] est variable et qu'il obéit à des facteurs linguistiques et extralinguistiques, nous examinerons la forme à partir de trois corpus de français parlé au Canada : le corpus de Casselman (en Ontario), le corpus de Saint-Laurent (au Manitoba), ainsi que le corpus d'Edmonton (en Alberta). Arrêtons-nous un instant sur la composition de ces trois corpus.

Le corpus de Casselman (ON) est composé de 62 entrevues semi-dirigées d'environ une heure chacune, réalisées par une jeune femme native du petit village ontarien. Un premier sous-ensemble de 32 entrevues a été construit durant l'été 2009, à partir d'entrevues faites auprès d'adultes âgés de 21 à 60 ans. Un second sous-ensemble de 30 entrevues semi-dirigées faites avec des jeunes âgés de 15 à 20 ans fut complété durant l'été 2010. Chacune des entrevues a été effectuée chez l'interviewé, afin de faciliter le discours informel. Bien entendu, le corpus est stratifié :

- pour les adultes : sexe (hommes vs femmes)/âge (21 à 30 ans vs 31 à 50 vs plus de 50 ans)/classe sociale (ouvrière vs moyenne vs supérieure)/niveau de scolarité (secondaire vs collégial vs universitaire);

- pour les adolescents : sexe (hommes vs femmes)/niveau de scolarité (secondaire vs universitaire)/classe sociale (ouvrière vs moyenne vs supérieure).

Dans leur étude, Bigot et Papen (2012)^[1] ne se sont attachés qu'aux locuteurs adultes. Les résultats que nous verrons dans un instant ne portent donc que sur le premier sous-ensemble d'entrevues du corpus de Casselman (ON).

Le corpus de Saint-Laurent (MB), dont nous avons déjà parlé, regroupe un ensemble d'entrevues semi-guidées informelles d'une cinquantaine de locuteurs du français mitchif de Saint-Laurent (Manitoba), effectuées en 1987 par le Père Guy Lavallée. Les entrevues portaient surtout sur le vécu (actuel et passé) des locuteurs. La répartition des locuteurs s'est faite sur la base des facteurs suivants :

- l'âge : les locuteurs ont été stratifiés selon cinq tranches d'âge (très aînés : 81 ans et plus, âge d'or : 61 à 80 ans, adultes : 41 à 60 ans, jeunes adultes : 21 à 40 ans et jeunes : moins de 20 ans).

- le sexe : hommes vs femmes ;

- le statut économique et social (repris par l'acronyme SES) ancien ou actuel : chasseur/pêcheur/éleveur/ouvrier pour les hommes; ménagère/ouvrière/femme de ménage pour les femmes (que nous désignerons comme « cols bleus ») vs « cols blancs » : instituteur/institutrice, politicien, administrateur, fonctionnaire, etc.

La durée totale des enregistrements est d'un peu plus de 50 heures.

Enfin, comme nous l'avons mentionné dans l'étude précédente, les entrevues d'Edmonton constituent un sous-ensemble du corpus Papen-Rochet, comprenant à l'origine 108 entrevues de locuteurs d'Edmonton, 108 entrevues de Bonnyville et 108 entrevues de Falher. Toutes ces entrevues ont été réalisées en 1976 par le même intervieweur franco-albertain. Le corpus de locuteurs provenant d'Edmonton est composé de 25 entrevues semi-dirigées de jeunes adultes âgés de 16 à 24 ans, hommes et femmes. Les locuteurs ont été répartis selon les facteurs suivants :

- le sexe des locuteurs (hommes vs femmes) ;

- leur niveau de scolarité (S+ = plus de 12 ans de scolarité, S = entre 10 et 12 ans et S- = moins de 10 ans de scolarité) ;

- leur degré de restriction linguistique (restreint, semi-restreint et non-restreint).

Les corpus étant présentés, précisons maintenant nos variables dépendantes et indépendantes.

Notre variable dépendante est la variante [tʊt]. Son nombre d'occurrences sera donc comparé à celui des deux variantes standard « tout » [tu] et « tous » /tus/ (les formes féminines « toute » et « toutes » ont évidemment été exclues, car celles-ci se prononcent obligatoirement /tʊt/, que ce soit en discours formel ou informel).

Nos variables indépendantes sont nombreuses. Pour ce qui est des facteurs linguistiques, nous avons retenu la classification de Lemieux et al. (1985)^[2], celle-ci étant particulièrement claire et précise. Elle comprend les éléments suivants :

- PAM = Pré-article masculin + syntagme nominal (ex : tout mon courage/tous mes amis)

- PAML = Pré-article masculin + article les (ex : tous les gens étaient arrivés)

- AdvQMS = Adverbe de quantité + syntagme nominal singulier (ex : il achète tout du bon)

- AdvQMP = Adverbe de quantité + syntagme nominal pluriel (ex : il achète tous des bons billets)

- DEGM = Mot de degré + adjectif masculin (ex : il est tout content)

- ModT = Modifieur du pronom ça (ex : je comprends tout ça)

- ModC = Modifieur d'un complément (ex : c'est tout ce que tu veux)

- QMS = Quantificateur masculin singulier (ex : je l'ai tout fait)

- QMP = Quantificateur masculin pluriel (ex : je les ai tous vus)

- PRO = Pronom (singulier/pluriel) (ex : tous se sont fait piéger)

En ce qui concerne les facteurs extralinguistiques, nous nous baserons sur la stratification originale de chaque corpus.