Un corpus, c’est quoi ? 🔎

Dihia Kaddour - Mis Ă  jour le 25/08/2023
corpus

D’accord, on y est encore, un autre de ces mots que tu as croisĂ©s Ă  l’universitĂ©, mais dont tu n’es pas vraiment sĂ»r de la signification : « corpus ». Pas de panique, tout va s’Ă©claircir. Enfin, si tu lis cet article ! On va tout te dĂ©voiler sur ce mot. Plus de problĂšmes, plus de soucis, on a concoctĂ© un petit guide pratique pour toi ! 😉 PrĂȘt ? C’est parti ! 🚀

quand tu découvres ton corpus...

Origine et histoire du mot ✹

Tout d’abord, jetons un coup d’Ɠil Ă  l’origine du mot « corpus ». Une chose Ă  savoir, c’est qu’il a traversĂ© un nombre impressionnant de significations diffĂ©rentes au fil du temps. Pour nos amis latins, ça voulait dire « corps, chair » (CicĂ©ron Nat. 2, 139) ; personne (Salluste C.33.2) ; cadavre (CĂ©sar G.2,10) ; ensemble de l’État (Tite-Live 1,17, 2).

đŸ«… Tu connais Justinien, l’empereur ? Eh bien, c’est sous son rĂšgne que le corpus juris civilis a fait son apparition. Tu te demandes peut-ĂȘtre ce que c’est. En rĂ©alitĂ©, c’est simplement un recueil qui rĂ©unit de lois civiles romaines en sept ouvrages. Mais devine quoi ? Le mot a encore Ă©voluĂ© dans ses significations et est devenu plus couramment utilisĂ© dans le sens chrĂ©tien latin de « hostie », du pain sans levain que l’officiant consacre pendant la cĂ©lĂ©bration de l’Eucharistie : 

✔ Corpus Deu (Mort Garin), dĂ©but du XIIIe siĂšcle,

✔ corpus Domini (Guiot, Bible, 1223) jusqu’au XVIIe siĂšcle.

C’est ainsi que le peuple appelle le pain Ă  chanter, sur lequel on peut faire la consĂ©cration.

Le dictionnaire de FuretiĂšre

1690

👉 Au milieu du XIXe siĂšcle, en Belgique, le terme « corpus » retrouve son sens de « collection de donnĂ©es ». Tu peux le trouver dans Corpus inscriptorium grƓcorum ainsi que dans le LittrĂ©, 1872-1877, un bulletin gĂ©ographique qui dĂ©crit une compilation d’inscriptions de l’AntiquitĂ©.

À lire aussi

DĂ©finitions 📚

Tu sais, on pourrait simplement te dire que le mot « corpus » signifie : « Recueil de documents relatifs Ă  une discipline, rĂ©unis en vue de leur conservation », selon le Larousse, un corps de texte, quoi ! Mais honnĂȘtement, c’est un peu trop simple, tu ne trouves pas ? En plus, le mot a plus d’une dĂ©finition, car il peut ĂȘtre utilisĂ© dans diffĂ©rents contextes, en fonction du domaine. Regardons de plus prĂšs quelques dĂ©finitions !

1ïžâƒŁ Recueil de piĂšces, de documents concernant une mĂȘme matiĂšre, les mĂȘmes rĂšgles.

Dans ce cas, « corpus » signifie principalement un ensemble de docs liés par leurs caractéristiques communes, comme le domaine, par exemple la littérature. Ainsi, un chercheur peut par exemple analyser une base de données, disons des livres portant sur la biologie ou la chimie.

2ïžâƒŁ AgrĂ©gat de textes qui tendent Ă  prendre l’aspect d’un tout cohĂ©rent.

Eh bien, pas grand-chose Ă  ajouter ici ! Un corpus peut ĂȘtre un ensemble de docs liĂ©s les uns aux autres, formant ainsi une entitĂ© globale cohĂ©rente.

3ïžâƒŁ Ensemble des Ɠuvres d’un Ă©crivain ou d’un peintre.

Imaginons que tu sois chercheur et que tu veuilles mener une Ă©tude sur les Ɠuvres de Victor Hugo. Eh bien, tu peux utiliser une liste de ses Ɠuvres d’une pĂ©riode prĂ©cise et les analyser. C’est ce que l’on appelle un corpus. Rien de compliquĂ© lĂ -dedans, n’est-ce pas ?

👉 D’autres significations comprennent :

  • Exercice matĂ©riel du droit dans le droit de la propriĂ©tĂ©.
  • Ensemble fini d’énoncĂ©s constituant un support.

Noémie

M2 en droit Ă  Assas

19€/h

Fanny

Ponts ParisTech

19€/h

Pierre

ESSEC

16€/h

Nicolas

CentraleSupélec

17€/h

Hugo

Insa Lyon

16€/h

Thibault

ENS Paris Ulm

20€/h

Emilie

Sciences Po Lyon

19€/h

Fabien

Télécom Paris

20€/h

Ton premier cours particulier est offert ! 🎁

Nos profs sont passés par les meilleures écoles et universités.

 

J’EN PROFITE MAINTENANT !

Types de corpus 📖

Tu sais, le mot « corpus » change de sens en fonction du contexte. Jetons un coup d’Ɠil sur quelques types de corpus ! 

Linguistique 🔠

Un grand domaine oĂč ce mot est utilisĂ©, c’est la linguistique. C’est normal comme les linguistes s’intĂ©ressent beaucoup aux corpus. Ils appellent ça « linguistique de corpus » et ça consiste Ă  crĂ©er des bases de donnĂ©es de textes.

â†Ș Par exemple, il y a une revue appelĂ©e CORPUS qui publie ce genre d’analyses. Ils ont fait une Ă©tude intĂ©ressante sur les discours de l’ancien Premier ministre britannique Tony Blair. Ils ont analysĂ© 237 discours provenant du site officiel de sa rĂ©sidence, 10 Downing Street.

GrĂące Ă  cette analyse, ils ont pu voir les changements dans le style et les thĂšmes des discours sur huit ans. Ça permet aussi de mesurer combien de mots diffĂ©rents Tony Blair utilise.

đŸ€— Bref, un corpus sert Ă  comprendre comment le langage est utilisĂ© dans diffĂ©rents contextes. Si tu n’as pas tout compris, un prof particulier peut t’aider avec ça !

À lire aussi

Apprends tout sur la morphologie linguistique 📚

LittĂ©rature 📕

En littĂ©rature, un corpus, c’est un ensemble de textes qui se ressemblent d’une certaine maniĂšre. Ils peuvent ĂȘtre diffĂ©rents : des extraits de livres, des poĂšmes, etc. Ils se ressemblent peut-ĂȘtre par le thĂšme (amour, aventure…), par l’Ă©poque, ou mĂȘme par le style.

đŸ€“ Un chercheur qui Ă©tudie un corpus en littĂ©rature va essayer de dĂ©montrer quelque chose. Par exemple, il peut montrer que les descriptions du corps dans les Ɠuvres d’un auteur sont plus dĂ©taillĂ©es que chez les autres Ă©crivains. En gros, on essaie de faire des dĂ©couvertes Ă  partir de ces textes rassemblĂ©s.

Science đŸ§Ș

Un autre endroit oĂč on utilise « corpus », c’est en science ! Ici, on Ă©tudie les faits et les chiffres. MĂȘme le langage, quand on l’analyse de maniĂšre scientifique, devient une science. Les corpus aident beaucoup quand on traite les langues naturelles avec des ordinateurs.

👉 Pour faire ça, les chercheurs doivent trouver des tendances et construire des groupes de mots. C’est ce qu’on appelle le traitement automatique du langage naturel. Savais-tu d’ailleurs que c’est une branche de l’intelligence artificielle qui veut aider les ordinateurs Ă  comprendre et Ă  utiliser le langage humain de façon plus naturelle ?

CaractĂ©ristiques du corpus ✹

Un ensemble d’Ă©lĂ©ments, quelle que soit sa nature, doit avoir des caractĂ©ristiques spĂ©cifiques pour ĂȘtre appelĂ© un « corpus ». Voyons ça rapidement !

Taille 📏

D’abord, un corpus doit ĂȘtre suffisamment grand pour ĂȘtre utile. Si tu veux Ă©tudier des documents et obtenir des chiffres et des rĂ©sultats fiables, il doit y avoir assez de choses dans le corpus pour en tirer des informations intĂ©ressantes.

â†Ș C’est important parce que si tu te bases sur juste quelques Ă©lĂ©ments, tes rĂ©sultats ne seront pas vraiment bons. Par exemple, pour faire un corpus sur une pĂ©riode donnĂ©e, il faut souvent utiliser des centaines de docs, voire plus !

un corpus infini

Langage đŸ—Łïž

Tu ne le sais peut-ĂȘtre pas, mais dans un corpus, tous les Ă©lĂ©ments doivent utiliser la mĂȘme langue, et pas plusieurs dĂ©clinaisons de cette langue. Par exemple, si tu veux Ă©tudier un corpus de langue française de France, tu ne peux pas mĂ©langer ça avec des textes en français canadien. Ça ne serait pas fiable pour en tirer des conclusions.

PĂ©riode ⌛

Une autre chose Ă  prendre en considĂ©ration, c’est quand les textes dans le corpus ont Ă©tĂ© Ă©crits. Tu sais, le français qu’on parle aujourd’hui n’est pas du tout celui qu’on trouvait dans des livres du XVIIe siĂšcle.

đŸ€· Et mĂȘme si tu regardes des textes qui datent d’il y a dix ans, tu verras que certains mots sont diffĂ©rents parce que les langues Ă©voluent. Donc, tu ne devrais pas mĂ©langer des textes qui ont Ă©tĂ© Ă©crits Ă  des Ă©poques trĂšs diffĂ©rentes.

Registre 📝

MĂȘme chose pour le registre ! Si tu veux Ă©tudier des textes scientifiques, tu ne peux pas en prendre d’autres de revues vulgarisĂ©es pour en tirer des infos sur la science. Ça ne marche pas comme ça. đŸ€·

👉 Imaginons que tu veux parler de sciences. Eh bien, tu ne dois pas prendre des textes qui parlent de tout et n’importe quoi. Ça ne serait pas correct pour tirer des conclusions !

Clémence

HEC Paris

21€/h/h

Thibault

ENS Paris Ulm

20€/h

Sophie

Sciences Po Bordeaux

12€/h

Noémie

M2 en droit Ă  Assas

19€/h

Fanny

Ponts ParisTech

19€/h

Simon

4e année de médecine

26€/h

Nicolas

CentraleSupélec

17€/h

Victor

ESCP

25€/h

Besoin d’un prof particulier ? ✹

Nos profs sont lĂ  pour t’aider Ă  progresser !

 

JE PRENDS UN COURS GRATUIT !

Les questions fréquentes

Le corpus, c’est un ensemble de textes ou d’articles que tu rassembles pour Ă©tudier un sujet. Ça t’aide dans un projet de recherche.

Comment présenter son corpus dans un mémoire ?

Dans un mĂ©moire, tu montres les ressources que tu as choisies pour ton projet. C’est comme un guide pour le jury qui les aide Ă  comprendre ce que tu analyses.

Pourquoi utiliser un corpus ?

On utilise un corpus pour avoir des exemples et des rĂ©fĂ©rences concrets Ă  Ă©tudier. Ça aide Ă  apprendre et Ă  montrer des preuves dans tes travaux pour plus de fiabilitĂ© et de prĂ©cision.

Comment constituer un corpus en linguistique ?

En linguistique, constituer un corpus, c’est rassembler des exemples de langage pour mieux le comprendre. Pour cela, tu choisis des Ă©crits, des discours, des conversations qui parlent du sujet que tu Ă©tudies. Ces textes peuvent ĂȘtre des extraits de livres, de journaux, de sites web, ou mĂȘme de conversations enregistrĂ©es.

Qu’est-ce qu’un corpus en didactique ?

En didactique, un « corpus » fait rĂ©fĂ©rence Ă  un ensemble organisĂ© de docs, textes, matĂ©riels pĂ©dagogiques ou Ă©lĂ©ments linguistiques. On le rĂ©unit dans le but d’Ă©tudier un aspect spĂ©cifique de l’apprentissage ou de l’enseignement d’une langue ou d’une matiĂšre.

 

Il est utilisĂ© dans la didactique des langues et des disciplines et il permet d’analyser comment les Ă©lĂšves utilisent les contenus d’enseignement et comment les enseignants prĂ©parent leurs cours.

Et voilĂ , tu sais maintenant tout sur le corpus ! Si tu as encore des questions Ă  nous poser, n’hĂ©site pas Ă  laisser un message ou mĂȘme prendre un prof particulier pour des conseils de mĂ©thodologie. đŸ§‘â€đŸ«

4/5 - (5 votes)

Ton premier cours est offert ! 🎁

+4,36 points sur la moyenne pour les Ă©lĂšves prenant des cours rĂ©guliers chez Les Sherpas ! 👇

Dihia Kaddour
Team Lead Édito
Hello, moi, c'est Dihia. Prof d'anglais à temps partiel et passionnée d'écriture, mon monde tourne autour des mots et de l'envie d'aider les gens. J'espÚre que mes articles te seront d'un précieux secours !

Laisse-nous un commentaire !

Des questions ? Des bons plans Ă  partager ? Nous validons ton commentaire et te rĂ©pondons en quelques heures ! 🎉

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Laisse-nous un commentaire !

Des questions ? Des bons plans Ă  partager ? Nous validons ton commentaire et te rĂ©pondons en quelques heures ! 🎉

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ebooks

Découvre nos ebooks

Découvre nos ebooks

Avoir confiance en soi, rĂ©ussir le bac, trouver son stage, gagner en productivité  À chaque problĂšme son guide pour progresser et devenir la meilleure version de toi-mĂȘme ! đŸ’Ș