Suivre la vie du site Firefox Lettre d'info SPIP
Notice légale et crédits | Membres

Cluster 14 | E.R.S.T.U.

Enjeux et Représentations de la Science, de la Technologie et de leurs Usages.

Elaboration et assimilation du savoir scientifique dans les structures de la langue et du discours

Opération de recherche

Responsable(s) : Françoise Boch, Agnès Tutin

Cette opération vise à rassembler des équipes rhônalpines de recherche autour de deux objectifs :

- Contribuer à une didactique du discours scientifique, en français langue maternelle, en français et anglais langue étrangère, en procédant à une description fine des caractéristiques linguistiques du genre.

- Exploiter les corpus d’écrits scientifiques dans le cadre des applications de traitement automatique des langues, comme la recherche d’information ou la construction d’outils d’aide à la rédaction. Dans cette double perspective, l’équipe réunie dans ce projet (cf. nom des participants ci-dessous) aura pour première tâche de constituer un large corpus de discours scientifiques en français et en anglais. Ce projet répond au besoin des chercheurs intéressés par le discours scientifique qui ne disposent actuellement d’aucune ressource textuelle contemporaine facilement exploitable. Plusieurs paramètres seront pris en compte dans la constitution du corpus :

- la discipline. Nous chercherons à déterminer les invariants et les spécificités des discours scientifiques dans différentes disciplines. Les disciplines suivantes seront intégrées : linguistique, économie, psychologie, sociologie, biologie-médecine, chimie, informatique. Les discours de vulgarisation scientifiques seront également intégrés dans le projet.

- le sous-genre. Le corpus comprendra non seulement des articles - le prototype des écrits scientifiques - mais aussi des résumés d’articles, communications dans des actes de colloques, des thèses, des rapports, des mémoires et des travaux d’étudiants. Des transcriptions de discours oraux (cours magistraux, conférences) sont également envisagées.

- le degré d’expertise du rédacteur. On pourra ainsi comparer les stratégies lexicales et énonciatives des apprentis chercheurs dans les mémoires, par rapport aux chercheurs confirmés dans des revues reconnues dans la discipline. Le corpus constitué fera 4 à 5 millions de mots.

Parallèlement, et cela constituera la deuxième grande tâche de cette opération, le corpus sera exploité du point de vue linguistique. Il s’agira de décrire les différents genres de l’écrit scientifique d’un point de vue énonciatif, lexical et syntaxique, de façon à étudier le positionnement et le raisonnement de l’auteur dans son texte, et de concourir à l’émergence de paradigmes scientifiques. La question du lexique méthodologique et celle des aspects énonciatifs propres aux écrits de recherche seront au centre de l’étude. Il y a en effet un enjeu important, en particulier du point de vue de la production, à entraîner les étudiants à maîtriser ces deux dimensions lexicale et énonciative (très liées dans les faits). Il est fréquemment demandé aux étudiants - francophones et non francophones - de rédiger un mémoire de recherche dans un domaine spécifique, voire, pour les plus avancés, de rédiger un article. La mobilisation de ce type de lexique relève de deux compétences complémentaires : il s’agit d’une part de connaître la phraséologie propre à ce genre d’écrits et les collocations que l’on y rencontre (faire une hypothèse, traiter des données etc.) ; mais il s’agit aussi d’être en mesure d’intégrer ces connaissances lexicales dans une compétence plus large, permettant au scripteur de se constituer comme auteur et d’adopter un point de vue, en se démarquant éventuellement d’autres positions tenues dans le champ scientifique considéré. Afin de compléter cette analyse du genre, et d’aider ainsi les chercheurs débutants à entrer dans l’écrit scientifique, le corpus sera également décrit du point de vue des traces de didactisation (reformulations, définitions etc.) qui sont inhérentes à ce genre. A côté des applications didactiques, des applications sont envisagées en traitement automatique du langage. Les études linguistiques réalisées doivent en effet permettre d’élaborer à plus long terme des aides à la recherche d’information, permettant de cibler des écrits scientifiques, par exemple des écrits comportant une approche nouvelle sur un aspect donné. Des outils d’aide à la rédaction, permettant d’observer des exemples en contexte et comportant des lexiques avec un accès onomasiologique, sont également programmés.

Plusieurs équipes rhônalpines seront impliquées dans ce projet :
-  Le LIDILEM de l’Université Grenoble 3 (Laboratoire de Linguistique et Didactique des Langues Etrangères et Maternelles, F. Boch, A. Tutin, C. Carras, C. Cavalla, G. Grossmann, I. Novakova, F. Rinck) coordonnera la constitution du corpus en français et s’intéressera du point de vue linguistique aux aspects énonciatifs, terminologiques et lexicaux.
-  Le CSRPC de l’Université Grenoble 2 (Centre de Sociologie des Représentations et des Pratiques Culturelles, M.-S. Poli) s’intéressera particulièrement aux écrits à dimension scientifique informative dans une approche transtextuelle.
-  Le GRESEC de l’Université Grenoble 3 (Groupe de Recherche sur les Enjeux de la Communication, V. Clavier) comparera les textes en sciences exactes et en sciences humaines et apportera son expertise en recherche d’information.
-  Le LLS de l’Université de Savoie de Chambéry (Langages, Littératures, Sociétés, J. Osborne, A. Henderson) travaillera principalement sur les écrits universitaires réalisés en L2 (anglais).
-  Le CRTT de l’Université Lyon 2 (Centre de Recherche en Terminologie et en Traduction, H. Béjoint, F. Maniez) traitera du lexique scientifique spécialisé, en particulier dans le domaine de la médecine.

Hormis la réalisation d’un corpus d’écrits scientifiques (dont une partie sera financée par un projet ANR piloté par le LIDILEM) incluant des corpus académiques oraux transcrits et les études linguistiques mentionnées, nous prévoyons de réaliser dans le cadre de ce projet un site web permettant de diffuser les corpus et les ressources lexicales développées. Nous prévoyons également une série de séminaires (5 à 6 séminaires par an) ainsi qu’une journée d’études annuelle qui donnera lieu à une publication.