scispace - formally typeset
Open AccessJournal ArticleDOI

Le logiciel Prospéro à l'épreuve d'un corpus de résumés sociologiques

Patrick Trabal
- Vol. 85, Iss: 85, pp 10-43
Reads0
Chats0
TLDR
In this paper, the authors discuss the analysis of a corpus of resumes from the first congres of l'Association Francaise de Sociologie (AFS) and propose a modele tentant de decrire les attentes d'un lecteur d'une proposition de communication.
Abstract
Le but de cet article est d'eprouver l'interet du logiciel Prospero pour l'analyse du corpus des resumes du premier congres de l'Association Francaise de Sociologie (AFS). Le logiciel etant construit principalement pour etudier des corpus de textes marques par des variations (en particulier dans les argumentations et dans le temps), nous avons considere ces resumes comme un dossier, c’est-a-dire comme un ensemble de textes marques par l'incertitude et les contraintes des auteurs proposant une communication dans un Reseau Thematique (RTF). Nous avons dans un premier temps montre combien les operations de codage, qui dans Prospero appartiennent au chercheur, sont decisives pour faire varier le niveau d'analyse et evaluer ses hypotheses. Dans un second temps, nous avons realise un modele tentant de decrire les attentes d'un lecteur d'une proposition de communication. Nous avons alors construit des categories, des collections et des etres fictifs afin d'eprouver ce modele. Le logiciel apparait dans ces conditions comme un outil permettant de reperer des proprietes singulieres du corpus (par exemple de discriminer l'usage d'une categorie ou d'une collection en fonction du RTF) mais aussi de pointer des textes atypiques qui invitent a reviser le modele. Enfin dans un troisieme temps, nous avons etudie la facon dont les auteurs se soumettent a une contrainte de proximite entre leur resume et l'appel a communication diffuse quelques mois plus tot par le RTF choisi. Cette approche montre que seuls certains reseaux font apparaitre une certaine unite en rassemblant des textes partageant des proprietes communes. A l'issue de ce travail qui permet de reperer quelques aspects interessants de la sociologie francaise, nous pensons surtout avoir montre l'interet et les limites de Prospero. Celui-ci est apparu comme un outil au service du chercheur permettant d'eprouver ses interpretations, ses hypotheses et ses modeles. Le logiciel serait encore plus utile si le corpus pouvait etre complete par des textes permettant d'obtenir une variation (notamment historique) et l'analyse de la production sociologique y gagnerait assurement.

read more

Content maybe subject to copyright    Report

HAL Id: hal-03016322
https://hal.parisnanterre.fr//hal-03016322
Submitted on 20 Nov 2020
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-
entic research documents, whether they are pub-
lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diusion de documents
scientiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Le logiciel Prospéro à l’épreuve d’un corpus de résumés
sociologiques
Patrick Trabal
To cite this version:
Patrick Trabal. Le logiciel Prospéro à l’épreuve d’un corpus de résumés sociologiques. Bulletin de
Méthodologie Sociologique / Bulletin of Sociological Methodology, SAGE Publications, 2005, 85, p.10-
43. �hal-03016322�

Le logiciel Prospéro à l'épreuve d'un
corpus de résumés sociologiques
Patrick Trabal
1 Lors du premier congrès de l’Association Française de Sociologie (AFS), fut distribué un
ouvrage contenant les sumés des 1068 communications annones dans quelque 43
réseaux thématiques
1
. Ce rassemblement apparaît comme une opportunité sans
prédent d’avoir un état de la sociologie fraaise, même si demeurent des incertitudes
quant à la représentativité de ce corpus par rapport à la discipline.
2 Voici, à premre vue, un corpus typique de ceux que l’on analyse à l’aide du logiciel
Prospéro : il s’agit d’un grand nombre de textes, tous écrits dans la même langue, par des
acteurs de la même discipline, partageant un vocabulaire et des concepts communs même
si leurs préoccupations diffèrent. On peut donc soumettre cet ensemble à des opérations
comparatives et faire apparaître des différences selon les auteurs ou leurs appartenances
institutionnelles, ainsi que des rapprochements autour de certains objets, certaines
questions, certains concepts. Deux propriétés fondamentales des ries textuelles à
l’analyse desquelles est voué le logiciel sont cependant absentes de cette collection de
résumés :
L’articulation autour d’un même objet ou d’une problématique commune aux différents auteurs,
sur la nature, l’importance, la réalité, les enjeux desquels on cherche à produire un accord :
en effet, Prospéro a vocation à aider le chercheur à identifier des propriétés sur des objets
d’alertes et de controverses, sur la construction des jugements et sur les argumentations
déployées dans des dossiers marqués par de longues séries de textes et de discours
hétérogènes
2
. Or, les résumés présentés au colloque de l’AFS, rédigés sans référence les uns
aux autres, ne visent pas à argumenter autour d’un objet de dispute, mais à présenter des
travaux réalisés séparément – qui plus est sous une forme résumée ou programmatique,
c’est-à-dire dans un format qui s’exprime notamment par une contrainte de longueur et se
prête donc peu au déploiement d’argumentations caractérisant les dossiers habituellement
étudiés à l’aide du logiciel.

L’épaisseur temporelle de la collection : nombreuses sont les fonctions du logiciel qui visent à
voir apparaître, disparaître ou se transformer des personnages et des objets dans le dossier dont
rend compte la série textuelle, et à décrire la façon dont les arguments y sont repris et
critiqués, les accords remis en question ou au contraire renégociés, les preuves rediscutées
ou stabilisées. Or, dans notre collection de résumés, la production des discours est non
seulement indépendante, mais en outre simultanée.
3 Que Prosro peut-il alors apporter au chercheur dés
ireux d’analyser ce corpus ?
3
Si l’on
veut mobiliser dans les meilleures conditions ce logiciel sur cet ensemble de textes, il est
cessaire de construire un objet se rapprochant de ceux qui préoccupent les
veloppeurs-utilisateurs de Prospéro. Dans cette perspective, on va regarder le corpus
comme un dossier, c’est-à-dire comme un ensemble de textes dans lesquels se discutent
des notions, s’opposent des points de vue et se déploient des argumentations.
4 Sans proposer une histoire de ce congs, il est san
s doute utile de préciser qu’il fut
pré de différentes réunions au cours desquelles des réseaux thématiques en
formation (RTF) furent constitués. En tenant compte de cette phase au cours de laquelle
les sociologues se sont regrous, on identifie un autre moment, antérieur à la rédaction
des résumés, celui qui a débouché sur la rédaction des « appels à communication » de
chaque RTF. On peut formuler l’hypothèse selon laquelle ces « appels » ont pesé sur les
sociologues dans la rédaction des résus sous des formes différentes. Il s’agissait en
effet de rédiger leur texte en s’ajustant au mieux à la présentation du réseau choisi pour
que la proposition de communication soit accepe. Même si cela n’est qu’une formalité
pour les sociologues confirmés, la soumission d’un texte dans un RTF, plutôt que dans un
autre où la même proposition aurait pu être acceptée, peut être sujette à des incertitudes
et à desenjeux. Ceux-ci peuvent porter sur la notorié du RTF, liée en partie aux
animateurs du groupe, ou sur le public escompté : faut-il assurer une communication
dans un RTF « l’on connaît bien les gens », ou faut-il au contraire essayer de se faire
connaître ou reconntre dans un réseau dans lequel il y aura X ou Y ? On peut donc
penser ce corpus comme un ensemble de productions d’acteurs tentant de franchir une
épreuve, de difficul variable selon les personnes, pour être retenus dans le seau de
leur choix. Joindre à ce corpus de résumés les appels à communication qui, pourrait-on
dire, les ont gérés, permet alors d’introduire une variabilité portant non seulement sur
la forme (le texte d’un appel à communiquer est di généralement de façon
œcuménique afin d’obtenir de nombreuses réponses), mais aussi sur le moment de
rédaction.
5 Nous chercherons donc à évaluer ces effets d’ajustement auxappels à communication – ce
qui nous conduira à recenser la proximité entre les différents textes – et, d’une façon plus
générale, à repérer les contraintes et les ressources des auteurs dans l’écriture de leurs
propositions. Mais auparavant, il semble utile de rendre compte du travail nécessaire
pour utiliser le logiciel.
Travailler avec le logiciel Prospéro
6 Le logiciel fonctionne à partir des textes en langag
e naturel. Parce que le chercheur
néficie des dictionnaires et autres ressources des précédents utilisateurs, l'on peut
imdiatement recenser des listes d'éléments présents dans le corpus. Notre attention
est alors pore sur les objets dont les poids sont importants. Le tableau des premiers
éléments de la liste des entités de notre série de résumés figure en annexe (Tableau 1). On

voit qu’il est avant tout question de travail, d’analyse et de sociologie… On pourrait se
contenter de noter cela, en remarquant que ces mots traduisent assez correctement notre
activi. Toutefois, il est clair que le mot « travail » peut intervenir dans des expressions
comme « sociologie du travail », expression que l’on peut construire pour la distinguer de
celle-ci : « travail en sociologie ». Cette activité de codage des expressions est une des
modalités centrales du travail avec le logiciel. Il fonctionne en effet sur l'ie selon
laquelle le chercheur doit assumer la responsabilité des opérations de codage et
d'interptation, et que ce travail se réalise tout au long de l'exploration du corpus et
non, comme le suggère une tradition de l'analyse des données, à l'issue du calcul
informatique.
Tableau 1 : Liste des 30 premières entités, obtenue avant la construction des expressions
ENTITE
Poids
Q:!Ja
d'occurrences)
travail
621
analyse
501
sociologie
382
processus
355
femmes
341
commwùcation
336
recherche
320
étude(s)
306
acteurs
306
question
271
formes
271
LA-FRANCE@
261
---i=e
iations
259
Jeunes
252
rapports
239
-· . -
. - - ---

Tableau 1 (suite)
7 Cette position, largement développée par Francis Chateauraynaud dans son ouvrage sur
Prospéro
4
, apparaît en rupture avec les attentes habituellement rées par
l'informatique. En effet, l'on attribue souvent à la machine une mission d'objectivation et
une capaci d'administration de la preuve. Cela revient sytriquement à assigner au
chercheur un rôle subalterne alors que plusieurs traditions (en particulier
comphensive, pragmatique, phénoménologique et ethno-méthodologique) invitent à
penser qu'il n'y a guère de textes sans lecteurs et de lectures sans interprétations.
Toutefois, confier au chercheur le soin de fixer ce qui fait sens, selon lui, dans un
ensemble de textes, ne conduit pas pour autant à une forme de relativisme. En effet, le
logiciel est un moyen d'éprouver ses lectures, d'en sugrer d'autres, de réformer les
interprétations qui ne résistent pas à la confrontation avec les éléments présents ou
absents dans le corpus, et de faire des exriences sur les textes pour enrichir l'analyse.
8 Inutile donc de mobiliser ici les algorithmes visant à établir des co-occurrences entre les
éléments du tableau 1 pour coder des expressions comme "sociologie du travail". Doter le
chercheur de cette capacité à coder "sociologie du travail" pose néanmoins une série de
problèmes. Il s'agit, à un premier niveau, de réserver le même sort à la "sociologie de
l'éducation", la "sociologie de la famille", la "sociologie des religions"… Pour s'assurer de
ne pas en oublier, on peut rechercher à l’aide de formules, des segments du type
< « sociologie » - quelques mots outils (comme « de », « du », « des », « de la ») – n’importe
quelle entité >. Dans le corpus des résumés du congs de l’AFS, cette requête donne 136
occurrences sous 57 formes différentes, présentées dans le tableau 2. Cette liste fait
apparaître que c’est la sociologie de la connaissance qui alise le meilleur score (19
apparitions réparties dans 11 textes), alors que la sociologie du travail n’arrive qu’en
deuxième position avec 15 occurrences
5
. D’une façon plus générale, si cette liste donne à
lire les principaux objets de la discipline (au moins pour les formes ayant reçu plus d’une
ETAT-CENTRAL@
233
TRA
V AILLEURS@
233
CHERCHEURS-ENSEIGNANTS@
229
ENFANTS@
227
LA-PLANETE@
225
construction
224
action
217
cadre
201
EUROPE@
196
objet
193
ECOLE@
189
..
vie
189
professionnels
186
production
184
rapport
183

Citations
More filters
Dissertation

Le commerce équitable à l'épreuve de la mode : Le rôle de la critique dans la formation des marchés

TL;DR: The role of the critique in the construction sociale des marches is discussed in this article, where the authors propose the notion d'entreprise de marche for decrire l'activite consistant a faire tenir dans un meme cadre le marche and la critique.
Dissertation

L'activité physique adaptée pour les personnes atteintes de diabète de type 2 : approche sociologique des "carrières de pratiquant d'APA" dans leurs relations avec la "trajectoire de maladie"

TL;DR: In this paper, a methodologie articule une observation de terrain avec 52 recits d'experiences of personnes atteintes demaladie(s) chronique(s), (dont 39 de DT2) who ont evolue dans de two dispositifs d’APA differents : l'un proposant des seancestheoriques d'information/explication (n=17), l'autre mettant en place des seances pratiques dans un cycle educat

Le résumé de communication comme objet sociologique

TL;DR: The first congres of the Association Francaise de Sociologie (AFS) was held in Villetaneuse, France, in 2004, with 1067 propositions of communication emanant of 920 premiers auteurs as discussed by the authors.
Journal ArticleDOI

Preliminary Co-Word Analysis of the 2006 Congress of the Association Française de Sociologie

TL;DR: In this paper, a premiere analysis des resumes de toutes les presentations faites au second congres de l'AFS a Bordeaux en septembre 2006 is presented.
References
More filters
Book

Les règles de la méthode sociologique

TL;DR: In this paper, the authors discuss the distinction between the normal and pathologique, and the distinction du normal and du pathologie. But they do not discuss the relation between normal and pathology.