Argumentaire
Des revues de sciences sociales les plus prestigieuses (Miguel et al., 2014) aux guides de bonnes pratiques (Ginouvès et Gras, 2018) en passant par les politiques publiques (PNSO 2, 2021 ; Feuille de route de la donnée, 2021), le mouvement d'ouverture des données de la recherche touche aujourd'hui massivement les sciences humaines et sociales (SHS). Tantôt “dirty word” (Mohr et al., 2016), tantôt élément majeur de l’avènement d’un quatrième paradigme, les “données de la recherche” jouent aujourd’hui un rôle de repoussoir autant que de parangon au sein des sciences humaines et sociales dans leur diversité. De fait, les matériaux de la recherche au sens large, et les méthodes choisies pour les constituer en éléments de preuve ou de sens, sont des lieux de la négociation de la légitimité épistémique des SHS.
Dans une perspective historique, une définition contemporaine de « la donnée » comme “unité de calcul minimal représentative du réel” et les méthodes computationnelles associées ne sont en réalité qu’un des avatars possibles de cette négociation. Un avatar qui s’inscrit dans une longue généalogie de légitimation des SHS par leur quantification-formalisation-computation (Desrosières, 1993 ; Wiggins et Jones, 2023 ; Geoghegan, 2023) et qui justifierait à la fois leur scientificité et les investissement financiers, notamment dans des infrastructures dédiées à l’accumulation, l’ordonnancement et l’analyse des données (cf. Zurbach, 2024 pour le pan le plus récent de cette histoire).
Les données de la recherche apparaissent alors comme un instrument de (dé)légitimation des SHS comme espace épistémique distinct en regard d’autres disciplines – les sciences naturelles, la médecine, l’ingénierie. Parmi les forces en jeu dans le travail de démarcation par lequel les sciences humaines et sociales, à un moment historique donné, se posent dans un rapport d'extériorité mutuelle, partes extra partes, vis-à-vis de disciplines voisines, les données de la recherche jouent désormais un rôle central. Cette dynamique caractérise également la différenciation dite interne aux SHS ainsi constituées en ensemble. La question de ce qui fait donnée devient donc, autant que celle des méthodes, des objets et des épistémologies, une des forces par lesquelles une discipline se démarque, s'individue et se légitime.
En effet, les disciplines scientifiques construisent et mobilisent différemment ce qui fait « donnée » dans leur cycle de production scientifique (Leonelli et Tempini, 2020), et ce qui s'y apparente, tantôt matériaux, traces, archives, sources ou mesures. L'hétérogénéité de la notion de « donnée » répond ainsi à celle des disciplines, c'est-à-dire à la différenciation synchronique et diachronique de leurs objets, de leurs méthodes et de leurs modes de véridiction. Cette différenciation dicte en partie le rôle et l'importance que chaque discipline accorde aux données.
Ainsi, « ouvrir » ses données en SHS implique aujourd’hui de réfléchir à la diversité des données produites et de leurs usages, d’une discipline à une autre (Cotte, 2016 ; Galonnier et al., 2019). Tout en gardant à l’esprit que cette diversité est l’expression d’un travail de démarcation et de (dé)légitimation des SHS à l’heure de l’ouverture des données (Levain et al., 2024).
Cette journée d’étude se propose d’aborder la question au croisement de perspectives historiques, sociologiques et philosophiques afin d’éclairer ce qui se joue dans le mouvement d’ouverture des données. Dans le cadre du projet ANR PaReDo et à l’appui de plusieurs intervenant·es, nous discuterons sur la place des « données » dans les processus de légitimation et de différenciation disciplinaire des SHS et au sein des SHS, en inscrivant le récent mouvement d’ouverture des données de la recherche dans une histoire plus longue de la datafication de ces pratiques.
Bibliographie
- (Cotte, 2016) Cotte, Dominique, « Les données de la recherche. Un objet de la recherche en sciences humaines et sociales ? », Études digitales, n° 2, 2016 – 2, Le gouvernement des données, pp.23-39.
- (Desrosières, 1993), Desrosières, Alain, La politique des grands nombres : Histoire de la raison statistique. La Découverte, 2010 [1993]. https://doi.org/10.3917/dec.desro.2010.01.
- (Galonnier et al., 2019) Galonnier, Juliette, Stefan Le Courant, Anthony Pecqueux and Camille Noûs, « Ouvrir les données de la recherche ? », Tracés. Revue de Sciences humaines, n°19, 2019, pp.17-33.
- (Geoghegan, 2023) Geoghegan, Bernard Dionysius, Code: From Information Theory to French Theory. Duke University Press, 2023.
- (Ginouvès, Gras, 2018) Ginouvès, Véronique et Gras Isabelle (dir.), La diffusion numérique des données en SHS - Guide des bonnes pratiques éthiques et juridiques. Presses universitaires de Provence, 2018.
- (Leonnelli, Tempini, 2020) Leonelli, Sabina et Niccolò Tempini (dir.), Data Journeys in the Sciences, Springer, Cham. 2020
- (Miguel et al., 2014), E. Miguel, C. Camerer, K. Casey, J. Cohen, K. M. Esterling, A. Gerber, R. Glennerster, D. P. Green, M. Humphreys, G. Imbens, D. Laitin, T. Madon, L. Nelson, B. A. Nosek, M. Petersen, R. Sedlmayr, J. P. Simmons, U. Simonsohn, and M. Van der Laan, « Promoting transparency in Social science Research », Science, n°343, pp. 30-31, 2014.
- (Mohr et al., 2016) Mohr, Alicia Hofelich, Bishoff, Josh, Bishoff, Carolyn, Braun, Steven, Storino, Christine and Lisa R. Johnston. “When Data Is a Dirty Word: A Survey to Understand Data Management Needs Across Diverse Research Disciplines.”. Bulletin of the Association for Information Science and Technology 42(1) (2016), 51–53. https://doi.org/10.1002/bul2.2015.1720420114
- (Rosenberg, 2018) Rosenberg, Daniel, « Data as word », Historical Studies in the Natural Sciences, n°48(5), 2018, pp.557–567.
- (Wiggins et Jones, 2023), Wiggins, Chris et Matthew L. Jones (2023), How Data Happened: A History from the Age of Reason to the Age of Algorithms, WW Norton.
- (Zurbach, 2024), Jonathan Zurbach, “Soutenir et améliorer la science”, Thèse de doctorat Université d’Avignon



