Sommaire : L'apport des big data à l'étude de la différence d’âge au sein des couples - Plateforme, big data et recomposition du gouvernement urbain - Big data et pluralité des mesures de l’opinion sur le web - The Great Regression - Machine Learning, Econometrics, and the Future of Quantitative Social Sciences Lire la suite
Dans un texte introductif faisant le point sur le moment big data des sciences sociales, G. Bastin et P. Tubaro s'interrogent sur les effets des deux grandes révolutions qui se déroulent dans le domaine des données aujourd'hui : leur captation par des plateformes du web et l’irruption du machine learning dans leur analyse.
M. Bergström compare les résultats d’une enquête traditionnelle sur les préférences des hommes et des femmes en matière d’écart d’âge dans le couple à ses propres investigations dans les données du réseau social Meetic. Elle en déduit que l’écart d’âge favorable à l’homme dans la plupart des couples est le produit de stratégies masculines dont la sociologie rendait peu compte jusqu’ici et qui doivent interroger ses méthodes d’enquête sur un sujet aussi sensible.
À partir d’une enquête dans les milieux de la régulation du trafic urbain, A. Courmont compare deux mondes jusqu’ici séparés : celui de l’algorithme Waze fondé sur l’optimisation des temps de parcours de ses utilisateurs et celui des opérateurs publics chargés de répartir les automobilistes sur la voirie en fonction de contraintes techniques. Il note finement ce qui oppose ces deux mondes mais aussi les négociations qu’ils ont commencées pour « faire réalité commune ».
B. Kotras fait entrer son lecteur dans le marché de la mesure d’opinion sur le web. Les intermédiaires qui opèrent sur ce marché le font au moyen de techniques variées dont deux principalement se sont opposées dans les années 2000 : la première obéissait à un principe d’échantillonnage alors que la seconde, victorieuse, repose théoriquement sur une aspiration exhaustive du web. Les enjeux techniques, économiques, politiques mais aussi épistémologiques de cette opposition sont considérables.
J. Boelaert et É. Ollion proposent une plongée à la fois technique, historique et théorique dans le machine learning. À partir d’une comparaison entre différentes solutions d’analyse d’un même jeu de données sur les déterminants du salaire en Suède, ils mettent en évidence les apports et les limites de ces méthodes pour la sociologie.
M. Severo et R. Lamarche-Perrin font le bilan des études menées sur Twitter depuis une dizaine d’années et rattachent ces recherches à des conceptions alternatives de l’opinion publique. Ils présentent aussi les différentes méthodes employées pour extraire et analyser les données de la plateforme de micro-blogging.
Un autre ensemble de méthodes est présenté par J.-P. Cointet et S. Parasie qui s’intéressent au text mining comme moyen de faire accéder les sociologues aux masses considérables de matériaux textuels aujourd’hui à leur disposition ainsi qu’aux nouvelles méthodes importées de la science des données comme la modélisation thématique (topic modeling) ou les plongements de mots (word embedding).
Présentation Gilles BASTIN
Le moment big data des sciences sociales Paola TUBARO
De quoi l'écart d’âge est-il le nombre ? Marie BERGSTRÖM
L’apport des big data à l’étude de la différence d’âge au sein des couples
Plateforme, big data et recomposition du gouvernement urbain Antoine COURMONT
Les effets de Waze sur les politiques de régulation du trafic
Le tout plutôt que la partie Baptiste KOTRAS
Big data et pluralité des mesures de l’opinion sur le web
The Great Regression Julien BOELAERT
Machine Learning, Econometrics, and the Future of Quantitative Social Sciences Étienne OLLION
NOTES CRITIQUES
L’analyse des opinions politiques sur Twitter Marta SEVERO
Défis et opportunités d’une approche multi-échelle Robin LAMARCHE-PERRIN
Ce que le big data fait à l’analyse sociologique des textes Jean-Philippe COINTET, Sylvain PARASIE
Un panorama critique des recherches contemporaines