Big Data Measures of Well-Being: Evidence from a Google Well-Being Index in the US

Big Data & Bien-être

Algan Yann, Beasley Elizabeth, Guyot Florian, Higad Kazuhito, Murtin Fabrice, Senik Claudia. Working paper. 2015.

Nous avons construit un indicateur du bien-être individuel aux Etats-Unis en utilisant Google Trends (les tendances des recherches sur Google). L’indicateur est une combinaison des groupes de mots clés qui sont identifiés de manière endogène pour correspondre aux séries temporelles hebdomadaires des mesures de bien-être subjectives collectées par les études de Gallup Analytics. Nous montrons que ces données issues des Big Data peuvent être utilisées pour construire un modèle qui prévoit correctement les mesures de bien-être subjectives tirées des enquêtes classiques. Le modèle réussit à prédire l’évolution « hors échantillon » de la plupart des mesures de bien-être subjectives à l’horizon d’un an. Ce résultat ouvre la possibilité d’utiliser les Big Data comme un complément aux données traditionnelles des enquêtes pour mesurer et analyser le bien-être des populations très régulièrement et à un niveau géographique fin. Nous montrons que nous pouvons également exploiter les volumes de recherche sur Internet pour éliciter les principales dimensions de la vie qui sont associées au bien-être. Nous trouvons que les mots clés associés à la recherche d’emploi, la sécurité financière, la vie de famille et les loisirs sont les facteurs prédictifs principaux des variations du bien-être subjectif aux Etats-Unis. Cet article de recherche contribue au nouveau programme de recherche dans la sciences des données en montrant comment les Big Data peuvent améliorer notre compréhension des déterminants du bien-être des hommes.