Note! Apply link will take you to an external website.

Stage - Analyse statistique de données de santé (H/F)
Withings, France

Experience

1 Year

Salary

0 - 0

Job Type

Work Study Job

Job Shift

Morning Job

Job Category

Science

Traveling

Career Level

Non-Managerial

Telecommute

Qualification

As mentioned in job details

Total Vacancies

1 Job

Posted on

May 10, 2021

Last Date

Jun 10, 2021

Location(s)

Castries, France

Job Description

Chez Withings, nous souhaitons redonner aux individus le contrôle de leur santé.

Nous avons l’obsession de créer des produits beaux et intuitifs, afin que chacun puisse les utiliser facilement au quotidien; nos balances connectées, montres hybrides, tensiomètres, moniteurs de sommeil et tous les dispositifs de notre gamme sont aujourd’hui utilisés par des millions d’utilisateurs.

Notre objectif : permettre la prévention, le dépistage et l’accompagnement d’un certain nombre de maladies chroniques via des produits et des services innovants, afin de révolutionner la manière dont on prend soin de notre santé.

Pour cela Withings collecte via ses produits un grand nombre de data-points différents : mesures de poids (BMI, masse maigre, grasse etc.), d’activité physique (nombre de pas, reconnaissance d’activité etc.), de fréquence cardiaque, SpO2, ECG, tension artérielle, ou encore de sommeil (phases, score d’apnée du sommeil). Pour chaque utilisateur, ces mesures sont à échantillonnage variable.

L’objectif de ce stage consiste à construire des modèles d’analyse de ces données adaptés à ce cadre très spécifique aux objets connectés innovants développés par Withings.

Intégré.e au sein de l’équipe Data Science de Withings et en collaboration avec l’équipe de recherche MODAL (Models for Data Analysis and Learning) de l’Inria, tu auras les responsabilités suivantes:

Extraire un dataset prêt à être analysé ;
Construire des modèles de clustering en grande dimension ;
Construire des modèles de détermination de trajectoires ;
Construire des modèles de détection de rupture ;
Gérer les sujets d’anonymisation / pseudonymisation afférent aux données stockées.

D’un point de vue technique, tu devras mobiliser les compétences suivantes :

Modélisation et clustering en grande dimension : les modèles de mélange de distributions sont des références en clustering mais en grande dimension, le nombre de paramètres peut devenir trop grand d’où la nécessité de représenter les données dans des espaces de dimension réduite. On pourra alors explorer des pistes de mélanges parcimonieux reposant sur des mélanges spécifiques de lois gaussiennes/multinomiales [1,2] ou encore des techniques basées sur des modèles à variables latentes (PCA, PLS) [3].
Modélisation et clustering des données temporelles (signaux) : La représentation des données sous forme de fonctions de temps est connue en statistique sous le nom d’analyse de données fonctionnelles [4]. Nous proposons dans ce stage de s’intéresser à l’analyse des données fonctionnelles univariées et multivariées avec un objectif de clustering. Les méthodes présentées en [5] et [6] seront développées. Une méthodologie pour l’analyse conjointe de données mixtes (données temporelles et non-indexées par le temps) sera réalisée sur la base des travaux [1-5].
Modélisation et régression avec variables réponse fonctionnelle : Il s’agit de prédire une trajectoire (possiblement multivariée) à partir des co-variables de type hétérogènes (scalaire, catégorielles, fonctionnelles). Des travaux comme [7] pourront servir de base pour aborder cette problématique.

Références

[1] C. Biernacki amp; C. Maugis-Rabusseau (2015). High-dimensional clustering. Choix de modèles et agrégation, Sous la direction de J-J. DROESBEKE, G. SAPORTA, C. THOMAS-AGNAN Edition: Technip.

[2] Cardot, H., Cenac, P. and Monnez, J.-M. (2012). A fast and recursive algorithm for clustering large datasets with k-medians. Computational Statistics and Data Analysis, 56, 1434-1449.

[3] Jérôme Pagès, Brigitte Escofier (2008). Analyse Factorielles Simples et Multiples 4ème édition. p 31-63.

[4] Ramsay J., Silverman B. (2005). Functional Data Analysis. Springer-Verlag New York. ISBN

978-0-387-22751-1. doi:10.1007/b98.

[5] J. Jacques and C. Preda (2014), Functional data clustering: a survey, in Advances in Data Analysis

and Classification, 8, (3), 231-255.

[6] J. Jacques, C. Preda (2014), Model-based clustering of multivariate functional data,

Computational Statistics and Data Analysis, 72, 92-106.

[7] C. Preda, G. Saporta (2005), PLS regression on a stochastic process, Computational Statistics and Data Analysis, 48, p. 149-158.

[8] David Benatia, Marine Carrasco, Jean-Pierre Florens (2017), Functional linear regression with functional response, Journal of Econometrics, Volume 201, Issue 2, 2017, Pages 269-291.

Requirements

Formation bac+5 type école d’ingénieurs ou équivalent ;
Solides connaissances théoriques en statistiques, en machine learning et en algorithmie ;
Maîtrise de SQL et une première expérience en développement sur des infrastructures informatiques de type Big Data (Cassandra, Elasticsearch etc.) ;
Maîtrise de Debian ou de Ubuntu, de Shell et de l

Job Specification

Job Rewards and Benefits

More Jobs like this Job

Stage - Analyse statistique de données de santé (H/F) Jobs in Castries France
Jobs in this company

Withings

Information Technology and Services - Boston, Massachusetts, United States