Développement/visualisation d’indicateurs pondérés de surveillance de mortalité

Accueil Forums Offres de stage / d’alternance Développement/visualisation d’indicateurs pondérés de surveillance de mortalité

Ce sujet a 0 réponse, 1 participant et a été mis à jour par  Fouillet Anne, il y a 1 semaine et 4 jours.

Affichage de 1 message (sur 1 au total)
  • Auteur
    Messages
  • #3427 Répondre

    Fouillet Anne

    Type de stage : Master 1 ou 2
    Durée : 5-6 mois, à partir de Mars 2019
    Lieu : Santé publique France (Saint-Maurice)

    Contexte
    Santé publique France est l’agence nationale de santé publique française. Elle intervient au service de la santé des populations. Agence scientifique et d’expertise du champ sanitaire, elle a pour missions : (1) l’observation épidémiologique et la surveillance de l’état de santé des populations ; (2) la veille sur les risques sanitaires menaçant les populations ; (3) la promotion de la santé et la réduction des risques pour la santé ; (4) le développement de la prévention et de l’éducation pour la santé ; (5) La préparation et la réponse aux menaces, alertes et crises sanitaires ; (6) le lancement de l’alerte sanitaire.

    Le stage se déroulera dans l’unité « Application, Big Data et Surveillance Syndromique » de la Direction Appui, Traitements et Analyses des données (DATA). Cette unité a de nombreuses missions au sein de l’agence dont le traitement des grandes bases de données, la réalisation d’outils de restitution graphiques et le pilotage du système national de surveillance des urgences et des décès SurSaUD®, mis en place en 2004. SurSaUD® est un des principaux dispositifs de Santé publique France pour assurer la veille sanitaire non spécifique à visée d’alerte notamment par l’identification d’événements inhabituels. Cette veille s’appuie sur l’analyse quotidienne du recours aux soins d’urgence hospitaliers et libéraux (réseaux OSCOUR® et SOS Médecins) et de la mortalité (analyse des décès toutes causes de l’Insee principalement et analyse des décès par cause médicale, issue de la certification électronique de décès).

    Le stage portera sur les données de la certification électronique des décès, contenant les causes médicales de décès exprimées en texte libre. Cette source de données est en cours de généralisation sur le territoire, elle enregistre 13% de la mortalité nationale en 2018, proportion en hausse régulière depuis plusieurs années.
    Un premier travail de recherche réalisé en 2018 dans le cadre d’un stage de Master Linguistique Informatique, a permis d’identifier et d’évaluer deux méthodes de classement automatisé de ces causes médicales de décès dans des regroupements prédéfinis (« regroupements syndromiques ») : une méthode par règles linguistiques et un SVM. Chaque certificat de décès contient plusieurs causes médicales, classées dans un ou plusieurs regroupements syndromiques. Ce travail a été réalisé sous Python 3.0.

    Objectifs du stage
    L’objectif général de ce stage consiste à mettre en routine les méthodes de classement automatisé sur les données qui arrivent quotidiennement, puis de construire les séries temporelles de ces regroupements syndromiques, agrégées par jour ou semaine. Ces séries temporelles devront prendre en compte la montée en charge du système (déploiement progressif de l’utilisation de la certification électronique par les médecins sur le territoire) et une pondération des causes lorsqu’un décès contribue à plusieurs regroupements syndromiques.
    Le second objectif consistera à développer une application web en R-shiny, permettant aux épidémiologistes de l’agence travaillant au niveau national et au niveau régional, de visualiser l’évolution de ces séries temporelles selon différents axes d’analyse (géographique, classe d’âge, quotidien/hebdo).

    Les principales étapes du stage seront :
    • La construction des séries temporelles pondérées
    • La recherche, mise en place et comparaison de stratégies pour la prise en compte de la montée en charge du système
    • La création d’une application web développée en R-shiny intégrant des outils de visualisation.

    Selon le temps, le développement d’une méthode de classement automatisé des causes médicales de décès sera réalisé sous R. Les résultats du classement et les performances (temps d’exécution) seront comparés avec ceux obtenus à partir des programmes Python déjà réalisés.

    Les travaux devront être réalisés sous R et Python 3.0, une compétence dans la programmation sous ces deux langages est donc indispensable.

    Prérequis :
    Maîtrise des langages R et Python

    Pour postuler :
    Contact : Anne Fouillet
    anne.fouillet@santepubliquefrance.fr

Affichage de 1 message (sur 1 au total)
Répondre à : Développement/visualisation d’indicateurs pondérés de surveillance de mortalité
Vos informations: