Statistiques - Modèles linéaires généralisés & non linéaires

Stage
Actions régionales
Techniques spécifiques

Objectifs

A l’issue de cette formation, l’apprenant sera capable de :
• D’identifier quel modèle statistique utilisé selon le contexte, la nature des variables
• De connaître les concepts mathématiques inhérents aux modèles logistiques, de Poisson et de Poisson ZIP (Zero Inflated Poisson)
• De connaître les méthodes d’estimations des paramètres des modèles
• D’interpréter les résultats de chaque méthode et d’analyser les différents graphiques qui en découlent
• De connaître les moyens d’évaluation de la qualité et de la robustesse du modèle

Public

Cette formation s'adresse à des personnes souhaitant maitriser les concepts et la mise en œuvre des modèles linéaires généralisés et non linéaires.
Cette formation conviendra à des personnes venant chercher du savoir statistique sur :
• Les concepts d’utilisation des modèles linéaires généralisés et non linéaires
• Les différents contextes d’application des modèles
• Les fondements mathématiques de ces analyses
• La mise en application et l’interprétation des résultats des différentes méthodes

Pré-requis

IL EST INDISPENSABLE que les participants aient de bonnes connaissances sur les outils statistiques de base : tests d'hypothèses, p-value, risque alpha… ainsi que sur l’ANOVA et la régression linéaire simple et multiple.

Programme

OBJECTIFS OPERATIONNELS ET CONTENU DE LA FORMATION

Rappel sur la modélisation
• Variable à expliquer / Variables explicatives
• Objectif de la modélisation
• Choix de variables
• Choix de modèles
• Plusieurs types de modèles

Rappel sur les modèles linéaires simples
• ANOVA (1 ou plusieurs facteurs)
1. Modèle
2. Qualité d’ajustement du modèle
• Régression (simple, multiple)
1. Modèle
2. Qualité d’ajustement du modèle
• Limites des modèles linéaires simples (Y non continu, hétéroscédasticité, résidus non normaux,…)

Principes des modèles linéaires généralisés (GLM)
• Cadre de développement de modèles linéaires généralisés
1. Modélisation où hypothèses fondamentales des modèles linéaires simples ne sont pas respectées
2. Type de variable à expliquer : Y dichotomique, Y polytomique, Y bornés (proportion ou pourcentage), Mesures de comptage
• Modèle GLM
• Estimation des paramètres du modèle
1. Transformation mathématique de la variable à expliquer
2. Méthodes d’estimation : Maximum de vraisemblance

Application du modèle
• Régression logistique
1. Variable de réponse catégorielle
2. Estimation des effets
3. Odd Ratio, comment les lire et les comprendre
4. Choix des variables
5. Choix du modèle
6. Diagnostic du Modèle
• Régression de Poisson
1. Variable de réponse comme mesure de comptage
2. Estimations des effets
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
7. Problème de la surdispersion et des zéros
• ZIP, Zero Inflated Poisson
1. Variable de réponse comme mesure de comptage avec présence de zéro importante
2. Modélisation différencié : Y=0 et Y> 0
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
Application du modèle
• Régression logistique
1. Variable de réponse catégorielle
2. Estimation des effets
3. Odd Ratio, comment les lire et les comprendre
4. Choix des variables
5. Choix du modèle
6. Diagnostic du Modèle
• Régression de Poisson
1. Variable de réponse comme mesure de comptage
2. Estimations des effets
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
7. Problème de la surdispersion et des zéros
• ZIP, Zero Inflated Poisson
1. Variable de réponse comme mesure de comptage avec présence de zéro importante
2. Modélisation différencié : Y=0 et Y> 0
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
Application du modèle
• Régression logistique
1. Variable de réponse catégorielle
2. Estimation des effets
3. Odd Ratio, comment les lire et les comprendre
4. Choix des variables
5. Choix du modèle
6. Diagnostic du Modèle
• Régression de Poisson
1. Variable de réponse comme mesure de comptage
2. Estimations des effets
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
7. Problème de la surdispersion et des zéros
• ZIP, Zero Inflated Poisson
1. Variable de réponse comme mesure de comptage avec présence de zéro importante
2. Modélisation différencié : Y=0 et Y> 0
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
• Régression sur Y en proportion

Modèles non linéaires
• Contexte et objectif
• Différence modèle linéaire – modèle non linéaire
• Exemple de modèles non linéaires
• Vers le modèle mixte et au-delà ?

Méthodes pédagogiques

Méthodes et moyens :
• Explications théoriques suivies de pratiques guidées puis mises en autonomie
• 1 vidéoprojecteur par salle
• 1 ordinateur par stagiaire

Support stagiaire :
• Support électronique (dématérialisé)
• Les exercices d’accompagnement peuvent être récupérés sur clef USB

Méthodes d’évaluation des acquis :
• Exercices d’applications
• Evaluation de fin de stage

Sessions passées 3

Mercredi 27 Novembre 2019

Mardi 13 Octobre 2020

Mercredi 16 Novembre 2022

Partenaires

CNRS

Informations pratiques

Formation DR20 CNRS

250 RUE ALBERT EINSTEIN - BÂTIMENT 3
06 905 SOPHIA ANTIPOLIS CEDEX

04 93 95 42 22

04 92 96 03 39

dr20.formation@cnrs.fr

http://www.cote-azur.cnrs.fr