Statistiques - Modèles linéaires généralisés & non linéaires
- Stage
- Actions régionales
- Techniques spécifiques
Objectifs
A l’issue de cette formation, l’apprenant sera capable de :
• D’identifier quel modèle statistique utilisé selon le contexte, la nature des variables
• De connaître les concepts mathématiques inhérents aux modèles logistiques, de Poisson et de Poisson ZIP (Zero Inflated Poisson)
• De connaître les méthodes d’estimations des paramètres des modèles
• D’interpréter les résultats de chaque méthode et d’analyser les différents graphiques qui en découlent
• De connaître les moyens d’évaluation de la qualité et de la robustesse du modèle
Public
Cette formation s'adresse à des personnes souhaitant maitriser les concepts et la mise en œuvre des modèles linéaires généralisés et non linéaires.
Cette formation conviendra à des personnes venant chercher du savoir statistique sur :
• Les concepts d’utilisation des modèles linéaires généralisés et non linéaires
• Les différents contextes d’application des modèles
• Les fondements mathématiques de ces analyses
• La mise en application et l’interprétation des résultats des différentes méthodes
Pré-requis
IL EST INDISPENSABLE que les participants aient de bonnes connaissances sur les outils statistiques de base : tests d'hypothèses, p-value, risque alpha… ainsi que sur l’ANOVA et la régression linéaire simple et multiple.
Programme
OBJECTIFS OPERATIONNELS ET CONTENU DE LA FORMATION
Rappel sur la modélisation
• Variable à expliquer / Variables explicatives
• Objectif de la modélisation
• Choix de variables
• Choix de modèles
• Plusieurs types de modèles
Rappel sur les modèles linéaires simples
• ANOVA (1 ou plusieurs facteurs)
1. Modèle
2. Qualité d’ajustement du modèle
• Régression (simple, multiple)
1. Modèle
2. Qualité d’ajustement du modèle
• Limites des modèles linéaires simples (Y non continu, hétéroscédasticité, résidus non normaux,…)
Principes des modèles linéaires généralisés (GLM)
• Cadre de développement de modèles linéaires généralisés
1. Modélisation où hypothèses fondamentales des modèles linéaires simples ne sont pas respectées
2. Type de variable à expliquer : Y dichotomique, Y polytomique, Y bornés (proportion ou pourcentage), Mesures de comptage
• Modèle GLM
• Estimation des paramètres du modèle
1. Transformation mathématique de la variable à expliquer
2. Méthodes d’estimation : Maximum de vraisemblance
Application du modèle
• Régression logistique
1. Variable de réponse catégorielle
2. Estimation des effets
3. Odd Ratio, comment les lire et les comprendre
4. Choix des variables
5. Choix du modèle
6. Diagnostic du Modèle
• Régression de Poisson
1. Variable de réponse comme mesure de comptage
2. Estimations des effets
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
7. Problème de la surdispersion et des zéros
• ZIP, Zero Inflated Poisson
1. Variable de réponse comme mesure de comptage avec présence de zéro importante
2. Modélisation différencié : Y=0 et Y> 0
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
Application du modèle
• Régression logistique
1. Variable de réponse catégorielle
2. Estimation des effets
3. Odd Ratio, comment les lire et les comprendre
4. Choix des variables
5. Choix du modèle
6. Diagnostic du Modèle
• Régression de Poisson
1. Variable de réponse comme mesure de comptage
2. Estimations des effets
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
7. Problème de la surdispersion et des zéros
• ZIP, Zero Inflated Poisson
1. Variable de réponse comme mesure de comptage avec présence de zéro importante
2. Modélisation différencié : Y=0 et Y> 0
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
Application du modèle
• Régression logistique
1. Variable de réponse catégorielle
2. Estimation des effets
3. Odd Ratio, comment les lire et les comprendre
4. Choix des variables
5. Choix du modèle
6. Diagnostic du Modèle
• Régression de Poisson
1. Variable de réponse comme mesure de comptage
2. Estimations des effets
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
7. Problème de la surdispersion et des zéros
• ZIP, Zero Inflated Poisson
1. Variable de réponse comme mesure de comptage avec présence de zéro importante
2. Modélisation différencié : Y=0 et Y> 0
3. Lire et comprendre les coefficients
4. Choix des variables
5. Choix du modèle
6. Diagnostic
• Régression sur Y en proportion
Modèles non linéaires
• Contexte et objectif
• Différence modèle linéaire – modèle non linéaire
• Exemple de modèles non linéaires
• Vers le modèle mixte et au-delà ?
Méthodes pédagogiques
Méthodes et moyens :
• Explications théoriques suivies de pratiques guidées puis mises en autonomie
• 1 vidéoprojecteur par salle
• 1 ordinateur par stagiaire
Support stagiaire :
• Support électronique (dématérialisé)
• Les exercices d’accompagnement peuvent être récupérés sur clef USB
Méthodes d’évaluation des acquis :
• Exercices d’applications
• Evaluation de fin de stage
Sessions passées 3
Partenaires
CNRS
Informations pratiques
06 905 SOPHIA ANTIPOLIS CEDEX