(Types de variable statistique, moyenne, variance, loi de probabilité, estimation, intervalle de confiance, test d'hypothèse)
Introduction au langage R (EC 552)
(Importer un jeu de données, manipuler un jeu de données, types de variable informatique, fonctions, packages)
Vue d'ensemble de l'EC
Régression linéaire
Analyse de la Variance (ANOVA)
Analyse de la covariance (ANCOVA)
Modalités d'évaluation de la partie Analyse de la Variance
Un projet par binôme
Une évaluation écrite individuelle
Notation
Chaque question est associée à un niveau d'objectif : Rang A ou Rang B. Chacun des deux rangs (A et B) est noté sur 20. La note finale est calculée comme suit : Note finale = 0.67 × Rang A + 0.33 × Rang B
Quelques exemples
Rang A 10/20 Rang B 0/20 Note finale = 6.7/20
15/20 Rang A et 0/20 Rang B Note finale = 10/20
20/20 Rang A et 0/20 Note finale = 13.4/20
15/20 Rang A et 10/20 Rang B Note finale = 13.35/20
20/20 Rang A et 5/20 Rang B Note finale = 15.05
Rang A
Mettre en œuvre une analyse de la variance via le logiciel R (évalué par le projet)
Interpréter les résultats d'une analyse de la variance pour prendre des décisions
Valider le modèle pour estimer un degré de confiance dans les décisions prises
Rang B
Ecrire le modèle d'analyse de la variance avec ses hypothèses et l'estimation de ses paramètres
Formaliser les tests statistiques associés au modèle d'analyse de la variance : hypothèses nulles/alternatives, statistiques de test et lois de distribution associées
Compétences
Analyser des problématiques complexes et anticiper les problèmes liés à leur résolution
Etablir un plan d'action
Etablir une démarche scientifique et expérimentale à partir d'un cahier des charges donné
Imaginer, développer et optimiser un produit ou un service
Intégrer la démarche d'amélioration continue répondant aux enjeux et contraintes de l'organisation
Évaluer la qualité et assurer la conformité d'un produit alimentaire, d'un bioproduit, d'un procédé
Maîtriser les outils et techniques de communication professionnelle
Transmettre, diffuser et discuter des informations et des connaissances
Objectifs de l'EC
Etudier la relation entre une variable réponse et des variables externes
Conduire la modélisation d'un phénomène et en interpréter les résultats
Les modèles linéaires "classiques"
Régression linéaire
Analyse de la Variance (ANOVA)
Analyse de la covariance (ANCOVA)
Variable(s) explicative(s) (X's)
Quantitative(s) pour la régression linéaire, Qualitative(s) pour l'ANOVA, Quantitative(s) et Qualitative(s) pour l'ANCOVA
Objectifs (courants)
Modélisation de la relation et prédiction pour la régression linéaire, Etude de l'influence d'un ou plusieurs facteur(s) sur Y pour l'ANOVA, Modélisation selon un ou plusieurs facteur(s) pour l'ANCOVA
Vue d'ensemble de la partie Analyse de la Variance
Introduction
Modèles à un facteur
Modèle à deux facteurs sans interaction estimable
Modèles à deux facteurs avec interaction estimable
Pour aller plus loin...
Quantifier et tester l'effet d'une ou plusieurs variables qualitatives (facteurs) sur une variable quantitative
Expliquer la variabilité d'une variable quantitative (somme des carrés des écarts à la moyenne) par un ou plusieurs facteurs
Les moyennes des trois modalités sont-elles différentes ?
Dans quel cas les moyennes des trois modalités sont-elles différentes ?
Pas d'effet du facteur sur la variable quantitative
Effet du facteur sur la variable quantitative
On possède trois types de viandes
Le caractère fibreux des trois types de viande a été noté sur une échelle de 1 à 15 par 5 experts
Les trois viandes ont-elles un caractère fibreux moyen égal ?
Dans la négative, lesquelles sont plus ou moins fibreuses en moyenne ?
Les experts ont-ils une perception différente du caractère fibreux en moyenne ?
Yij
Variable à expliquer
μ
Paramètre de moyenne globale
Modèle à un facteur
1. Yij = μ
2. Yij = μ + αi
3. Yij = μ + αi + εij
εij
Résidus, suivent une loi normale centrée réduite
I degrés de liberté ont été utilisés pour estimer les paramètres du modèle : 1 pour estimer μ, I-1 pour estimer les αi, il en reste n-I
Estimation de σ
1. σ̂² = 1/(n-I)Σi=1^I Σj=1^ni (Yij - Ŷij)²
2. σ̂² = 1/(n-I) Σi=1^I Σj=1^ni (Yij - μ̂ - α̂i)²
Spécification de la contrainte de somme (par défaut R utilise la première modalité comme référence)
Construction du modèle
lm = linear model
μ
Estimation de la moyenne globale
αi
Estimation des effets du facteur
σ
Estimation de l'écart-type résiduel
SCET = SCEFA + SCER
SCET
Somme des Carrés des Ecarts Totale
SCEFA
Somme des Carrés des Ecarts du FActeur = inter-niveaux = expliquée par le facteur
SCER
Somme des Carrés des Ecarts Résiduelle = intra-niveaux = résiduelle non expliquée par le facteur