ANOVA

Cards (64)

  • Prérequis
    • Statistique descriptive et décisionnelle (EC 551)
    • (Types de variable statistique, moyenne, variance, loi de probabilité, estimation, intervalle de confiance, test d'hypothèse)
    • Introduction au langage R (EC 552)
    • (Importer un jeu de données, manipuler un jeu de données, types de variable informatique, fonctions, packages)
  • Vue d'ensemble de l'EC
    • Régression linéaire
    • Analyse de la Variance (ANOVA)
    • Analyse de la covariance (ANCOVA)
  • Modalités d'évaluation de la partie Analyse de la Variance
    • Un projet par binôme
    • Une évaluation écrite individuelle
  • Notation
    Chaque question est associée à un niveau d'objectif : Rang A ou Rang B. Chacun des deux rangs (A et B) est noté sur 20. La note finale est calculée comme suit : Note finale = 0.67 × Rang A + 0.33 × Rang B
  • Quelques exemples
    • Rang A 10/20 Rang B 0/20 Note finale = 6.7/20
    • 15/20 Rang A et 0/20 Rang B Note finale = 10/20
    • 20/20 Rang A et 0/20 Note finale = 13.4/20
    • 15/20 Rang A et 10/20 Rang B Note finale = 13.35/20
    • 20/20 Rang A et 5/20 Rang B Note finale = 15.05
  • Rang A
    • Mettre en œuvre une analyse de la variance via le logiciel R (évalué par le projet)
    • Interpréter les résultats d'une analyse de la variance pour prendre des décisions
    • Valider le modèle pour estimer un degré de confiance dans les décisions prises
  • Rang B
    • Ecrire le modèle d'analyse de la variance avec ses hypothèses et l'estimation de ses paramètres
    • Formaliser les tests statistiques associés au modèle d'analyse de la variance : hypothèses nulles/alternatives, statistiques de test et lois de distribution associées
  • Compétences
    • Analyser des problématiques complexes et anticiper les problèmes liés à leur résolution
    • Etablir un plan d'action
    • Etablir une démarche scientifique et expérimentale à partir d'un cahier des charges donné
    • Imaginer, développer et optimiser un produit ou un service
    • Intégrer la démarche d'amélioration continue répondant aux enjeux et contraintes de l'organisation
    • Évaluer la qualité et assurer la conformité d'un produit alimentaire, d'un bioproduit, d'un procédé
    • Maîtriser les outils et techniques de communication professionnelle
    • Transmettre, diffuser et discuter des informations et des connaissances
  • Objectifs de l'EC
    • Etudier la relation entre une variable réponse et des variables externes
    • Conduire la modélisation d'un phénomène et en interpréter les résultats
  • Les modèles linéaires "classiques"
    • Régression linéaire
    • Analyse de la Variance (ANOVA)
    • Analyse de la covariance (ANCOVA)
  • Variable(s) explicative(s) (X's)
    Quantitative(s) pour la régression linéaire, Qualitative(s) pour l'ANOVA, Quantitative(s) et Qualitative(s) pour l'ANCOVA
  • Objectifs (courants)
    Modélisation de la relation et prédiction pour la régression linéaire, Etude de l'influence d'un ou plusieurs facteur(s) sur Y pour l'ANOVA, Modélisation selon un ou plusieurs facteur(s) pour l'ANCOVA
  • Vue d'ensemble de la partie Analyse de la Variance
    • Introduction
    • Modèles à un facteur
    • Modèle à deux facteurs sans interaction estimable
    • Modèles à deux facteurs avec interaction estimable
    • Pour aller plus loin...
  • Quantifier et tester l'effet d'une ou plusieurs variables qualitatives (facteurs) sur une variable quantitative
  • Expliquer la variabilité d'une variable quantitative (somme des carrés des écarts à la moyenne) par un ou plusieurs facteurs
  • Les moyennes des trois modalités sont-elles différentes ?
  • Dans quel cas les moyennes des trois modalités sont-elles différentes ?
  • Pas d'effet du facteur sur la variable quantitative
  • Effet du facteur sur la variable quantitative
  • On possède trois types de viandes
  • Le caractère fibreux des trois types de viande a été noté sur une échelle de 1 à 15 par 5 experts
  • Les trois viandes ont-elles un caractère fibreux moyen égal ?
  • Dans la négative, lesquelles sont plus ou moins fibreuses en moyenne ?
  • Les experts ont-ils une perception différente du caractère fibreux en moyenne ?
  • Yij
    Variable à expliquer
  • μ
    Paramètre de moyenne globale
  • Modèle à un facteur
    1. Yij = μ
    2. Yij = μ + αi
    3. Yij = μ + αi + εij
  • εij
    Résidus, suivent une loi normale centrée réduite
  • I degrés de liberté ont été utilisés pour estimer les paramètres du modèle : 1 pour estimer μ, I-1 pour estimer les αi, il en reste n-I
  • Estimation de σ
    1. σ̂² = 1/(n-I) Σi=1^I Σj=1^ni (Yij - Ŷij)²
    2. σ̂² = 1/(n-I) Σi=1^I Σj=1^ni (Yij - μ̂ - α̂i)²
  • Spécification de la contrainte de somme (par défaut R utilise la première modalité comme référence)
  • Construction du modèle
    lm = linear model
  • μ
    Estimation de la moyenne globale
  • αi
    Estimation des effets du facteur
  • σ
    Estimation de l'écart-type résiduel
  • SCET = SCEFA + SCER
  • SCET
    Somme des Carrés des Ecarts Totale
  • SCEFA
    Somme des Carrés des Ecarts du FActeur = inter-niveaux = expliquée par le facteur
  • SCER
    Somme des Carrés des Ecarts Résiduelle = intra-niveaux = résiduelle non expliquée par le facteur
  • Sur l'exemple : 140 = 90 + 50