ANOVA

    Cards (64)

    • Prérequis
      • Statistique descriptive et décisionnelle (EC 551)
      • (Types de variable statistique, moyenne, variance, loi de probabilité, estimation, intervalle de confiance, test d'hypothèse)
      • Introduction au langage R (EC 552)
      • (Importer un jeu de données, manipuler un jeu de données, types de variable informatique, fonctions, packages)
    • Vue d'ensemble de l'EC
      • Régression linéaire
      • Analyse de la Variance (ANOVA)
      • Analyse de la covariance (ANCOVA)
    • Modalités d'évaluation de la partie Analyse de la Variance
      • Un projet par binôme
      • Une évaluation écrite individuelle
    • Notation
      Chaque question est associée à un niveau d'objectif : Rang A ou Rang B. Chacun des deux rangs (A et B) est noté sur 20. La note finale est calculée comme suit : Note finale = 0.67 × Rang A + 0.33 × Rang B
    • Quelques exemples
      • Rang A 10/20 Rang B 0/20 Note finale = 6.7/20
      • 15/20 Rang A et 0/20 Rang B Note finale = 10/20
      • 20/20 Rang A et 0/20 Note finale = 13.4/20
      • 15/20 Rang A et 10/20 Rang B Note finale = 13.35/20
      • 20/20 Rang A et 5/20 Rang B Note finale = 15.05
    • Rang A
      • Mettre en œuvre une analyse de la variance via le logiciel R (évalué par le projet)
      • Interpréter les résultats d'une analyse de la variance pour prendre des décisions
      • Valider le modèle pour estimer un degré de confiance dans les décisions prises
    • Rang B
      • Ecrire le modèle d'analyse de la variance avec ses hypothèses et l'estimation de ses paramètres
      • Formaliser les tests statistiques associés au modèle d'analyse de la variance : hypothèses nulles/alternatives, statistiques de test et lois de distribution associées
    • Compétences
      • Analyser des problématiques complexes et anticiper les problèmes liés à leur résolution
      • Etablir un plan d'action
      • Etablir une démarche scientifique et expérimentale à partir d'un cahier des charges donné
      • Imaginer, développer et optimiser un produit ou un service
      • Intégrer la démarche d'amélioration continue répondant aux enjeux et contraintes de l'organisation
      • Évaluer la qualité et assurer la conformité d'un produit alimentaire, d'un bioproduit, d'un procédé
      • Maîtriser les outils et techniques de communication professionnelle
      • Transmettre, diffuser et discuter des informations et des connaissances
    • Objectifs de l'EC
      • Etudier la relation entre une variable réponse et des variables externes
      • Conduire la modélisation d'un phénomène et en interpréter les résultats
    • Les modèles linéaires "classiques"
      • Régression linéaire
      • Analyse de la Variance (ANOVA)
      • Analyse de la covariance (ANCOVA)
    • Variable(s) explicative(s) (X's)
      Quantitative(s) pour la régression linéaire, Qualitative(s) pour l'ANOVA, Quantitative(s) et Qualitative(s) pour l'ANCOVA
    • Objectifs (courants)
      Modélisation de la relation et prédiction pour la régression linéaire, Etude de l'influence d'un ou plusieurs facteur(s) sur Y pour l'ANOVA, Modélisation selon un ou plusieurs facteur(s) pour l'ANCOVA
    • Vue d'ensemble de la partie Analyse de la Variance
      • Introduction
      • Modèles à un facteur
      • Modèle à deux facteurs sans interaction estimable
      • Modèles à deux facteurs avec interaction estimable
      • Pour aller plus loin...
    • Quantifier et tester l'effet d'une ou plusieurs variables qualitatives (facteurs) sur une variable quantitative
    • Expliquer la variabilité d'une variable quantitative (somme des carrés des écarts à la moyenne) par un ou plusieurs facteurs
    • Les moyennes des trois modalités sont-elles différentes ?
    • Dans quel cas les moyennes des trois modalités sont-elles différentes ?
    • Pas d'effet du facteur sur la variable quantitative
    • Effet du facteur sur la variable quantitative
    • On possède trois types de viandes
    • Le caractère fibreux des trois types de viande a été noté sur une échelle de 1 à 15 par 5 experts
    • Les trois viandes ont-elles un caractère fibreux moyen égal ?
    • Dans la négative, lesquelles sont plus ou moins fibreuses en moyenne ?
    • Les experts ont-ils une perception différente du caractère fibreux en moyenne ?
    • Yij
      Variable à expliquer
    • μ
      Paramètre de moyenne globale
    • Modèle à un facteur
      1. Yij = μ
      2. Yij = μ + αi
      3. Yij = μ + αi + εij
    • εij
      Résidus, suivent une loi normale centrée réduite
    • I degrés de liberté ont été utilisés pour estimer les paramètres du modèle : 1 pour estimer μ, I-1 pour estimer les αi, il en reste n-I
    • Estimation de σ
      1. σ̂² = 1/(n-I) Σi=1^I Σj=1^ni (Yij - Ŷij)²
      2. σ̂² = 1/(n-I) Σi=1^I Σj=1^ni (Yij - μ̂ - α̂i)²
    • Spécification de la contrainte de somme (par défaut R utilise la première modalité comme référence)
    • Construction du modèle
      lm = linear model
    • μ
      Estimation de la moyenne globale
    • αi
      Estimation des effets du facteur
    • σ
      Estimation de l'écart-type résiduel
    • SCET = SCEFA + SCER
    • SCET
      Somme des Carrés des Ecarts Totale
    • SCEFA
      Somme des Carrés des Ecarts du FActeur = inter-niveaux = expliquée par le facteur
    • SCER
      Somme des Carrés des Ecarts Résiduelle = intra-niveaux = résiduelle non expliquée par le facteur
    • Sur l'exemple : 140 = 90 + 50
    See similar decks