Formules de statistiques descriptives1. Mesures de tendance centrale a. Moyenne arithmétique Données en vrac Données regroupées ∑ ∑ = = = b. Médiane Au moins 50% des données sont inférieures ou égales à la médiane et au moins 50% des données sont supérieures ou égales à la médiane i. Données en vrac : Nombre pair de données : () + () é = Nombre impair de données : é = ( ) ii. Données regroupées : On repère la classe où se trouve la médiane [aM, bM[ puis on interpole en utilisant la formule suivante: − ∗ é = + ( − ) où nM est l'effectif de la classe contenant la médiane et f* est la somme des effectifs des classes qui précèdent celle où se trouve la médiane 1 classe à laquelle est des effectifs (ou des fréquences). Sinon. bQ3[ puis on interpole en utilisant la formule suivante: − ∗ = + − où nQ3 est l'effectif de la classe contenant le dernier quartile et f* est la somme des effectifs des classes qui précèdent celle où se trouve ce quartile. associée le maximum des effectifs (ou des fréquences). d.c. [aQ3. Mode et classe modale Données en vrac Données regroupées Donnée à laquelle est associée le maximum Si les classes sont égales. [aQ1. Dernier quartile : On repère la classe où se trouve le dernier quartile Q3. bQ1[ puis on interpole en utilisant la formule suivante: − ∗ = + − où nQ1 est l'effectif de la classe contenant le premier quartile et f* est la somme des effectifs des classes qui précèdent celle où se trouve ce quartile. Quartiles Au moins 25% des données sont inférieures ou égales à Q1 et au moins 75% des données sont supérieures ou égales à Q1 Données regroupées : Premier quartile : On repère la classe où se trouve le premier quartile Q1. classe qui "se détache" dans l'histogramme une fois qu'on a réajusté les hauteurs pour que les surfaces des rectangles soient proportionnelles aux effectifs (ou aux fréquences) 2 . e. Boîte à moustaches (BoxPlot) Li = max { minimum.5 (Q3 .Q1) } Ls = min { maximum.5 (Q3 . Q1 – 1.Q1) } Toute donnée qui déborde de [Li. Q3 + 1. Ls] est considérée extravagante (atypique) 3 . 5·s (au moins 84% à l’intérieur) Remarque : On ne doit pas déborder ni du minimum ni du maximum des observations ! 4 . Mesures de dispersion a. il y aura au plus 16% des données en dehors de ü ± 2. Écart-type (standard deviation) ! = #! d.minimum b.2. il y aura au plus 25% des données en dehors de ü ± 2·s (au moins 75% à l’intérieur) • si k = 3. Théorème de Tchebycheff La proportion des observations situées à l’extérieur de l’intervalle défini par ü ± k·s est d’au plus 1/k² ( k ≥ 1) Exemples : • si k = 2. Plage (Range) Plage = maximum . il y aura au plus 11% des données en dehors de ü ± 3·s (au moins 89% à l’intérieur) • si k = 2. Variance Données en vrac Données regroupées Définition Définition )² ∑( − )² ∑( − ! = ! = − − Formule de calcul Formule de calcul (∑ ) (∑ ) ∑ − ∑ − ! = − ! = − c.5. Remarque : la cote Z est une transformation linéaire de X où a = -ü/s et b = 1/s Remarque : =2 0 et !0 = (découle de la remarque précédente) c.3. Transformation linéaire =+∙ Si & = + ∙ alors & et !& = ||! b. Autres mesures a. Coefficient de variation ! 34 = 5 5 ∙ 22% Critères d’homogénéité . Cote-Z de X − 0 = ! Remarque : si |0 | > on concluera que X est une donnée extravagante.pour ce cours: • Un phénomène industriel sera considéré homogène si son CV est inférieur à 10% • On considérera tout autre phénomène comme homogène si son CV est inférieur à 30% 5 . Coefficient d'aplatissement (Kurtosis) 9:. >?@A ) ( + ) ∑( − ( − ) 8 = − ( − )( − )( − )! ( − )( − ) Données regroupées Données regroupées ) ( + ) ∑( − ( − ) 8 = − ( − )( − )( − )! ( − )( − ) Interprétation .pour ce cours: • Si SK < 0 il y a une asymétrie négative (ou un biais à gauche) • Si SK ≥ 0 il y a une asymétrie positive (ou un biais à droite) • Si |SK| ≤ 0. l’asymétrie est prononcée e.é<= <. l’asymétrie est modérée • Si |SK| > 2. l’aplatissement est prononcé 6 .5 la courbe n’est ni trop aplatie. pour |SK| ≤ 0. l’aplatissement est modéré • Si |K| > 2.d.e.5 < |K| ≤ 2..5 … • Si K < 0 la courbe est aplatie (distribution platykurtique) • Si K ≥ 0 la courbe est étirée (distribution leptokurtique) • Si |K| ≤ 0.pour ce cours: On ne peut interpréter ce coefficient que lorsque le biais est négligeable i.5.5 < |SK| ≤ 2. ni trop étirée (distribution mésokurtique) • Si 0. Coefficient d'asymétrie (Skewness) Données en vrac Données regroupées ) ∑( − ) ∑( − 78 = 78 = ( − )( − )! ( − )( − )! Interprétation . l’asymétrie est négligeable • Si 0.