Formules de Statistiques Descriptives

May 22, 2018 | Author: Nada Chraibi | Category: Quartile, Data Analysis, Mathematical Analysis, Descriptive Statistics, Statistical Analysis


Comments



Description

Formules de statistiques descriptives1. Mesures de tendance centrale a. Moyenne arithmétique Données en vrac Données regroupées ∑  ∑    =   =  =     b. Médiane Au moins 50% des données sont inférieures ou égales à la médiane et au moins 50% des données sont supérieures ou égales à la médiane i. Données en vrac : Nombre pair de données : () + ()   é  =  Nombre impair de données : é  =   ( )  ii. Données regroupées : On repère la classe où se trouve la médiane [aM, bM[ puis on interpole en utilisant la formule suivante:    − ∗  é  =  + ( −  )  où nM est l'effectif de la classe contenant la médiane et f* est la somme des effectifs des classes qui précèdent celle où se trouve la médiane 1 classe à laquelle est des effectifs (ou des fréquences). Sinon. bQ3[ puis on interpole en utilisant la formule suivante:     − ∗  =  +  −    où nQ3 est l'effectif de la classe contenant le dernier quartile et f* est la somme des effectifs des classes qui précèdent celle où se trouve ce quartile. associée le maximum des effectifs (ou des fréquences). d.c. [aQ3. Mode et classe modale Données en vrac Données regroupées Donnée à laquelle est associée le maximum Si les classes sont égales. [aQ1. Dernier quartile : On repère la classe où se trouve le dernier quartile Q3. bQ1[ puis on interpole en utilisant la formule suivante:     − ∗  =  +  −    où nQ1 est l'effectif de la classe contenant le premier quartile et f* est la somme des effectifs des classes qui précèdent celle où se trouve ce quartile. Quartiles Au moins 25% des données sont inférieures ou égales à Q1 et au moins 75% des données sont supérieures ou égales à Q1 Données regroupées : Premier quartile : On repère la classe où se trouve le premier quartile Q1. classe qui "se détache" dans l'histogramme une fois qu'on a réajusté les hauteurs pour que les surfaces des rectangles soient proportionnelles aux effectifs (ou aux fréquences) 2 . e. Boîte à moustaches (BoxPlot) Li = max { minimum.5 (Q3 .Q1) } Ls = min { maximum.5 (Q3 . Q1 – 1.Q1) } Toute donnée qui déborde de [Li. Q3 + 1. Ls] est considérée extravagante (atypique) 3 . 5·s (au moins 84% à l’intérieur) Remarque : On ne doit pas déborder ni du minimum ni du maximum des observations ! 4 . Mesures de dispersion a. il y aura au plus 16% des données en dehors de ü ± 2. Écart-type (standard deviation) ! = #!  d.minimum b.2. il y aura au plus 25% des données en dehors de ü ± 2·s (au moins 75% à l’intérieur) • si k = 3. Théorème de Tchebycheff La proportion des observations situées à l’extérieur de l’intervalle défini par ü ± k·s est d’au plus 1/k² ( k ≥ 1) Exemples : • si k = 2. Plage (Range) Plage = maximum . il y aura au plus 11% des données en dehors de ü ± 3·s (au moins 89% à l’intérieur) • si k = 2. Variance Données en vrac Données regroupées Définition Définition  )² ∑( −   )² ∑( −  ! = ! = − − Formule de calcul Formule de calcul (∑  ) (∑   ) ∑  − ∑   − ! =   − ! = − c.5. Remarque : la cote Z est une transformation linéaire de X où a = -ü/s et b = 1/s Remarque : =2 0 et !0 =  (découle de la remarque précédente) c.3. Transformation linéaire  =+∙ Si & =  +  ∙  alors &  et !& = ||! b. Autres mesures a. Coefficient de variation ! 34 = 5 5 ∙ 22%   Critères d’homogénéité . Cote-Z de X − 0 = ! Remarque : si |0 | >  on concluera que X est une donnée extravagante.pour ce cours: • Un phénomène industriel sera considéré homogène si son CV est inférieur à 10% • On considérera tout autre phénomène comme homogène si son CV est inférieur à 30% 5 . Coefficient d'aplatissement (Kurtosis) 9:. >?@A  ) ( + ) ∑( −  ( − ) 8 = − ( − )( − )( − )! ( − )( − ) Données regroupées Données regroupées  )  ( + ) ∑( −  ( − ) 8 = − ( − )( − )( − )! ( − )( − ) Interprétation .pour ce cours: • Si SK < 0 il y a une asymétrie négative (ou un biais à gauche) • Si SK ≥ 0 il y a une asymétrie positive (ou un biais à droite) • Si |SK| ≤ 0. l’asymétrie est prononcée e.é<= <. l’asymétrie est modérée • Si |SK| > 2. l’aplatissement est prononcé 6 .5 la courbe n’est ni trop aplatie. pour |SK| ≤ 0. l’aplatissement est modéré • Si |K| > 2.d.e.5 < |K| ≤ 2..5 … • Si K < 0 la courbe est aplatie (distribution platykurtique) • Si K ≥ 0 la courbe est étirée (distribution leptokurtique) • Si |K| ≤ 0.pour ce cours: On ne peut interpréter ce coefficient que lorsque le biais est négligeable i.5.5 < |SK| ≤ 2. ni trop étirée (distribution mésokurtique) • Si 0. Coefficient d'asymétrie (Skewness) Données en vrac Données regroupées )  ∑( −   )   ∑( −  78 = 78 = ( − )( − )! ( − )( − )! Interprétation . l’asymétrie est négligeable • Si 0.
Copyright © 2024 DOKUMEN.SITE Inc.