Corrigé 2015 :

 

1. le coefficient de corrélation linéaire r est défini par r=\frac{Cov(X,Y}{\sigma_{X}\sigma_{Y}}.

 

D'où r\approx 0,69 (01 pt)

 

2.a) La droite de regression de Y en X, (D_{Y/X}) à pour équation y = 92,59x - 4,35.   (01 pt)

 

b) il faut investir 3,29 milliards de FCFA si l'on désire un chiffre d'affaire de 300 milliards     (0,5 pt)

 

 

Corrigé 2013 : Statistiques à deux variables

 

1. (a)  r =\frac{cov(X,Y)}{\sigma X\sigma Y}, r=-0,973. Il y a une forte corrélation.

 

(b) La droite de régression deY en X est :

 

y=ax+b avec  a =\frac{cov(X,Y)}{V(X)}

 

et  b =\bar{Y}-a\bar{X}

 

y = -0, 874x + 4, 12

 

(c) Si x = 6 alors y = -1, 124.

 

Cette équation ne permet pas d’estimer le degré de salinité car au 6^{\'ieme} mois de pluie le degré de salinité ne peut être négatif.

 

2. Soit Z = ln(Y - 1)

 

(a) \begin{tabular}{|c|c|c|c|c|c|}\hline xi&0&1&2&3&4\\\hline zi&1,182&0,875&0,010&-1,83&-4,61\\\hline\end{tabular}

 

(b) r =\frac{cov(X,Z)}{\sigma{X}\sigma{Z}},r=-0,944

 


(c)  La droite de régression de Z en X est : z = ax + b avec  a =\frac{cov(X,Z)}{V(X)}

 

et  b =\bar{Z}-a\bar{X}

 

z = -1, 428x + 1, 982

 

On a z = ln(y - 1) et z = -1,428x + 1,982 d’où

 

ln(y - 1) = -1,428x + 1,982

 

y=e^{-1,428x + 1,982}+1

 

Ainsi y=e^{-1,428x + 1,982}+1

 

(d) Si x = 6 alors y = 1, 001. Le degré de salinité estimé au 6^{i\grave{e}me}est positif, il est très proche de celui du quatrième mois et lui est inférieur. Donc l’équation y=e^{-1,428x + 1,982}+1 nous permet de faire cette estimation.

 

corrigé epreuve 2008 : Nuage de points



\begin{tabular}{|c|c|c|c|c|c|c|c|}
\hline
x(ann\'ees)&0&1&2&4&7&11&12\\
\hline
y(kg)&3,5&6,5&9,5&14&21&32,5&34\\
\hline
\end{tabular}

 

1) Représenter le nuage de points de cette série.

Insérer schéma

2) Déterminer les coordonnées du point moyen G puis placer G

G(\bar{x},\bar{y})   

\bar{x} = \frac{1}{N}\sum{x_i}= \frac{0+1+2+4+7+11+12}{7} = \frac{37}{7} \approx 5,3

 

\bar{y} = \frac{1}{N}\sum{y_i}= \frac{3,5+6,5+9,5+14+21+32,5+34}{7}= \frac{121}{7} = 17,3

 

3) a)Déterminer le coefficient de correlation linéaire r

 

r = \frac{Cov(x,y)}{\sigma(x)\sigma(y)}

 

Cov(x,y)= \frac{1}{7}(6,5+19+56+7 \times 21+11\times 32,5+12\times 34)-5,28 \times 17,28

 

Cov(x,y)= \frac{1}{7}(6,5+19+56+147+ 357,5 + 408)- 91,2

 

Cov(x,y)= \frac{994}{7} - 91,2 = 50,8

 

\sigma^2(x) = \frac{1}{N}(\sum{x_i^2})- \bar{x}^2= \frac{1}{7}(1+2^2+4^2+7^2+11^2+12^2)-(5,28)^2

 

\sigma(x)^2 = \frac{335}{7} - 27,9 = 47,8 -27,8 = 20 \Longrightarrow \sigma(x)= \sqrt{20}= 4,47

 


\sigma^2(y) = \frac{1}{N}(\sum{y_i^2})- \bar{y}^2 = \frac{1}{7(2994)-(17,28)}^2 = 427,7-298,5

 

\sigma^2(y) = 129,2 \Longrightarrow \sigma(y)=\sqrt{129,2} = 11,3

 

\Longrightarrow r = \frac{50,8}{4,5 \times 11,3}= 0,290

 

b)

4) Donner une équation de la droite de regression (D) de y en x

on a y - \bar{y} = a(x-\bar{x})      

 

a = \frac{Cov(x,y)}{V(x)} = \frac{50,8}{20} \approx 2,5

 


y = a(x-\bar{x}) + \bar{y} = 2,5(x - 5,3) + 17,3

 

y = 2,5 x + 4

 

graphiquement à partir de 4,5 ans le poids sera supérieur à 15 kg

 

y = 15 \Longrightarrow x = \frac{15-4}{2,5} = 4,4


corrigé epreuve 2010 : statistiques à deux variables

 

Le tableau ci-dessous donne le nombre d'années d'exercice X des ouvriers d'une entreprise et leur salaire mensuel Y en milliers de francs.

Notons X_{i} les modalités de X et n_{i} l'effectif avec 1\leq i\leq6.

Soit y_{j} les modalités de Y et n_{j} l'effectif avec 1\leq j\leq4. N est l'effectif total.





1) Déterminons a et b pour que la moyenne

\displaystyle\overline{x}=\frac{596}{59} et \displaystyle\overline{y}=\frac{8450}{59};


On sait que \displaystyle\overline{x}=\frac{\displaystyle\sum_{1}^{6}n_{i}x_{i}}{N} et \displaystyle\overline{y}=\frac{\displaystyle\sum_{1}^{4}n_{j}y_{j}}{N}


\displaystyle\overline{x}=\frac{2(a+2)+(6\times13)+'10\times10)+(14\times11)+18\times(b+17)+(22\times5)}{a+b+58} et


 \displaystyle\overline{y}=\frac{75(a+5)+(10\times125)+(38\times 175)+225(b+5)}{a+b+58}


On obtient ainsi le système suivant :


\left\{\begin{array}{lll}
239a-233b=4900\\
161a-193b=2580\\
\end{array}\right.


Doù a=40 et b=20


2) On suppose que a=40 et b=20.


En associant à chaque valeur x_{i} de X la moyenne m_{i} de la série conditionnelle : (y/x=x_{i}), on a le tableau suivant:



a) Calculons le coefficient de corrélation linéaire entre X et m.

Déterminons d'abord les moyennes \overline{x} et \overline{m}, les variances  V_{X} et V_{M}, les écarts-types \sigma _{X} et \sigma _{y} et la variance de x et y


\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^{6}x_{i}}{N} et \displaystyle\overline{m}=\frac{\displaystyle\sum_{i=1}^{6}m_{i}}{N}


\displaystyle V(X)=\frac{\displaystyle\sum x_{i}}{N}-\overline{x} et \displaystyle V(M)=\frac{\displaystyle\sum m_{i}}{N}-\overline{m}


\sigma(X)=\sqrt{V(X)} et \sigma(M)=\sqrt{V(M)}


\overline{x}=12 \overline{m}=156 V(X)\approx 46.66


V(M)=1933,33 \sigma(x)\equiv 6,83 \sigma(M)\approx 43,96 et cov(X,M)\equiv 267,33


Le coefficient de corrélation \displaystyle r=\frac{cov(x,m)}{\sigma x\sigma m}

r\approx0,89


Puisque r est proche de 1, il ya alors une forte corrélation entre X et m.


b) La droite de régression de m en x D_{m/x} a pour équation m=ax+b avec


\displaystyle a=\frac{cov(x,m)}{V(x)} et b=\overline{m}-a\overline{x}


a\approx5,73 et b\approx87,25


D_{m/x} : m=5,73x+87,25


c) Si x=30 alors m\approx259,128 d'où le salaire moyen d'un ouvrier ayant 30 ans d'ancienneté est environ égal à 259130 F

Corrigé corrélation et droites de régression (3 pts - 2009)

 

1. (D1) droite de régression de Y en X ayant pour équation : y = ax + b, on a a = \frac{cov(X,Y)}{V(X)} et b =\bar{y} - a\bar{x}

 

(D2) droite de régression de X en Y ayant pour équation : x = a’y + b’, on a a’ = \frac{cov(Y,X)}{V(Y)} et b =\bar{x} - a’\bar{y}

 

On en déduit que aa’ = \frac{cov(X,Y)}{V(X)} \frac{cov(Y,X)}{V(Y)} = \frac{\left(cov(X,Y)\right)^{2}}{V(X)V(Y)} = \left( \frac{cov(X,Y)}{\sigma(X) \sigma(Y)\right)^{2}}

aa’ = r2

 

 

2.

 

(D1) droite de régression de Y en X ayant pour équation réduite y = 2,4x, on a : a = 2,4 et b = 0

 

(D2) droite de régression de X en Y ayant pour équation réduite : x = \frac{3,5}{9}y + \frac{24}{9}, on a : a’ = \frac{3,5}{9} et b’ = \frac{24}{9}

 


D’après la question précédente, le coefficient de corrélation vérifie :

 

r2 = aa’ = 2,4 \times \frac{3,5}{9} = \frac{14}{15}

 

Puisque r = \frac{con(X,Y)}{\sigma(X) \sigma(Y)}, que \sigma(X) et \sigma(Y) sont positifs par définition et que cov (X,Y) est positif par hypothèse, alors r est positif.

 

Donc r = \sqrt{\frac{14}{15}}

 

3.

 

On a  \left\{ \begin{array}{ll}- a \bar{x} + \bar{y} = b (1) \\ \bar{x} - a^\prime \bar{y} = b^\prime (2) \\ \end{array} \right.

 


Nous multiplions l’équation (2) par a et obtenons : a\bar{x} - aa^\prime\bar{y} =a b^\prime

 


Le système devient :  \left\{ \begin{array}{ll} - a \bar{x} + \bar{y} = b (1) \\ a\bar{x} - aa^\prime\bar{y} = ab^\prime (2’) \\ \end{array} \right.

 


La somme membre à membre des 2 équations donne : (1 - aa^\prime)\bar{y} = b + ab^\prime

 


Nous déduisons \bar{y} = \frac{b + ab^\prime}{1 - r^{2}}

 


Pour trouver \bar{x}, je remplace \bar{y} par sa valeur dans (2)

 


soit :

 


\bar{x} - a^\prime\frac{b + ab^\prime}{1 - r^{2}} = b^\prime

 


\Longleftrightarrow \bar{x} = b^\prime + a^\prime \frac{b + ab^\prime}{1 - r^{2}}

 

\bar{x} = \frac{b^\prime - r^{2}b^\prime + a^\prime b + a^{\prime} ab^\prime}{1 - r^{2}}

 

\bar{x} = \frac{b^\prime - aa^{\prime}b^\prime + a^\prime b + a^{\prime} ab^\prime}{1 - r^{2}}

 

\bar{x} = \frac{b^\prime + a^\prime b}{1 - r^{2}}


Application numérique :

 

\frac{1}{1 - r^{2}} = 15, on a \bar{y} = 15 \times 2,4 \times \frac{24}{9} et \bar{x} = 15 \times \frac{24}{9}

 

Donc \bar{y} = 96 et \bar{x} = 40

 

OIF
RESAFAD

EXAMEN.SN V2.0 © RESAFAD SENEGAL Creative Commons License - Avenue Bourguiba x rue 14 Castors, Dakar (Sénégal) - Tél/Fax : +221 33864 62 33