Introduction

L’objectif du chapitre est la mise en place de techniques mathématiques pour étudier des séries chronologiques afin de :

  • comprendre le passé, analyser et expliquer les valeurs, il s’agit de modéliser les séries
  • prédire le futur, faire des prévisions pour les valeurs non observées
  • étudier le lien entre d’autres séries chronologiques

On va considérer une série chronologique de longueur T (= longueur de la série = taille de l’échantillon). t1, t2… tT : instants successifs d’observation. Yt = série étudiée.

On va distinguer l’évolution à travers le temps de la série, et les variations saisonnières.

I. Etude de la série chronologique

A. Méthode des nombres carrés ordinaires

Il existe plusieurs méthodes qui nous permettent de chercher la tendance générale (trend à la hausse/baisse). Comment quantifier la valeur entre deux variables ?

Dans un premier temps, on va partir d’un ensemble général qui met en relation 2 variables x et y, comment la quantifier :

J’ai y=f(x) avec y la variable expliquée et f(x) la variable explicative (y : f(x) = variable explicative (y est ce que je veux expliquer). y = ax+f = relation linéaire)

Dans la réalité, je ne connais pas de manière exacte la forme de la relation entre les deux variables. Cette forme, c’est f. F, on va essayer de l’approximer.
Il existe une infinité de façon de lier x et y, par exemple :

  • y=a log(x)+b
  • y=aex+b
  • y=ax+b

En l’écrivant ainsi, on décide que la relation entre les deux variables est linéaire. Une relation = une dynamique. Quelle est la différence entre une relation linéaire et non linéaire ?

Dans une relation linéaire (1), x augmente, y augmente, relation positive entre les deux variables. Relation non-linéaire (2). Relation linéaire (3)

Dans le premier cas on a une droite, dans le second on a une courbe ou morceau de droite. Dans le premier cas il s’agit de relation linéaire car j’ai une droite. Dans le second cas il s’agit d’une relation non linéaire. Dans le premier cas quand x augmente, y augmente. Il s’agit d’une relation linéaire positive entre 2 variables.

Est ce qu’on peut envisager une relation entre les variables x et y ? Oui, on peut envisager une relation entre deux variables négatives. On est dans le cas de la relation linéaire y=ax+b

 

Dans la figure (4) il n’y a aucune relation entre les deux : quand l’une augmente l’autre stagne. Ici y=b où b est une constante.

(manque exemple sur les sommes)

La relation Yt= axt+b n’est pas entachée d’erreur, elle est certaine. Ca n’a donc pas d’intérêt du point de vue mathématique, ce qui donne de l’intérêt à la relation c’est d’introduire l’incertitude (⅀t), ce sont les erreurs, les perturbations, les résidus.
Ce que l’on connait, qui est certain représente 95% et l’incertitude représente elle 5%.

Yt=axt+b      connus (observés)     inconnus=estimation    >> certitude = aucun intérêt

(exemple avec incertitudes : Yt=axt+b+∑t             t-Yt-(axt+b)          (où axt+b est estimé) )

La différence entre ce qui est observé et estimé doit être petite, on doit minimiser les erreurs. C’est la somme des différences qui doit etre petite. C’est cette somme qui nous intéresse, elle doit être nulle. La somme de t et de ⅀t doit être nulle. Du point de vue mathématique, si la somme d’une quantité (variable) est nulle on ne peut pas faire la modélisation dessus.

On va prendre la somme des carrés pour avoir une quantité qui n’est pas nulle.

⅀t² = [Yt – (axt+b)]²

La somme de Ƹt² = ⅀ [Yt – (axt+b)]² = ø

a et b sont les inconnus, x et y sont connus. On va minimiser cette quantité par rapport à a et à b
On va faire la dérivé par rapport à a et à b qui est égal à 0

Rappel :

(fn)’=nf(n-1)f’

Q’a = dq/da = 0
= 2⅀ (yt – (axt+b)) (-xt) = 0
= -2⅀(xt) (yt – (axt+b))=0
= ⅀(xt)(yt-axt+b)=0
= ⅀(xtyt) – ⅀(axt²) – ⅀(bxt) = 0
= ⅀(xtyt) – a ⅀(xt)² – b ⅀(xt) = 0
= ⅀(xtyt) – a ⅀(xt)² – bTx = 0
= ⅀(xtyt) – ⅀(xt)² – (y – ax) tx = 0
= ⅀(xtyt) – a ⅀(xt)² – Txy + aTx²
= ⅀(xtyt) – Txy = a ⅀(xt²) – a Tx²
= a[ ⅀(xt²) – Tx²]
a= [ ⅀(xtyt) – Txy] / [ ⅀(xt²) – Tx²]

Si on divise le numérateur et le dénominateur par T je vais avoir un numérateur ce que l’on appelle la co-variance et au dénominateur la variance. ⅀

Q’b = dq/db = 0
= 2⅀(yt – (axt+b)) (-1) = 0
= ⅀(yt-axt-b) = 0
= ⅀(ty) – ⅀(axt) – ⅀(b) = 0
= Ty – a⅀(xt) – T(b) = 0
= Ty – aTx-Tb = 0
= y – ax – b
b= y – ax

Reprenons l’exemple de l’entreprise bio :

t

yt

yt – y

t – t

(yt – y)(t – t)

(t – t

1

306

-66,416

-5,5

365,288

30,25

2

344

-28,416

-4,5

20,25

3

333

-39,416

4

373

0,584

5

327

-45,416

6

345

-27,416

7

347

-25,416

8

406

33,584

9

362

-10,416

10

387

14,584

11

382

9,584

12

437

64,584

5,5

355,212

78

4349

0,000

0,0

On a des chiffres qui évoluent avec le temps, la variable expliquée est le chiffre d’affaire, la variable explicative est le temps. Il est normal que le chiffre d’affaire évolue avec le temps, plus le temps passe plus le chiffre d’affaire dit normalement augmenter. Le temps est une bonne variable explicative du chiffre d’affaire, c’est ce que nous allons essayer de démontrer ici.

Yt = at+b+Ƹt
a = cov(y;t)/v(t)
b = y – at = 372,416- 8,188×6,5 = 319,122

a = [ ⅀(Yt – y)(t – t) ] / [ ⅀(t – t)²] = 1172,5 / 143 = 8,199
t = ⅀t/T = 78/12 = 6,5
y = ⅀y/y = 4349/12 = 372,416

Comment tracer la droite de régression ?

T        1          12
YT     327      417

On trace la droite qui passe par ces deux points

B. Méthodes des moyennes

1. Échelonnées

La méthode est simple, elle consiste à remplacer les observations successives par leur moyenne arithmétique. La méthode semble intuitive, la formulation est simple et consiste à calculer la moyenne des valeurs correspondant à une même période, l’intérêt de la méthode c’est qu’elle permet d’obtenir rapidement une estimation de la tendance générale mais la méthode est réductrice.
Pour chaque année on obtient i moyenne, au lieu d’avoir 12 observations (4 par années) on va en avoir une seule par année.

2. Mobiles

la méthode des moyennes mobiles consiste à faire des regroupements de 3, 4, 5 … observations par leurs moyennes. Supposons que l’on dispose des tables suivantes :

t

xi

MoyMobile

1

x1

2

x2

(x1+x2+x3)/3

3

x3

(x2+x3+x4)/3

T-1

xT-1

(xT-2+xT-1+xT)/3

T

xT

L’idée est d’avoir une série plus lisse pour faire des prédictions.

On a donné le même poids à toutes les valeurs, si on considère par exemple x2, on a pris la moyenne en prenant x1, x2 et x3 en leur donnant le même poids à chaque observation. On peut faire autrement en donnant plus de poids dans le calcul de la moyenne à x2, c’est ce que l’on appelle la méthode des moyennes mobiles pondérées.

t

xi

MoyMobile

MoyMob Pond

1

x1

2

x2

(x1+x2+x3)/3

(x1+2×2+x3)/4

3

x3

(x2+x3+x4)/3

(x2+2×3+x4)/4

T-1

xT-1

(xT-2+xT-1+xT)/3

(xT-2+2xT-1+xT)/4

T

xT

Application :

Reprenons l’exemple précédent

3. Représentation graphique

Pour représenter graphiquement la moyenne échelonnée on place les valeurs trouvées pour chaque année au milieu de l’année, ainsi pour la première moyenne 339, on va la placer entre le 2eme et 3 eme trimestre, la deuxième valeur entre le 6 eme et 7 eme trimestre et la troisième valeur entre le 10 eme et 11 eme

Question : laquelle des méthodes choisir ?

La moyenne échelonnée est rapide à calculer mais on perd beaucoup d’informations. Mais pour le lissage de la série et les prévisions on a une préférence pour les moyennes mobiles

4. Élimination de l’influence saisonnière ou désaisonnalisation
a. Recherche des coefficients saisonniers
  • On va utiliser l’équation du « trend » calculé par la méthode des moindres carrés ordinaires qui permet de calculer pour chaque trimestre en faisant varier t de 1 jusqu’à 12 une valeur moyenne du chiffre d’affaire réalisé
Chapitre 2 – Les séries chronologiques

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *