Thursday 26 January 2017

Fonction D'Autocorrélation

2.1 Modèles de moyenne mobile (modèles MA) Les modèles de séries chronologiques connus sous le nom de modèles ARIMA peuvent inclure des termes autorégressifs ou des termes de moyenne mobile. Dans la semaine 1, nous avons appris un terme autorégressif dans un modèle de série chronologique pour la variable x t est une valeur décalée de x t. Par exemple, un terme autorégressif de retard 1 est x t-1 (multiplié par un coefficient). Cette leçon définit les termes moyens mobiles. Un terme moyen mobile dans un modèle de séries chronologiques est une erreur passée (multipliée par un coefficient). Soit (wt overet N (0, sigma2w)), ce qui signifie que les w t sont identiquement, indépendamment distribués, chacun avec une distribution normale ayant une moyenne 0 et la même variance. Le modèle de moyenne mobile du 1er ordre, noté MA (1) est (xt mu wt theta1w) Le modèle de moyenne mobile du 2 e ordre, noté MA (2) est (xt mu wt theta1w theta2w) , Désignée par MA (q) est (xt mu wt theta1w theta2w points thetaqw) Note. De nombreux manuels et logiciels définissent le modèle avec des signes négatifs avant les termes. Cela ne modifie pas les propriétés théoriques générales du modèle, bien qu'il renverse les signes algébriques des valeurs des coefficients estimés et des termes (non carrés) dans les formules pour les ACF et les variances. Vous devez vérifier votre logiciel pour vérifier si des signes négatifs ou positifs ont été utilisés pour écrire correctement le modèle estimé. R utilise des signes positifs dans son modèle sous-jacent, comme nous le faisons ici. Propriétés théoriques d'une série temporelle avec un modèle MA (1) Notez que la seule valeur non nulle dans l'ACF théorique est pour le lag 1. Toutes les autres autocorrélations sont 0. Ainsi, un échantillon ACF avec une autocorrélation significative seulement au décalage 1 est un indicateur d'un modèle MA (1) possible. Pour les étudiants intéressés, les preuves de ces propriétés sont une annexe à ce document. Exemple 1 Supposons qu'un modèle MA (1) soit x t 10 w t .7 w t-1. Où (wt dépasse N (0,1)). Ainsi, le coefficient 1 0,7. L'ACF théorique est donné par Un tracé de cette ACF suit. Le graphique qui vient d'être montré est l'ACF théorique pour un MA (1) avec 1 0,7. En pratique, un échantillon ne fournira habituellement qu'un tel motif clair. En utilisant R, nous avons simulé n 100 échantillons en utilisant le modèle x t 10 w t .7 w t-1 où w t iid N (0,1). Pour cette simulation, un schéma chronologique des données de l'échantillon suit. Nous ne pouvons pas dire beaucoup de cette intrigue. L'échantillon ACF pour les données simulées suit. Nous observons un pic au décalage 1 suivi par des valeurs généralement non significatives pour les décalages au-delà de 1. Notez que l'échantillon ACF ne correspond pas au modèle théorique du MA (1) sous-jacent, c'est-à-dire que toutes les autocorrélations Un échantillon différent aurait un ACF d'échantillon légèrement différent indiqué ci-dessous, mais aurait probablement les mêmes caractéristiques générales. Propriétés théoriques d'une série temporelle avec un modèle MA (2) Pour le modèle MA (2), les propriétés théoriques sont les suivantes: Noter que les seules valeurs non nulles dans l'ACF théorique sont pour les lags 1 et 2. Les autocorrélations pour les décalages supérieurs sont 0 . Ainsi, un échantillon ACF avec des autocorrélations significatives aux décalages 1 et 2, mais des autocorrélations non significatives pour des décalages plus élevés indique un modèle MA (2) possible. Iid N (0,1). Les coefficients sont 1 0,5 et 2 0,3. Parce qu'il s'agit d'une MA (2), l'ACF théorique aura des valeurs non nulles uniquement aux lags 1 et 2. Les valeurs des deux autocorrélations non nulles sont: Un tracé de la théorie ACF suit. Comme presque toujours le cas, les données d'échantillon ne se comporteront pas aussi parfaitement que la théorie. Nous avons simulé n 150 échantillons pour le modèle x t 10 w t .5 w t-1 .3 w t-2. Où w t iid N (0,1). Le tracé de la série chronologique des données suit. Comme avec le graphique de la série temporelle pour les données d'échantillon MA (1), vous ne pouvez pas en dire beaucoup. L'échantillon ACF pour les données simulées suit. Le modèle est typique pour les situations où un modèle MA (2) peut être utile. Il y a deux pointes statistiquement significatives aux écarts 1 et 2, suivies des valeurs non significatives pour les autres retards. Notez qu'en raison de l'erreur d'échantillonnage, l'ACF de l'échantillon ne correspondait pas exactement au modèle théorique. ACF pour les modèles MA (q) Une propriété des modèles MA (q) en général est qu'il existe des autocorrélations non nulles pour les q premiers lags et autocorrélations 0 pour tous les retards gt q. Non-unicité de la connexion entre les valeurs de 1 et (rho1) dans MA (1) Modèle. Dans le modèle MA (1), pour toute valeur de 1. La valeur réciproque 1 1 donne la même valeur pour. Par exemple, utilisez 0,5 pour 1. Puis utilisez 1 (0,5) 2 pour 1. Vous obtiendrez (rho1) 0,4 dans les deux cas. Pour satisfaire une restriction théorique appelée invertibilité. Nous limitons les modèles MA (1) à des valeurs dont la valeur absolue est inférieure à 1. Dans l'exemple donné, 1 0,5 sera une valeur de paramètre admissible, alors que 1 10,5 2 ne le sera pas. Invertibilité des modèles MA Un modèle MA est dit inversible s'il est algébriquement équivalent à un modèle d'ordre infini convergent. En convergeant, nous voulons dire que les coefficients AR décroissent à 0 lorsque nous retournons dans le temps. Invertibilité est une restriction programmée dans le logiciel de séries temporelles utilisé pour estimer les coefficients de modèles avec des termes MA. Ce n'est pas quelque chose que nous vérifions dans l'analyse des données. Des informations supplémentaires sur la restriction d'inversibilité pour les modèles MA (1) sont données en annexe. Théorie avancée. Pour un modèle MA (q) avec un ACF spécifié, il n'existe qu'un seul modèle inversible. La condition nécessaire à l'inversibilité est que les coefficients ont des valeurs telles que l'équation 1- 1 y-. - q y q 0 a des solutions pour y qui tombent en dehors du cercle unitaire. Code R pour les exemples Dans l'exemple 1, nous avons représenté l'ACF théorique du modèle x t 10 w t. 7w t-1. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les r commandes utilisées pour tracer l'ACF théorique sont: acfma1ARMAacf (mac (0.7), lag. max10) 10 lags de ACF pour MA (1) avec theta1 0.7 lags0: 10 crée une variable nommée lags qui va de 0 à 10. plot Abline (h0) ajoute un axe horizontal à la trame La première commande détermine l'ACF et la stocke dans un objet (a0) Nommé acfma1 (notre choix de nom). La commande plot (la 3ème commande) trace des retards par rapport aux valeurs ACF pour les lags 1 à 10. Le paramètre ylab étiquette l'axe y et le paramètre principal place un titre sur la trame. Pour voir les valeurs numériques de l'ACF, utilisez simplement la commande acfma1. La simulation et les parcelles ont été effectuées avec les commandes suivantes. (X, typeb, mainSimulated MA (1) data) xcarima. sim (n150, list (mac (0.7))) Simule n 150 valeurs de MA (1) xxc10 ajoute 10 pour faire la moyenne 10. La simulation (X, xlimc (1,10), mainACF pour des données d'échantillon simulées) Dans l'exemple 2, nous avons représenté graphiquement l'ACF théorique du modèle xt 10 wt.5 w t-1 .3 w t-2. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les ordres R utilisés étaient: ACFma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 tracé (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal pour MA (2) avec theta1 0,5, (X, typeb, principale série MA (2) simulée) acf (x, xlimc (1,10), x2) (1) Pour les étudiants intéressés, voici des preuves des propriétés théoriques du modèle MA (1). Lorsque x 1, l'expression précédente 1 w 2. Pour tout h 2, l'expression précédente 0 (x), x, x, x, x, x, La raison en est que, par définition de l'indépendance du wt. E (w k w j) 0 pour tout k j. En outre, parce que w t ont une moyenne 0, E (w j w j) E (w j 2) w 2. Pour une série chronologique, appliquer ce résultat pour obtenir l'ACF ci-dessus. Un modèle inversible MA est celui qui peut être écrit comme un modèle AR d'ordre infini qui converge de sorte que les coefficients AR convergent vers 0 alors que nous avançons infiniment dans le temps. Bien démontrer l'inversibilité pour le modèle MA (1). On substitue alors la relation (2) pour w t-1 dans l'équation (1) (3) (zt wt theta1 (z - theta1w) wt theta1z - theta2w) Au temps t-2. L'équation (2) devient Nous substituons alors la relation (4) pour w t-2 dans l'équation (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si nous devions continuer On notera cependant que si 1 1, les coefficients multipliant les décalages de z augmentent (infiniment) en taille à mesure que l'on se déplace vers l'arrière temps. Pour éviter cela, nous avons besoin de 1 lt1. C'est la condition pour un modèle inversible MA (1). Infinite Order MA model Dans la semaine 3, voyez bien qu'un modèle AR (1) peut être converti en un modèle d'ordre infini MA: (xt - mu wt phi1w phi21w points phik1 w dots sum phij1w) Cette sommation des termes de bruit blanc passé est connue Comme la représentation causale d'un AR (1). En d'autres termes, x t est un type spécial de MA avec un nombre infini de termes revenant dans le temps. C'est ce qu'on appelle un ordre infini MA ou MA (). Un ordre fini MA est un ordre infini AR et tout ordre fini AR est un ordre infini MA. Rappelons à la semaine 1, nous avons noté qu'une exigence pour un AR stationnaire (1) est que 1 lt1. Calculons le Var (x t) en utilisant la représentation causale. Cette dernière étape utilise un fait de base sur les séries géométriques qui nécessite (phi1lt1) sinon la série diverge. NavigationAutocorrélation du processus de moyenne mobile Cet exemple montre comment introduire l'autocorrélation dans un processus de bruit blanc par filtrage. Lorsque nous introduisons l'autocorrélation en un signal aléatoire, nous manipulons sa fréquence. Un filtre à moyenne mobile atténue les composantes haute fréquence du signal, le lissant efficacement. Créez la réponse impulsionnelle pour un filtre à moyenne mobile à 3 points. Filtrer une séquence de bruit blanc N (0,1) avec le filtre. Réglez le générateur de nombres aléatoires sur les paramètres par défaut pour obtenir des résultats reproductibles. Obtenir l'auto-corrélation de l'échantillon biaisé à 20 décalages. Tracer l'autocorrélation de l'échantillon avec l'autocorrélation théorique. L'autocorrélation d'échantillon capture la forme générale de l'autocorrélation théorique, même si les deux séquences ne concordent pas en détail. Dans ce cas, il est clair que le filtre n'a introduit une autocorrélation significative que sur des décalages -2,2. La valeur absolue de la séquence décroît rapidement à zéro en dehors de cette plage. Pour voir que le contenu en fréquence a été affecté, tracer les estimations Welch des densités spectrales de puissance des signaux originaux et filtrés. Le bruit blanc a été coloré par le filtre de moyenne mobile. MATLAB et Simulink sont des marques déposées de The MathWorks, Inc. Veuillez consulter mathworkstrademarks pour obtenir une liste des autres marques de commerce appartenant à The MathWorks, Inc. Les autres noms de produits ou de marques sont des marques de commerce ou des marques déposées de leurs propriétaires respectifs. Sélectionnez votre paysA Corrélogramme Dans l'analyse des données, nous commençons généralement par les propriétés statistiques descriptives des données de l'échantillon (par exemple, moyenne, écart-type, biais, kurtosis, répartition empirique, etc.). Ces calculs sont certainement utiles, mais ils ne tiennent pas compte de l'ordre des observations dans les données de l'échantillon. L'analyse des séries chronologiques exige que l'on prête attention à l'ordre et nécessite donc un type différent de statistiques descriptives: des statistiques descriptives de séries chronologiques ou simplement des analyses de corrélogrammes. L'analyse corrélogramme examine la dépendance spatio-temporelle dans les données de l'échantillon et se concentre sur l'autocovariance empirique, l'auto-corrélation et les tests statistiques connexes. Enfin, le corrélogramme est une pierre angulaire pour l'identification du (des) modèle (s) et modèle (s). Ce tutoriel est un peu plus théorique que les tutoriels précédents dans la même série, mais nous ferons de notre mieux pour conduire les intuitions Maison pour vous. Contexte D'abord, commencez bien par une définition de la fonction d'auto-corrélation, simplifiez-la et étudiez l'ACF théorique pour un processus de type ARMA. Fonction d'auto-corrélation (ACF) Par définition, l'autocorrélation du lag k est exprimée comme suit: En utilisant la formule d'autocorrélation MA (q), on peut calculer les fonctions d'auto-corrélation ARMA (p, q) pour leur représentation MA . Cela devient intense Certains d'entre vous pourraient se demander pourquoi nous n'avons pas utilisé VAR ou une représentation d'espace d'état pour simplifier les notations. J'ai fait un point de rester dans le domaine du temps, et évité toute nouvelle idée ou des astuces de mathématiques car ils ne serviraient pas nos intentions ici: Implying l'ordre ARMA exacte en utilisant les valeurs ACF par eux-mêmes, ce qui est tout sauf précis. Intuition: Les valeurs ACF peuvent être considérées comme les valeurs des coefficients du modèle équivalent MA. Intuition: La variance conditionnelle n'a pas de barrière (effet) sur les calculs d'auto-corrélation. Intuition: La moyenne à long terme n'a pas non plus de barrière (effet) sur les auto-corrélations. Fonction d'auto-corrélation partielle (PACF) Nous avons vu que l'identification de l'ordre du modèle (MA ou AR) est non trivial pour les cas non-simples, nous avons besoin d'un autre outil d'auto-corrélation partielle (PACF). La fonction d'auto corrélation partielle (PACF) joue un rôle important dans l'analyse des données visant à identifier l'ampleur du retard dans un modèle autorégressif. L'utilisation de cette fonction a été introduite dans le cadre de l'approche de Box-Jenkins à la modélisation des séries temporelles, dans laquelle on peut déterminer les décalages appropriés p dans un modèle AR (p) ou dans un modèle ARIMA (p, d, q) Les fonctions d'auto-corrélation partielle. Le PACF suppose que le modèle sous-jacent est un AR (k) et utilise des régressions multiples pour calculer le dernier coefficient de régression. Intuition rapide: les valeurs PACF peuvent être considérées (à peu près) comme les valeurs des coefficients du modèle AR équivalent. Comment le PACF nous est-il utile? En supposant que nous avons un processus AR (p), le PACF aura des valeurs significatives pour les premiers p lags et tombera à zéro après. Qu'en est-il du processus MA Le processus MA comporte des valeurs PACF non nulles pour un nombre (théoriquement) infini de décalages. Exemple 4: MA (1)


No comments:

Post a Comment