Saturday 11 November 2017

Autoregressivo Movimento Média Modelo Variância


ARMA Unplugged Esta é a primeira entrada em nossa série de tutoriais desconectados, nos quais aprofundamos os detalhes de cada um dos modelos de séries temporais com os quais você já está familiarizado, destacando os pressupostos subjacentes e conduzindo suas intuições. Nesta questão, abordamos o modelo ARMA como uma pedra angular na modelagem de séries temporais. Ao contrário dos problemas de análise anteriores, começaremos aqui com a definição do processo ARMA, indicar as entradas, saídas, parâmetros, restrições de estabilidade, premissas e finalmente desenhar algumas diretrizes para o processo de modelagem. Antecedentes Por definição, a média móvel auto-regressiva (ARMA) é um processo estocástico estacionário composto por somas de Excel autoregressivo e componentes de média móvel. Alternativamente, em uma formulação simples: Premissas Vamos olhar mais de perto para a formulação. O processo ARMA é simplesmente uma soma ponderada das observações e choques de resultados passados, com poucos pressupostos fundamentais: o que esses pressupostos significam que um processo estocástico é uma contrapartida de um processo determinista que descreve a evolução de uma variável aleatória ao longo do tempo. No nosso caso, a variável aleatória é O processo ARMA apenas captura a correlação serial (ou seja, auto-correlação) entre as observações. Em palavras simples, o processo ARMA resume os valores de observações passadas, não seus valores quadrados ou seus logaritmos, etc. A dependência de ordem superior exige um processo diferente (por exemplo, ARCHGARCH, modelos não-lineares, etc.). Existem inúmeros exemplos de um processo estocástico em que os valores passados ​​afetam os atuais. Por exemplo, em um escritório de vendas que recebe PDOs de forma contínua, alguns são realizados como vendas vencidas, algumas como vendas perdidas e algumas derrubadas no próximo mês. Como resultado, em qualquer mês, alguns dos casos de vendas vencidas se originam como PDOs ou são vendas repetidas dos meses anteriores. Quais são os choques, inovações ou termos de erro Esta é uma pergunta difícil, e a resposta não é menos confusa. Ainda assim, vamos tentar: em palavras simples, o termo de erro em um determinado modelo é um balde catch-all para todas as variações que o modelo não explica. Ainda perdido. Utilize um exemplo. Para um processo de preço de ações, há possivelmente centenas de fatores que impulsionam o nível de preços atualizado, incluindo: Dividendos e anúncios divididos Relatórios de ganhos trimestrais Atividades de fusão e aquisição (MampA) Eventos legais, e. A ameaça de ações judiciais de classe. Outros Um modelo, por design, é uma simplificação de uma realidade complexa, então, o que quer que deixamos fora do modelo, é incluído automaticamente no termo de erro. O processo ARMA assume que o efeito coletivo de todos esses fatores age mais ou menos como o ruído gaussiano. Por que nos preocupamos com os choques passados ​​Ao contrário de um modelo de regressão, a ocorrência de um estímulo (por exemplo, choque) pode afetar o nível atual e possivelmente os níveis futuros. Por exemplo, um evento corporativo (por exemplo, atividade MampA) afeta o preço das ações da empresa subjacente, mas a mudança pode levar algum tempo para ter seu impacto total, pois os participantes do mercado absorvem as informações disponíveis e reagem de acordo. Isso levanta a questão: não os valores passados ​​da saída já têm os erros de informações passadas SIM, o histórico de choques já é contabilizado nos níveis de saída passados. Um modelo ARMA pode ser representado apenas como um modelo auto-regressivo puro (AR), mas o requisito de armazenamento de um sistema desse tipo em infinito. Esta é a única razão para incluir o componente MA: para economizar em armazenamento e simplificar a formulação. Novamente, o processo ARMA deve ser estacionário para a variância marginal (incondicional) existir. Nota: Na minha discussão acima, não estou fazendo uma distinção entre a simples ausência de uma raiz unitária na equação característica e a estacionaridade do processo. Eles estão relacionados, mas a ausência de uma unidade de raiz não é uma garantia de estacionaria. Ainda assim, a raiz da unidade deve estar dentro do círculo da unidade para ser precisa. Conclusão Vamos recapitular o que fizemos até agora. Primeiro examinamos um processo ARMA estacionário, juntamente com sua formulação, insumos, pressupostos e requisitos de armazenamento. Em seguida, mostramos que um processo ARMA incorpora seus valores de saída (auto-correlação) e choques que experimentou anteriormente na saída atual. Finalmente, mostramos que o processo ARMA estacionário produz uma série de tempo com uma média e variância estavel a longo prazo. Na nossa análise de dados, antes de propor um modelo ARMA, devemos verificar a suposição de estacionararia e os requisitos de memória finita. No caso de a série de dados exibir uma tendência determinista, precisamos remover (de-tendência) primeiro e, em seguida, usar os resíduos para ARMA. No caso de o conjunto de dados exibir uma tendência estocástica (por exemplo, caminhada aleatória) ou sazonalidade, precisamos entreter ARIMASARIMA. Finalmente, o correlograma (ou seja, o ACFPACF) pode ser usado para avaliar o requisito de memória do modelo, devemos esperar que ACF ou PACF se desintequem rapidamente após alguns atrasos. Caso contrário, isso pode ser um sinal de não-estacionaridade ou um padrão de longo prazo (por exemplo, ARFIMA). Um RIMA significa modelos de Módulo de Mídia Integrada Autoregressiva. Univariado (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série inteiramente baseada em sua própria inércia. Sua principal aplicação é a previsão de curto prazo que requer pelo menos 40 pontos de dados históricos. Isso funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de valores atípicos. Às vezes, chamado Box-Jenkins (após os autores originais), o ARIMA geralmente é superior às técnicas de suavização exponencial quando os dados são razoavelmente longos e a correlação entre observações passadas é estável. Se o dado for curto ou altamente volátil, algum método de suavização poderá ser melhor. Se você não tem pelo menos 38 pontos de dados, você deve considerar algum outro método que o ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaria. A estacionarização implica que a série permanece em um nível bastante constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou empresariais, seus dados NÃO são estacionários. Os dados também devem mostrar uma variância constante em suas flutuações ao longo do tempo. Isso é facilmente visto com uma série que é fortemente sazonal e cresce a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem essas condições de estacionaridade, muitos dos cálculos associados ao processo não podem ser computados. Se um gráfico gráfico dos dados indica não-estacionária, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não estacionária em uma estacionária. Isso é feito subtraindo a observação no período atual do anterior. Se essa transformação for feita apenas uma vez para uma série, você diz que os dados foram diferenciados pela primeira vez. Este processo elimina essencialmente a tendência se sua série estiver crescendo a uma taxa bastante constante. Se estiver crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferenciar os dados novamente. Os seus dados seriam então diferenciados em segundo lugar. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número especificado de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados costuma ser chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores de 1 período separado estão correlacionados entre si ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados separados por dois períodos estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma alta correlação negativa. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de auto-correlação para uma determinada série em diferentes atrasos. Isso é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em uma série de tempo estacionária como uma função do que são chamados de parâmetros verticais autorregressivos e móveis. Estes são referidos como parâmetros AR (autoregessivos) e MA (médias móveis). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo da ordem 1 X (t-1) a série temporal atrasou 1 período E (T) o termo de erro do modelo Isso significa simplesmente que qualquer valor X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), além de algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse de .30, então o valor atual da série ficaria relacionado a 30 de seu valor 1 há. Claro, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente precedentes, X (t-1) e X (t-2), além de algum erro aleatório E (t). Nosso modelo é agora um modelo de ordem autorregressivo 2. Modelos médios em movimento: um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora esses modelos pareçam muito parecidos com o modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros médios em movimento relacionam o que acontece no período t apenas com os erros aleatórios ocorridos em períodos passados, ou seja, E (t-1), E (t-2), etc., em vez de X (t-1), X ( T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo de MA pode ser escrito da seguinte forma. X (t) - B (1) E (t-1) E (t) O termo B (1) é chamado de MA da ordem 1. O sinal negativo na frente do parâmetro é usado somente para convenção e geralmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima simplesmente diz que qualquer valor dado de X (t) está diretamente relacionado apenas ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso de modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo combinações diferentes e comprimentos médios móveis. A metodologia ARIMA também permite a criação de modelos que incorporam parâmetros de média autorregressiva e móvel em conjunto. Estes modelos são frequentemente referidos como modelos mistos. Embora isso faça para uma ferramenta de previsão mais complicada, a estrutura pode simular a série melhor e produzir uma previsão mais precisa. Os modelos puros implicam que a estrutura consiste apenas em parâmetros AR ou MA - e não em ambos. Os modelos desenvolvidos por esta abordagem geralmente são chamados de modelos ARIMA porque eles usam uma combinação de autoregressivo (AR), integração (I) - referente ao processo reverso de diferenciação para produzir as operações de previsão e média móvel (MA). Um modelo ARIMA geralmente é declarado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autoregressivo de segunda ordem com um componente de média móvel de primeira ordem, cuja série foi diferenciada uma vez para induzir a estacionararia. Escolhendo a especificação correta: o principal problema no clássico Box-Jenkins está tentando decidir qual a especificação ARIMA para usar - i. e. Quantos parâmetros AR e ou MA devem incluir. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Dependia da avaliação gráfica e numérica da autocorrelação da amostra e das funções de autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que se parecem de uma certa maneira. No entanto, quando você aumenta a complexidade, os padrões não são facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isso significa que erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte e não uma ciência.

No comments:

Post a Comment