Etapas na escolha de um modelo de previsão Seu modelo de previsão deve incluir características que capturam todas as propriedades qualitativas importantes dos dados: padrões de variação no nível e tendência, efeitos da inflação e sazonalidade, correlações entre variáveis, etc. Modelo escolhido deve concordar com sua intuição sobre como a série é susceptível de se comportar no futuro. Ao montar um modelo de previsão, você tem algumas das seguintes opções: Estas opções são descritas resumidamente abaixo. Consulte o fluxograma de previsão que acompanha uma visão pictórica do processo de especificação do modelo e consulte novamente o painel Especificação do Modelo Statgraphics para ver como os recursos do modelo são selecionados no software. Deflação Se a série mostrar um crescimento inflacionário, então a deflação ajudará a explicar o padrão de crescimento e reduzir a heteroscedasticidade nos resíduos. Você pode (i) esvaziar os dados passados e reinflar as previsões de longo prazo a uma taxa constante adotada, ou (ii) desinflar os dados passados por um índice de preços como o IPC, e então quotmanualmente reinflar as previsões de longo prazo usando Uma previsão do índice de preços. A opção (i) é a mais fácil. No Excel, você pode apenas criar uma coluna de fórmulas para dividir os valores originais pelos fatores apropriados. Por exemplo, se os dados são mensais e você quer deflacionar a uma taxa de 5 por 12 meses, você dividiria por um fator de (1.05) (k12) onde k é o índice de linha (número de observação). RegressIt e Statgraphics têm ferramentas embutidas que fazem isso automaticamente para você. Se você seguir esta rota, geralmente é melhor definir a taxa de inflação assumida igual à sua melhor estimativa da taxa atual, especialmente se você estiver indo para prever mais de um período à frente. Se preferir a opção (ii), primeiro você deve salvar as previsões deflacionadas e os limites de confiança na sua planilha de dados, em seguida, gerar e salvar uma previsão para o índice de preços e, finalmente, multiplicar as colunas apropriadas. Transformação logarítmica Se a série mostra um crescimento composto e / ou um padrão sazonal multiplicativo, uma transformação logarítmica pode ser útil em adição ou em substituição à deflação. Registrando os dados não vai achatar um padrão de crescimento inflacionário, mas ele vai endireitá-lo para que ele pode ser ajustado por um modelo linear (por exemplo, um passeio aleatório ou modelo ARIMA com crescimento constante, ou um modelo de suavização linear exponencial). Além disso, o log irá converter padrões sazonais multiplicativos para padrões aditivos, de modo que se você executar o ajuste sazonal após o registro, você deve usar o tipo aditivo. Logging lida com a inflação de forma implícita se você quiser inflação a ser modelado explicitamente - i. e. Se você quiser que a taxa de inflação seja um parâmetro visível do modelo ou se você quiser exibir gráficos de dados deflacionados - então você deve desinflar ao invés de logar. Outro uso importante para a transformação do log é linearizar as relações entre variáveis em um modo de regressão l. Por exemplo, se a variável dependente for uma função multiplicativa em vez de aditiva das variáveis independentes, ou se a relação entre variáveis dependentes e independentes for linear em termos de variações percentuais em vez de mudanças absolutas, então aplicando uma transformação de log para uma ou mais variáveis Pode ser apropriado, como no exemplo de vendas de cerveja. (Retornar ao início da página). Ajuste sazonal Se a série tiver um forte padrão sazonal que se acredita ser constante de ano para ano, o ajuste sazonal pode ser uma maneira apropriada de estimar e extrapolar o padrão. A vantagem do ajuste sazonal é que ele modela o padrão sazonal explicitamente, dando-lhe a opção de estudar os índices sazonais e os dados dessazonalizados. A desvantagem é que ela exige a estimativa de um grande número de parâmetros adicionais (particularmente para dados mensais), e não fornece nenhuma razão teórica para o cálculo de intervalos de confiança quotcorrect. A validação fora da amostra é especialmente importante para reduzir o risco de ajuste excessivo dos dados passados através de ajuste sazonal. Se os dados são fortemente sazonais, mas você não escolhe ajuste sazonal, as alternativas são para (i) usar um modelo ARIMA sazonal. Que implícitamente prevê o padrão sazonal usando defasagens e diferenças sazonais, ou (ii) use o modelo de suavização exponencial sazonal de Winters, que estima os índices sazonais variando no tempo. Quota de variáveis independentes Se houver outras séries cronológicas que você acredita ter poder explicativo com relação à sua série de interesse (por exemplo, indicadores econômicos ou variáveis de políticas como preço, publicidade, promoções, etc.) você Pode desejar considerar a regressão como seu tipo de modelo. Se você escolhe ou não a regressão, você ainda precisa considerar as possibilidades mencionadas acima para transformar suas variáveis (deflação, log, ajuste sazonal - e talvez também diferencial) para explorar a dimensão do tempo e / ou linearizar as relações. Mesmo que você não escolha a regressão neste ponto, talvez você queira considerar adicionar regressores mais tarde a um modelo de séries temporais (por exemplo, um modelo ARIMA) se os resíduos tiverem correlação cruzada signficante com outras variáveis. (Voltar ao início da página.) Alisamento, média ou caminhada aleatória Se você tiver escolhido ajustar os dados sazonalmente - ou se os dados não forem sazonais para começar - então você pode usar um modelo de média ou suavização para Ajuste o padrão não sazonal que permanece nos dados neste ponto. Uma média móvel simples ou um modelo de suavização exponencial simples calcula apenas uma média local de dados no final da série, partindo do pressuposto de que esta é a melhor estimativa do valor médio actual em torno do qual os dados estão a flutuar. Normalmente, a suavização exponencial simples é preferida a uma média móvel simples, pois sua média ponderada exponencialmente faz um trabalho mais sensato de descontar os dados mais antigos, porque a sua média O parâmetro de suavização (alfa) é contínuo e pode ser prontamente optimizado, e porque tem uma base teórica subjacente para calcular intervalos de confiança. Se a suavização ou a média não parecer ser útil - i. e. Se o melhor preditor do próximo valor da série de tempo é simplesmente o seu valor anterior - então um modelo de caminhada aleatória é indicado. Este é o caso, por exemplo, se o número ótimo de termos na média móvel simples for 1, ou se o valor ótimo de alfa em suavização exponencial simples for 0,9999. Browns linear suavização exponencial pode ser usado para ajustar uma série com tendências lineares lentamente variar o tempo, mas ser cauteloso sobre a extrapolação dessas tendências muito longe no futuro. (Os intervalos de confiança que se alargam rapidamente para este modelo testemunham a sua incerteza quanto ao futuro distante.) O alisamento linear de Holts também estima tendências que variam no tempo, mas utiliza parâmetros separados para suavizar o nível e a tendência, o que geralmente proporciona um melhor ajuste aos dados Do que o modelo Brown8217s. Q uadratic suavização exponencial tenta estimar o tempo variando tendências quadráticas, e praticamente nunca deve ser usado. (Isto corresponderia a um modelo ARIMA com três ordens de diferenciação não sazonal). A suavização exponencial linear com tendência amortecida (isto é, uma tendência que se aplana em horizontes distantes) é frequentemente recomendada em situações onde o futuro é muito incerto. Os vários modelos exponenciais de suavização são casos especiais de modelos ARIMA (descritos abaixo) e podem ser equipados com software ARIMA. Em particular, o modelo de suavização exponencial simples é um modelo ARIMA (0,1,1), o modelo de suavização linear Holt8217s é um modelo ARIMA (0,2,2) eo modelo de tendência amortecida é um ARIMA (1,1,2 ) modelo. Um bom resumo das equações dos vários modelos de suavização exponencial pode ser encontrado nesta página no site da SAS. Os modelos de linha de tendência lineares, quadráticos ou exponenciais são outras opções para extrapolar uma série dessazonalizada, mas raramente superam a marcha aleatória, alisamento ou ARIMA em dados de negócios. (Retornar ao início da página.) Invernos Seasonal Exponential Smoothing Winters O Seasonal Smoothing é uma extensão de suavização exponencial que estima simultaneamente os fatores de variação temporal, tendência e sazonal usando equações recursivas. Os fatores sazonais de Invernos podem ser multiplicativos ou aditivos: normalmente você deve escolher a opção multiplicativa a menos que tenha registrado os dados. Embora o modelo de Winters seja inteligente e razoavelmente intuitivo, pode ser difícil de aplicar na prática: tem três parâmetros de suavização - alfa, beta e gama - para separar o nível, a tendência e os fatores sazonais, que devem ser estimados simultaneamente. A determinação dos valores iniciais para os índices sazonais pode ser feita aplicando-se o método da média da relação-para-movimentação de ajuste sazonal para parte ou toda a série e ou por backforecasting. O algoritmo de estimação que Statgraphics usa para esses parâmetros às vezes não consegue convergir e / ou rende valores que dão previsões bizarras e intervalos de confiança, então eu recomendaria cautela ao usar este modelo. (Voltar ao início da página.) ARIMA Se você não escolher o ajuste sazonal (ou se os dados não forem sazonais), você pode usar o modelo ARIMA. Modelos ARIMA são uma classe muito geral de modelos que inclui caminhada aleatória, tendência aleatória, suavização exponencial e modelos autorregressivos como casos especiais. A sabedoria convencional é que uma série é um bom candidato para um modelo ARIMA se (i) ele pode ser estacionalizado por uma combinação de diferenciação e outras transformações matemáticas, como o registro, e (ii) você tem uma quantidade substancial de dados para trabalhar com : Pelo menos 4 estações completas no caso de dados sazonais. (Se a série não pode ser estacionada adequadamente por diferenças - por exemplo, se é muito irregular ou parece estar qualitativamente mudando seu comportamento ao longo do tempo - ou se você tiver menos de 4 estações de dados, então você pode ser melhor com um modelo Que usa o ajuste sazonal e algum tipo de média ou de suavização simples.) Os modelos de ARIMA têm uma convenção de nomeação especial introduzida por Caixa e por Jenkins. Um modelo não-sazonal ARIMA é classificado como um modelo ARIMA (p, d, q), onde d é o número de diferenças não sazonais, p é o número de termos autorregressivos (atrasos das séries diferenciadas) e q é o número de movimento - Termos médios (atrasos dos erros de previsão) na equação de predição. Um modelo ARIMA sazonal é classificado como ARIMA (p, d, q) x (P, D, Q). Onde D, P e Q são, respectivamente, o número de diferenças sazonais, os termos sazonais autorregressivos (defasagens das séries diferenciadas em múltiplos do período sazonal) e os termos da média móvel sazonal (desfasamentos dos erros de previsão em múltiplos do período sazonal período). O primeiro passo na montagem de um modelo ARIMA é determinar a ordem apropriada de diferenciação necessária para estacionar a série e remover as características brutas da sazonalidade. Isso equivale a determinar qual modelo de caminhada aleatória ou de tendência aleatória é o melhor ponto de partida. Não tente usar mais do que 2 ordens totais de diferenciação (não sazonal e sazonal combinada) e não use mais de uma diferença sazonal. A segunda etapa é determinar se deve incluir um termo constante no modelo: geralmente você inclui um termo constante se a ordem total de diferenciação for 1 ou menos, caso contrário você não. Em um modelo com uma ordem de diferenciação, o termo constante representa a tendência média nas previsões. Em um modelo com duas ordens de diferenciação, a tendência das previsões é determinada pela tendência local observada no final da série temporal e o termo constante representa a tendência na tendência, ou seja, a curvatura do longo prazo, Prazo. Normalmente, é perigoso extrapolar tendências em tendências, então você suprimir o termo contante neste caso. O terceiro passo é escolher os números de parâmetros de média autorregressiva e móvel (p, d, q, P, D, Q) que são necessários para eliminar qualquer autocorrelação que permanece nos resíduos do modelo ingênuo (ou seja, qualquer correlação que permaneça após Mera diferenciação). Estes números determinam o número de defasagens das séries diferenciadas e / ou os atrasos dos erros de previsão que estão incluídos na equação de previsão. Se não houver autocorrelação significativa nos resíduos neste momento, então STOP, você está pronto: o melhor modelo é um modelo ingênuo Se houver autocorrelação significativa nos retornos 1 ou 2, você deve tentar ajustar q1 se uma das seguintes opções for aplicada: I) existe uma diferença não sazonal no modelo, (ii) a autocorrelação de atraso 1 é negativa. Andor (iii) o gráfico de autocorrelação residual é mais limpo (menos, picos mais isolados) do que o gráfico de autocorrelação parcial residual. Se não houver diferença não sazonal no modelo e / ou a autocorrelação de atraso 1 for positiva e ou a parcela de autocorrelação parcial residual parecer mais limpa, então tente p1. (Às vezes, essas regras para escolher entre p1 e q1 conflito uns com os outros, caso em que provavelmente não faz muita diferença qual você usar. Tente ambos e comparar.) Se houver autocorrelação no atraso 2 que não é removido por configuração p1 Ou q1, você pode então tentar p2 ou q2, ou ocasionalmente p1 e q1. Mais raramente você pode encontrar situações em que p2 ou 3 e q1, ou vice-versa, produz os melhores resultados. É altamente recomendável que você não use pgt1 e qgt1 no mesmo modelo. Em geral, ao montar modelos ARIMA, você deve evitar aumentar a complexidade do modelo para obter apenas pequenas melhorias adicionais nas estatísticas de erro ou na aparência dos gráficos ACF e PACF. Além disso, em um modelo com pgt1 e qgt1, existe uma boa possibilidade de redundância e não-unicidade entre os lados AR e MA do modelo, conforme explicado nas notas sobre a estrutura matemática dos modelos ARIMA. Geralmente, é melhor prosseguir de uma forma passo a passo em vez de retroceder passo a passo ao ajustar as especificações do modelo: comece com modelos mais simples e apenas adicione mais termos se houver uma clara necessidade. As mesmas regras aplicam-se ao número de termos autorregressivos sazonais (P) e ao número de termos de média móvel sazonal (Q) em relação à autocorrelação no período sazonal (por exemplo, atraso 12 para dados mensais). Tente Q1 se já houver uma diferença sazonal no modelo e / ou a autocorrelação sazonal for negativa e ou a parcela de autocorrelação residual parecer mais limpa na vizinhança da defasagem sazonal, caso contrário, tente P1. (Se for lógico que a série exiba forte sazonalidade, então você deve usar uma diferença sazonal, caso contrário, o padrão sazonal desaparecerá ao fazer previsões de longo prazo.) Ocasionalmente, você pode querer tentar P2 e Q0 ou vice-v ersa, Ou PQ1. No entanto, é altamente recomendável que PQ nunca deve ser maior do que 2. Padrões sazonais raramente têm o tipo de regularidade perfeita sobre um número suficientemente grande de estações que permitiriam identificar e estimar com fiabilidade muitos parâmetros. Além disso, o algoritmo backforecasting que é usado na estimação de parâmetros é susceptível de produzir resultados não confiáveis (ou mesmo louco) quando o número de estações de dados não é significativamente maior do que PDQ. Gostaria de recomendar não menos do que PDQ2 temporadas completas, e mais é melhor. Mais uma vez, quando se encaixam modelos ARIMA, você deve ter cuidado para evitar excesso de ajuste os dados, apesar do fato de que ele pode ser muito divertido uma vez que você pegar o jeito dele. Casos especiais importantes: Conforme observado acima, um modelo ARIMA (0,1,1) sem constante é idêntico a um modelo de suavização exponencial simples, e assume um nível flutuante (isto é, sem reversão média), mas com tendência de longo prazo. Um modelo ARIMA (0,1,1) com constante é um modelo de suavização exponencial simples com um termo de tendência linear não nulo incluído. Um modelo ARIMA (0,2,1) ou (0,2,2) sem constante é um modelo de suavização exponencial linear que permite uma tendência variável no tempo. Um modelo ARIMA (1,1,2) sem constante é um modelo de suavização exponencial linear com tendência amortecida, isto é, uma tendência que eventualmente se aplana em previsões de longo prazo. Os modelos ARIMA sazonais mais comuns são o modelo ARIMA (0,1,1) x (0,1,1) sem constante eo modelo ARIMA (1,0,1) x (0,1,1) com constante. O primeiro destes modelos aplica basicamente suavização exponencial tanto às componentes não sazonais como sazonais do padrão nos dados, ao mesmo tempo que permite uma tendência variável no tempo, eo último modelo é um pouco semelhante, mas assume uma tendência linear constante e, portanto, um pouco mais longo - previsibilidade a longo prazo. Você deve sempre incluir estes dois modelos entre sua linha de suspeitos ao ajustar dados com padrões sazonais consistentes. Um deles (talvez com uma pequena variação tal aumento p ou q por 1 andor ou configuração P1, bem como Q1) é muitas vezes o melhor. (Retornar ao início da página.) Previsão por Técnicas de Suavização Este site faz parte dos objetos de aprendizagem JavaScript E-Labs para tomada de decisão. Outros JavaScript nesta série são classificados em diferentes áreas de aplicações na seção MENU nesta página. Uma série de tempo é uma seqüência de observações que são ordenadas no tempo. Inerente na coleta de dados levados ao longo do tempo é alguma forma de variação aleatória. Existem métodos para reduzir o cancelamento do efeito devido a variação aleatória. As técnicas amplamente utilizadas são suavização. Estas técnicas, quando devidamente aplicadas, revelam mais claramente as tendências subjacentes. Insira a série de tempo em ordem de linha em seqüência, começando pelo canto superior esquerdo e o (s) parâmetro (s) e, em seguida, clique no botão Calcular para obter uma previsão de um período antecipado. As caixas em branco não são incluídas nos cálculos, mas os zeros são. Ao inserir seus dados para mover de célula para célula na matriz de dados use a tecla Tab não seta ou digite chaves. Características de séries temporais, que podem ser reveladas ao examinar seu gráfico. Com os valores previstos, eo comportamento residual, modelagem de previsão de condições. Médias móveis: As médias móveis classificam-se entre as técnicas mais populares para o pré-processamento de séries temporais. Eles são usados para filtrar o ruído branco aleatório dos dados, para tornar a série de tempo mais suave ou mesmo para enfatizar certos componentes informativos contidos na série de tempo. Suavização Exponencial: Este é um esquema muito popular para produzir uma Série de Tempo suavizada. Enquanto nas Médias Móveis as observações passadas são ponderadas igualmente, a Suavização Exponencial atribui pesos exponencialmente decrescentes à medida que a observação avança. Em outras palavras, as observações recentes recebem relativamente mais peso na previsão do que as observações mais antigas. O Double Exponential Smoothing é melhor para lidar com as tendências. Triple Exponential Smoothing é melhor no manuseio de tendências de parabola. Uma média móvel exponencialmente ponderada com uma constante de suavização a. Corresponde aproximadamente a uma média móvel simples de comprimento (isto é, período) n, onde a e n estão relacionados por: a 2 (n1) OR n (2 - a) a. Assim, por exemplo, uma média móvel exponencialmente ponderada com uma constante de suavização igual a 0,1 corresponderia aproximadamente a uma média móvel de 19 dias. E uma média móvel simples de 40 dias corresponderia aproximadamente a uma média móvel exponencialmente ponderada com uma constante de alisamento igual a 0,04878. Suavização Linear Exponencial de Holts: Suponha que a série de tempo não é sazonal, mas exibe tendência. Holts método estima tanto o nível atual ea tendência atual. Observe que a média móvel simples é caso especial da suavização exponencial, definindo o período da média móvel para a parte inteira de (2-Alpha) Alpha. Para a maioria dos dados de negócios, um parâmetro Alpha menor que 0,40 é freqüentemente efetivo. No entanto, pode-se realizar uma busca de grade do espaço de parâmetro, com 0,1 a 0,9, com incrementos de 0,1. Então o melhor alfa tem o menor erro médio absoluto (erro MA). Como comparar vários métodos de alisamento: Embora existam indicadores numéricos para avaliar a precisão da técnica de previsão, a abordagem mais abrangente é o uso de comparação visual de várias previsões para avaliar a sua precisão e escolher entre os vários métodos de previsão. Nesta abordagem, é necessário plotar (usando, por exemplo, Excel) no mesmo gráfico os valores originais de uma variável de série temporal e os valores previstos de vários métodos de previsão diferentes, facilitando assim uma comparação visual. Você pode gostar de usar as Previsões Passadas por Técnicas de Suavização JavaScript para obter os valores de previsão anteriores com base em técnicas de suavização que usam apenas um único parâmetro. Os métodos Holt e Winters usam dois e três parâmetros, respectivamente, portanto, não é uma tarefa fácil selecionar os valores ótimos, ou até perto de ótimos, por tentativa e erros para os parâmetros. A suavização exponencial única enfatiza a perspectiva de curto alcance que define o nível para a última observação e é baseada na condição de que não há tendência. A regressão linear, que se ajusta a uma linha de mínimos quadrados aos dados históricos (ou dados históricos transformados), representa a faixa de longo alcance, que está condicionada à tendência básica. Holts linear suavização exponencial captura informações sobre tendência recente. Os parâmetros no modelo de Holts são níveis-parâmetro que devem ser diminuídos quando a quantidade de variação de dados é grande, e as tendências-parâmetro devem ser aumentadas se a tendência de direção recente é suportada pelo causal alguns fatores. Previsão de Curto Prazo: Observe que cada JavaScript nesta página fornece uma previsão de um passo adiante. Para obter uma previsão de duas etapas. Basta adicionar o valor previsto ao final dos dados de séries temporais e, em seguida, clicar no mesmo botão Calcular. Você pode repetir este processo por algumas vezes para obter as previsões de curto prazo necessárias. Movendo modelos de suavização média e exponencial Como um primeiro passo para ir além dos modelos de média, modelos de tendência aleatória e modelos de tendência linear, padrões e tendências não sazonais podem Ser extrapolado usando um modelo de média móvel ou suavização. A suposição básica por trás dos modelos de média e suavização é que a série temporal é estacionária localmente com uma média lentamente variável. Assim, tomamos uma média móvel (local) para estimar o valor atual da média e, em seguida, usá-lo como a previsão para o futuro próximo. Isto pode ser considerado como um compromisso entre o modelo médio eo modelo randômico-sem-deriva. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é chamada frequentemente uma versão quotsmoothedquot da série original porque a média de curto prazo tem o efeito de alisar para fora os solavancos na série original. Ajustando o grau de suavização (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ótimo entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para ficar Para uma previsão da série de tempo Y feita o mais cedo possível antes de um determinado modelo). Esta média é centrada no período t (m1) 2, o que implica que a estimativa da média local tende a ficar aquém do verdadeiro Valor da média local em cerca de (m1) 2 períodos. Dessa forma, dizemos que a média de idade dos dados na média móvel simples é (m1) 2 em relação ao período para o qual a previsão é calculada: é a quantidade de tempo que as previsões tendem a ficar atrás de pontos de viragem nos dados . Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados em responder a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m é muito grande (comparável ao comprimento do período de estimação), o modelo SMA é equivalente ao modelo médio. Como com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot aos dados, isto é, os erros de previsão mais baixos em média. Aqui está um exemplo de uma série que parece apresentar flutuações aleatórias em torno de uma média de variação lenta. Primeiro, vamos tentar encaixá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de 1 termo: O modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo escolhe grande parte do quotnoisequot na Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se preferirmos tentar uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais suaves: a média móvel simples de 5 períodos produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nessa previsão é 3 ((51) 2), de modo que ela tende a ficar atrás de pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não virar até vários períodos mais tarde.) Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões a partir do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se alargam à medida que o horizonte de previsão aumenta. Isto obviamente não é correto Infelizmente, não há uma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para este modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões de longo prazo. Por exemplo, você poderia configurar uma planilha na qual o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc. dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e então construir intervalos de confiança para previsões de longo prazo adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obteremos previsões ainda mais suaves e mais de um efeito retardado: A idade média é agora de 5 períodos ((91) 2). Se tomarmos uma média móvel de 19 períodos, a idade média aumenta para 10: Observe que, na verdade, as previsões estão agora atrasadas por pontos de viragem por cerca de 10 períodos. A quantidade de suavização é melhor para esta série Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3-termo: Modelo C, a média móvel de 5-termo, rende o menor valor de RMSE por uma pequena margem sobre o 3 E médias de 9-termo, e suas outras estatísticas são quase idênticas. Assim, entre modelos com estatísticas de erro muito semelhantes, podemos escolher se preferiríamos um pouco mais de resposta ou um pouco mais de suavidade nas previsões. O modelo de média móvel simples descrito acima tem a propriedade indesejável de tratar as últimas k observações de forma igual e ignora completamente todas as observações anteriores. (Voltar ao início da página.) Browns Simple Exponential Smoothing (média ponderada exponencialmente ponderada) Intuitivamente, os dados passados devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que a segunda mais recente, ea segunda mais recente deve ter um pouco mais de peso do que a 3ª mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Vamos 945 denotar uma constante quotsmoothingquot (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série, conforme estimado a partir dos dados até o presente. O valor de L no tempo t é calculado recursivamente a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: Na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior por uma fração 945. é o erro feito em Tempo t. Na terceira versão, a previsão é uma média móvel exponencialmente ponderada (ou seja, descontada) com o fator de desconto 1- 945: A versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: ela se encaixa em um Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior ea célula onde o valor de 945 é armazenado. Observe que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, assumindo que o primeiro valor suavizado é definido igual à média. A idade média dos dados na previsão de suavização exponencial simples é de 1 945 em relação ao período para o qual a previsão é calculada. (Isso não é suposto ser óbvio, mas pode ser facilmente demonstrado pela avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a ficar para trás de pontos de viragem em cerca de 1 945 períodos. Por exemplo, quando 945 0,5 o atraso é 2 períodos quando 945 0,2 o atraso é de 5 períodos quando 945 0,1 o atraso é de 10 períodos, e assim por diante. Para uma determinada idade média (isto é, a quantidade de atraso), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão de média móvel simples (SMA) porque coloca relativamente mais peso na observação mais recente - i. e. É ligeiramente mais quotresponsivequot às mudanças que ocorrem no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 têm uma idade média de 5 para os dados nas suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no modelo SMA. Uma outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, de modo que pode ser otimizado com facilidade Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor óptimo de 945 no modelo SES para esta série revela-se 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é 10.2961 3.4 períodos, que é semelhante ao de uma média móvel simples de 6-termo. As previsões a longo prazo do modelo SES são uma linha reta horizontal. Como no modelo SMA e no modelo randômico sem crescimento. No entanto, note que os intervalos de confiança calculados por Statgraphics agora divergem de uma forma razoável, e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um tanto quotmore previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. Assim a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como modelo quotARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1-945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante para a série aqui analisada, o coeficiente MA estimado (1) resulta ser 0,7029, que é quase exatamente um menos 0,2961. É possível adicionar a hipótese de uma tendência linear constante não-zero para um modelo SES. Para fazer isso, basta especificar um modelo ARIMA com uma diferença não sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão então uma tendência que é igual à tendência média observada durante todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial de longo prazo constante a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa adequada de inflação (crescimento percentual) por período pode ser estimada como o coeficiente de declive num modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode basear-se em outra informação independente sobre as perspectivas de crescimento a longo prazo . (Voltar ao início da página.) Browns Linear (ie duplo) Suavização exponencial Os modelos SMA e SES assumem que não há tendência de qualquer tipo nos dados (o que normalmente é OK ou pelo menos não muito ruim para 1- Antecipadamente quando os dados são relativamente ruidosos), e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. O que acontece com as tendências de curto prazo Se uma série exibir uma taxa de crescimento variável ou um padrão cíclico que se destaque claramente contra o ruído, e se houver uma necessidade de prever mais do que um período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de suavização exponencial simples pode ser generalizado para obter um modelo linear de suavização exponencial (LES) que calcula as estimativas locais de nível e tendência. O modelo de tendência de variação de tempo mais simples é o modelo de alisamento exponencial linear de Browns, que usa duas séries suavizadas diferentes que são centradas em diferentes pontos do tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de suavização exponencial linear de Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em várias formas diferentes mas equivalentes. A forma quotstandard deste modelo é usualmente expressa da seguinte maneira: Seja S a série de suavização simples obtida aplicando-se a suavização exponencial simples à série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, Exponencial, esta seria a previsão para Y no período t1.) Então deixe Squot denotar a série duplamente-alisada obtida aplicando a suavização exponencial simples (usando o mesmo 945) à série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dado por: Isto resulta em e 1 0 (isto é, enganar um pouco, e deixar a primeira previsão igual à primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isto produz os mesmos valores ajustados que a fórmula baseada em S e S se estes últimos foram iniciados utilizando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing Brown8217s O modelo LES calcula as estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz isso com um único parâmetro de suavização coloca uma restrição nos padrões de dados que é capaz de ajustar: o nível ea tendência Não podem variar em taxas independentes. Holt8217s modelo LES aborda esta questão, incluindo duas constantes de alisamento, um para o nível e um para a tendência. Em qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui eles são calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam alisamento exponencial para eles separadamente. Se o nível estimado ea tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão para Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é calculada recursivamente pela interpolação entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1-945. A mudança no nível estimado, Nomeadamente L t 8209 L t82091. Pode ser interpretado como uma medida ruidosa da tendência no tempo t. A estimativa actualizada da tendência é então calculada recursivamente pela interpolação entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: A interpretação da constante de suavização de tendência 946 é análoga à da constante de suavização de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda apenas muito lentamente ao longo do tempo, enquanto modelos com Maior 946 supor que está mudando mais rapidamente. Um modelo com um 946 grande acredita que o futuro distante é muito incerto, porque os erros na tendência-estimativa tornam-se completamente importantes ao prever mais de um período adiante. As constantes de suavização 945 e 946 podem ser estimadas da maneira usual minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas se tornam 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudança na tendência de um período para o outro, então basicamente este modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados que é utilizada na estimativa do nível local da série, a idade média dos dados que são utilizados na estimativa da tendência local é proporcional a 1 946, embora não exatamente igual a . Neste caso, isto é 10.006 125. Isto não é um número muito preciso, na medida em que a precisão da estimativa de 946 é realmente de 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100, portanto Este modelo está calculando a média sobre bastante muita história em estimar a tendência. O gráfico de previsão abaixo mostra que o modelo LES estima uma tendência local ligeiramente maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pela montagem do modelo SES com ou sem tendência, de modo que este é quase o mesmo modelo. Agora, eles parecem previsões razoáveis para um modelo que é suposto ser estimar uma tendência local Se você 8220eyeball8221 esse enredo, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foram calculados minimizando o erro quadrático das previsões de um passo à frente, e não as previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está olhando são 1-passo-frente erros, você não está vendo a imagem maior de tendências sobre (digamos) 10 ou 20 períodos. A fim de obter este modelo mais em sintonia com a nossa extrapolação do globo ocular dos dados, podemos ajustar manualmente a tendência de alisamento constante para que ele usa uma linha de base mais curto para a estimativa de tendência. Por exemplo, se escolhemos definir 946 0,1, então a idade média dos dados usados na estimativa da tendência local é de 10 períodos, o que significa que estamos fazendo a média da tendência ao longo dos últimos 20 períodos. Here8217s o que o lote de previsão parece se definimos 946 0,1, mantendo 945 0,3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso para extrapolar esta tendência mais de 10 períodos no futuro. E sobre as estatísticas de erro Aqui está uma comparação de modelos para os dois modelos mostrados acima, bem como três modelos SES. O valor ótimo de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com ligeiramente mais ou menos responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. Alisamento com alfa 0,3 e beta 0,1 (C) Suavização exponencial simples com alfa 0,5 (D) Suavização exponencial simples com alfa 0,3 (E) Suavização exponencial simples com alfa 0,2 Suas estatísticas são quase idênticas, portanto, realmente não podemos fazer a escolha com base De erros de previsão de 1 passo à frente dentro da amostra de dados. Temos de recorrer a outras considerações. Se acreditarmos firmemente que faz sentido basear a estimativa de tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se queremos ser agnósticos quanto à existência de uma tendência local, então um dos modelos do SES pode ser mais fácil de explicar e também dar mais previsões de médio-caminho para os próximos 5 ou 10 períodos. Evidências empíricas sugerem que, se os dados já tiverem sido ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar os resultados lineares de curto prazo Muito para o futuro. As tendências evidentes hoje podem afrouxar no futuro devido às causas variadas tais como a obsolescência do produto, a competição aumentada, e os abrandamentos cíclicos ou as ascensões em uma indústria. Por esta razão, a suavização exponencial simples geralmente desempenha melhor fora da amostra do que poderia ser esperado, apesar de sua extrapolação de tendência horizontal quotnaivequot. Modificações de tendência amortecida do modelo de suavização exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES com tendência a amortecimento pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de suavização (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos à frente que você está prevendo. Em geral, os intervalos se espalham mais rapidamente à medida que o 945 fica maior no modelo SES e eles se espalham muito mais rápido quando se usa linear ao invés de alisamento simples. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Voltar ao topo da página.)
No comments:
Post a Comment