Saturday 16 December 2017

Variance of a moving average process


Desvio Padrão e Variação E a coisa boa sobre o Desvio Padrão é que ele é útil. Agora, podemos mostrar quais alturas estão dentro de um Desvio Padrão (147mm) da Média: Assim, usando o Desvio Padrão temos uma maneira quotstandardquot de saber o que é normal eo que é extra grande ou extra pequeno. Rottweilers são cães altos. E Dachshunds são um pouco curto. Mas não conte para eles Mas. Há uma pequena mudança com dados de exemplo Nosso exemplo foi para uma população (os 5 cães foram os únicos cães que estavam interessados ​​em). Mas se os dados são uma amostra (uma seleção tomada de uma população maior), então o cálculo muda Quando você tem quotNquot valores de dados que são: A População. Divida por N ao calcular a Variância (como fizemos) Uma Amostra. Divida por N-1 no cálculo da Desvio Todos os outros cálculos permanecem os mesmos, incluindo como calculamos a média. Exemplo: se os nossos 5 cães fossem apenas uma amostra de uma maior população de cães, dividiríamos por 4 em vez de 5 como este: Variância da amostra 108,520 / 4 27,130 Desvio padrão da amostra radic27,130 164 (para o mm mais próximo) Pense nisso Como uma quotcorreção quando seus dados são apenas uma amostra. Fórmulas Aqui estão as duas fórmulas, explicadas em Fórmulas de Desvio Padrão se você quiser saber mais: Eu tenho um processo de média móvel que se parece com: E eu posso ver que a variância foi calculada da seguinte forma: O que eu não consigo entender. As regras de variância dizem que a variância da soma de duas variáveis ​​aleatórias. Bem, não parece nada assim, tem um termo Covariance nele. Se alguém puder ajudar a explicar como esse passo é possível, eu ficaria muito grato. EDIT: Depois de algumas pesquisas adicionais eu acho que isso tem a ver com o fato de que as duas variáveis ​​são independentes A consulta que tenho relaciona-se com o cálculo da variância de AR (1) processos que são suavizadas com uma média móvel simples. Assim: Em um processo AR (1) da forma: a variância pode ser calculada como: onde sigma é o desvio padrão de varepsilon (um ruído branco) e varphi é a variável que define as propriedades de autocorrelação do processo AR (1) . Gostaria de ser capaz de calcular a variância do processo AR (1) após o alisamento por uma simples média móvel não ponderada para vários tamanhos de janela. Até agora, analisei o problema analiticamente com dados e, à medida que o tamanho da janela da média móvel aumenta, a variância, obviamente, cai, ea maneira pela qual ela cai (isto é, taxa e forma) é dependente de varphi. Obviamente, quando a janela de média móvel é igual a N (o tamanho do conjunto de dados analisado) então a variância é 0. Em última análise, portanto, existe uma maneira de determinar a variância esperada do AR (1) em termos de varphi, N, E o tamanho da janela média móvel Todos os ponteiros agradecidos recebidos pediu 31 de agosto às 7:12 Agradecimentos Eu acho que eu poderia estar faltando alguma coisa, mas a equação de código para MAvar doesn39t parecem corresponder à equação derivada var acima Você poderia dar mais informações sobre Como é obtida a equação final Também, dado que quando a janela de média móvel é igual a N a var deve ser zero, a equação não precisa ser expressa em termos de N ndash user29771 Sep 1 13 at 8:11 swisslog, I Só alterou a ordem de alguns termos em MAvar. Em comparação com a última equação, então eles devem ser os mesmos. Eu adicionei mais duas linhas para a derivação, o resto é um par de somas geométricas e simplificações. Agora, no que diz respeito a N, a coisa é que estamos a olhar para uma variância teórica, não empírica e, uma vez que, em teoria, este processo de AR suavizado nunca termina, a variância teórica não tem de ser zero assim como não depende de N. Ndash Julius Sep 1 13 at 10:23 Outra maneira de fazê-lo é calcular diretamente usando as propriedades das auto-covariâncias que são gamma (k) rho gama (0), onde gamma (0) sigma / (1 - rho) É a variância. Assim, a média para os períodos K ​​é dada por begin tilde x amp frac1K sumlimits x end A média média é mathbb E tilde x frac1K sumlimits mathbb E x mu e denotando hat x x - mu para simplificar a notação. A variância é dada por. E (esquerda) (esquerda) (esquerda) (esquerda) (esquerda) (esquerda) (esquerda) (esquerda) (esquerda) (esquerda) Matriz de N vezes N elementos com o elemento ij sendo hat x hat x pode ser escrito em termos de sua diagonal e duas vezes a matriz triangular superior como as metades superior e inferior são simétricas. (S) sumlimits gama (ji) extremidade direita que, com um reordenamento da soma no último (J) e lembrando que gama (k) rho gama (0) então, começam amperes sumlimlimits sumlimits gama (j) gama (0) sumlimits sumlimits rho end Agora, a soma geométrica (1 - rho) fim E a soma final pode ser simplificada como segue começam sumlimits (1 - rho) e as soma final podem ser simplificadas como segue começam sumlimits (1 - rho) (1 - rho) (1 - rho) ldots (1 - rho) (K-1) - (rho ldots rho) amp (K-1) - esquerda (frac) (Tilde x) amp frac1 mathbb E somas de som esquerda gama (0) 2 sumlimits sumlimits gama (j) direita amp frac1 esquerda K gama (0) 2 frac esquerda ((K-1) - esquerda (frac) direita) direita Direita (direita) direita (direita) direita (direita) esquerda direita (direita) esquerda direita direita (1-rho) direita direita fr (1 - rho) esquerda K (1 rho) - 2 rho - esquerda (frac-1) 1-rho) - 2 rho (1-rho) - 2 rho (1-rho) direita fr frac (1-rho) (1-rho) esquerda K (1-rho) - 2 rho (1-rho) direita. (1-rho) - 2 rho (1-rho) fim direito Usando o método de Juliuss acima eu recebo exatamente a mesma resposta como isto também . Espero que ajude. Neste trabalho, investigamos os gráficos de controle para monitorar um processo para detectar alterações na média e / ou variância de uma variável de qualidade normal quando uma observação individual É tomada em cada ponto de amostragem. O gráfico X tradicional eo gráfico de distância móvel (MR) são avaliados. Também foram avaliados o gráfico da média móvel ponderada exponencialmente (EWMA) das observações eo gráfico EWMA dos desvios quadrados das observações do alvo. Mostra-se que a combinação dos gráficos X e MR não irá detectar mudanças de parâmetro pequenas e moderadas tão rapidamente quanto as combinações envolvendo os gráficos EWMA. Também é investigada a capacidade das cartas para diagnosticar o tipo de mudança de parâmetro produzido por uma causa especial. Mostra-se que as combinações envolvendo os gráficos EWMA são tão eficazes para diagnosticar o tipo de mudança de parâmetro como a combinação tradicional dos gráficos X e MR. O efeito de adicionar o recurso de intervalo de amostragem variável (VSI) também é avaliado para algumas das combinações de gráficos. O recurso VSI permite variar o intervalo de amostragem em função dos valores das estatísticas que estão sendo plotadas. É mostrado que a adição da característica VSI às combinações de gráficos resulta em reduções muito substanciais no tempo esperado necessário para detectar mudanças nos parâmetros do processo. Palavras-chave: Número Médio de Observações ao Sinal, Tempo Média de Sinal, Média Móvel Ponderada Exponencialmente, Gráficos de Controle de Movimento, Gráficos de Controle Estatístico, Estatuto Contínuo, Gráficos de Controle de Intervalo de Amostragem Variável, X Gráficos de Controle. Por Marion R. Reynolds, JR. Um gráfico de controle é usado para monitorar um processo com a finalidade de detectar causas especiais (por exemplo, um estudo clínico, um estudo clínico, um estudo clínico, De variação do processo que pode resultar em saída de processo de menor qualidade. A estatística traçada num gráfico de controlo é normalmente baseada em amostras (ou subgrupos) de n observações que são tomadas em intervalos regulares de amostragem. Por exemplo, uma amostra de n 4 observações pode ser tomada a cada hora. Existem, contudo, muitas aplicações em que o gráfico de controlo é baseado em observações individuais (n 1) em vez de amostras de n gt 1. Nestas aplicações, a amostragem pode ser cara, destrutiva e / ou demorada, eo intervalo de amostragem Pode ser relativamente longo. Não é raro encontrar exemplos industriais em que há apenas uma amostra por turno. Em algumas situações, por exemplo, quando um instrumento está sendo monitorado para precisão e precisão, as observações obtidas para o monitoramento podem ser dias ou mesmo semanas de intervalo. Na maioria das situações em que uma variável de qualidade contínua está sendo medida, assume-se que esta variável, digamos X. Tem uma distribuição normal. Se X é normal e uma causa especial afeta a distribuição de X. Então a causa especial mudará a média, o desvio padrão, ou ambos e. Quando se tomam amostras de n 1, a prática usual é usar dois gráficos de controle, um para detectar alterações e outro para detectar alterações em. O gráfico de controle para monitoramento é geralmente baseado nas médias da amostra. Por exemplo, o gráfico de Shewhart é baseado em traçar as médias da amostra. O gráfico de controle para geralmente é baseado em uma medida de dispersão dentro da amostra, como a variância da amostra ou intervalo de amostra. Por exemplo, o gráfico Shewhart R é baseado em traçar as faixas de amostras. Quando são feitas observações individuais, um gráfico para o monitoramento usaria essas observações individuais em vez das médias da amostra. Por exemplo, o gráfico de Shewhart X seria usado no lugar do gráfico de Shewhart. A monitorização é agora mais difícil, uma vez que as medidas de dispersão habituais dentro da amostra já não se aplicam. Assim, há a questão de como monitorar quando n 1. Uma escolha tradicional é basear um gráfico na faixa de movimento (MR), que é o intervalo de sucessivas observações individuais, mas há agora evidência considerável de que há pouco ou Nenhum benefício ao usar o gráfico de Shewhart MR quando um gráfico de Shewhart X também está sendo usado (ver, por exemplo, Nelson (1982), Roes, Does e Schurink (1993), Rigdon, Cruthis e Champ (1994), Albin, Kang , E Shea (1997), e Stoumbos e Reynolds (2000)). Os gráficos Shewhart são amplamente utilizados para monitoramento de processos e são eficazes para detectar grandes mudanças nos parâmetros do processo. No entanto, um gráfico de Shewhart pode levar muito tempo para detectar uma pequena mudança persistente em um parâmetro de processo. A capacidade de detectar mudanças de parâmetros menores pode ser melhorada usando um gráfico baseado em uma estatística que incorpora informações de amostras passadas além de amostras atuais. Por exemplo, o gráfico da média móvel ponderada exponencialmente (EWMA) é baseado em uma média ponderada de estatísticas de amostra atuais e passadas, eo gráfico de soma cumulativa (CUSUM) é baseado em uma soma de estatísticas de amostra atuais e passadas. Quando observações individuais são tomadas em intervalos amplamente espaçados, há relativamente poucos dados do processo, então usando um gráfico como o gráfico EWMA ou o gráfico CUSUM irá fornecer um uso eficiente dos dados escassos. Uma abordagem útil para melhorar a capacidade de detectar alterações de processo é usar um gráfico de controle de intervalo de amostragem variável (VSI) em vez do gráfico de controle de intervalo de amostragem fixo tradicional (FSI). Num gráfico de controlo VSI, o intervalo de amostragem varia em função da estatística de controlo. Um intervalo de amostragem curto é usado sempre que houver alguma indicação de que um parâmetro do processo pode ter mudado e um intervalo de amostragem longo é usado se não houver indicação de uma alteração de parâmetro. Reynolds Amin, Arnold e Nachlas (1988), Reynolds, Amin e Arnold (1990), e Reynolds (1996a, b), e Stoumbos E Reynolds (1996, 1997, 2001)). Muito pouco trabalho tem sido feito em gráficos VSI para monitoramento e. Chengular, Arnold e Reynolds (1989) consideraram os gráficos VSI Shewhart para monitoramento e quando amostras de n 1 foram tomadas. Shamma e Amin (1993) consideraram o desempenho de um único gráfico VSI EWMA que pode ser usado para monitorar e. Temos dois objetivos principais neste artigo. O primeiro objetivo é considerar várias combinações de gráficos de Shewhart e EWMA, a fim de determinar quais combinações são mais eficazes para detectar mudanças em e / ou quando são feitas observações isoladas. Mostramos que existem alternativas muito melhores do que a abordagem tradicional de usar os gráficos X e MR. O segundo objetivo é mostrar como o uso do recurso VSI pode oferecer melhorias substanciais adicionais na capacidade de detectar mudanças de parâmetros. É bastante óbvio que os ACFs em (1.4) e em um em (1.8) todos cortados após o atraso dois. Isto é indicativo do fato de que um processo de média móvel de ordem dois e um processo de série de tempo bilinear diagonal puro de ordem dois têm estruturas de autocorrelação semelhantes. Como resultado, existe a possibilidade de classificar erroneamente um processo diagonal bilinear puro de ordem dois como um processo de média móvel de ordem dois. A facilidade com que os modelos lineares são instalados e a prática de aproximar modelos não-lineares por modelos lineares também podem causar a falta de especificação do processo linear não linear linear de ordem dois. A partir do que precede, é imperativo investigar a implicação estatística do modelo acima mencionado misclassification. Nesse sentido, iremos nos concentrar na função de penalidade associada à classificação incorreta de um processo do APO (2) como um processo de MA (2). 2. Relação entre os Parâmetros do Processo Bilinear Puro Diário da Ordem Dois e o Processo Mínimo de Ordem Dois Tendo observado que o processo de média móvel da ordem dois e o processo diagonal bilinear puro de ordem dois têm estruturas de autocorrelação semelhantes, vale a pena derivar A relação entre os parâmetros dos dois modelos. Esses relacionamentos nos ajudarão a obter a função de penalidade para classificar erroneamente o modelo não linear como o modelo linear concorrente. O método de momentos que envolve a equação do primeiro e segundo momentos do modelo diagonal bilinear puro com os momentos correspondentes do processo de média móvel não zero de ordem dois deve ser usado para este fim. Considerando a tabela completa contendo 2129 conjuntos de valores, podemos ver que a função de penalidade para misclassification de um processo de PDB (2) como um MA (2) processo (P) assume valores positivos Para todos os valores de, /. /. O valor positivo da penalidade por classificação errada de um processo PDB (2) como um processo de MA (2) mostra que essa classificação equivocada leva a um aumento na variação dos erros. Esta constatação concorda com os resultados obtidos por 6 no que se refere à classificação errada de um processo de PDB (1) como um processo MA (1). Para fins de previsão, temos que encontrar a relação entre P e /. Primeiro, plotamos P contra cada um de /. A Figura 1 mostra o gráfico de P contra. O valor de p de 0,00 na Tabela 3 implica que o modelo de regressão ajustado é adequado para descrever a relação entre P e /. 4. Conclusão Neste estudo, determinamos o efeito de classificar erroneamente um processo diagonal bilinear puro de ordem dois como um processo de média móvel de ordem dois. Uma função de penalidade foi definida e foi usada para computar penalidades para a classificação errada do processo diagonal bilinear puro de ordem dois como o processo de média móvel de ordem dois baseado em vários conjuntos de valores dos parâmetros dos dois processos. As penalidades calculadas assumiram valores positivos. Isto indicou um aumento da variância de erro devido a uma classificação errada do processo bilinear diagonal puro de ordem dois como um processo de média móvel de ordem dois. Um modelo de regressão quadrática foi considerado adequado para prever as penalidades com base nos parâmetros do processo bilinear diagonal puro de ordem dois. Referências Bessels, S. (2006). Um passo além da equação resolvível. staff. science. uu. nc//AfstudeerscriptieSanderBessels. pdf (Este site foi visitado em junho de 2017). Box, G. E. P. Jenkins, G. M. e Reinsel, G. C. (1994). Análise de Séries Temporais: Previsão e Controle. 3 ª ed. Prentice-Hall, Englewood Cliffs, N. J.

No comments:

Post a Comment