Média móvel Este exemplo ensina como calcular a média móvel de uma série temporal no Excel. Uma média móvel é usada para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série de tempo. 2. No separador Dados, clique em Análise de dados. Nota: não é possível encontrar o botão Análise de dados Clique aqui para carregar o suplemento do Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Input Range e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e escreva 6. 6. Clique na caixa Output Range e seleccione a célula B3. 8. Faça um gráfico destes valores. Explicação: porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores eo ponto de dados atual. Como resultado, os picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não consegue calcular a média móvel para os primeiros 5 pontos de dados porque não existem pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para o intervalo 2 eo intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais perto as médias móveis são para os pontos de dados reais. Eva Goldwater Biostatistics Consulting Center Universidade de Massachusetts Escola de Saúde Pública atualizado fevereiro de 2007 Em Breve Nós usamos o Excel para fazer algumas tarefas básicas de análise de dados para ver se é Uma alternativa razoável para usar um pacote estatístico para as mesmas tarefas. Concluímos que o Excel é uma má escolha para análise estatística além dos exemplos de livros didáticos, as estatísticas descritivas mais simples ou para mais do que algumas poucas colunas. Os problemas que encontramos que levaram a esta conclusão estão em quatro áreas gerais: Valores em falta são tratados de forma inconsistente, e às vezes incorretamente. Organização de dados difere de acordo com a análise, forçando você a reorganizar seus dados de muitas maneiras, se você quiser fazer muitas análises diferentes. Muitas análises só podem ser feitas em uma coluna de cada vez, tornando inconveniente fazer a mesma análise em muitas colunas. A produção é mal organizada, às vezes inadequadamente rotulada, e não há registro de como uma análise foi realizada. Excel é conveniente para a entrada de dados, e para manipular rapidamente linhas e colunas antes da análise estatística. No entanto, quando você estiver pronto para fazer a análise estatística, recomendamos o uso de um pacote estatístico, como SAS, SPSS, Stata, Systat ou Minitab. Introdução Excel é provavelmente a planilha mais comumente usada para PCs. Computadores recém-comprados freqüentemente chegam com o Excel já carregado. É facilmente usado para fazer uma variedade de cálculos, inclui uma coleção de funções estatísticas, e um Data Analysis ToolPak. Como resultado, se de repente você achar que você precisa fazer alguma análise estatística, você pode recorrer a ele como a escolha óbvia. Decidimos fazer alguns testes para ver como o Excel serviria como um aplicativo de análise de dados. Para apresentar os resultados, usaremos um pequeno exemplo. Os dados para este exemplo são fictícios. Optou-se por ter duas variáveis categóricas e duas contínuas, de modo que pudéssemos testar uma variedade de técnicas estatísticas básicas. Uma vez que quase todos os conjuntos de dados reais têm pelo menos alguns pontos de dados em falta, e uma vez que a capacidade de lidar com dados em falta correctamente é um dos recursos que tomamos para concedido em um pacote de análise estatística, introduzimos duas células vazias nos dados: Cada linha da planilha representa um assunto. O primeiro sujeito recebeu o Tratamento 1 e teve o Resultado 1. X e Y são os valores de duas medidas em cada sujeito. Não foi possível obter uma medição para Y no segundo assunto ou em X para o último assunto, portanto essas células estão em branco. Os assuntos são inseridos na ordem em que os dados se tornaram disponíveis, de modo que os dados não são ordenados de nenhuma maneira específica. Usamos esses dados para fazer algumas análises simples e comparamos os resultados com um pacote estatístico padrão. A comparação considerou a precisão dos resultados, bem como a facilidade com que a interface poderia ser usada para conjuntos de dados maiores - ou seja, mais colunas. Utilizamos o SPSS como padrão, embora qualquer um dos pacotes estatísticos que a ILO suporta faria igualmente bem para esse fim. Neste artigo, quando dizemos pacote estatístico de cota, queremos dizer SPSS, SAS, STATA, SYSTAT ou Minitab. A maioria dos procedimentos estatísticos Excels fazem parte do pacote de ferramentas Análise de dados, que está no menu Ferramentas. Inclui uma variedade de escolhas, incluindo estatísticas descritivas simples, testes t, correlações, análise de variância de 1 ou 2 vias, regressão, etc. Se você não tiver um item Análise de Dados no menu Ferramentas, Ferramenta de análise. Procure na Ajuda para quotData Analysis Toolsquot para obter instruções sobre como carregar o ToolPak. Dois outros recursos do Excel são úteis para determinadas análises, mas o pacote de ferramentas Análise de Dados é o único que fornece testes razoavelmente completos de significância estatística. A tabela dinâmica no menu Dados pode ser usada para gerar tabelas de resumo de médias, desvios padrão, contagens, etc. Além disso, você pode usar funções para gerar algumas medidas estatísticas, como um coeficiente de correlação. Funções geram um único número, então usando funções você provavelmente terá que combinar pedaços e bits para obter o que você quer. Mesmo assim, você pode não ser capaz de gerar todas as peças que você precisa para uma análise completa. Salvo indicação em contrário, todos os testes estatísticos usando o Excel foram feitos com o Data Analysis ToolPak. A fim de verificar uma variedade de testes estatísticos, escolhemos as seguintes tarefas: obter médias e desvios padrão de X e Y para todo o grupo e para cada grupo de tratamento. Obter a correlação entre X e Y. Faça um teste t de duas amostras para testar se os dois grupos de tratamento diferem em X e Y. Faça um teste t pareado para testar se X e Y são estatisticamente diferentes uns dos outros. Compare o número de indivíduos com cada resultado pelo grupo de tratamento, usando um teste qui-quadrado. Todas essas tarefas são rotina para um conjunto de dados desta natureza, e todos eles podem ser facilmente feito usando qualquer um dos pacotes listados aobve listados. Problemas gerais Habilitar o ToolPak de análise O ToolPak de análise de dados não é instalado com a instalação padrão do Excel. Procure no menu Ferramentas. Se você não tiver um item Análise de Dados, precisará instalar as ferramentas de Análise de Dados. Pesquisar Ajuda para quotData Analysis Toolsquot para obter instruções. Valores ausentes Uma célula em branco é a única maneira para o Excel lidar com dados ausentes. Se você tiver quaisquer outros códigos de valores em falta, será necessário alterá-los para espaços em branco. Arranjo de dados Diferentes análises exigem que os dados sejam organizados de várias maneiras. Se você planejar uma variedade de testes diferentes, pode não haver um único arranjo que funcione. Você provavelmente precisará reorganizar os dados várias maneiras de obter tudo o que você precisa. Caixas de diálogo Escolha ToolsData Analysis e selecione o tipo de análise que você deseja fazer. A caixa de diálogo típica terá os seguintes itens: Intervalo de entrada: digite as células de canto superior esquerdo e inferior direito. por exemplo. A1: B100. Você só pode escolher linhas e colunas adjacentes. A menos que haja uma caixa de seleção para agrupar dados por linhas ou colunas (e geralmente não existe), todos os dados são considerados como um glop. Etiquetas - Às vezes, há uma caixa que você pode marcar para indicar que a primeira linha da folha contém rótulos. Se você tiver rótulos na primeira linha, marque esta caixa e sua saída PODE ser rotulada com o rótulo. Então, novamente, não pode. Local de saída - Nova folha é o padrão. Ou, digite o endereço de célula do canto superior esquerdo de onde você deseja colocar a saída na folha atual. Nova planilha é outra opção, que eu não tentei. As ramificações desta escolha são discutidas abaixo. Outros itens, dependendo da análise. Local de saída A saída de cada análise pode ir para uma nova folha dentro do arquivo do Excel atual (esse é o padrão) ou pode colocá-lo dentro da folha atual especificando a célula de canto superior esquerdo onde deseja colocá-la. De qualquer maneira é um pouco de um incômodo. Se cada saída está em uma nova planilha, você acaba com lotes de folhas, cada uma com um pequeno pedaço de saída. Se você colocá-los na folha atual, você precisa colocá-los adequadamente deixar espaço para adicionar comentários e etiquetas alterações que você precisa fazer para formatar uma saída corretamente pode afetar adversamente outra saída. Exemplo: A saída de Descritivos tem uma coluna de rótulos como Desvio padrão, Erro padrão, etc. Você vai querer fazer essa coluna ampla para poder ler os rótulos. Mas se uma saída de frequência simples estiver bem abaixo, então a coluna que exibe os valores que estão sendo contados, que pode conter números inteiros pequenos, também será ampla. Resultados das análises Estatísticas descritivas A maneira mais rápida de obter médias e desvios padrão para um grupo inteiro é usar Descritivos nas ferramentas Análise de Dados. Você pode escolher várias colunas adjacentes para o intervalo de entrada (neste caso as colunas X e Y), e cada coluna é analisada separadamente. Os rótulos na primeira linha são usados para rotular a saída e as células vazias são ignoradas. Se você tiver mais colunas não adjacentes que você precisa analisar, você terá que repetir o processo para cada grupo de colunas contíguas. O procedimento é direto, pode gerenciar muitas colunas razoavelmente eficiente e células vazias são tratadas adequadamente. Para obter os meios e desvios padrão de X e Y para cada grupo de tratamento, é necessário usar tabelas dinâmicas (a menos que você queira reorganizar a folha de dados para separar os dois grupos). Depois de selecionar o intervalo de dados (contíguo), na opção Layout de assistentes de tabelas dinâmicas, arraste a área de tratamento para a linha de variáveis e X para a área de dados. Clique duas vezes em ldquoCount de Xrdquo na área Dados e mude para Média. Arraste X para a caixa Dados novamente, e este tempo mude Contagem para StdDev. Finalmente, arraste X em mais uma vez, deixando-o como Contagem de X. Isso nos dará a Média, desvio padrão e número de observações em cada grupo de tratamento para X. Faça o mesmo para Y, então obteremos a média, padrão Desvio e número de observações para Y também. Isso colocará um total de seis itens na caixa Dados (três para X e três para Y). Como você pode ver, se você quiser obter uma variedade de estatísticas descritivas para várias variáveis, o processo ficará tedioso. Um pacote estatístico permite que você escolha quantas variáveis desejar para estatísticas descritivas, sejam ou não contíguas. Você pode obter as estatísticas descritivas para todos os assuntos em conjunto, ou discriminados por uma variável categórica, como tratamento. Você pode selecionar as estatísticas que deseja ver uma vez e ela se aplicará a todas as variáveis escolhidas. Correlações Usando as ferramentas de análise de dados, a caixa de diálogo para correlações é muito parecida com a de descritores - você pode escolher várias colunas contíguas e obter uma matriz de saída de todos os pares de correlações. As células vazias são ignoradas adequadamente. A saída NÃO inclui o número de pares de pontos de dados usados para calcular cada correlação (que pode variar, dependendo de onde você tem dados ausentes) e não indica se alguma das correlações são estatisticamente significativas. Se desejar correlações em colunas não contíguas, você teria que incluir as colunas intermediárias ou copiar as colunas desejadas para um local contíguo. Um pacote estatístico permite que você escolha colunas não-contíguas para suas correlações. A saída indicaria quantos pares de pontos de dados foram usados para calcular cada correlação e quais correlações são estatisticamente significativas. Teste T de duas amostras Este teste pode ser usado para verificar se os dois grupos de tratamento diferem nos valores de X ou Y. Para fazer o teste, você precisa inserir um intervalo de células para cada grupo. Uma vez que os dados não foram inseridos pelo grupo de tratamento, primeiro precisamos ordenar as linhas por tratamento. Certifique-se de tomar todas as outras colunas juntamente com o tratamento, de modo que os dados para cada assunto permanece intacto. Após os dados serem classificados, você pode inserir o intervalo de células que contém as medidas X para cada tratamento. Não inclua a linha com os rótulos, porque o segundo grupo não tem uma linha de etiqueta. Portanto, sua saída não será rotulada para indicar que esta saída é para X. Se você deseja que a saída rotulada, você tem que copiar as células correspondentes ao segundo grupo para uma coluna separada e digite uma linha com um rótulo para o segundo grupo . Se você também quiser fazer o teste t para as medições Y, você precisará repetir o processo. As células vazias são ignoradas e, além dos problemas com a rotulagem da saída, os resultados estão corretos. Um pacote estatístico faria essa tarefa sem qualquer necessidade de classificar os dados ou copiá-los para outra coluna ea saída seria sempre devidamente rotulada na medida em que você fornece rótulos para suas variáveis e grupos de tratamento. Ele também permite que você escolha mais de uma variável de cada vez para o teste t (por exemplo, X e Y). Teste t emparelhado O teste t emparelhado é um método para testar se a diferença entre duas medições sobre o mesmo sujeito é significativamente diferente de 0. Neste exemplo, queremos testar a diferença entre X e Y medidos no mesmo assunto. A característica importante deste teste é que ele compara as medições dentro de cada sujeito. Se você digitalizar as colunas X e Y separadamente, elas não parecem obviamente diferentes. Mas se você olhar para cada par X-Y, você notará que em todos os casos, X é maior que Y. O teste t pareado deve ser sensível a esta diferença. Nos dois casos em que X ou Y está ausente, não é possível comparar as duas medidas em um assunto. Assim, apenas 8 linhas são utilizáveis para o teste t emparelhado. Quando você executa o teste t pareado nestes dados, você obtém uma estatística t de 0,09, com uma probabilidade de 2 caudas de 0,93. O teste não encontra nenhuma diferença significativa entre X e Y. Olhando para a saída com mais cuidado, notamos que ele diz que há 9 observações. Como observado acima, deve haver apenas 8. Parece que o Excel não conseguiu excluir as observações que não tiveram tanto X e Y medições. Para obter os resultados corretos, copie X e Y para duas novas colunas e remova os dados nas células que não têm valor para a outra medida. Agora volte a executar o teste t emparelhado. Desta vez, a estatística t é 6,14817 com uma probabilidade de 2 caudas de 0,000468. A conclusão é completamente diferente Claro, este é um exemplo extremo. Mas o ponto é que o Excel não calcula o t-teste emparelhado corretamente quando algumas observações têm uma das medidas, mas não a outra. Embora seja possível obter o resultado correto, você não teria motivo para suspeitar dos resultados obtidos a menos que esteja suficientemente alerta para perceber que o número de observações está errado. Não existe nada na ajuda online que o avise sobre este problema. Curiosamente, há também uma função TTEST, que dá os resultados corretos para este exemplo. Aparentemente, as funções e as ferramentas de análise de dados não são consistentes na forma como lidam com células ausentes. No entanto, não posso recomendar o uso de funções de preferência às ferramentas de Análise de Dados, porque o resultado de usar uma função é um único número - neste caso, a probabilidade de 2 caudas da estatística t. A função não lhe dá a t-estatística em si, os graus de liberdade, ou qualquer número de outros itens que você gostaria de ver se você estava fazendo um teste estatístico. Um pacote estatístico excluirá corretamente os casos com uma das medidas ausentes e fornecerá todas as estatísticas de suporte necessárias para interpretar a saída. Crosstabulation e Qui-Quadrado Teste de Independência Nossa tarefa final é contar os dois resultados em cada grupo de tratamento e usar um qui-quadrado teste de independência para testar uma relação entre tratamento e desfecho. A fim de contar os resultados por grupo de tratamento, você precisa usar tabelas dinâmicas. Na opção Layout de Assistentes de Tabela Dinâmica, arraste Tratamento para Fila, Resultado para Coluna e também para Dados. A área de dados deve dizer quotCount de Outcomequot ndash se não, clique duas vezes nele e selecione quotCountquot. Se desejar porcentagens, clique duas vezes em quotCount de Outcomequot e clique em Opções na caixa ldquoShow Data Asrdquo que aparece, selecione quot de rowquot. Se você quiser ambas as contagens e porcentagens, você pode arrastar a mesma variável para a área de dados duas vezes, e usá-lo uma vez para contagens e uma vez para porcentagens. Obter o teste qui-quadrado não é tão simples, no entanto. Ele só está disponível como uma função ea entrada necessária para a função é a contagem observada em cada combinação de tratamento e resultado (que você tem em sua tabela dinâmica) e as contagens esperadas em cada combinação. Contas esperadas Como são obtidas Se você tiver conhecimento estatístico suficiente para saber como calcular as contagens esperadas e pode fazer cálculos do Excel usando endereços de célula relativa e absoluta, você deve ser capaz de navegar por isso. Se não, você está fora de sorte. Assumindo que você superou o problema das contagens esperadas, você pode usar a função de Chitest para obter a probabilidade de observar um valor de qui-quadrado maior do que aquele para esta tabela. Novamente, uma vez que estamos usando funções, você não recebe muitas outras peças necessárias do cálculo, notavelmente o valor da estatística chi-quadrado ou seus graus de liberdade. Nenhum pacote estatístico exigiria que você fornecesse os valores esperados antes de calcular um teste qui-quadrado de independência. Além disso, os resultados sempre incluem a estatística chi-quadrado e seus graus de liberdade, bem como sua probabilidade. Muitas vezes você vai ter algumas estatísticas adicionais também. Análises Adicionais As análises restantes não foram feitas neste conjunto de dados, mas alguns comentários sobre eles são incluídos para completar. Frequências simples Você pode usar tabelas dinâmicas para obter freqüências simples. (Consulte Crosstabulations para obter mais informações sobre como obter tabelas dinâmicas.) Usando tabelas dinâmicas, cada coluna é considerada uma variável separada e rótulos na linha 1 aparecerão na saída. Você só pode fazer uma variável de cada vez. Outra possibilidade é usar a função Frequências. A principal vantagem deste método é que uma vez que você definiu a função de freqüências para uma coluna, você pode usar CopyPaste para obtê-lo para outras colunas. Primeiro, você precisará digitar uma coluna com os valores que deseja contar (bins). Se você pretende fazer as freqüências para muitas colunas, certifique-se de inserir valores para a coluna com a maioria das categorias. por exemplo. Se 3 colunas tiverem valores de 1 ou 2 e o quarto tiver valores de 1,2,3,4, você precisará digitar os valores de bin como 1,2,3,4. Agora selecione suficientes células vazias em uma coluna para armazenar os resultados - 4 neste exemplo, mesmo que a coluna atual tenha apenas 2 valores. Em seguida, escolha InsertFunctionStatisticalFrequencies no menu. Preencha o intervalo de entrada para a primeira coluna que você deseja contar usando endereços relativos (por exemplo A1: A100). Preencha o Bin Range usando os endereços absolutos dos locais onde você digitou os valores a serem contados (por exemplo, M1: M4). Clique em Concluir. Observe a caixa acima dos cabeçalhos de coluna da folha, onde a fórmula é exibida. Começa com quot FREQUENCIES (Coloque o cursor à esquerda do sinal na fórmula e pressione Ctrl-Shift-Enter. A frequência de contagem agora aparece nas células que você selecionou. Para obter as contagens de freqüência de outras colunas, selecione As células com as freqüências neles e escolha EditCopy no menu. Se a próxima coluna que você deseja contar é uma coluna à direita do anterior, selecione a célula à direita da primeira célula de freqüência e escolha EditPaste Ctrl-V) Continue movendo para a direita e colando para cada coluna que você quer contar Cada vez que você move uma coluna para a direita das células de freqüência original, a coluna a ser contada é deslocada para a direita da primeira coluna que você contou. Se você quiser porcentagens também, yoursquoll tem que usar a função Sum para calcular a soma das freqüências e definir a fórmula para obter a porcentagem de uma célula. Consulte a célula para armazenar o primeiro por cento e digite a fórmula na fórmula Caixa na parte superior da folha - eg N1100N 5 - onde N1 é a célula com a freqüência para a primeira categoria, e N5 é a célula com a soma das freqüências. Use CopyPaste para obter a fórmula para as células restantes da primeira coluna. Depois de ter os percentuais para uma coluna, você pode Copiar-los para as outras colunas. Yoursquoll precisa ter cuidado com o uso de endereços relativos e absolutos No exemplo acima, usamos N5 para o denominador, então quando copiar a fórmula para baixo para a próxima freqüência na mesma coluna, ele ainda vai olhar para a soma na linha 5, mas quando copiar a fórmula para a direita para outra coluna, ele irá mudar para as freqüências na próxima coluna. Finalmente, você pode usar Histograma no menu Análise de dados. Você só pode fazer uma variável de cada vez. Como com a função Freqüências, você deve inserir uma coluna com limites quotbinquot. Para contar o número de ocorrências de 1 e 2, você precisará inserir 0,1,2 em três células adjacentes e atribuir o intervalo dessas três células como as caixas na caixa de diálogo. A saída não é rotulada com quaisquer etiquetas que você pode ter na linha 1, nem mesmo com a letra da coluna. Se você fizer freqüências em muitas variáveis, você terá dificuldade em saber qual freqüência pertence a qual coluna de dados. Regressão linear Uma vez que a regressão é uma das análises estatísticas mais utilizadas, nós tentamos fazê-lo, mesmo que não fizemos uma análise de regressão para este exemplo. O procedimento de Regressão nas ferramentas Análise de Dados permite escolher uma coluna como a variável dependente e um conjunto de colunas contíguas para os independentes. No entanto, ele não tolera quaisquer células vazias em qualquer lugar nos intervalos de entrada, e você está limitado a 16 variáveis independentes. Portanto, se você tiver quaisquer células vazias, você precisará copiar todas as colunas envolvidas na regressão para novas colunas e excluir quaisquer linhas que contenham quaisquer células vazias. Modelos grandes, com mais de 16 preditores, não podem ser feitos de forma alguma. Análise de Variância Em geral, as características de ANOVA Excels estão limitadas a alguns casos especiais raramente encontrados fora dos manuais e requerem muitos reajustes de dados. ANOVA unidirecional Os dados devem ser dispostos em colunas (ou linhas) separadas e adjacentes para cada grupo. Claramente, isso não é propício para fazer 1-maneiras em mais de um agrupamento. Se você tiver rótulos na linha 1, a saída usará as etiquetas. ANOVA de Dois Factores Sem Replicação Isto só faz o caso com uma observação por célula (isto é, sem termo de erro dentro da célula). O intervalo de entrada é um arranjo retangular de células, com linhas representando níveis de um fator, colunas os níveis do outro fator e o conteúdo da célula o único valor nessa célula. ANOVA de dois fatores com réplicas Isso faz uma ANOVA de duas vias com tamanhos de célula iguais. A entrada deve ser uma região retangular com colunas que representem os níveis de um fator e as linhas que representem repetições dentro dos níveis do outro fator. A faixa de entrada deve também incluir uma linha adicional na parte superior e coluna à esquerda, com rótulos indicando os fatores. No entanto, esses rótulos não são usados para rotular a tabela ANOVA resultante. Clique em Ajuda na caixa de diálogo ANOVA para obter uma imagem do que o intervalo de entrada deve ser semelhante. Solicitando muitas análises Se você tivesse uma variedade de diferentes procedimentos estatísticos que você queria executar em seus dados, você quase certamente se veria fazendo um monte de classificação, reorganização, cópia e colagem de seus dados. Isso ocorre porque cada procedimento requer que os dados sejam dispostos de uma maneira particular, muitas vezes diferente da maneira como outro procedimento deseja que os dados sejam dispostos. Em nosso pequeno teste, tivemos que classificar as linhas para fazer o teste t, e copiar algumas células para obter rótulos para a saída. Tínhamos que limpar o conteúdo de algumas células para obter o teste t pareado correto, mas não queríamos que essas células fossem limpas para algum outro teste. E nós estávamos apenas fazendo cinco tarefas. Ele não fica melhor quando você tenta fazer mais. Não há um arranjo único dos dados que permitiria que você fizesse muitas análises diferentes sem fazer muitas cópias diferentes dos dados. A necessidade de manipular os dados de muitas maneiras aumenta a chance de introduzir erros. Usando um programa estatístico, os dados seriam normalmente organizados com as linhas que representam os sujeitos e as colunas que representam as variáveis (como estão em nossos dados de amostra). Com este arranjo você pode fazer qualquer uma das análises discutidas aqui, e muitos outros também, sem ter que classificar ou reorganizar seus dados de forma alguma. Somente análises muito mais complexas, além das capacidades do Excel e do escopo deste artigo exigiria o rearranjo dos dados. Trabalhando com muitas colunas E se seus dados não tivessem 4, mas 40 colunas, com uma mistura de medidas categóricas e contínuas Como facilmente os procedimentos acima se dimensionam para um problema maior Na melhor das hipóteses, alguns dos procedimentos estatísticos podem aceitar várias colunas contíguas para entrada , E interpretar cada coluna como uma medida diferente. Os procedimentos descritivos e de correlações são deste tipo, portanto, você pode solicitar estatísticas descritivas ou correlações para um grande número de variáveis contínuas, desde que sejam inseridas em colunas adjacentes. Se eles não são adjacentes, você precisa reorganizar colunas ou usar copiar e colar para torná-los adjacentes. Muitos procedimentos, no entanto, só podem ser aplicados a uma coluna de cada vez. T-testes (independentes ou emparelhados), contagens de freqüência simples, o qui-quadrado teste de independência, e muitos outros procedimentos estão nesta classe. Isso se tornaria uma séria desvantagem se você tivesse mais do que um punhado de colunas, mesmo se você usar cortar e colar ou macros para reduzir o trabalho. Além de ter que repetir o pedido muitas vezes, você tem que decidir onde armazenar os resultados de cada um, e verifique se ele está corretamente rotulado para que você possa facilmente localizar e identificar cada saída. Finalmente, o Excel não fornece um registro ou outro registro para rastrear o que você fez. Isso pode ser um inconveniente grave se você quiser ser capaz de repetir a mesma análise (ou similar) no futuro, ou mesmo se você simplesmente esqueceu o que já fez. Usando um pacote estatístico, você pode solicitar um teste para tantas variáveis como você precisa de uma vez. Cada um será devidamente rotulado e organizado na saída, por isso não há confusão quanto ao que é o quê. Você também pode esperar para obter um log, e muitas vezes um conjunto de comandos também, que pode ser usado para documentar o seu trabalho ou para repetir uma análise sem ter que passar por todas as etapas novamente. Embora o Excel seja uma planilha fina, não é um pacote de análise de dados estatísticos. Com toda a justiça, nunca foi pretendido ser um. Tenha em mente que o Data Analysis ToolPak é um quotadd-inquot - um recurso extra que permite que você faça alguns cálculos rápidos. Portanto, não deve ser surpreendente que isso é apenas o que é bom para - alguns cálculos rápidos. Se você tentar usá-lo para análises mais extensas, você encontrará dificuldades devido a uma ou todas as seguintes limitações: Problemas potenciais com análises envolvendo dados ausentes. Estes podem ser insidiosos, em que o usuário incautável é improvável que perceber que algo está errado. Falta de flexibilidade nas análises que podem ser feitas devido às suas expectativas quanto ao arranjo dos dados. Isso resulta na necessidade de cortar o sabor e reorganizar a folha de dados de várias maneiras, aumentando a probabilidade de erros. Saída espalhada em muitas planilhas diferentes, ou em toda uma planilha, que você deve assumir a responsabilidade de organizar de forma sensata. A saída pode estar incompleta ou não estar devidamente rotulada, aumentando a possibilidade de erro de identificação da saída. Necessidade de repetir solicitações para algumas análises várias vezes para executá-lo para várias variáveis, ou para solicitar várias opções. Necessidade de fazer algumas coisas definindo suas próprias funções formulas, com o seu risco de erros. Nenhum registro do que você fez para gerar seus resultados, tornando difícil documentar sua análise, ou repeti-la em um momento posterior, se isso for necessário. Se você tiver mais do que cerca de 10 ou 12 colunas, e ou quiser fazer qualquer coisa além de estatísticas descritivas e talvez correlações, você deve usar um pacote estatístico. Há vários disponíveis por licença de site através da OIT, ou você pode usá-los em qualquer laboratório da OIT. Se você tiver o Excel em seu próprio PC e não quiser pagar por um programa estatístico, use o Excel para digitar os dados (com linhas representando os assuntos e colunas para as variáveis). Todos os pacotes estatísticos mencionados podem ler arquivos do Excel, assim você pode fazer a entrada de dados (demorada) em casa, e ir para os laboratórios para fazer a análise. Uma discussão muito mais extensa sobre as armadilhas do uso do Excel, com muitos links adicionais, está disponível em burns-stat Clique em Tutoriais e, em seguida, em Spreadsheet Addiction. Para obter assistência ou obter mais informações sobre software estatístico, entre em contato com o Centro de Consultoria de Bioestatística. Telefone 545-2949Como calcular médias móveis no Excel Análise de dados do Excel para Dummies, 2ª edição O comando Análise de dados fornece uma ferramenta para calcular movimentação e médias exponencialmente suavizadas no Excel. Suponha, por uma questão de ilustração, que você tenha coletado informações diárias sobre temperatura. Você quer calcular a média móvel de três dias 8212 a média dos últimos três dias 8212 como parte de algumas previsões meteorológicas simples. Para calcular médias móveis para este conjunto de dados, execute as seguintes etapas. Para calcular uma média móvel, clique primeiro no botão de comando Dados da análise de dados tab8217s. Quando o Excel exibe a caixa de diálogo Análise de dados, selecione o item Média móvel da lista e clique em OK. O Excel exibe a caixa de diálogo Média móvel. Identifique os dados que você deseja usar para calcular a média móvel. Clique na caixa de texto Intervalo de entrada da caixa de diálogo Média móvel. Em seguida, identifique o intervalo de entrada, digitando um endereço de intervalo de planilha ou usando o mouse para selecionar o intervalo de planilha. Sua referência de intervalo deve usar endereços de célula absolutos. Um endereço de célula absoluto precede a letra da coluna eo número da linha com sinais, como em A1: A10. Se a primeira célula do seu intervalo de entrada incluir uma etiqueta de texto para identificar ou descrever os dados, marque a caixa de seleção Etiquetas na primeira linha. Na caixa de texto Intervalo, informe ao Excel quantos valores devem ser incluídos no cálculo da média móvel. Você pode calcular uma média móvel usando qualquer número de valores. Por padrão, o Excel usa os três valores mais recentes para calcular a média móvel. Para especificar que algum outro número de valores seja usado para calcular a média móvel, insira esse valor na caixa de texto Intervalo. Diga ao Excel onde colocar os dados da média móvel. Use a caixa de texto Range de saída para identificar o intervalo de planilha no qual você deseja colocar os dados de média móvel. No exemplo da folha de cálculo, os dados da média móvel foram colocados na gama de folhas de cálculo B2: B10. (Opcional) Especifique se você deseja um gráfico. Se você quiser um gráfico que traça a informação da média móvel, marque a caixa de seleção Saída do gráfico. (Opcional) Indique se você deseja que as informações de erro padrão sejam calculadas. Se você deseja calcular erros padrão para os dados, marque a caixa de seleção Erros Padrão. O Excel coloca valores de erro padrão ao lado dos valores da média móvel. (As informações de erro padrão passam para C2: C10.) Depois de concluir especificando quais informações de média móvel você deseja calcular e onde deseja colocá-las, clique em OK. O Excel calcula as informações da média móvel. Nota: Se o Excel não possui informações suficientes para calcular uma média móvel para um erro padrão, ele coloca a mensagem de erro na célula. É possível ver várias células que mostram esta mensagem de erro como um valor.
No comments:
Post a Comment