摘要:Dados ambientais frequentemente apresentam valores censurados, perdidos e/ou discrepantes (outliers). Além disto, as amostras devem ser consideradas dependentes por terem componentes espaciais e temporais. Outro fato frequente nestes dados é que dificilmente seguem uma distribuição Normal ou Log-normal. Devido a estas características e outras, técnicas estatísticas convencionais não devem ser utilizadas. O presente trabalho apresenta um estudo de caso do rio das Velhas, Minas Gerais, utilizando métodos estatísticos robustos após o tratamento adequado dos dados. A análise de componentes principais detectou as variáveis que mais contribuem para a degradação da qualidade das águas do rio das Velhas e a visualização espacial dos escores mostrou onde esta contaminação está mais evidente.
其他摘要:Environmental data often presents censored, lost and/or outlier values. In addition, samples should be considered dependent for having spatial and temporal components. Another fact is that, frequently, these data won't follow a Normal or Log-normal distribution. Because of these and other characteristics, conventional statistical techniques should not be used. This article presents a case study of the Das Velhas river, Minas Gerais, using robust statistical methods after appropriate treatment of the data. The analysis of the main components found the variables that contribute the most for the degradation of water quality in the river, and the spatial visualization of the scores showed where this contamination is most evident.
关键词:Estatísticas robustas;dados ambientais;análise de componentes principais;SoftwareR;rio das Velhas
其他关键词:robust statistics;environmental data;principal components analysis;R software;Das Velhas river