Contents/conteúdo

Probability and Statistics Seminar   RSS

15/02/2006, 14:30 — 15:30 — Room P3.31, Mathematics Building
Graciela Boente, Universidad de Buenos Aires

Regiões de Tolerância Multivariadas Robustas

Las regiones de tolerancia son de amplio uso en la industria, siendo quizá la principal aplicaión el Control de Calidad, en donde se busca garantizar, para una multiplicidad de variables en estudio, el cumplimiento de ciertos estándares. Otra importante aplicación consiste en la utilización de las regiones de tolerancia como elementos de decisión sobre la pertenencia de ciertas muestras a determinadas poblaciónes. Aunque para la familia de distribuciónes normal, el problema de las regiones de tolerancia parece resuelto, los procedimientos existentes no son distribuciónalmente robustos ya que son extremadamente sensibles a pequeños alejamientos del supuesto de normalidad. Más precisamente, la presencia de una sola observación atípica puede modificar en gran medida la región hallada, debido a cambios en la estimación de la matriz de covarianza y de la media, alterando la cobertura real de dicha región o el nivel de confianza de la misma. La pregunta es, por lo tanto, si el contenido q es todavía una cota inferior válida para la probabilidad de cobertura de la región de tolerancia basada en la media muestral y la matriz de covarianza muestral. En general, la respuesta es negativa. En el caso univariado, los límites de tolerancia no son ni siquiera aproximadamente válidos cuando nos alejamos de la hipótesis de normalidad, como fue observado por Butler (1982), Canavos & Koutraouvaelis (1984), Fernholz & Gillespie (2001) y las referencias citadas allí. En esta charla abordaremos el problema de estudiar las propiedades de robustez de regiones de tolerancia definidas para datos normales multivariados. Se estudiará el comportamiento de las regiones clásicamente usadas ante la presencia de datos atípicos internos (inliers) y externos (outliers). Dicho estudio permite mostrar la falta de robustez del procedimiento tradicionalmente utilizado. Para resolver, la sensibilidad de estas regiones, se propondrá una version robusta de las regiones clásicas y se calcularán los factores necesarios para la determinación de dichas regiones. Por otra parte, un estudio de la función de influencia permite analizar la sensibilidad a datos atípicos de las propuestas consideradas. Basado en ese hecho y con el objetivo de obtener procedimientos menos sensibles a datos atípicos, propondremos regiones de tolerancia basadas en estimadores robustos de posición y escala. Para el caso particular de los estimadores de Donoho–Stahel, se calculan numéricamente los factores de tolerancia para distintos valores de cobertura y niveles de confianza. Un análisis de sensibilidad preliminar análogo al realizado con el estimador clásico permite mostrar la ventaja de utilizar este tipo de procedimiento. Por último, un estudio de simulación permite comparar la cobertura real de las regiones clasicas y robustas cuando las observaciones provienen de una distribución normal y de distribuciones alternativas.