Probability and Statistics Seminar   RSS

Past sessions

Newer session pages: Next 4 3 2 1 Newest 

04/07/2008, 14:00 — 15:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
Cláudia Nunes, CEMAT e Departamento de Matemática, Instituto Superior Técnico

Análise Probabilística de Opções Reais

A análise de opções reais, muito em voga nos meios financeiros actuais, lida com a necessidade premente de prever preços futuros de opções (de compra ou venda) num cenário aleatório, de forma a estabelecer preços contractuais justos para ambas as partes. Neste contexto a componente estocástica tem um papel relevante, que será explorado nesta apresentação. Veremos como o movimento Browniano, por exemplo, é indispensável na análise em horizonte finito de produtos financeiros, e como no dia a dia de "traders" especializados aparecem integrais estocásticos.

20/06/2008, 14:00 — 15:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
Carlos Daniel Paulino, Departamento de Matemática, Instituto Superior Técnico

Análise bayesiana de privação das famílias portuguesas

Neste trabalho pretende-se analisar multidimensionalmente a pobreza das famílias portuguesas considerando quatro dimensões de bem-estar — Habitação, Bens de Conforto, Capacidade Económica e Redes de Sociabilidade — com base no Painel Europeu de Agregados Domésticos Privados do Eurostat. Propõe-se uma abordagem em várias etapas permitindo uma análise parcial e global da privação, recorrendo-se, para tal, à análise de modelos bayesianos de classes latentes através do método Monte Carlo via Cadeias de Markov. Os resultados obtidos evidenciam uma melhoria substancial no bem-estar das famílias entre 1995 e 2001. As dimensões Capacidade Económica e Redes de Sociabilidade são as que mais contribuem para a situação de privação das famílias.

30/05/2008, 14:00 — 15:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
Manuela Souto de Miranda, Departamento de Matemática, Universidade de Aveiro

Erros nos regressores: realismo, desconforto e desafios

Os modelos de regressão constituem uma das ferramentas mais usadas pelos utilizadores da Estatística — por vezes ignorando que as variáveis são medidas com erro. Que fazer quando um regressor contém erros? Os modelos com erros-nas-variáveis dão a resposta. São uma extensão dos modelos de regressão, que disponibiliza uma descrição mais realista dos fenómenos em análise. Apesar das aparentes vantagens da modelação, os modelos com erros-nas-variáveis não têm tido a procura dos seus congéneres, nem a mesma aceitação. Porque será? Nesta apresentação procura-se responder às questões anteriores, divulgando esta família de modelos, comparando-os com os modelos de regressão, apontando os métodos a usar, as vantagens e os desafios associados à sua aplicação.

20/05/2008, 15:00 — 16:00 — Room P10, Mathematics Building
Isabel Rodrigues, CEMAT and Department of Mathematics, Instituto Superior Técnico

Métodos robustos para regressão com erros autocorrelacionados

Uma das suposições associadas ao modelo de regressão linear múltipla é a independência dos erros. No entanto em muitas aplicações, nomeadamente em econometria, essa suposição não se verifica. Têm sido, por isso, propostos desde longa data métodos de diagnóstico para esta situação (um deles é o conhecido teste de Durbin-Watson) e métodos adequados de estimação (por exemplo, mínimos quadrados generalizados). Neste trabalho mostra-se que esses métodos não são robustos em relação a outras violações das suposições do modelo, tais como a não normalidade dos erros e/ou a existência de outliers, e apresentam-se métodos alternativos adequados para diagnosticar de forma robusta a existência de erros autocorrelacionados, bem como estimadores robustos para os parâmetros do modelo de regressão na presença daquele tipo de erros. Os métodos propostos são avaliados com base em estudos de Monte Carlo e em dados reais.

11/04/2008, 14:00 — 15:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
João Branco, CEMAT and Department of Mathematics, Instituto Superior Técnico

Regressão Robusta

Desde os finais do século XIX que a regressão é uma espécie de pão de cada dia para uma vasta população de utilizadores da estatística nos mais variados domínios. O método dos mínimos quadrados é como que a manteiga que prepara e facilita a ingestão, permitindo o estudo do modelo. Nesta apresentação mostra-se que este pão com manteiga da Estatística nem sempre tem o sabor delicioso que o seu consumo voraz parece sugerir. A receita pode falhar e o sabor pode ser amargo. Para prevenir acidentes e desconfortos propõe-se um condimento muito abrangente, capaz de satisfazer e deixar mais tranquilo o utilizador em geral, mesmo o mais exigente, aquele que trabalha em domínios ou casos em que a aplicação dos mínimos quadrados conduz a soluções enganadoras. Trata-se da regressão robusta cuja análise constitui a preocupação central do seminário: o que é, que vantagens, que limitações, que métodos e que popularidade, são alguns dos tópicos a abordar.

07/03/2008, 15:00 — 16:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
Luzia Gonçalves, CEAUL e Instituto de Higiene e Medicina Tropical - Universidade Nova de Lisboa

A Bioestatística integrada numa perspectiva multidisciplinar

Actualmente os investigadores das áreas biomédicas estão mais sensibilizados para a intervenção da Estatística nos seus projectos de investigação. A participação tardia do estatístico (apenas na fase da análise de dados) ainda é frequente. Contudo, existe uma maior preocupação na integração atempada do estatístico na fase do planeamento e recolha de dados. Por outro lado, o desenvolvimento das áreas biomédicas (e.g. Biologia Molecular) tem suscitado o desenvolvimento de metodologias estatísticas cada vez mais sofisticadas e que requerem a intervenção da Teoria das Probabilidades, da Investigação Operacional e das Ciências da Computação, habitualmente, não contempladas nas instituições biomédicas. Neste trabalho aborda-se a problemática do diálogo, nem sempre fácil, com outras áreas do saber de forma a reforçar o papel da Bioestatística em alguns projectos de investigação. Fazendo referência ao Projecto “Epidemiologia e Controlo da Leptospirose nos Açores” ilustram-se os esforços e as dificuldades sentidas no terreno para realizar uma amostragem aleatória e recolher os dados. Outra área importante na Bioestatística relaciona-se com o estudo da sensibilidade e especificidade de técnicas laboratoriais na ausência de uma técnica de referência fiável (Gold standard). Os Modelos de Classes Latentes, tradicionais na Psicologia e Sociologia, têm sido aplicados para estimar especificidades e sensibilidades de técnicas laboratoriais sem fixar uma técnica como referência. Através de um problema prático exemplifica-se a importância destes modelos no diagnóstico de algumas doenças tropicais. Paralelamente, ao explorar este problema prático, surgiu a necessidade de revisitar alguns problemas antigos da Estatística, relacionados com os intervalos de confiança para proporções (próximas de $0$ ou $1$) e, consequentemente, com o cálculo do tamanho da amostra. Em suma, a multidisciplinaridade está naturalmente presente na Bioestatística e as linhas de investigação, em oposição à Estatística Teórica, podem ser enriquecidas pela diversidade de problemas práticos e pelo diálogo com outros profissionais.

Seminário integrado no Seminário de Probabilidades e Estatística da UTL

22/02/2008, 15:00 — 16:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
Graciela Boente, Universidad de Buenos Aires e CONICET Argentina

Robust estimators in Generalized Partially Linear Models

Semiparametric models contain both a parametric and a nonparametric component. Sometimes the nonparametric component plays the role of a nuisance parameter. The aim of this talk is to consider semiparametric versions of the generalized linear models where the response $y$ is to be predicted by covariates $({\bf x},t)$, where ${\bf x}\in\mathbb{R}^{p}$ and $t\in\mathbb{R}$. It will be assumed that the conditional distribution of $y|({\bf x},t)$ belongs to the canonical exponential family $\exp\left[y\theta({\bf x},t)-B\left(\theta({\bf x},t)\right)+C(y)\right]$, for known functions $B$ and $C$. The generalized linear model (McCullagh and Nelder, 1989), which is a popular technique for modelling a wide variety of data, assumes that the mean is modelled linearly through a known link function, $g$, i.e., \[ g(\mu\left({\bf x},t\right))=\theta({\bf x},t)=\beta_{0}+{\bf x}^T{\bf\beta}+\alpha t\;.\] In many situations, the linear model is insufficient to explain the relationship between the response variable and its associated covariates. A natural generalization, which suffers from the curse of dimensionality, is to model the mean nonparametrically in the covariates. An alternative strategy is to allow most predictors to be modeled linearly while one or a small number of predictors enter the model nonparametrically. This is the approach we will follow, so that the relationship will be given by the semiparametric generalized partially linear model \begin{equation} \mu\left({\bf x},t\right)=E\left(y|({\bf x},t)\right)=H\left(\eta(t)+{\bf x}^T{\bf\beta}\right)\qquad(\text{GPLM})\end{equation} where $H=g^{-1}$ is a known link function, ${\bf\beta}\in\mathbb{R}^{p}$ is an unknown parameter and $\eta$ is an unknown continuous function. Severini and Wong (1992) introduced the concept of generalized profile likelihood, which was later applied to this model by Severini and Staniswalis (1994). In this method, the nonparametric component is viewed as a function of the parametric component, and root--$n$ consistent estimates for the parametric component can be obtained when the usual optimal rate for the smoothing parameter is used. Such estimates fail to deal with outlying observations. In a semiparametric setting, outliers can have a devastating effect, since the extreme points can easily affect the scale and the shape of the function estimate of $\eta$, leading to possibly wrong conclusions on $\beta$. Robust procedures for generalized linear models have been considered among others by Stephanski, Carroll and Ruppert (1986), Künsch, Stefanski and Carroll (1989), Bianco and Yohai (1995), Cantoni and Ronchetti (2001), Croux and Haesbroeck (2002) and Bianco, García Ben and Yohai (2005). The basic ideas from robust smoothing and from robust regression estimation have been adapted to deal with the case of independent observations following a partly linear regression model with $g(t)=t$; we refer to Gao and Shi (1997) and Bianco and Boente (2004), and He, Zhu and Fung (2002). In this talk, we will first remind the classical approach to generalized partly linear models. The sensitivity to outliers of the classical estimates for these models is good evidence that robust methods are needed. The problem of obtaining a family of robust estimates was first considered by Boente, He and Zhou (2006). However, their procedure is computationally expensive. We will introduce a general three--step robust procedure to estimate the parameter ${\bf\beta}$ and the function $\eta$, under a generalized partly linear model (GPLM), that is easier to compute than the one introduce by Boente, He and Zhou (2006). It is shown that the estimates of ${\bf\beta}$ are root--$n$ consistent and asymptotically normal. Through a Monte Carlo study, we compare the performance of these estimators with that of the classical ones. Besides, through their empirical influence function we study the sensitivity of the estimators. A robust procedure to choose the smoothing parameter is also discussed. We will briefly discuss the generalized partially linear single index model which generalizes the previous one since the independent observations are such that $y_{i}|\left({{\bf x}_{i},t_{i}}\right)\sim F\left(\cdot,\mu_{i}\right)$ with $\mu_{i}=H\left(\eta({\bf\alpha}^T{\bf t}_{i})+{\bf x}_{i}{\bf\beta}^T\right)$, where now ${\bf t}_{i}\in\mathbb{R}^{q}$, ${\bf x}_{i}\in\mathbb{R}^{p}$ and $\eta:\mathbb{R}\to\mathbb{R}$, ${\bf\beta}\in\mathbb{R}^{p}$ and ${\bf\alpha}\in\mathbb{R}^{q}$ ($\|{\bf\alpha}\|=1$) are the unknown parameters to be estimated. Two families of robust estimators are introduced which turn out to be consistent and asymptotically normally distributed. Their empirical influence function is also computed. The robust proposals improve the behavior of the classical ones when outliers are present.

Trabalho efectuado em parceria com Daniela Rodriguez

15/02/2008, 15:00 — 16:00 — Conference Room, Instituto de Sistemas e Robótica, North Tower, 7th floor, IST
Ana Pires, Departamento de Matemática e CEMAT, Instituto Superior Técnico

Robust statistics: an overview

The basic ingredients of a statistical analysis are, in general, a data set, a model and a number of statistical procedures (estimation methods and tests). These procedures require that certain assumptions are fulfilled in order to function properly. Examples of this kind of assumptions are: normality of the observations, their independence and distributional identity (i.i.d.), homogeneity of variances, linearity or stationarity. If one or several of these assumptions are not verified the results of the statistical procedures may become completely aberrant. When this happens the procedure is called "non-robust". If, on the contrary, the results do not change a lot in the presence of small deviations from the assumptions, the procedure is called "robust". The importance of robust statistical procedures comes from the fact that the ideal assumptions are barely or never met in practice. Several simple examples will be presented to illustrate the severe effects of the violation of the underlying assumptions on the results of statistical procedures. After this introduction the talk goes on with a brief presentation of the basic concepts of robust statistics and with the discussion of robust methods in two main areas of statistics: regression and multivariate analysis. These areas are precisely those where there is a stronger need for robust methods and where the research effort has been more concentrated. The talk ends with some considerations on the future of robust statistics.

14/12/2007, 15:00 — 16:00 — Room P7, Mathematics Building, IST
Conceição Amado, Instituto Superior Técnico e CEMAT.

Métodos de reamostragem para a estimação de medidas de precisão em sondagens

A ideia de efectuar inferências a partir de amostras seleccionadas de populações finitas é fundamental em estatística. Um dos aspectos importantes da inferência diz respeito à estimação da variância, enviesamentos e erros quadráticos médios associados às estimativas das características populacionais. Porém, esta pode ser uma tarefa bastante complicada devido à complexidade dos esquemas de amostragem, ao uso de estimadores não lineares, ou ao impacto do processo de recolha dos dados no estudo de amostragem (dados omissos, não respostas). Mesmo em esquemas de amostragem simples, como o caso da amostragem aleatória simples, a estimação da variância de algumas estatísticas requer técnicas mais elaboradas de estimação. Neste trabalho efectua-se uma breve descrição de vários procedimentos de reamostragem que têm sido propostos na literatura (bootstrap, jackknife e replicação equilibrada repetida) para a estimação de medidas de precisão em sondagens. Esta abordagem parece adequada para suprir certas dificuldades dos métodos tradicionais.

06/12/2007, 15:00 — 16:00 — Room P9, Mathematics Building
Philippe Robert, INRIA

Analysis of a Stochastic Model for Flash Crowd Scenarios

In this talk we investigate the performance of a file sharing principle similar to the one implemented by eMule and BitTorrent. For this purpose, we consider a system composed of N peers becoming active at exponential random times, thus modeling a ``flash crowd'' scenario where an initial burst of clients occurs. The system is initiated with only one server offering the desired file and the other peers try to download it after becoming active. Once the file has been downloaded by a peer, this one immediately becomes a server. While the system starts in a congested state where all servers available are saturated by incoming demands, it shifts to a state where a growing number of servers are idle. We are interested in the time needed for this shift to happen, which is closely related to the transient performance of this file sharing principle. In spite of its apparent simplicity, this queueing model (with a random number of servers) reveals quite difficult to analyze. A formulation in terms of an urn and ball model is proposed and corresponding scaling results are derived. These asymptotic results are then compared against simulations.

22/11/2007, 15:00 — 16:00 — Room P9, Mathematics Building
Helena Ribeiro, Instituto Politécnico de Leiria e CEMAT

Filas de espera oscilantes $M/G/1/n$ e $GI/M(m)//n$ com chegadas em grupo

As filas de espera oscilantes $M/G/1/n$ e $GI/M(m)//n$ com chegadas em grupo oscilam entre duas fases que têm impacto nas características de serviço. Quando o sistema está na fase 1 o número de clientes no sistema varia entre $0$ e $b-1$, e quando está na fase 2 o número de clientes no sistema varia entre $a+1$ e $n$, com $a$ e $b$ sendo dois números inteiros tais que $a \lt b$. Um sistema oscilante evolui da seguinte maneira: se num instante o sistema opera na fase 1, o número de clientes no sistema é menor do que $b$, e o sistema permanece nesta fase até que o número de clientes no sistema seja maior ou igual a $b$. Nesse instante o sistema muda para a fase 2 e permanece nesta fase até ao primeiro instante em que o número de clientes no sistema seja menor ou igual do que $a$. Nesse instante o sistema muda para a fase 1 e assim sucessivamente. O estudo das filas oscilantes $M/G/1/n$ com chegadas em grupo é feito tirando partido da sua estrutura regenerativa markoviana. Usamos cadeias de Markov embebidas e caracterizamos a distribuição limite do número de clientes no sistema. São também estudadas duas outras importantes medidas de desempenho do sistema, particularmente importantes na análise de transmissão de dados e vídeo na Internet: as probabilidades de perdas consecutivas de clientes em períodos de ocupação contínua, e a duração de períodos de ocupação contínua. O estudo das filas oscilantes $GI/M(m)//n$ com chegadas em grupo é feito combinando a metodologia das cadeias embebidas e o uso de uniformização. Caracterizamos as probabilidades limite do número de clientes no sistema e determinamos probabilidades de perda consecutiva em períodos de ocupação contínua.

07/11/2007, 11:00 — 12:00 — Room P3.10, Mathematics Building
Ana Luísa Papoila, Faculdade de Ciências Médicas da Universidade Nova de Lisboa e CEAUL

Modelos Aditivos Generalizados com função de ligação flexível

Ao utilizar Modelos Lineares Generalizados (GLMs), é possível que ocorra uma má especificação da função de ligação, dada a habitual falta de informação que nos permita escolher correctamente esta função. No caso dos GLMs, vários autores não só detectaram como também quantificaram os efeitos de uma má escolha da função de ligação. Assim, torná-la mais flexível passou a ser uma preocupação para alguns investigadores. Inicialmente, o objectivo era apenas o de generalizar o modelo de regressão logística, mas, cedo, essa generalização contemplou outros GLMs. Para isso, foram utilizadas técnicas paramétricas, não paramétricas e Bayesianas. Mais recentemente, e depois da identificação do mesmo problema nos Modelos Aditivos Generalizados (GAMs), foram desenvolvidos novos métodos não paramétricos com o objectivo de estimar a função de ligação destes modelos. Neste trabalho, propomos a introdução de famílias de funções de ligação paramétricas nos GAMs e, embora os procedimentos aqui sugeridos possam ser utilizados com qualquer tipo de resposta (desde que pertença à família exponencial), concentrar-nos-emos unicamente no caso em que a variável resposta é binária, devido ao lugar tão importante que a regressão logística ocupa na Estatística. A nossa proposta situa-se algures entre um modelo aditivo com uma função de ligação fixa, que tem que ser escolhida a priori, e um modelo aditivo cuja função de ligação é não paramétrica e estimada a partir dos dados.

02/11/2007, 15:00 — 16:00 — Room P7, Mathematics Building, IST
Nelson Antunes, Universidade do Algarve e CEMAT

Modelação Estocástica em redes de telecomunicações

Um dos desafios que se colocam ao desempenho das redes de telecomunicações é o desenvolvimento de modelos matemáticos e métodos para os analisar, que representem de maneira apropriada a aleatoriadade presente nestes sistemas. Neste seminário, serão apresentados três problemas de investigação em redes fixas e sem fios de telecomunicações, recentemente estudados pelo orador, que utilizam modelação estocástica.

26/10/2007, 15:00 — 16:00 — Room P7, Mathematics Building, IST
Gualter Couto, Universidade dos Açores

Instante Óptimo de Relocalização

Na actualidade noticiária somos frequentemente confrontados com notícias sobre a relocalização de empresas multinacionais. A decisão à cerca de uma possível relocalização resulta de um balanço entre o custo associado à relocalização (indemnizações aos trabalhadores despedidos, custos de construção de infraestruturas, etc) e os benefícios em termos de eficiência produtiva da nova localização face à antiga.

Neste seminário aborda-se de um ponto de vista estocástico a determinação do instante óptimo de localização de uma empresa que age de forma óptima, em ambiente de risco neutro, utilizando uma análise de opções reais.

Discutem-se várias hipóteses distribucionais associadas à incerteza presente na modelação do processo de disponibilização de novas e mais eficientes localizações.

(trabalho em co-autoria com José Azevedo-Pereira e Cláudia Nunes)

18/10/2007, 15:00 — 16:00 — Room P3.10, Mathematics Building
Vladas Pipiras, University of North Carolina at Chapel Hill, USA

Some research problems on long range dependence

Long range dependence is the property of time series data or corresponding models for which observations are strongly correlated across time lags. It has gained particular attention since the mid 90’s, primarily due to its use in modeling data traffic over Internet and other networks. In this talk, the speaker will discuss several, mostly mathematical research problems on long range dependence that he is presently involved in.

27/09/2007, 15:00 — 16:00 — Room V1.31, Civil Engineering Building, IST
Manuel Cabral Morais, Departamento de Matemática e CEMAT, Instituto Superior Técnico

Stochastic Ordering: from the Lorenz curve to Quality Control

The desire to compare what is random is probably as old as probability itself. A landmark in the history of stochastic ordering (SO) is the pioneering work by Lorenz (1905) in the assessment of income inequality in a population of n individuals. Lorenz - feeling that all of the summary measures then under consideration constituted too much condensation of the data - proposed what is now known as the Lorenz curve and suggested the following rule of interpretation: a high level of income inequality is associated to a severely bent curve. Since this tool was developed by Lorenz, SO has gained widespread acceptance and has been applied, namely, in Biology, Queueing Theory, Reliability Theory, Risk Theory, Scheduling, and Statistical Inference. This presentation will focus on a brief overview of SO and on two applications. In Finance, SO is particularly important in demand and shift effect problems in portfolio selection. As for Quality Control, SO provides decisive insights into how control schemes work in practice and allows the performance comparison of competitive schemes.

21/09/2007, 15:00 — 16:00 — Room P6, Mathematics Building
Fátima Ferreira, UTAD (Universidade de Trás-os-Montes e Alto Douro) e CEMAT

Ordenação em excedência de nível e aplicações

A ordenação estocástica é reconhecida nos dias de hoje como uma ferramenta útil para comparar variáveis aleatórias e processos estocásticos. Reflexo disso é a vasta bibliografia na área, a qual inclui inúmeras propostas de relações de ordem estocástica. De entre estas, a mais estudada, é sem dúvida, a ordenação estocástica em distribuição, também denominada de usual ou forte, que compara os processos através das correspondentes funções de distribuição. Contudo, outros tipos de ordenação estocástica de processos são por vezes mais talhadas para estudar determinadas variáveis de interesse. Neste seminário aborda-se, em particular, a ordenação estocástica em excedência de nível (do inglês, level-crossing stochastic order), proposta por A. Irle e J. Gani (2001), a qual é adequada para lidar com situações em que se está interessado em comparar os tempos aleatórios que processos estocásticos levam a exceder níveis. Especificamente, o processo estocástico $X$ diz-se menor que o processo estocástico $Y$ em excedência de nível se, estocasticamente, $X$ demora mais tempo do que $Y$ a exceder qualquer nível, partindo os dois processos de um mesmo nível. Apresentar-se-ão os resultados estabelecidos até à data para a ordenação estocástica em excedência de nível de processos semi-markovianos e cadeias de Markov com espaço de estados isomorfo a um subconjunto de inteiros, comparando-os, sempre que possível, com resultados análogos relativos à correspodente ordenação estocástica usual. Terminaremos com exemplos de aplicação dos mesmos a filas de espera e processos de nascimento e morte com catástrofes.

12/06/2007, 15:00 — 16:00 — Room P3.31, Mathematics Building
, DM, University of Athens

Pricing and equilibrium behavior for a Markovian queue with server vacations

The topic of the talk lies in the intersection of queueing and game theory. More specifically we seek for best balking strategies for the customers in a queueing system with server vacations under various levels of information. The model is the single server Markovian queue with setup times. Whenever a customer leaves this system empty, the server departs immediately to attend to secondary jobs. On the contrary, whenever a customer arrives to an empty system, the server is recalled immediately and it takes an exponential setup time to start service again. We assume a natural reward - cost structure for the customers, which incorporates their desire for service as well as their unwillingness to wait. We examine customers behavior under various levels of information regarding the state of the system at arrival instances. More specifically, a customer may know or not know the state of the server and the number of present customers upon his arrival. We derive equilibrium strategies for the customers under the various levels of information and we study the associated social optimization and profit maximization problems. Analytical and numerical comparisons illustrate further the effect of the information level to the pricing and equilibrium behavior of the system.

07/02/2007, 14:30 — 15:30 — Room P3.31, Mathematics Building
, Dep. Matemática para a Ciência e Tecnologia, Universidade do Minho

New methods in multi-state models

The multi-state models may be considered as a generalization of the survival process where several events occur successively over time. The classical multi-state model describes the life history of an individual as moving through various states. Thus at any time, say t, the individual will be in one state. For a single individual, these states may describe whether the subject is healthy, diseased, diseased with complication or dead. Estimation of the transition probabilities in a non-homogeneous illness-death model is considered here. Traditionally, inference for such models is based on the Markov assumption. We review some of these results and propose new estimators, based on a less restrictive (non-Markov) approach.

24/01/2007, 14:30 — 15:30 — Room P3.31, Mathematics Building
, Dep. Engenharia Química, Univ. Coimbra

A reconciliação de dados, o erro de medição com viés, o estimador robusto LTD, o engenheiro, e uma ideia dele

Devido ao erro aleatório inerente aos processos de medição, é usual haver inconsistência entre medições e princípios físicos e químicos básicos. A técnica estatística de estimação que permite obter estimativas dos verdadeiros valores das medições ajustados às leis físicas é conhecida como reconciliação de dados. Um problema que afecta as técnicas de reconciliação clássicas é a presença de outliers nos dados. Um outro problema importante é a existência de viés nas medições, o que ocorre com a inevitável descalibração dos instrumentos de medição. O estimador robusto least trimmed differences (LTD) é inerentemente insensível ao viés dos dados. Daqui decorre o interesse na investigação da sua aplicabilidade ao problema de reconciliação de dados. Sendo um estimador em que o grau de aparamento é fixo a priori, isto limita o grau de eficiência que é possível obter. Uma abordagem possível para contornar este problema é a extensão de uma regra adaptativa proposta por Gervini e Yohai em 2002. Na primeira parte, farei a exposição do problema de reconciliação de dados para sistemas dinâmicos não-lineares, e apresentarei um esboço do ataque deste problema com o estimador LTD. Na segunda parte, apresentarei os resultados de uma simulação de Monte Carlo em que uma pequena variação na regra adaptativa de Gervini e Yohai é aplicada ao estimador least trimmed squares (LTS) e a um estimador de norma-$L_p$ aparado. Além disso, estes estimadores adaptativos são comparados com o estimador MM e o estimador TAU.

Older session pages: Previous 6 7 8 Oldest