domingo, 22 de maio de 2016

Integração numérica da curva de uma distribuição normal padrão: estatística aliada a métodos numéricos


Alguns eventos aleatórios, quando em um conjunto suficientemente grande, apresentam determinados padrões que permitem prever certas probabilidades. Quando a quantidade de eventos aumenta em torno da média e diminui quando se afasta da mesma, seguindo um padrão simétrico, temos uma distribuição normal, geralmente representada por uma curva em formato de sino. Diversos eventos aleatórios seguem a distribuição normal: a estatura das pessoas, a pressão arterial, a resistência do concreto, etc.

Sendo a distribuição normal uma função densidade de probabilidade (f.d.p.) contínua, a probabilidade da variável aleatória X assumir um valor dentro de um intervalo [a,b] será a área ou integral de f(x) de a até b.

Para determinarmos essa probabilidade, o mais usual é recorremos a tabelas padronizadas. Essas tabelas são montadas com base numa distribuição normal padrão, onde a média é nula e a variância é tomada como sendo 1. Essa distribuição normal pode ser expressa pela fórmula:
A distribuição normal padrão com base nessa função pode ser visualizada no gráfico a seguir:


A variável aleatória normal padrão é denotada por Z e a probabilidade de que Z seja menor que um z calculado será P(Z≤z) e corresponderá à integral da função acima de -∞ até z. Infelizmente não há uma expressão exata para o cálculo da integral de uma f.d.p. normal. O que nos resta é obtermos valores aproximados por meio de uma integração numérica. A ideia foi utilizar aqui uma integração por meio da regra dos 3/8 de Simpson composta. 

Primeiramente foi adotado um valor para z=-1,2 (valor arbitrário apenas para teste). A integração da f.d.p. normal padrão pela regra dos 3/8 de Simpson, com passo de integração h=0,05, permitiu encontrar um valor bastante próximo àquele encontrado em tabela: P(Z≤-1,2)=0,1151. A diferença entre os valores foi de apenas 0,0001. A integral corresponde à área sob a curva do gráfico apresentado abaixo:


É claro que para montagem da tabela completa seria necessária a integração para cada valor de z (adotando esse valor como limite superior da integral). Nesse caso, maiores valores de z exigiriam números de subintervalos cada vez maiores para manter uma aproximação adequada.

Referências:

CAMPOS, F. F. Algoritmos Numéricos. 2ª Ed. Editora: LTC, 2007.
MONTGOMERY, Douglas C.; RUNGER. Estatística Aplicada e Probabilidade para Engenheiros. 5ª Ed. Editora: LTC, 2012.

Nenhum comentário:

Postar um comentário