Universidade Federal de Ouro Preto UFOP Programa de

  • Slides: 34
Download presentation
Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciëncia da Computação (PPGCC)

Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciëncia da Computação (PPGCC) Reconhecimento de Padrões Revisão de Probabilidade e Estatística David Menotti, Ph. D. www. decom. ufop. br/menotti

Conceitos Básicos • Estamos realizando um evento aleatório (pegar um peixe no mar) •

Conceitos Básicos • Estamos realizando um evento aleatório (pegar um peixe no mar) • Espaço amostral S – Conjunto de todas a possibilidades • Um evento A – Um subconjunto de S • Lei da probabilidade – Regra que atribui uma probabilidade aos eventos de um experimento S A

Axiomas Básicos da Probabilidade • P(A) >= 0 • P(S) = 1 • P(AUB)

Axiomas Básicos da Probabilidade • P(A) >= 0 • P(S) = 1 • P(AUB) = P(A)+P(B) se A e B forem mutuamente exclusivos – Eventos que não ocorrem simultaneamente, ou seja A∩B = ø • Caso contrário – P(AUB) = P(A)+P(B) – P(A∩B) • P(A) + P(~A)= 1

Probabilidade Condicional • A probabilidade de ocorrer um evento, na condição de que outro

Probabilidade Condicional • A probabilidade de ocorrer um evento, na condição de que outro evento já tenha ocorrido. • Considere o seguinte exemplo: – 250 alunos estão matriculados no primeiro ano • 100 homens e 150 mulheres • 110 cursam física e 140 química SexoDiscip. Física Química Total H 40 60 100 M 70 80 150 Total 110 140 250

Probabilidade Condicional • Um aluno é sorteado ao acaso. Qual a probabilidade de que

Probabilidade Condicional • Um aluno é sorteado ao acaso. Qual a probabilidade de que esteja cursando química dado que seja mulher.

Probabilidade Total • Uma sequência finita de experimentos na qual cada experimento tem um

Probabilidade Total • Uma sequência finita de experimentos na qual cada experimento tem um número finito de resultados com uma determinada probabilidade é chamada de processo estocástico finito. • Árvore Bayesiana é uma boa ferramenta para visualização do problema. • A probabilidade final é calculada pela lei da probabilidade final.

Probabilidade Total: Exemplo • Considere 3 caixas – Caixa 1 tem 10 lampadas, das

Probabilidade Total: Exemplo • Considere 3 caixas – Caixa 1 tem 10 lampadas, das quais 4 com defeito – Caixa 2 tem 6 lâmpadas, das quais 1 com defeito – Caixa 3 tem 8 lâmpadas, das quais 3 com defeito. • O problema consiste em saber a probabilidade de uma lâmpada ser defeituosa P(A), ao selecionar uma caixa aleatoriamente e depois selecionar uma lâmpada aleatoriamente. 1 4/10 Defeito 6/10 Ok 2 1/6 Defeito 5/6 Ok 3 3/8 Defeito 5/8 Ok 1/3 1/3 Baseado no conceito de probabilidade total, temos como probabilidade P(A)

Eventos Independentes • Dois eventos são ditos independentes se P(A∩B) = P(A) * P(B)

Eventos Independentes • Dois eventos são ditos independentes se P(A∩B) = P(A) * P(B) • Logo, pela regra da probabilidade condicional, se A e B são independentes,

Exemplo • Suponha que uma urna contenha 4 bolas brancas e 6 vermelhas. Vamos

Exemplo • Suponha que uma urna contenha 4 bolas brancas e 6 vermelhas. Vamos sortear duas bolas (sem reposição) em momentos distintos. Qual a probabilidade de sair uma bola branca seguida de uma vermelha P(B) = 3/9 P(B) = 4/10 P(V) = 6/9 P(B) = 4/9 P(V) = 6/10 P(V) = 5/9

Exemplo (cont) • Agora considere o exemplo anterior com reposição, ou seja, eventos independentes.

Exemplo (cont) • Agora considere o exemplo anterior com reposição, ou seja, eventos independentes. • P(B, V) = P(B) X P(V) = 4/10 X 6/10 = 0. 24

Teorema de Bayes • Basicamente o teorema de Bayes mostra como rever as crenças

Teorema de Bayes • Basicamente o teorema de Bayes mostra como rever as crenças sempre que novas evidências são coletadas. • Ou seja, atualizar a probabilidade a posteriori utilizando para isso a probabilidade a priori e as verossimilhanças evidências. priori Prob. a posteriori Verosimilhanças (likelihood) Evidências

Teorema de Bayes: Exemplo • Um médico sabe que a meningite causa torcicolo em

Teorema de Bayes: Exemplo • Um médico sabe que a meningite causa torcicolo em 50% dos casos. Porém, o médico sabe que a meningite atinge 1/50000 e também que a probabilidade de se ter torcicolo é de 1/20. • Usando Bayes pra saber a probabilidade de uma pessoa ter meningite dado que ela está com torcicolo P(T|M) = 0. 5 P(M) = 1/50000 P(T) = 1/20

Teorema de Bayes: Exercício • Considere o sistema de classificação de peixes visto anteriormente.

Teorema de Bayes: Exercício • Considere o sistema de classificação de peixes visto anteriormente. Para essa época do ano, sabe-se que a probabilidade de pescar salmão é maior que pescar robalo, P(salmão) = 0. 82 e P(robabo) = 0. 18. • Suponha que a única característica que você pode contar é a intensidade do peixe ou seja, se ele é claro ou escuro. Sabe-se que 49. 5% dos salmões tem intensidade clara e que 85% dos robalos tem intensidade clara. • Calcule a probabilidade de ser salmão dado que o peixe amostrado tem intensidade clara. Probabilidade total

Variáveis Aleatórias • Na prática, muitas vezes é mais interessante associarmos um número a

Variáveis Aleatórias • Na prática, muitas vezes é mais interessante associarmos um número a um evento aleatório e calcularmos a probabilidade da ocorrência desse número do que a probabilidade do evento. • Exemplo: Lançam-se três moedas. Seja X o numero de ocorrências da face cara. Determinar a distribuição de probabilidade de X – S = {ccc, cck, ckc, ckk, kcc, kck, kkc, kkk} – Se X é o número de caras, X assume os valores 0, 1, 2, e 3.

Variáveis Aleatórias • Podemos associar a esses números eventos que correspondem a ocorrência de

Variáveis Aleatórias • Podemos associar a esses números eventos que correspondem a ocorrência de nenhuma, duas ou três caras. • Desta forma temos – P(X=0) = 1/8 – P(X=1) = 3/8 – P(X=2) = 3/8 – P(X=3) = 1/8 Distribuição de Probabilidades

Variáveis Aleatórias • Portanto, podemos definir que variável aleatória é a função que associa

Variáveis Aleatórias • Portanto, podemos definir que variável aleatória é a função que associa a todo evento pertencente a uma partição do espaço amostral um único número real. • Variáveis podem ser discretas ou contínuas

Parâmetros de uma Distribuição • Existem características numéricas que são muito importantes em uma

Parâmetros de uma Distribuição • Existem características numéricas que são muito importantes em uma distribuição de probabilidades. São os parâmetros da distribuição – Esperança matemática e variância. • Esperança matemática

Esperança Matemática: Exemplo • Uma seguradora paga 30000 em caso de acidente de carro

Esperança Matemática: Exemplo • Uma seguradora paga 30000 em caso de acidente de carro e cobra franquia de 1000. Sabe-se que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado. • Variável Aleatória: X X P(X) 1000 0. 97 -29000 0. 03 Distribuição de Probabilidade E(X) = 1 K *. 97 + -29 K *. 03 = 100 Esperança (lucro médio) é de 100 por carro. Deve ser interpretada como valor médio

Variância • Conhecendo a média (esperança) de uma distribuição de probabilidades, podemos calcular o

Variância • Conhecendo a média (esperança) de uma distribuição de probabilidades, podemos calcular o grau de dispersão em torno da média

Variáveis Aleatórias Contínuas • Podemos definir uma variável aleatória contínua como sendo a variável

Variáveis Aleatórias Contínuas • Podemos definir uma variável aleatória contínua como sendo a variável aleatória X em R se existir uma função f(x) tal que:

Calculando as probabilidades Caso discreto: - Probabilidades - P(peixe ter 2 ou 3 nadadeiras)

Calculando as probabilidades Caso discreto: - Probabilidades - P(peixe ter 2 ou 3 nadadeiras) = - P(2) + P(3) = 0. 3+0. 4 Use a soma Caso contínuo: -Densidade e não probabilidades -Probabilidade do peixe pesar entre 29 e 31 kgs. - Integrar

Distribuições Teóricas • As distribuições teóricas associam uma probabilidade a cada resultado numérico de

Distribuições Teóricas • As distribuições teóricas associam uma probabilidade a cada resultado numérico de um experimento, ou seja, dá a probabilidade de cada valor de uma variável aleatória. • Podem ter uma variedade de formas. – Simétricas e não simétricas. • Binomial, Poisson, Exponencial, Normal

Distribuição Normal (Gaussiana) • A distribuição normal é a mais importante das distribuições pois

Distribuição Normal (Gaussiana) • A distribuição normal é a mais importante das distribuições pois muitas variáveis aleatórias de ocorrência natural ou de processos práticos obedecem a esta distribuição. • Formato de sino • Simétrica • Unimodal

Distribuição Normal • A função densidade para esta distribuição é dada por • Como

Distribuição Normal • A função densidade para esta distribuição é dada por • Como podemos perceber, a distribuição normal inclui dois parâmetros – μ – média populacional – σ – desvio padrão populacional. • Denotamos N(μ, σ) a curva normal com média μ e desvio padrão σ

Distribuição Normal • A média refere-se ao centro da distribuição e o desvio padrão

Distribuição Normal • A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva.

Distribuição Normal 68. 27% 95. 45% 99. 73%

Distribuição Normal 68. 27% 95. 45% 99. 73%

Exemplo • O peso de recém-nascidos é uma variável aleatória contínua. A Figura abaixo

Exemplo • O peso de recém-nascidos é uma variável aleatória contínua. A Figura abaixo mostra a distribuição de freqüências relativas 5000 pesos de recém-nascidos.

Exemplo • Considerando μ = 2800 g, σ = 500 g, podemos concluir que

Exemplo • Considerando μ = 2800 g, σ = 500 g, podemos concluir que – P(2300 <= X <= 3300) = 68. 3% – P(1800 <= X <= 3800) = 95. 5% – P(1300 <= X <= 4300) = 99. 7% • Porém, na prática desejamos calcular probabilidades para diferentes valores de μ e σ.

Distribuição Normal • Para isso, a variável X cuja distribuição N(μ, σ) é transformada

Distribuição Normal • Para isso, a variável X cuja distribuição N(μ, σ) é transformada numa forma padronizada Z, com distribuição N(0, 1) (distribuição normal padrão), pois tal distribuição é tabelada. • A normalização se dá por

Utilizando a Tábua de Probabilidades • Primeiro é necessário decompor Z em duas parcelas

Utilizando a Tábua de Probabilidades • Primeiro é necessário decompor Z em duas parcelas • Por exemplo, Z = 1. 39 – Primeira parcela = 1. 3 – Segunda parcela = 0. 09 • No cruzamento das duas parcelas encontra-se a probabilidade correspondente a área da curva entre 0 e Z.

Exemplo • Considere a seguinte distribuição – X -> N(30; 4) – Calcule a

Exemplo • Considere a seguinte distribuição – X -> N(30; 4) – Calcule a probabilidade de X >= 40. Da tabela, temos 0. 4938 Logo, P(X>=40) = 0. 5 – 0. 4938 0 2. 5

Exercício • Uma fábrica de carros sabe que os motores de sua fabricação têm

Exercício • Uma fábrica de carros sabe que os motores de sua fabricação têm duração normal com média 150 mil km e desvio de 5 mil. Qual a probabilidade de que um carro escolhido ao acaso dure – a) menos de 170 mil – b) entre 140 e 165 mil

Exercício • a) P(X < 170) – Z = 4. Da tabela temos 0.

Exercício • a) P(X < 170) – Z = 4. Da tabela temos 0. 4999968 – Logo P(X<170) = 0. 5 + 0. 4999= 0. 999

Teorema Central do Limite • A medida em que o tamanho da amostra X

Teorema Central do Limite • A medida em que o tamanho da amostra X cresce, a distribuição de X se aproxima da distribuição normal