Inferncia Indutiva Uma Perspectiva Genuinamente Bayesiana Carlos Alberto

Inferência Indutiva Uma Perspectiva Genuinamente Bayesiana Carlos Alberto de Bragança Pereira Inferência Bayesiana 2007 Aula 1

The Statistician is the Wizard who makes "scientific" statements about invisible states and quantities. However, contrary to real wishes (and witches), (s)he attaches uncertainties to h(er)is statements. " 1/11/2022 2

Probabilidades O trabalho do estatístico é iniciado no momento da descrição dos níveis de incerteza de um cientista sobre as quantidades de interesse (invisíveis), q. A ferramenta usada para a descrição do nível de incerteza sobre q é a Probabilidade. A Probabilidade de um estado de natureza específico, digamos q 0, é um índice que indica o nível de incerteza (ou conhecimento) sobre a veracidade da afirmação: ¨q é igual a q 0 ¨ 1/11/2022 3

Variáveis Aleatórias Nosso objetivo é descrever nossas incertezas Probabilisticamente. Às quantidades desconhecidas de nosso interesse damos o nome de Variáveis Aleatórias e podem ser de 3 tipos: -as observadas -as não observadas e -as não observáveis. As não observáveis e de interesse damos o nome de Parâmetros. 1/11/2022 4

Modelo Probabilístico Probabilidades devem ser atribuídas a todos os estados de natureza possíveis. Ao conjunto de todas as afirmações probabilísticas de um problema usamos o termo modelo probabilístico ou equivalentemente distribuição de probabilidades. 1/11/2022 5

Experimento & Banco de Dados O mecanismo que transforma uma quantidade invisível, X, em visível, x, é aqui denominado experimento. O conjunto de quantidades obtidas após a realização de experimentos é denominado resultados experimentais ou banco de dados. 1/11/2022 6

a priori & a posteriori A realização de um experimento {X=x} tem como objetivo a redução da incerteza sobre o parâmetro de interesse q. O modelo probabilístico de q, definido antes (depois) da realização do experimento X, é denominado a priori (a posteriori) de q. 1/11/2022 7

Associação Muitas vezes o cientista enfrenta um dilema: O que observar para diminuir a incerteza sobre q ? Ele pode estar em presença de um conjunto de experimentos, digamos X, Y, Z, . . . , passíveis de serem observados. Pode haver custos ou restrições associados à realização dos experimentos. Assim, o estatístico é obrigado a selecionar quais serão observados. 1/11/2022 8

Associação Para uma escolha adequada, ele deve descrever o tipo de associação que, em sua opinião, existe entre q e cada um dos experimentos. Essa descrição também é feita por meio de modelos probabilísticos. Por exemplo, considere que o experimento X vai ser realizado. 1/11/2022 9

Associação Para cada valor, q, do parâmetro, represente por f(x|q) a função de probabilidade que avalia, para cada x, a probabilidade de {X=x}. Se existem pelo menos dois valores de q, digamos q 1 e q 2, tal que f(. |q 1 ) ¹ f(. |q 2 ), então q e X são dependentes ou associados. Neste caso é razoável realizar-se o experimento X com o intuito de diminuir a incerteza sobre q. Q & X : conjuntos de valores possíveis de q e X, os conhecidos espaços paramétrico e amostral. 1/11/2022 10

Instrumental Dist. a priori: {P(q): qÎQ} Modelo Estatístico: {P(q, x): xÎX, qÎQ}. Dist. Amostral: Áq = {f(x|q): xÎX} " qÎQ. Verossimilhança: Áx = {L(q |x) = f(x|q): qÎQ} " xÎX. Dist a posteriori: {P(q |X=x): qÎQ} " xÎX. 1/11/2022 11

Exemplo 1: Bio. Equivalência Uma nova droga para enxaqueca tenta entrar no mercado. O laboratório afirma que é equivalente a melhor droga da praça, cujo efeito positivo é de 75%. Além disso a nova droga sairá mais barato para o consumidor. Em média 60% mais barato! Uma pesquisa com 30 pacientes foi realizada e apenas 9 desses não responderam positivamente a nova droga. 1/11/2022 12

Análise Padrão. 311 1/11/2022 13

Bayesian. 292 1/11/2022 14

Planejamento de Experimentos Quais quantidades devem ser observadas? As que podem gerar maior ganho de informação! Decisão antes de realizar e observar. Escolha é feita com base nas expectativas sobre resultados experimentos concorrentes. Essa análise de expectativas, é identificada como o clássico Planejamento de Experimentos. Procuram-se os planejamentos “ótimos”. Podem ser não realizáveis devido as restrições operacionais ou de custos. 1/11/2022 15

Estimação: Formulação Obter a posteriori é o nosso objetivo maior Após coletar as informações disponíveis em x sobre q, o estatístico descreve a informação calibrada sobre q, a posteriori. Como então melhor predizer q ? A resposta é estudada com o nome de teoria da estimação. Mais geralmente pela teoria da decisão. De posse da posteriori, fx(q), decidimos então como melhor predizer q. 1/11/2022 16

Estimação: Solução Consideramos características de fx (q) tais como média, mediana ou moda, dependendo da logística usada. Esse é o trabalho de estimação pontual. Por estimação intervalar entendemos a procura, do menor conjunto que, com probabilidade fixada (95%), contenha q: Conjunto de Credibilidade. 1/11/2022 17

Teste de Significancia: Formulação Por teste de significância entendemos uma avaliação da consistência de uma hipótese H , sobre q, com o os dados, x. Entendemos que todo procedimento estatístico deve basear-se tão somente na posteriori fx(q). Por hipótese entendemos uma afirmação do tipo “o parâmetro q pertence ao subconjunto Q 0 Ì Q”. 1/11/2022 18

Teste de Significancia: Solução Hipótese (não) precisa dim (Q 0 ) (=) < dim (Q). No caso não preciso, o valor de Px (Q 0) é um bom avaliador da consistência entre H & x. Nosso foco limita-se ao caso dim (Q 0 ) < dim (Q) das hipóteses precisas. Introduzimos o conceito de evidência contra ou a favor da hipótese H avaliada. 1/11/2022 19

Full Bayesian Significance Test: FBST Evidência contra a hipótese: 1 -ev = Pr(Tx ), onde TxÌ Q é tal que, t ÎTx e q ÎQ 0 Þ fx(t) > fx(q). Tx é a tangente (relativa a x) de Q 0. ev alto devemos aceitar H: q ÎQ 0. Caso contrário, rejeitar H ! 1/11/2022 20

Regras L 1 -Convexidade: 0<P(A|H)<1 e P(H|H)=1. L 2 -Adição: P(A ou B|H) = P(A|H)+P(B|H) se A e B são exclusivos. L 3 -Multiplicação: P(A e B|H) = P(A|H)P(B|A e H). Uma extensão da lei número 2 é apresentada a seguir. Entretanto não é conseqüência de conceitos simples Note que nenhuma das 3 leis pode ser deduzida das outras. 1/11/2022 • L 2’. Adição enumerável: Seja {(A 1, . . . , An, . . . )} um conjunto enumerável de eventos mutuamente exclusivos. Então, • P(ÈAi|H)=SP(Ai|H) 21

Teorema da Probabilidade Total 1/11/2022 22

Fórmula de Bayes 1/11/2022 23

Bibliography -David Blackwell (1969), Basic Statistics, Mc. Graw-Hill. (Theory of Games & Statisticcal Decisions) -Morris De. Groot (1986), Probability & Statistics, Adison-Wesley (Decision Theory) -Bruno De Finetti (1972), Probability, induction, and statistics, Wiley. (Theory of Probability, 2 volumes) - Oscar Kempthorne & L Folks (1971), Probability, Statistics & Data Analysis, Iowa University Press. - Dev Basu (1988), Statistical Information & Likelihood: A Collection Of Critical Essays, JK Gosh editor, Springer-Verlag. Lecture Notes in Statistics #45 - IJ Good (1983), Good Thinking, U. Minnesota Press. - Richard Barlow (1998), Engineering Reliability, SIAM - Paulino, Turkman & Murtrera (2003), Estatística Bayesiana. Fundação Calouste Gulberkian - Lisboa 1/11/2022 24