PAGE RANK Dulio Assis Nobre duilioanssgmail com SUMRIO
PAGE RANK Duílio Assis Nobre duilioanss@gmail. com
SUMÁRIO Introdução a Processos Estocásticos - Definição e exemplos Cadeias de Markov - - Definição e exemplos Probabilidade de Transição Probabilidades Estacionárias Aplicação na área de computação: Page Rank Referências -
INTRODUÇÃO A PROCESSOS ESTOCÁSTICOS Definição Exemplos: - X(t) representa o número de clientes numa loja no instante t; X(t) representa a cotação de uma ação no fim do dia t; X(t) representa o nível de stock de um determinado artigo no fim do dia t; -
CADEIAS DE MARKOV Definição
CADEIAS DE MARKOV Considere o seguinte exemplo: - Para cada pessoa que compre licor da família F há 90% de probabilidade de o próximo licor que comprar seja licor Florescente. - Já para cada pessoa que compre o licor da família P há só 80% de o próximo comprado seja ainda o licor Petalado.
CADEIAS DE MARKOV Matriz de transição de estados: Outra forma de representação, diagrama de tansições:
CADEIAS DE MARKOV Probabilidade de Transição: Portanto a probabilidade de transição em n passos é dada por:
CADEIAS DE MARKOV Matriz de transição para 3 passos: Visto isso, podemos dizer que se P for uma matriz estocástica, então qualquer potência de P o é, pois:
CADEIAS DE MARKOV Probabilidades Estacionárias: - Probabilidades de transição em dezesseis períodos: A esta probabilidade chama-se probabilidade estacionária do estado j e representase por ח j. Por outras palavras,
CADEIAS DE MARKOV - Corresponde a um sistema de equações de solução indeterminada:
CADEIAS DE MARKOV Relembrando o primeiro exemplo, quais são as probabilidades estacionárias? O que significam estes valores?
PAGE RANK Motivação: - Dexar claro o que é Page Rank e sua importância - Mostrar como o é calculado para cada página
PAGE RANK
PAGE RANK A formula: PR(A) = (1 -d) + d (PR(T 1)/C(T 1) + … + PR(Tn)/C(Tn)) - PR(Tn): Importância de cada página - C(Tn): Número de links saindo de cada página - d e (1 -d): valores de Teleporting
PAGE RANK Teleporting: - Uma caminha aleatória. - Uma caminha aleatoria normal.
PAGE RANK Exemplo 1: Pelo gráfico temos que C(A) = 1 e C(B) = 1 Certo, mas quais valores iniciais de PR(A) e PR(B)? d = 0. 85 PR(A) = (1 – d) + d(PR(B)/1) PR(B) = (1 – d) + d(PR(A)/1)
PAGE RANK Vamos começar com ambos iguais a 1: PR(A) = 0. 15 + 0. 85 * 1/1 =1 PR(B) = 0. 15 + 0. 85 * 1/1 =1 Agora, vamos considerar ambos inicialmente iguais a 0: PR(A) PR(B) = 0. 15 + 0. 85 * 0/1 = 0. 15 + 0. 85 * 0. 15/1 = 0. 2775 Repetindo as contas: PR(A) PR(B) = 0. 15 + 0. 85 * 0. 2775 = 0. 385875 = 0. 15 + 0. 85 * 0. 385875 = 0. 47799375
PAGE RANK Agora, vamos considerar ambos inicialmente iguais a 40: PR(A) = 0. 15 + 0. 85 * 40/1 = 34. 15 PR(B) = 0. 15 + 0. 85 * 34. 15/1 = 29. 1775 Repetindo as contas: PR(A) = 0. 15 + 0. 85 * 29. 1775/1 = 24. 950875 PR(B) = 0. 15 + 0. 85 * 24. 950875/1 = 21. 35824375
PAGE RANK Começando com ambos 0, vamos fazer um número considerável de interações. Abaixo segue apenas os resultados: PR(A): 0. 00000 PR(A): 0. 15000 PR(A): 0. 38588 PR(A): 0. 55629 PR(A): 0. 67942 PR(A): 0. 76838 PR(A): 0. 83266 PR(A): 0. 87909 PR(A): 0. 91265 PR(A): 0. 93689 PR(A): 0. 95440 PR(A): 0. 96705 PR(A): 0. 97620 PR(A): 0. 98280 PR(A): 0. 98757 PR(A): 0. 99102 PR(A): 0. 99351 PR(A): 0. 99531 PR(A): 0. 99661 PR(A): 0. 99755 PR(B): 0. 00000 PR(B): 0. 27750 PR(B): 0. 47799 PR(B): 0. 62285 PR(B): 0. 72751 PR(B): 0. 80313 PR(B): 0. 85776 PR(B): 0. 89723 PR(B): 0. 92575 PR(B): 0. 94635 PR(B): 0. 96124 PR(B): 0. 97200 PR(B): 0. 97977 PR(B): 0. 98538 PR(B): 0. 98944 PR(B): 0. 99237 PR(B): 0. 99449 PR(B): 0. 99602 PR(B): 0. 99712 PR(B): 0. 99792 Visto os resultados das 3 suposições de valores iniciais a PR(A) e PR(B), a que conclusão podemos chegar?
PAGE RANK Exemplo 2: Exemplo 3:
PAGE RANK Quais seriam os PRs das páginas do exemplo 3? PR(A) = (1 -d) + d (PR(B)/C(B) + … + PR(Spam n)/C(Spam n)) Pegando todos os 1000 spams e isolando temos: PR(A) = (1 -d) + d (PR(B)/C(B) + 1000(PR Spam) /C(Spam )) Qual seria o efeito desse fator 1000 no cálculo do PR(A) e PR(B)? Fazendo algumas contas, temos: PR(A): 0. 00000 PR(B): 0. 00000 PR(Spams): 0. 00000 PR(A): 0. 15000 PR(B): 0. 27750 PR(Spams): 0. 15024 PR(A): 127. 85049 PR(B): 108. 82292 PR(Spams): 0. 24250 PR(A): 206. 27456 PR(B): 175. 48338 PR(Spams): 0. 29916
PAGE RANK
PAGE RANK Qual seria a sua importância de um modo geral? O que seria um possível defeito?
REFERÊNCIAS http: //www. ianrogers. net/google-page-rank/ http: //www. youtube. com/watch? v=FNj. Qit. Lu. BY&feature=related - Chave de busca no You. Tube: Como funciona el algoritmo Page. Rank de Google
PAGE RANK Duílio Assis Nobre duilioanss@gmail. com
- Slides: 28