1 INFRAESTRUTURA Captulo 5 Crovella M Krishnamurthy B
1 INFRAESTRUTURA Capítulo 5 Crovella, M, Krishnamurthy, B. Internet Measurement: infrastructure, traffic & applications. John Wiley & Sons, 2006.
Roteiro 2 Propriedades Desafios Ferramentas Estado da Arte
3 Propriedades
Propriedades 4 Nesta seção são revistas as propriedades importantes da infraestrutura da Internet. Nossa abordagem será “bottom-up”: � Propriedades físicas dos componentes � Topologia (interconexão dos componentes) � Caminhos na Internet (rotas) � Interação do tráfego com a infraestrutura física
Links 5 Visto da camada IP, o progresso de um pacote através da rede consiste da passagem de nó para nó por uma sequência de etapas. Cada etapa pode ser considerada um link. Um link pode ser: � � � Propriedades de interesse: � � Um meio de transmissão ponto a ponto Sequência de conexões comutadas abaixo da camada IP Meio de difusão Atraso de propagação Capacidade Propriedades de desempenho: � � � Atraso dos pacotes Perda de pacotes Jitter (variação do atraso)
Roteadores 6 Roteadores movem pacotes de um link de entrada para um link de saída.
Roteadores 7 Organização interna do motor de encaminhamento: Estratégias para os buffers de saída: � Disciplina de serviço drop-tail � Gerenciamento ativo de filas
Roteadores 8 Muitas técnicas de medição de rede dependem da obtenção de respostas dos roteadores. Os detalhes da arquitetura interna podem afetar o tempo gasto para a geração de respostas. Em particular, o tempo necessário para um roteador responder a uma mensagem de um protocolo como um pacote ICMP pode ser substancialmente diferente do tempo que ele leva para repassar um pacote.
Roteadores 9 Propriedades que temos interesse de medir: � Ponto de vista estático: Endereços IP usados nas interfaces dos roteadores Localização geográfica do roteador Tipo particular do roteador Variantes dos protocolos suportados � Ponto de vista dinâmico: Tempo necessário para responder a uma mensagem ICMP Tempo necessário para repassar um pacote.
Sem Fio 10 As conexões sem fio normalmente são usadas apenas como tecnologias de acesso e não fim -a-fim. A escolha da tecnologia sem fio determina: � Alcance máximo, � Taxa de transferência de dados, � Confiabilidade � Interferência potencial � Número de usuários concorrentes
Tecnologias Sem Fio 11 Família 802. x � Wi-fi Bluetooth � PAN – Personal Wi. MAX Area Network
12 Medições envolvendo Comunicação Sem Fio Força do sinal Potência consumida Taxa de transferência de bits Grau de cobertura Informações relacionada com a sessão: � Duração � Tempo de estabelecimento da conexão � Lista das aplicações usadas � Handoffs entre pontos de acesso (caso haja algum) � Taxas de erros
Medições Tradicionais 13 Capacidade do link: � Em rede sem fio ela muda com o tempo devido a mobilidade do usuário, obstruções físicas, tráfego cruzado na mesma frequência, etc. Largura de banda disponível e efetiva Identificação de links gargalo Etc. As medições tendem a ser complicadas pela combinação de redes cabeadas e sem fio.
Propriedades da Topologia 14 A interconexão de componentes da Internet pode ser visualizada em quatro níveis: � Sistema autônomo (AS) � Ponto de presença (Po. P) � Roteador � Interface
15 Topologia: Interconexão de ASes A interconexão de ASes forma um grafo conhecido como grafo AS. Neste grafo os vértices são os ASes e As arestas conectam ASes que trocam tráfego diretamente. Esta é a visão mais grosseira da topologia da Internet.
16 Topologia: Interconexão de Po. Ps Dentro de um AS, os roteadores são frequentemente reunidos em localidades físicas identificáveis, chamadas de pontos de presença (Po. Ps). Um Po. P consiste de um ou mais roteadores num único local. Um grafo neste nível (Po. P) é normalmente a visão mais detalhada que um ISP disponibiliza publicamente.
Topologia: Grafo de roteadores 17 Neste grafo: � Os vértices são roteadores, e � As arestas são conexões de uma etapa entre roteadores. É importante distinguir entre uma conexão em uma etapa de um link físico ponto a ponto. Pode-se associar a cada aresta (link) o seu atraso de propagação e capacidade. E os vértices podem ser rotulados com sua localização física e AS proprietário. Pode ser útil rotulá-los também com a identificação do Po. P correspondente.
Topologia: Grafo de interfaces 18 Fornece a visão mais detalhada. Neste grafo: � Vértices são interfaces de roteadores e � Arestas são conexões de uma etapa. Este grafo é importante por ser diretamente medido pela ferramenta traceroute Um grafo de roteador pode ser obtido do grafo de interfaces agrupando os vértices de interfaces associados a cada roteador.
19 Interação do Tráfego com a Rede Certos aspectos da estrutura da rede restringem as propriedades de tráfego: � Menor atraso possível � Vazão máxima possível
Atraso de Pacotes 20
Atraso de Pacotes 21
Perda de Pacotes 22 Causas: � � Descarte explícito por um elemento de rede, ou Descarte por erro de transmissão identificado pela verificação de erros. A fonte mais significativa de perda de pacotes é o congestionamento. A perda explícita de pacotes poderia ser caracterizada como um processo de chegada de eventos de descarte. No entanto, normalmente é difícil obter informações sobre os instantes das perdas. Portanto, as perdas são normalmente caracterizadas como uma série temporal de contagens. E a quantidade de perdas por unidade de tempo podem ser interpretadas como estimativas das taxas de perdas de pacotes.
Perda de Pacotes 23
Vazão (Throughput) 24
Vazão 25
Jitter de Pacotes 26 É uma medida da suavidade do processo de chegada de pacotes e pode ser expresso como a variabilidade do intervalo de tempo entre chegada de pacotes. O jitter pode ocorrer devido à variação no tempo dos atrasos das filas nos roteadores ao longo do caminho. Chegada de pacotes com baixo jitter são mais previsíveis e leva a um desempenho na camada de aplicação mais confiável.
Jitter 27
Conexões 28 Podem ser importantes medidas de taxa de perda de pacotes, atraso de pacotes e vazão para conexões individuais, por exemplo para o TCP. Como a taxa média de pacotes do TCP depende do tamanho da sua janela e do tempo de ida e volta (RTT), medidas de RTT de uma conexão pode ser muito valiosa. Como há retransmissões, nem todos os bytes recebidos são repassados para a aplicação. Chamamos de goodput à taxa na qual a aplicação recebe dados com sucesso.
29 Desafios
Desafios 30 Simplicidade do Núcleo Camadas Escondidas Pedaços Escondidos Barreiras Administrativas
Simplicidade do Núcleo 31 Os elementos de comutação da Internet são projetados para ser “sem estados” em relação às conexões e fluxos que passam por eles. Este princípio de projeto permitiu aos roteadores Internet ser muito simples. Qualquer forma de instrumentação, mesmo simples contadores por pacote ou por byte, adicionam custo e complexidade ao projeto. Isto prejudica a observabilidade em muitos pontos da rede. Medições de atraso e perda de pacotes assim como vazão são fornecidos apenas de forma agregada através do SNMP. Para a obtenção de medições detalhadas seria necessária uma captura de pacotes.
Camadas Escondidas 32 Abaixo da camada IP a transmissão de pacotes pode ser implementada de formas muito diferentes. Estes detalhes estão escondidos no nível do IP. Nem mesmo a captura de pacotes pode detectar estas diferenças. Pacotes que passam por uma etapa do IP podem na verdade estar passando por: � Um enlace sem fio com sinalização complexa e retransmissões na camada de enlace � Caminho comutado por rótulos envolvendo diversos elementos de comutação de nível 2. � Redes ópticas. . .
Pedaços Escondidos 33 O argumento fim-a-fim indica que certas funções devem ser executadas apenas nos sistemas finais. No entanto, há diversos dispositivos que desviam deste princípio: � Coletivamente chamados de middleboxes: firewalls, tradutores de endereços e proxies Razões para o uso de middleboxes: � Segurança � Gerenciamento � Desempenho � Tradução de endereços
Pedaços Escondidos 34 Cada um destes tipos de middleboxes impede a visibilidade de alguns componentes da rede. � Firewalls bloqueiam pacotes UDP ou ICMP usados pelo traceroute. � NAT pode impedir a descoberta de sistemas finais via ping.
Barreiras Administrativas 35 ISPs normalmente escondem os detalhes de suas redes do público externo. Detalhes de configuração de roteadores individuais, padrões de interconexão, e a quantidade de tráfego transportado nos links são todos considerados sensíveis à competição.
Barreiras Administrativas 36 Os ISPs bloqueiam tráfego que possa ser usado para medir a infraestrutura: � Pacotes de eco ICMP são bloqueados nos roteadores de entrada � Tentativas de estabelecer conexões SNMP são bloqueadas. � Informações fornecidas como as de topologia são normalmente simplificadas. Portanto, pode ser difícil obter uma figura detalhada de porções da infraestrutura da Internet simplesmente porque os ISPs procuram ativamente esconder estes detalhes.
37 Ferramentas
Ferramentas 38 Medições Ativas: � Adicionam tráfego na rede para obter as medições desejadas Medições Passivas: � Captura de dados gerados por outros usuários e aplicações e não pelo processo de medição
39 Ferramentas de Medições Ativas Ping OWAMP Traceroute Medições de Largura de Banda (adiante)
Ping 40 Envia um pacote ICMP de Eco para o destino e captura o pacote de Resposta do Eco. Útil para: � Checar a conectividade até o destino � Medir o atraso de ida e volta (RTT – round entre o transmissor e o destino. trip time) Vantagem: o destino apenas responde da sua forma normal (não precisa estar instrumentado). Desvantagem: em caso de congestionamento, não dá para identificar se ocorre na ida, na volta, ou em ambos.
OWAMP 41 One-Way Active Measurement Protocol Definido na RFC 4656 Necessita de relógios sincronizados ou um método para remover o offset e skew dos relógios a partir das medições. Elementos: � Protocolo de controle � Protocolo de teste � Implementação de ambos os protocolos
OWAMP: Resultados obtidos 42 Métricas: � Atraso em um sentido (OWD – One Way Delay) � Pacotes perdidos em um sentido � Variação do atraso em um sentido Outros Resultados: � Pacotes duplicados � Reordenamento de pacotes (pacotes fora de ordem) � Número de Hops (indicação de alteração)
OWAMP: Protocolo de Controle 43 Implementado usando o TCP Utiliza a porta 861 Suporte a AA Utilizado para: � Configurar os testes Número de portas controladas no receptor (End. Points) Agenda de envio extremamente configurável Permite alterar o tamanho dos pacotes Marcar DSCP, etc. � Inicializar a conexão, iniciar e parar os testes � Receber os resultados Possibilidade de receber resultados parciais de uma medição
OWAMP: Protocolo de Teste 44 Responsável pela execução dos testes Utiliza o UDP Utiliza portas aleatórias > 1024 para executar os testes As sessões podem ser: � Não autenticadas (“Open”) � Autenticadas, ou � Criptografadas
OWAMP: Arquitetura 45
Traceroute 46 O campo de TTL (Time To Live) do cabeçalho do IP é decrementado de um toda vez que um pacote passa por um roteador. Se o contador chegar a zero, o protocolo IP requer que o pacote seja descartado e seja enviada uma indicação de erro para o remetente original, através de um pacote ICMP TIME EXCEEDED. � O endereço origem deste pacote é a interface do roteador que descartou o pacote original.
Traceroute 47
Traceroute 48 Dificuldades: � Assimetria dos caminhos de ida e de volta � Caminhos instáveis e falsos enlaces Roteador com Balanceamento de Carga � Resolução de apelidos (identificação de duas interfaces que pertencem ao mesmo roteador) � Carga da medição
49 Assimetria dos caminhos de ida e de volta Os nós visitados pelo traceroute são aqueles encontrados no caminho de ida (forward) da origem até o destino. Estes não são necessariamente os mesmos nós do caminho reverso!
50 Caminhos instáveis e falsos enlaces
51 Roteador com Balanceamento de Carga Resultado: Caminhos inexistentes e falsos links. Solução: Paris Traceroute � www. paris-traceroute. net
52 Paris Traceroute Balanceadores de carga por fluxo usam os campos em amarelo para identificar um fluxo. As setas vermelhas mostram os campos incrementados pelo traceroute clássico. O Paris Traceroute usa os campos em verde para identificar os pacotes de teste.
Resolução de apelidos 53 O traceroute descobre interfaces e não roteadores. Cada roteador possui múltiplas interfaces. Mas, nem sempre está claro que interfaces pertencem ao mesmo roteador. Foram propostos diversos métodos para descobrir se duas interfaces pertencem ao mesmo roteador.
54 Métodos para a Resolução de apelidos Envio de pacotes de Eco ICMP para ambas as interfaces a partir do mesmo roteador. � Se ambas pertencerem ao mesmo roteador, as respostas serão enviadas a partir da mesma interface. � Casando as mensagens de Eco que possuem a mesma interface de origem pode-se inferir que os pacotes de Eco originas foram enviados do mesmo roteador.
55 Métodos para a Resolução de apelidos Uso dos campos de identificação e TTL: � Como o campo de identificação é normalmente incrementado, dois pacotes que venham do mesmo roteador têm a tendência a ter campos com valores próximos. � Além do mais, pacotes que vierem do mesmo roteador ao chegarem a um ponto comum devem ter o mesmo valor de TTL. Portanto, se dois pacotes chegarem num ponto de medição com valores de TTL diferentes, é uma indicação de que são originados em diferentes roteadores.
56 Métodos para a Resolução de apelidos Uso da opção de Registro de Rota: � Os roteadores que dão suporte a esta opção irão inserir o endereço da interface através da qual o pacote foi transmitido no cabeçalho do pacote durante o processo de encaminhamento. � Esta interface é frequentemente diferente da que aparece no pacote de resposta de Eco do ICMP. � Isto permite que as duas interfaces sejam associadas com o mesmo roteador.
57 Métodos para a Resolução de apelidos Adivinhação(!): � Por facilidade de gerenciamento, os links entre dois roteadores normalmente recebem endereços que diferem um do outro por apenas uma unidade: 200. 0. 0. 1 e 200. 0. 0. 2
58 Carga da medição Na figura acima, o link de A a B é atravessado três vezes. Em geral o traceroute pode impor uma carga considerável e alguns links sobretudo para a descoberta de topologia em grande escala. Disparando testes de uma fonte para diversas origens provoca uma carga excessiva em links próximos à origem. Disparando testes de múltiplas fontes para o mesmo destino, tende a impor uma carga pesada nos links próximos ao destino.
59 Carga da medição Para otimizar o uso foram propostas algumas ideias: � Rastrear as interfaces que já foram visitadas e parar os testes quando se encontrar uma interface já visitada Assume que as rotas sejam estáveis e que haja um único caminho de modo que formem uma árvore. � No caso de múltiplas fontes é preciso trocar informações entre as origens sobre nós anteriormente vistos.
Traceroute: outros usos 60 O traceroute pode ser usado também para descobrir a topologia em termos de ASes. A ideia básica é determinar a que AS pertence cada um dos roteadores ou interfaces que estão no caminho descoberto. O mapeamento entre interfaces e ASes podem ser extraídos de registros de rotas ou a partir de tabelas BGP, mas elas devem ser usadas com cuidado.
Outros Métodos Ativos 61 Outra ferramenta útil para a medição de redes ativa é o multicast. Dado que uma única cópia é replicada pelos roteadores ao longo do caminho, as condições de rede experimentadas por um único pacote são refletidas nas propriedades mensuráveis das múltiplas cópias do pacote. Pacotes enviados aproximadamente no mesmo tempo pelo mesmo caminho experimentam condições de rede semelhantes. Se dois pacotes são enviados próximos e um deles se perde, o outro fornece informações úteis sobre as condições da rede experimentada pelo pacote perdido. � Esta mesma ideia pode ser usada para inferir o tamanho das filas em roteadores de acesso. �
62 Suporte do Sistema a Medições Ativas Muitos métodos de medição ativa envolvem a injeção de pacotes arbitrários na rede, ou na captura de pacotes arbitrários na rede. Acesso irrestrito às interfaces de rede levanta questões de segurança e os administradores de rede frequentemente hesitam em garantir este acesso. Além do mais, a injeção eficiente de pacotes e a medição precisa dos instantes de partida e chegada é feito mais facilmente ao nível do kernel do SO. � Por isto, foram definidos bibliotecas e interfaces de sistema especializados para a medição ativa de redes.
Medições Passivas 63 A medição passiva consiste em capturar tráfego que foi gerado por outros usuários e aplicações e não pelo processo de medição. O uso mais comum da medição passiva de tráfego é entender as propriedades do próprio tráfego e, portanto, será coberto no Capítulo 6. Nesta seção o foco é apenas em métodos passivos para a medição da infraestrutura que consiste geralmente na captura e análise do tráfego do plano de controle (roteamento).
BGP 64 Tabela de roteamento BGP provê informação parcial sobre a topologia entre ASes.
BGP 65 Vantagens: � Grande conjunto de conexões AS-AS que se aprende apenas processando visões do BGP. Desvantagens: � Todos os caminhos formam uma estrutura como uma árvore, com raiz no AS alvo. Mas, nenhuma conexão cruzada existente é descoberta (porque não são usadas pelo roteamento até o prefixo alvo). � Agregação de rotas e filtragem tende a esconder certas conexões entre ASes.
BGP 66 Desvantagens: � Muitos ASes (especialmente os de tier 1) possuem múltiplas conexões físicas. � Grandes ISPs fazem conexões com outros em diversas localidades por questões de eficiência e redundância. No entanto, apenas uma aresta entre os dois ASes irá aparecer no gráfico resultante.
Obtenção de dados do BGP 67 Além dos dados do routeview, é possível obter atualizações do BGP diretamente registrando-se para recebê-las através de uma sessão com um roteador que fale BGP (vide detalhes na seção 6. 3. 1). Dificuldades: � Pode não ser possível obter atualizações no ponto de interesse. � A visão local obtida é necessariamente incompleta � Anomalias de roteamento e ‘ruído’ podem dificultar inferir o estado real do sistema de roteamento interdomínio.
OSPF 68 É possível obter passivamente medições de infraestrutura dentro de um AS, capturando tráfego gerado pelo plano de controle através dos protocolos de roteamento interno (IS-IS ou OSPF). No caso do OSPF pode-se capturar anúncios dos estados enlaces dentro de um domínio de roteamento. � No caso do OSPF não é importante o ponto de captura pois todas as informações são enviadas para todos através de inundação.
Medições Combinadas 69 Ao medir a infraestrutura ou descobrir características de topologia , frequentemente é útil fundir diferentes tipos de medições, combinando medições ativas e passivas. Uma dificuldade com medições ativas é a grande quantidade de tráfego de testes que é necessária, mesmo quando a finalidade é a de mapear um único AS. � Usando dados do BGP é possível limitar os testes apenas para os endereços que provavelmente fazem parte do AS alvo.
Medições Combinadas 70 Outro modo de melhorar os mapas de AS é aumentar passivamente topologias obtidas através do BGP com conexões adicionais inter. AS inferidas a partir de medições ativas (traceroute). Da mesma forma podem se usados Registros de Roteamento Internet para ampliar as topologias derivadas através do BGP. Ao estudar a dinâmica do congestionamento, é possível correlacionar grandes conjuntos de medições de RTT com dados de topologia derivados do BGP para localizar degradações de desempenho na Internet.
Medições de Largura de Banda 71 Largura de banda ou vazão (throughput): � Quantidade de dados que pode ser transmitida por unidade de tempo. Importância: � Aplicações multimídia podem ajustar suas taxas de transmissão � Seleção do servidor com conexão adequada � Estimativa do produto banda-atraso para o controle de fluxo do TCP � Redes overlay: identificação de “bons” caminhos � Verificação de SLAs entre usuários e provedores de rede
Medições de Largura de Banda 72 Geralmente é um processo ativo, no qual pacotes são injetados na rede e o processo de medição é baseado na observação dos resultados. Algumas vezes assume-se que: ambos os lados do caminho de medição estejam instrumentados, enquanto que � outras vezes assume-se que um dos lados esteja instrumentado e o outro simplesmente deve responder a um pedido de eco ICMP ou algo semelhante. � Foram propostos também métodos passivos e as aplicações podem usar os seus próprios pacotes de dados como fonte de informação para a estimativa de largura de banda.
Medições de Largura de Banda 73 Link gargalo: é aquele que possui a menor vazão durante o período de medição. � Em alguns casos basta medir a largura de banda do link gargalo. Enquanto que em outros casos deseja-se obter a largura de banda de cada um dos links. Nos casos em que uma única etapa do IP corresponder a uma sequência de múltiplos links físicos pode ser um desafio inferir a largura de banda de cada link.
Tipos de Largura de Banda 74 Capacidade Banda disponível Capacidade de transferência em lote (bulk)
Capacidade 75 Vazão máxima que um enlace ou caminho pode suportar. Algumas vezes é chamada de largura de banda ‘sem congestionamento’ A capacidade é uma propriedade de um caminho que não muda frequentemente. � Muda apenas quando a infraestrutura subjacente (roteador e/ou velocidade dos links) muda.
Banda disponível 76 Porção da capacidade que não está em uso durante um certo intervalo de tempo. Também chamada de capacidade residual. Por exemplo: � Se um link possui uma capacidade de 1000 Mbps e atualmente está fluindo 600 Mbps através do link, então a banda disponível é de 400 Mbps.
Banda Disponível 77
78 Capacidade de transferência em lotes (bulk) A banda disponível não é necessariamente o que seria obtido por uma nova conexão fazendo uso do link ou caminho. Muitas transferências de dados na Internet fazem uso do TCP para controle de fluxo e os algoritmos de controle do TCP interagirão com o tráfego competidor de uma maneira complexa. � Por exemplo, se a banda disponível num dado caminho for de 400 Mbps, uma nova conexão fluindo por aquele caminho pode fluir a 400 Mbps, 500 Mbps ou até 300 Mbps. Taxa que seria obtida por uma nova conexão TCP que perdure por algum tempo naquele dado caminho. � Esta definição assume que a taxa da conexão está limitada apenas pela sua janela de congestionamento e não por outros fatores.
79 Métodos de Medição de Largura de Banda Baseados em observar como o atraso dos pacotes são afetados pelas propriedades do enlace. Atraso de enfileiramento � Efeito depende do tamanho dos pacotes que estão enfileirados na sua frente � Base para os métodos de pares de pacotes Atraso de transmissão � Depende apenas do tamanho do próprio pacote � Base para os métodos de tamanho-atraso.
Métodos de Pares de Pacotes 80 Medição de Capacidade Pacotes de mesmo comprimento estão sendo transmitidos da esquerda para a direita e enfileiram no link mais estreito. � A capacidade mais baixa do link estreito impõe um atraso fixo entre a borda inicial de dois pacotes sucessivos, relacionado ao comprimento fixo do pacote. � Este atraso fixo é preservado quando os pacotes deixam este link mais estreito. � Este atraso pode então ser medido e serve para inferir a largura de banda do link mais estreito. �
81 Métodos de Pares de Pacotes
82 Métodos de Pares de Pacotes
Métodos de Pares de Pacotes 83 Dificuldades: � É preciso garantir que os pacotes enfileirem no gargalo: a taxa de envio deve ser maior do que a capacidade do enlace gargalo � Efeito de tráfego cruzado: Pacotes individuais do par podem experimentar diferentes atrasos de enfileiramento ao longo do caminho. Este efeito pode ser difícil de prever. Uma variação no tráfego cruzado pode causar que um determinado par de pacotes relatem uma estimativa de banda maior ou menor do que o valor real.
Métodos de Pares de Pacotes 84
Métodos de Pares de Pacotes 85
Método de Comprimento-Atraso 86 Na ausência de tráfego cruzado, o atraso experimentado por um pacote que passa através de um enlace é afetado pelo comprimento do pacote e pela capacidade do enlace. Variando o comprimento do pacote pode-se observar o efeito do atraso e inferir a capacidade do enlace.
Método de Comprimento-Atraso 87 A cada etapa, os atrasos principais experimentados por um pacote de teste são: Atraso de enfileiramento � Atraso de transmissão e � Atraso de propagação. � O atraso de propagação é determinado pelo comprimento do link e a velocidade de propagação do sinal e é, portanto, independente do tamanho do pacote. Da mesma forma, o atraso de enfileiramento é determinado pelos pacotes que estão na frente dos pacotes de teste e não é determinado pelas propriedades do pacote em si. Apenas o atraso de transmissão é afetado pela capacidade do link e o tamanho do pacote de testes.
Método de Comprimento-Atraso 88
Método de Comprimento-Atraso 89 Vantagem em Relação aos Pares de Pacotes
90 Problemas com o Método de Comprimento-Atraso Uma complicação considerável é a necessidade de que os pacotes de teste passem pela rede sem enfileirar atrás de tráfego cruzado. � Este problema é geralmente enfrentado enviando muitos pacotes de teste para cada etapa que está sendo medida, e observando o menor tempo de propagação obtido para cada etapa. � Com o crescimento do comprimento do caminho, esta hipótese fica mais suspeita, dado que fica mais difícil para um pacote passar por muitas etapas sem experimentar fila em nenhuma delas.
91 Problemas com o Método de Comprimento-Atraso
92 Problemas com o Método de Comprimento-Atraso Este método assume que o comprimento do pacote não varia ao atravessar um caminho. � Isto nem sempre é verdade: os cabeçalhos de camada 2 podem comprimentos diferentes em etapas distintas. � A extensão da imprecisão introduzida depende do tamanho do pacote: os erros serão maiores para pacotes menores.
93 Combinação dos Métodos “Pares de Pacotes” e “Comprimento. Atraso” Uma ideia é enviar pares de pacotes de comprimentos variáveis. Quando um par de pacotes consiste em um pacote grande seguido por um ou mais pacotes pequenos, é mais provável que o pacote maior enfileire em um dado link. Se o pacote maior tiver um TTL limitado ele será descartado no link a ser medido, enquanto que o demais pacotes prosseguirão até o destino levando informação sobre o atraso experimentado pelo pacote maior até o link em que foi descartado.
94 Congestionamento autoinduzido
95 Dificuldades dos Métodos de Congestionamento autoinduzido Devido à explosividade (burstiness) do tráfego possui uma tendência em subestimar a banda disponível. � Esta tendência diminui à medida que o comprimento do trem de pacotes aumenta. O pacote de teste é, por definição, grande o bastante para afetar o tráfego cruzado e pode, portanto, mudar a própria quantidade que está sendo medida. Assume-se que a formação de fila ocorre em um único link. A presença de múltiplos links com aproximadamente a mesma largura de banda disponível causará uma subestimação.
96 Dificuldades dos Métodos de Congestionamento autoinduzido Assume-se que o tráfego cruzado varie lentamente o suficiente que a quantidade que está sendo medida esteja estável o suficiente para que o método convirja. Finalmente, estes métodos assumem um enfileiramento FIFO em todos os roteadores, o que nem sempre é verdade na Internet atual.
97 Medição da Capacidade de Transferência em Lote Abre uma conexão TCP e envia tantos dados quanto o caminho possa suportar. � Apesar de ser um método intrusivo, ele é mais simples e mais robusto do que a maioria dos outros métodos de estimativa de largura de banda. Requer cooperação das duas extremidades, requer a instalação de software (ex. : iperf).
98 Medição da Capacidade de Transferência em Lote Fatores que influenciam a vazão TCP e que devem ser consideradas: � Tamanho da transferência: É necessária uma transferência longa (dezenas de segundos) � Natureza do tráfego cruzado: TCP x UDP; muitas x uma conexão TCP � Comprimento dos buffers nos dois lados. � Variações na especificação e implementação da variante do TCP utilizada.
99 Desafios na Medição de Largura de Banda Nos enlaces de alta capacidade os atrasos são tão pequenos que é muito difícil ou impossível de serem medidos com precisão. Enlaces sem fio: muda a taxa e não entrega de acordo com FIFO. Atrasos adicionais de dispositivos de nível 2 (ex. : switches)
100 Medição e Estimação de Latência Além da medição de largura de banda, um segundo problema importante é a medição ou a estimação da latência ao longo de caminhos da Internet. Importância em: � Redes de distribuição de conteúdo: fornecer objetos Web ao cliente a partir da réplica disponível mais próxima. � Redes P 2 P: recuperação de objetos a partir de pares próximos. � Jogos multiusuários: busca por jogadores que estejam próximos. � Seleção de servidores dinâmicos: fornecer objetos Web ao cliente a partir do servidor mais próximo que possua uma réplica dos mesmos.
Latência da Rede 101 Uma indicador do desempenho que o caminho de rede envolvido pode suportar. RTT mínimo (min. RTT): Interesse pois muda em escala de tempos longa, i. e. , apenas com a mudança da topologia ou do roteamento. RTT instantâneo: Varia dinamicamente de acordo com o congestionamento Pode também ser medido em um único sentido.
Estimação da Latência 102 Se um dos lados do caminho puder ser instrumentado, a medição da latência é direta (usando ping). Desafios (medição de atraso sem o envio de pacotes de teste entre eles): � Métodos baseados em proxy: quando nenhum dos dois pontos terminais de um caminho pode participar do processo de medição. � Métodos de incorporação: os hosts são capazes de efetuar medições, mas não se quer medir cada caminho de interesse diretamente.
Elementos 103 Todos os métodos para estimativa da latência contam com alguns nós fixos que agem como: � intermediários (proxies) ou como � pontos de referência (landmarks).
Desigualdade Triangular 104
Métodos baseados em proxy 105
Métodos baseados em proxy 106
Métodos baseados em proxy 107 King: � Aborda algumas desvantagens do IDMaps explorando o sistema DNS � Ao invés de contar com tracers instalados especialmente para esta finalidade, ele usa o servidor DNS local de um nó como o seu proxy de medição.
Métodos baseados em proxy 108 King: � O método é baseado nas seguintes observações: Muitos nós na Internet estão próximos de seus servidores locais DNS. É possível disparar trocas entre servidores DNS arbitrários usando consultas DNS recursivas. Dados dois servidores de nomes em domínios diferentes (ex. , dns. first. com e dns. second. com), uma consulta recursiva a dns. first. com para um nome como any. second. com irá disparar uma consulta DNS de dns. first. com para dns. second. com. � Ele mede o tempo de uma consulta recursiva do para any. second. com para estimar a latência entre um host no domínio first. com e um host no domínio second. com. dns. first. com
Métodos de Incorporação 109
Métodos de Incorporação: GNP 110
Métodos de Incorporação: GNP 111
Métodos de Incorporação: GNP 112 Dado que a carga de medições para cada landmark pode ser alto, � As landmarks podem ser divididas em conjuntos, onde cada alvo realiza medições apenas para um destes conjuntos. � Como dois nós podem usar conjuntos distintos, pode-se aplicar uma função de transformação para mapear cada conjunto de coordenadas locais num sistema canônico de coordenadas global. � Pode-se também eliminar as landmarks, usando os próprios nós para isto.
Geolocalização 113 Problema: Dado o endereço de rede de um host alvo, qual é a localização geográfica deste host? É importante reconhecer que muitos métodos de geolocalização comumente usados podem ser muito imprecisos. Razões: O endereço que está sendo localizado não está correto � Pode não ser possível realizar as medições necessárias para realizar corretamente a geolocalização � Alguns métodos contam com bases de dados que mapeiam redes, organizações ou blocos de endereços inteiros num único local. � Usuários podem usar contramedidas para não serem localizados. �
Geolocalização e Privacidade 114 Os usuários podem não querer divulgar suas localizações Enquanto outros podem permitir a divulgação mas restringir a precisão da mesma, além de restringir se pode ou não ser armazenada. O GT geopriv do IETF definiu um conjunto de padrões para tratar informações de localização.
115 Geolocalização baseada em Nome Abordagem simples: � Inspecionar os nomes DNS do host alvo, ou de hosts próximos topologicamente ao host alvo. � Este método se baseia na observação de que os operadores de rede frequentemente atribuem nomes com significado geográfico a suas interfaces. � Quando o host alvo não é um roteador, procurando o roteador que esteja próximo em termos da topologia da rede pode fornecer informações úteis. � Este método é sujeito a erros pois nem sempre os roteadores têm nomes com significado geográfico.
116 Geolocalização baseada em Atrasos
117 Geolocalização: Método da Melhor Landmark
118 Método da Melhor Landmark: Limitações A acurácia da localização inferida é limitada pela distribuição espacial das landmarks. � Se não houver landmarks próximas ao alvo, a localização inferida será inacurada.
119 Geolocalização baseada em Restrições Nesta abordagem são exploradas as propriedades conhecidas da propagação do sinal em uma fibra � A luz se propaga a aproximadamente 2/3 da sua velocidade no vácuo. Encontra-se uma estimativa da localização de um host alvo através de multilateração � Processo de estimar a posição usando um número suficiente de distâncias até pontos fixos (por exemplo, usado por GPSs).
Multilateração 120
121 Banco de Dados de Localização Construção manual de uma grande base de dados com mapeamentos entre endereços IP e suas localizações conhecidas. Informações de localização podem ser fornecidas por administradores de rede. � O DNS foi proposto como repositório para esta informação. Bancos de dados do serviço whois inclui entradas de localização para sistemas autônomos e blocos de endereços alocados. � Estas informações podem ser imprecisas ou desatualizadas.
Inferência 122
123 Atrasos Internos e Taxas de Perdas Hipóteses para a estimativa: � Links: unidirecionais ou bidirecionais � Caminhos: simétricos ou assimétricos � Medições dos caminhos: ida-e-volta (RTT) ou em um sentido (OW) � Estratégia de testes: multicast ou unicast. Hipóteses mais realistas: � Links unidirecionais e caminhos assimétricos.
Soluções 124
Inferências em todos os links 125
126 Tomografia de rede: Métodos baseados em Multicast
127 Tomografia de rede: Métodos baseados em Multicast
128 Tomografia de rede: Métodos baseados em Unicast Algumas redes não suportam multicast. Ao usar unicast tentaremos imitar o ‘destino compartilhado’ dos pacotes de teste multicast. Para este fim podemos usar pares de pacotes dado que eles tendem a sofrer as mesmas consequências de enfileiramento e perda. Métodos unicast são mais imprecisos que os multicast, mas são mais flexíveis. � Por exemplo, podem ser estendidos a medições passivas.
129 Tomografia de Rede: Links Congestionados Dominantes Em alguns casos pode haver um link ao longo do caminho que seja responsável pela maioria das perdas ou atrasos, que é chamado de link congestionado dominante. Pode ser suficiente determinar se existe um link congestionado dominante e � Em caso afirmativo, identificar este link � Uma abordagem é enviar pacotes periódicos ao longo do caminho e observar a sequência de valores de atrasos. O atraso sofrido pelo pacote perdido pode ser inferido pelos atrasos dos pacotes não perdidos. � Se a maior parte dos pacotes perdidos tiver atrasos inferidos semelhantes pode ser inferido que existe um link congestionado no caminho. �
130 Tomografia de Rede: Links Congestionados Dominantes A identificação do link congestionado pode ser feita (assumindo que a incidência dos mesmos seja baixa) através da interseção de desempenho ruim entre caminhos diversos.
Projetos Eficientes de Medição 131
Outras ferramentas 132 Identificação da Topologia: � Árvores multicast Taxa de reordenação de pacotes: � observando as propriedades de conexões TCP Taxas de perdas de pacotes em um sentido � Envio de pacotes TCP selecionados e deduzir a quantidade de pacotes perdidos em cada direção em função das respostas do host remoto.
133 Estado da Arte
Roteiro 134 Propriedades dos Equipamentos Propriedades das Topologias Interação do Tráfego com a Rede
135 Propriedades dos Equipamentos: Roteadores
136 Propriedades dos Equipamentos: Roteadores No entanto, se o roteador estiver bem carregado, os atrasos de enfileiramento podem ser da ordem de dezenas de milissegundos. Uma outra fonte de atrasos (que pode estar na faixa dos milissegundos) ocorre quando o pacote contém opções IP. Em algumas raras ocasiões o roteador atrasa a transmissão de pacotes mesmo na ausência de tráfego esperando para ser transmitido no link de saída (isto afeta menos de 1% do tráfego). Estes atrasos são da ordem de milissegundos e � Parecem ocorrer com a ativação periódica de software no roteador. �
137 Propriedades dos Equipamentos: Roteadores É útil também entender como os roteadores produzem e consomem tráfego � por exemplo, mensagens de roteamento. Mensagens de anúncio do estado de enlaces (LSAs) requerem da ordem de 100 microssegundos para serem processadas. Boa parte disto pode ser atribuída à cópia de dados dentro do roteador. � O tempo necessário para processar os pacotes OSPF tende a variar linearmente com o número de LSAs contidos no pacote � Enquanto que o tempo associado ao cálculo do caminho mais curto cresce de forma quadrática em relação ao número de nós. �
138 Propriedades dos Equipamentos: Middleboxes Caixas intermediárias tais como NATs e firewalls. Estes dispositivos podem introduzir atrasos de um milissegundo a centenas de milissegundos para encaminhar os pacotes.
Propriedades das Topologias 139 Propriedades estáticas do Grafo de Sistemas Autônomos: � Alta variabilidade da distribuição de graus: Grafos aleatórios tradicionais apresentam baixa variabilidade na distribuição dos graus. Mas este não é o caso para o grafo de ASes.
Propriedades das Topologias 140 � Alta variabilidade da distribuição de graus: Consequências: Esta é uma invariante importante que deve estar presente em qualquer modelo realista de topologia de ASes. Alguns ASes são muito bem conectados, enquanto que outros são muito pouco conectados. Papeis muito diferentes: grau do nó parece estar altamente correlacionado com o tamanho do AS. Mecanismos de crescimento da Internet: Nós adicionais se conectam com nós existentes com uma probabilidade proporcional ao grau do nó existente. Nós adicionais conectam a nós existentes de modo a minimizar tanto o comprimento físico da nova conexão como o número médio de etapas para outros nós na rede Se novos ASes surgirem com uma taxa de crescimento exponencial e cada AS também crescer exponencialmente. Se o tamanho do AS estiver correlacionado com o seu grau então obteremos distribuições de graus altamente variáveis.
Propriedades das Topologias 141 � Propriedades de Mundo Pequeno: Diz respeito ao relacionamento de duas propriedades dos grafos: diâmetro e agrupamento (clustering): Normalmente têm um alto grau de agrupamento e pequenos diâmetros! Grafos de ASes são grafos de mundo pequeno: Dados de Janeiro 2002 continham 12. 709 ASes e 27. 384 arestas. Comprimento médio do caminho é de 3, 6 e o coeficiente de agrupamento é 0, 46 (grafos aleatórios semelhantes apresentam um coeficiente de 0, 0014).
Propriedades das Topologias 142 � Relacionamentos entre ASes: Os ASes podem ser identificados de acordo com os papeis que desempenham na rede. O relacionamento comercial entre dois ASes pode ser classificado como: Cliente-provedor Parceiros Trânsito mútuo Backup mútuo Estes relacionamentos são aplicados através da escolha de que rotas são anunciadas através do BGP, e para quem elas são anunciadas. Portanto, pode ser difícil identificar a natureza dos relacionamentos sem o acesso direto ao tráfego BGP entre os ASes de interesse.
Propriedades das Topologias 143 Propriedades estáticas dos Grafos de Roteadores: � Grafo de roteadores: grafo no qual os nós são os roteadores e as arestas são conexões diretas (1 etapa) entre roteadores. � Obter uma visão completa do grafo de roteadores da Internet hoje é impossível. É mais fácil focar em pequenos pedaços, ou seja, subgrafos correspondentes a um único AS ou rede.
144 Mapa da ARPANET em 30/12/1972
145 Mapa da Rede Abilene em 2005
146 Mapa da Rede Ipê em Maio 2011
Propriedades das Topologias 147 Propriedades estáticas dos Grafos de Roteadores: � Alta Variabilidade na Distribuição dos Graus: Como os grafos de ASes, medições dos grafos de roteadores mostraram que eles também apresentam uma alta variabilidade na distribuição dos graus. Muitos nós têm graus menores do que 5 mas alguns têm graus maiores do que 100 (provavelmente em pontos de acesso na borda da rede). Ao contrário da medição de grafos de ASes que são passivas (a partir do BGP), as medições de grafos de roteadores são ativas (com o uso do traceroute).
Propriedades das Topologias 148 Propriedades estáticas dos Grafos de Roteadores: � Alta Variabilidade na Distribuição dos Graus: Grafo sintético respeitando as restrições técnicas para os roteadores:
Propriedades das Topologias 149 Propriedades estáticas dos Grafos de Roteadores: � Propriedades dos Caminhos: Como no caso dos grafos de ASes, os caminhos típicos através dos grafos de roteadores tendem a ser curtos Medidas do número de etapas IP entre nós na Internet mostram valores médios em torno de 16, enquanto que caminhos com mais de 30 etapas são raros. Apesar de serem curtos, as medições têm mostrado que eles são mais longos do que necessário. Este efeito parece ser devido principalmente a políticas de peering entre ASes e roteamento interdomínio.
Propriedades das Topologias 150 Aspectos Dinâmicos da Topologia: � � Também temos interesse em observar como a infraestrutura da Internet muda com o tempo. Crescimento e mudança: Fonte: bgp. potaroo. net
Propriedades das Topologias 151 Aspectos Dinâmicos da Topologia: � Crescimento e mudança: Observar o crescimento da Internet ao nível dos roteadores ou dos sistemas finais é mais complicado e muito mais dinâmico. Alternativas: Contar o número de endereços que foram alocados pelos Registros Regionais. Este seria um superdimensionamento pois é conhecido que muitos endereços alocados não estão em uso. Contar o número de endereços anunciados pelo BGP. Mesmo assim muitos endereços anunciados não estão em uso. Testar todos os endereços anunciados usando o ping Mas, muitos hosts estão conectados de forma intermitente ou estão atrás de NATs ou firewalls que bloqueiam as respostas e produzem um número subestimado. Consulta ao DNS para encontrar o conjunto de todos os endereços IP que possuem nomes DNS alocados. Mas este seria também um valor subestimado dado que nem todos os hosts estão cadastrados no DNS.
Propriedades das Topologias 152 Aspectos Dinâmicos da Topologia: � Crescimento e mudança:
153 Evolução do Número de Hosts do Brasil Número de Hosts Posição Relativa Fonte: www. cetic. br
Propriedades das Topologias 154 Aspectos Dinâmicos da Topologia: � Estabilidade: Mudanças na topologia da rede podem resultar da instabilidade do sistema. Os componentes da infraestrutura da rede estão continuamente sujeitas a falhas, reinicializações e reconfigurações. Isto provoca alterações na topologia com nós e arestas desaparecendo e depois reaparecendo. Reflete também na instabilidade das rotas.
Propriedades das Topologias 155 Aspectos Dinâmicos da Topologia: � Estabilidade: Instabilidade no BGP: Provocam sequências longas de atualizações. Podem causar loops de roteamento e um crescimento no atraso e perdas de pacotes. Aparentemente afeta uma pequena parte do tráfego da Internet. Num backbone a maioria das falhas dos links está concentrada num pequeno subconjunto dos mesmos. E duram menos do que 10 minutos.
Propriedades das Topologias 156 Localização Geográfica:
157 Interação do Tráfego com a Rede Muitas propriedades importantes do tráfego são influenciadas pelas condições da rede. Atraso dos Pacotes: � Determinísticos: Atrasos de transmissão e propagação O atraso de transmissão é significativo apenas em links lentos. O atraso de propagação é influenciado pela distância geográfica. � Estocásticos: Atraso de encaminhamento (sobretudo de enfileiramento) Boa parte do atraso total observado é devido a este atraso. São normalmente observados grandes picos de atraso.
158 Interação do Tráfego com a Rede Perdas de Pacotes: � Normalmente ocorrem em rajadas (bursts) provavelmente por eventos de congestionamento persistente nos roteadores. � Medições sugerem que as taxas de perdas em caminhos ‘cabeados’ são, em geral, inferiores a 0, 1% � Por outro lado, taxas de perdas em caminhos que incluem links sem fio podem ser bem altos – 2% ou mais.
159 Interação do Tráfego com a Rede Reordenamento de Pacotes, Duplicação e Jitter: � Causas do reordenamento dos pacotes: Paralelismo em um roteador Balanceamento de carga entre múltiplos caminhos na rede Mudanças de rotas � O reordenamento dos pacotes têm um efeito importante no comportamento do TCP. � No TCP os pacotes podem chegar fora de ordem por diversos motivos: Reordenamento real dentro da rede Duplicação de pacotes dentro da rede Retransmissão pelo transmissor TCP (maior parte)
160 Interação do Tráfego com a Rede Largura de Banda e Vazão: � Há poucos dados sobre a distribuição de larguras de banda entre caminhos na Internet. � As velocidades dos links estão crescendo firmemente e continuamente. Portanto, a medição de taxas em lotes tem crescido em certos caminhos.
161 Lei da Largura de Banda de Edholm 10 Gb/s Ethernet Fonte: IEEE Spectrum July 2004
162 Interação do Tráfego com a Rede Largura de Banda e Vazão: � Em escalas de tempo menores, a vazão em caminhos individuais é uma métrica relativamente firme. Ao contrário do RTT e taxas de perdas, as taxas de vazão do TCP variam lentamente. � As taxas de vazão podem variar por um fator menor do que três durante uma hora. Isto é importante para medições de largura de banda disponível e indica que estas medições são úteis por pelo menos um período da ordem de horas.
- Slides: 162