A difusão da Internet na África tem aumentado lenta, mas constantemente, desde o início deste milênio. Graças a várias organizações que doaram tempo e recursos, hoje em dia é possível afirmar que os ecossistemas AS de vários países da África estão passando por um estágio inicial da era de peering. Mas quanto dessa conectividade de peering recém-nascida somos capazes de revelar usando os coletores de rota BGP disponíveis publicamente? Ao analisar os dados do BGP disponíveis com as técnicas existentes, descobrimos que uma grande parte dessa conectividade está faltando no conjunto de dados, principalmente devido à falta de fontes de dados na região. Na maioria dos países, isso poderia ser teoricamente resolvido com a introdução de no máximo dez novos ASs, compartilhando suas informações de roteamento completas para coletores de rotas.
O ecossistema de nível AS da Internet
A Internet é composta por um conjunto de redes heterogêneas e independentes, cada uma das quais compete e coopera entre si por meio do Border Gateway Protocol (BGP) para construir as rotas que levarão o tráfego real. Este ecossistema pode ser analisado em diferentes níveis de abstração dependendo do tipo de análise que deve ser realizada, por exemplo, Sistemas Autônomos (ASes), IP / roteador, Pontos de Presença (PoPs). O nível AS em particular é útil para analisar como os diferentes jogadores que compõem a Internet (isto é, ASes) interagem uns com os outros - em termos de roteamento BGP - sem focar muito nos detalhes relativos à estrutura interna de cada jogador. O conhecimento completo do nível de AS de uma determinada região também ajudaria os administradores de rede nessa mesma região a planejarem seu roteamento entre domínios com antecedência, introduzindo, portanto, a quantidade adequada de redundâncias em suas escolhas de provedor para que possíveis problemas de A Internet teria um impacto mínimo no desempenho de suas próprias redes.
O nível do AS da Internet é normalmente representado como um gráfico onde os nós são ASes e as conexões são sessões BGP estabelecidas entre ASes. Dois ASes que decidem estabelecer uma sessão BGP essencialmente trocam um conjunto de informações de acessibilidade de rede que é usado para rotear parte de seu tráfego de Internet entre eles. A quantidade e a natureza das informações de acessibilidade trocadas dependem totalmente dos acordos econômicos firmados entre os dois AS, que podem ser classificados como provedor-para-cliente (p2c) ou ponto-a-ponto (p2p). No primeiro caso, o provedor anuncia ao cliente as rotas para chegar a todas as redes da Internet, enquanto o cliente anuncia ao provedor as rotas para chegar às suas redes e às redes clientes (se houver). Neste último, os dois ASes trocam rotas para alcançar seus respectivos clientes, normalmente para manter o tráfego local local e para reduzir os custos de trânsito. A principal fonte de dados para analisar a Internet no nível AS de abstração são os dados BGP coletados e fornecidos por organizações que executam coletores de rotas, como o Centro de Coordenação de Rede Réseaux IP Européens (RIPE NCC) com o Serviço de Informação de Roteamento (RIS), O Universidade de Oregon com o Visualizações de rota projeto e o Instituto de Informática e Telemática do Conselho Nacional de Pesquisa da Itália (IIT-CNR) com o Isolamento projeto. Um coletor de rotas é um servidor que executa um daemon de roteamento BGP que coleta e armazena informações de roteamento no formato Multi-Threaded Routing Toolkit (MRT) e não anuncia nenhuma informação de acessibilidade de volta para seus vizinhos BGP. Todo AS é livre para aderir e compartilhar suas informações de roteamento com o público, contribuindo para melhorar a quantidade - e, portanto, a qualidade - dos dados do BGP disponíveis para fins de pesquisa. A informação fundamental encontrada nos dados BGP coletados para analisar o ecossistema de nível de AS é o atributo AS PATH, que pode ser usado para inferir os nós (ASes) e as conexões (adjacências de AS) da topologia de nível de AS.
Coletor de rota BGP
Geolocation
Graças às bases de dados publicamente disponíveis, é possível inferir a geolocalização do AS por meio da geolocalização de cada uma das sub-redes anunciadas pelo AS, graças à disponibilidade de bases de dados que mapeiam os endereços IP nos países. Esta técnica permite inferir topologias regionais apenas considerando que cada adjacência de AS pode ser geolocalização se ambos os AS estiverem anunciando (pelo menos) uma sub-rede no mesmo país. No final, o conjunto de ASes geolocalizados em um determinado país / continente conterá tanto ASes de propriedade de organizações locais e estritamente vinculados ao território onde operam - doravante ASes locais - quanto ASes de propriedade de organizações internacionais que operam no mesmo território para fins de marketing - doravante ASes internacionais. Doravante, consideraremos um determinado AS como local se houver uma entrada no registro AFRINIC relacionada a esse AS.
Uma primeira visão do ecossistema africano de nível AS
A África é um continente extremamente heterogêneo em termos de idioma, cultura e economia, e essa heterogeneidade também pode ser reconhecida em seu ecossistema de nível AS. No mesmo continente coexistem países com boa conectividade e penetração da Internet - com outro conjunto de países onde a infraestrutura da Internet ainda precisa ser uma parte consolidada de suas economias. De 1084 ASes locais, a África do Sul recebe a maior parte com 322 ASes, seguida pela Nigéria (145 ASes), Quênia (79 ASes), Tanzânia (63 ASes) e Gana (56 ASes). Uma das características mais impressionantes que pode ser notada à primeira vista é a fraca difusão de IPv6 apesar dos esforços despendidos por várias organizações em sessões de treinamento e IPv6 conferências focadas. Cada AS local anuncia na Internet pelo menos um IPv4 rede, enquanto apenas 203 deles anunciam (pelo menos) um IPv6 rede. O último conjunto de ASes é distribuído principalmente entre a África do Sul (47%), Tanzânia (13%), Quênia (10%), Maurício (9%) e Nigéria (6%). Outro aspecto interessante é que apenas 90 ASes locais (cerca de 8%) estão localizados em mais de um país, destacando como o tráfego em trânsito entre países vizinhos ainda depende de provedores internacionais.
Da mesma forma que o resto do ecossistema da Internet, o ecossistema de peering na África está em um estágio muito inicial de desenvolvimento. Há poucos anos, a maior parte do tráfego local era roteado pela Europa e América do Norte, causando problemas de desempenho devido às altas latências. As coisas começaram a mudar durante a última década, quando iniciativas como o African Internet Exchange System (AXIS) projeto levou a um aumento dramático no número de IXPs na região. Hoje em dia, na África, podem ser encontrados 37 IXPs ativos localizados em 34 cidades de 28 países (fonte: A Associação Africana IXP) Analisando os sites de cada IXP, é fácil ver que a maioria deles tem atualmente menos de 20 ASes conectados, com a notável exceção do NAPAfrica na África do Sul (273 ASes entre Joanesburgo, Cidade do Cabo e Durban), JINX na África do Sul ( 82 ASes em Joanesburgo), IXPN na Nigéria (54 ASes em Lagos, Abuja e Port Harcourt), KIXP no Quênia (36 ASes entre Nairobi e Mombasa), TIX na Tanzânia (36 ASes entre Dar es Salaam e Arusha) e UIXP em Uganda (26 ASes em Kampala). A presença de um IXP tão lotado quanto o NAPAfrica na África do Sul enfatiza ainda mais como o ecossistema da Internet na África do Sul é totalmente diferente do resto da África, lembrando o ecossistema de um país europeu.
Dados do ecossistema africano no nível do AS
Sobre a integridade do gráfico de nível AS africano
Os dados do BGP estão longe de ser totalmente representativos do ecossistema de nível AS da Internet. Em primeiro lugar, o número de ASes que participam de qualquer projeto de coleta de rota é extremamente baixo se comparado ao tamanho total dos ASes que compõem a Internet. Durante nossa análise, apenas 525 ASs estavam compartilhando suas informações de roteamento com Isolamento, RIS e / ou Visualizações de rota, enquanto o número total de ASes roteados na Internet foi 59,005. Em segundo lugar, os coletores de rota não estão recebendo informações de roteamento completas de todos os seus alimentadores. Vários coletores são colocados em IXPs em todo o mundo e muitos alimentadores aplicam a eles as mesmas políticas de exportação aplicadas a outros participantes de IXP. Em outras palavras, eles anunciam aos coletores de rotas apenas seu cone de cliente, o que proporciona uma visão extremamente limitada da Internet. Durante nossa análise, cerca de metade dos alimentadores estavam apresentando esse tipo de comportamento, com apenas 257 ASs compartilhando um IPv4 espaço e 200 ASes compartilhando um IPv6 espaço próximo a uma tabela de roteamento completa. Os alimentadores que anunciam sua tabela de roteamento completa para os coletores de rotas serão doravante denominados alimentadores completos. Finalmente, os dados BGP são conhecidos por perder uma grande parte da conectividade p2p estabelecida em IXPs ou via peering privado. Isso é causado principalmente pela localização de alimentadores completos no gráfico do AS e pela presença de políticas de exportação do BGP e relações econômicas entre os AS. Dadas as relações econômicas padrão estabelecidas entre os SAs, um SA anuncia ao outro SA suas informações completas de roteamento - contendo rotas aprendidas com seus pares, provedores e clientes - mas apenas se for um provedor da outra parte. Como consequência, um coletor de rotas é capaz de ver as rotas estabelecidas via IXPs e peering privado de um determinado AS X apenas se houver uma cadeia de relações de trânsito do coletor de rotas em direção a X. Este conceito foi formalizado como distância p2c, e tem sido usado para quantificar o número de ASes para os quais é possível descobrir a conectividade total dado um conjunto de alimentadores completos. A incompletude do gráfico resultante deve ser levada em consideração ao analisar a Internet no nível AS de abstração, uma vez que pode facilmente levar a conclusões erradas, especialmente ao analisar as propriedades do gráfico.
Um coletor de rota R conectado ao topo da hierarquia da Internet não será capaz de revelar a conectividade de peering estabelecida na parte inferior da hierarquia
A situação da cobertura na África não é muito diferente do resto do mundo. Atualmente, existem três coletores de rota na África fisicamente implantados em KIXP no Quênia (Visualizações de rota), Jinx na África do Sul (Visualizações de rota) e NAPAfrica na África do Sul (RIS). Esses coletores recebem dados de 69 alimentadores, 63 localizados na África do Sul, 4 no Quênia e 2 nas Ilhas Maurício. Um alimentador adicional da África do Sul está conectado a Isolamento via multihop BGP. A grande maioria dos alimentadores anuncia apenas uma pequena porção do espaço IP, muito menor do que o respectivo espaço de tabela de roteamento completo que hoje em dia é composto por cerca de 600k (v4) e 40k (v6) rotas. Dos 69 alimentadores, apenas 13 podem ser considerados alimentadores completos v4 e apenas 9 alimentadores completos v6. Todos eles estão localizados na África do Sul, com exceção de um alimentador completo v4 e um v6 localizado na ilha de Maurício. Assim, é quase fácil entender que a conectividade de peering estabelecida nos 30 IXPs na África, localizados nem na África do Sul nem nas Maurícias, está atualmente completamente oculta para os coletores de rotas BGP, enquanto o pequeno número de alimentadores completos disponíveis na África do Sul e nas Ilhas Maurício não permitir que eles revelem muito da conectividade de peering em seus países. Levando em consideração a métrica de distância p2c, é possível afirmar que os alimentadores completos atuais permitem revelar a conectividade total de 29 IPv4 ASes de 129 (22.5%) e 5 de 28 trânsito IPv6 ASes (17.9%) na África do Sul, enquanto é possível descobrir a conectividade total de 6 trânsito IPv4 ASes de 31 (19.4%) e não IPv6 trânsito ASes mais de 9 nas Maurícias. No resto dos países africanos, os únicos ASes cobertos são os ASes internacionais, que são cobertos por alimentadores fora da África.
Para entender melhor o quão longe o sistema de medição BGP atual está da condição ideal, onde toda a conectividade p2p de cada país é revelável e potencialmente visível, aplicamos o problema da Cobertura Mínima do Conjunto (MSC) descrito por Gregori e col. para cada topologia regional coletada de dados BGP. Em cada cenário regional, cada AS disponível é considerado um potencial alimentador com seu próprio conjunto de cobertura - ou seja, o conjunto de ASes de trânsito tendo uma distância p2c finita do AS - e o objetivo do problema é encontrar o número mínimo de ASes cujos conjuntos de cobertura cobrem todo o conjunto de ASes de trânsito naquela região. A figura abaixo mostra a função de distribuição cumulativa complementar (CCDF) do número de alimentadores necessários em cada país africano. Observe que o cenário v6 é calculado com base apenas em 12 países onde os ASs foram conectados entre si. O cenário da África do Sul é o que mais se distingue nas duas fotos. Dada a grande quantidade de ASes nos cenários v4 e v6, um número bastante grande de alimentadores é necessário para obter a cobertura total dos ASes de trânsito. Em todos os outros casos, porém, o número de alimentadores necessários é bastante baixo, geralmente menor do que 10 na v4 ou v6. Isso significa que com um esforço consideravelmente pequeno - 10 sessões BGP completas a serem estabelecidas - pode ser possível revelar a conectividade de peering completa de 90% dos países na África.
CCDF da cardinalidade da solução do problema de MSC em cada país africano
Conclusão
A África mostra em seu ecossistema de nível AS a mesma heterogeneidade que mostra em termos de cultura, economia e desenvolvimento. O ecossistema de nível AS mais desenvolvido pode ser encontrado na África do Sul, onde o ecossistema de peering é extremamente semelhante ao da maioria dos países europeus, conforme comprovado pelo número de IXP disponíveis. Então, há um pequeno conjunto de países progressistas (por exemplo, Egito, Quênia, Nigéria e Tanzânia) onde a difusão da Internet está aumentando constantemente e sendo cada vez mais uma parte importante de sua economia. Finalmente, há um grande conjunto de países onde a Internet está em um estágio muito inicial de desenvolvimento. Neste ecossistema, descobrimos que os coletores de rota de BGP quase completamente falham em revelar a conectividade de peering estabelecida entre os ASes, afetando assim qualquer análise gráfica possível sobre o ecossistema africano. Apesar disso, descobrimos que teoricamente seria possível resolver esta situação na maioria dos países africanos introduzindo apenas dez novos alimentadores completos.
Notas de rodapé finais
As análises realizadas nesta entrada do blog são computadas nos dados BGP coletados por cada coletor de rota disponibilizado por Isolamento, RIS e a Visualizações de rota em 8 de agosto de 2017. Geolocalização é realizada usando o Banco de dados GeoLite2 Country disponibilizado publicamente por Maxmind, enquanto as relações econômicas são inferidas usando o algoritmo descrito por Gregori e col.
Bio: Alessandro Improta recebeu seu BSc e MSc em Engenharia de Computação pela Universidade de Pisa, Itália, em 2006 e 2009, respectivamente. Em seguida, ele recebeu seu doutorado em Engenharia da Informação pela Universidade de Pisa, em 2013. Desde 2009, Alessandro ocupou um cargo de pesquisador no Instituto de Informática e Telemática (IIT) no Conselho Nacional de Pesquisa da Itália (CNR) em Pisa. Seus interesses de pesquisa incluem medição e análise no nível do AS da Internet e a descoberta de características de caminhos da Internet.