129
HAL Id: tel-01950686 https://tel.archives-ouvertes.fr/tel-01950686 Submitted on 11 Dec 2018 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Étude de la connectivité Internet de l’île de la Réunion Réhan Noordally To cite this version: Réhan Noordally. Étude de la connectivité Internet de l’île de la Réunion. Informatique. Université de la Réunion, 2018. Français. NNT : 2018LARE0023. tel-01950686

Étude de la connectivité Internet de l'île de la Réunion

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Étude de la connectivité Internet de l'île de la Réunion

HAL Id tel-01950686httpstelarchives-ouvertesfrtel-01950686

Submitted on 11 Dec 2018

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents whether they are pub-lished or not The documents may come fromteaching and research institutions in France orabroad or from public or private research centers

Lrsquoarchive ouverte pluridisciplinaire HAL estdestineacutee au deacutepocirct et agrave la diffusion de documentsscientifiques de niveau recherche publieacutes ou noneacutemanant des eacutetablissements drsquoenseignement et derecherche franccedilais ou eacutetrangers des laboratoirespublics ou priveacutes

Eacutetude de la connectiviteacute Internet de lrsquoicircle de la ReacuteunionReacutehan Noordally

To cite this versionReacutehan Noordally Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion Informatique Universiteacutede la Reacuteunion 2018 Franccedilais NNT 2018LARE0023 tel-01950686

Thegravesede lrsquoUniversiteacute de la Reacuteunion

Speacutecialiteacute

RESEAUX INFORMATIQUES

preacutesenteacutee par

M Reacutehan NOORDALLY

Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion

Soutenance le 30 Aoucirct 2018 devant le jury composeacute de

Pr Laure PETRUCCI RapporteurPr Emmanuel LOCHIN RapporteurDr HDR Promeacutetheacutee SPATHIS ExaminateurPr Reacutemy COURDIER ExaminateurDr HDR Pascal ANELLI Directeur de ThegraveseDr Richard LORION Encadrant

CETTE THEgraveSE A RECcedilU LE SOUTIEN FINANCIER DE LA REacuteGION REacuteUNION ET DE LrsquoUNION

EUROPEacuteENNE (FONDS EUROPEacuteEN DE DEacuteVELOPPEMENT REacuteGIONAL - FEDER)

Je deacutedie cette thegravese agrave lrsquoensemble des membres de ma famille

I

II

Remerciements

Mes premiers remerciements vont agrave lrsquoendroit de Monsieur Pascal Anelli Maicirctre deconfeacuterences HDR agrave lrsquoUniversiteacute de La Reacuteunion qui a accepteacute drsquoencadrer cette thegravese Jele remercie drsquoavoir mis toute son eacutenergie pour que je puisse mener ces travaux dans lesmeilleures conditions Je le remercie eacutegalement pour la confiance et la patience sans failleqursquoil mrsquoa teacutemoigneacutees durant ces anneacutees

Je remercie Monsieur Richard Lorion Maicirctre de Confeacuterences agrave lrsquoUniversiteacute de LaReacuteunion Malgreacute un emploi du temps surchargeacute il a su me consacrer du temps pouraiguiller mes travaux

Je tiens agrave remercier tout particuliegraverement Madame Laure Petrucci Professeur agrave lrsquoUni-versiteacute Paris 13 et Monsieur Emmanuel Lochin Professeur agrave lrsquoISAE SUPAERO qui mrsquoontfait lrsquohonneur drsquoaccepter de juger ces travaux et drsquoen ecirctre rapporteurs

Je remercie le Professeur Reacutemy Courdier qui a accepteacute de preacutesider mon jury de thegraveseDe par cette acceptation je boucle mon cursus universitaire agrave lrsquoUniversiteacute de La ReacuteunionMes remerciements vont agrave lrsquoattention de Monsieur Promeacutetheacutee Spathis qui consacre deson temps agrave la participation de mon jury de thegravese en tant qursquoexaminateur

Je tiens agrave remercier Messieurs Pierre-Ugo Tournoux et Xavier Nicolay pour les dis-cussions que lrsquoon a eues Cela mrsquoa permis de me remettre dans le droit chemin quand jemrsquoeacutegarais

Je remercie eacutegalement Monsieur Bruno Baynat Maicirctre de confeacuterences agrave lrsquoUniversiteacutede Paris 6 qui a su donner un nouveau souffle agrave ces travaux agrave travers ses conseils lors deson passage

Je remercie eacutegalement Monsieur Denis Fabregravegue Responsable du pocircle TIC agrave La ReacuteunionMonsieur Thierry Pretet travaillant agrave la cellule Investissements publics de la ReacutegionReacuteunion Monsieur Thomas Silverston Chercheur au NICT drsquoavoir accepteacute de faire par-tie de mon comiteacute de suivi de thegravese

Je remercie eacutegalement le Laboratoire drsquoInformatique et de Matheacutematiques dirigeacute parMonsieur Jean Diatta Professeur agrave lrsquoUniversiteacute de La Reacuteunion ainsi que lrsquoensemble desmembres pour lrsquoaccueil et les moyens qui mrsquoont eacuteteacute mis agrave disposition pour le bon deacuterou-lement de cette thegravese

Je remercie eacutegalement la Reacutegion Reacuteunion qui a soutenu financiegraverement ces travaux dethegravese

Je remercie eacutegalement Messieurs Jean-Christophe Lan-Yan-Fock et Arnaud Ravoa-vahy pour les travaux reacutealiseacutes durant leurs stages

Je remercie eacutegalement mes collegravegues mes amis et mes proches pour leurs contribu-tions et leurs encouragements

Je remercie particuliegraverement Aureacutelie Miora Florence et Anne-Claire qui ont eacuteteacute dansla mecircme galegravere que moi

Je tiens agrave remercier du fond du coeur lrsquoensemble des membres de ma famille qui mrsquoonttoujours apporteacute leur soutien et leur encouragement Merci agrave vous

Enfin je tiens agrave remercier toutes les personnes qui ont contribueacute de pregraves ou de loin agravela reacutealisation de ces travaux

III

IV

Reacutesumeacute

Lrsquoaccegraves agrave Internet des icircles de la Zone Oceacutean Indien a la particulariteacute drsquoutiliser deuxlongs cacircbles sous-marins Les routes ont en commun de passer par un de ces liens etdrsquointroduire une composante de deacutelai qui peut ecirctre significative La performance de TCPest lieacutee agrave lrsquoeacutetat des routes et au deacutelai Dans la situation de lrsquoicircle de la Reacuteunion comment secomporte un protocole ayant une deacutependance au deacutelai tel que TCP

Dans cette thegravese nous proposons une eacutetude de lrsquoInternet agrave la Reacuteunion Les travauxvisent agrave pouvoir dresser un bilan de la connectiviteacute Internet Ils srsquoorientent drsquoune partagrave caracteacuteriser la connectiviteacute au niveau du reacuteseau et drsquoautre part agrave traduire ses caracteacute-ristiques au niveau de la couche de transport Ainsi les travaux preacutesenteacutes reposent surdeux eacutetudes de meacutetrologie sur le reacuteseau reacuteunionnais

Le premier examen a pour objectif la caracteacuterisation des deacutelais et des routes emprun-teacutees depuis et en direction de lrsquoicircle Ces travaux reposent sur une plate-forme de mesuresmise en place agrave cet effet Un outil drsquoidentification des routes a eacuteteacute deacuteveloppeacute afin drsquoana-lyser les chemins depuis et vers la Reacuteunion Cet outil utilise une base de donneacutees degeacuteolocalisation construite agrave partir des adresses IP rencontreacutees des deacutelais associeacutes et drsquoin-formations provenant des Registres Internet Reacutegionaux Lrsquoanalyse des reacutesultats montredes caracteacuteristiques propres agrave la reacutegion Reacuteunion

La seconde eacutetude de meacutetrologie vise lrsquoanalyse des flux TCP Des meacutetriques associeacuteesagrave lrsquoobservation des captures de trafic sont identifieacutees afin drsquoeacutetablir les performances deTCP mais eacutegalement les types de trafic entrant et sortant de lrsquoicircle Le volume des eacutecouteseacutetant important un outil drsquoanalyse pour des traitements efficaces et rapides a eacutegalementeacuteteacute deacuteveloppeacute

Les contributions de cette thegravese sont drsquoabord rattacheacutees au contexte reacuteunionnais etsont extrapoleacutees vers lrsquointernet de la Zone Oceacutean Indien Cette thegravese se veut ecirctre un eacuteleacute-ment pour une reacuteflexion avec lrsquoensemble des acteurs de lrsquoInternet agrave la Reacuteunion

Mots cleacutes

Meacutetrologie active Deacutelais Routage Meacutetrologie passive Performance TCP Zone OceacuteanIndien Reacuteunion

V

Abstract

The access to the Internet of the Islands of the Indian Ocean Area has the particularityof using two long submarines cables The routes have in common to go through one ofthese links and introduce a delay component that can be significant The performance ofTCP is linked to the state of the route and the delay In the situation of Reunion Islandhow does a protocol having a dependence on delay such as TCP behaves

In this thesis we propose a study of the Internet in Reunion Island The work aimsto be able to take stock of Internet connectivity They are oriented on the one hand tocharacterize the connectivity at the level of the network and on the other hand to translatethese characteristics at the level of the transport layer Thus the works presented arebased on two metrology studies on the Reunion network

The first review aims to characterize the delays and the routes taken from and to theisland This work is based on a platform of measures put in place for this purpose A roadidentification tool has been developed to analyze roads to and from Reunion Island Thistool uses a geolocation database built from IP addresses encountered associated delaysand information from the Regional Internet Registries The analysis of the results showscharacteristics specific to the Reacuteunion region

The second metrology study aims to analyze TCP flows Metrics associated with theobservation of the catches of traffic are identified in order to establish the performancesof TCP but also the types of traffic entering and leaving the island Since the volume ofthe intercepts is important an analysis tool for efficient and rapid treatments has beendeveloped

The contributions of this thesis are first of all related to the Reunionese context andare extrapolated to the Internet of the Indian Ocean Zone This thesis is meant to be anelement for a reflection with all the actors of the Internet in Reunion Island

Keywords

Active Metrology Delay Routage Passive metrology Performance TCP Indian OceanArea Reunion Island

VI

Table des matiegraveres

Remerciements III

Reacutesumeacute V

Abstract VI

Liste des acronymes IX

Introduction 11 Contexte geacuteneacuteral 12 Contexte reacutegional 1

21 LrsquoInternet agrave La Reacuteunion 122 LrsquoInternet dans la Zone de lrsquoOceacutean Indien 5

3 Probleacutematique 84 Organisation de la thegravese 8

1 Eacutetat de lrsquoart 911 Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage 10

111 Controcircle de congestion de TCP 10112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de

stockage 14113 Un controcircle de congestion de TCP adapteacute aux LFN 17114 Controcircle de congestion avec implication des routeurs 22115 Caracteacuterisation de La Reacuteunion 23

12 Meacutetrologie du trafic Internet 25121 Deacutefinition 25122 Meacutetrologie active 26123 Meacutetrologie passive 32124 Comparatif entre mesures actives et mesures passives 35

13 Synthegravese 36

2 Caracteacuterisation de la connectiviteacute de La Reacuteunion 3921 Objectifs 4022 Cahier des charges 40

221 Evolution 40222 Connectiviteacute 40

23 Protocole de mesure 46231 Eacutechantillon de mesure 46232 Eacutevolution 47233 Connectiviteacute 48

24 Reacutesultats 53241 Eacutevolution 53

VII

242 Connectiviteacute de La Reacuteunion 54243 Connectiviteacute des icircles de la Zone Oceacutean Indien 65244 Synthegravese des reacutesultats 71

25 Conclusion 72

3 Meacutetrologie sur le service de transport agrave La Reacuteunion 7531 Objectifs 75

311 Les objectifs de lrsquoeacutetude 76312 Les meacutetriques de lrsquoeacutetude 76

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie 79321 Pour la capture du trafic 79322 Pour analyser les traces 80

33 Protocole de mesure 8234 Reacutesultats 85

341 Supervision du trafic 86342 Performance de TCP 88343 Synthegravese des reacutesultats 91

35 Conclusion 92

Conclusion amp perspectives 951 Synthegravese des travaux 952 Perspectives 96

Table des figures 100

Liste des tableaux 101

Bibliographie 103

VIII

Liste des acronymes

ACK Acknowledgement

ADSL Asymmetric Digital Subscriber Line

AIMD Additive Increase and Multiplicative Decrease

API Application Programming Interface

ARCEP Autoriteacute de Reacutegulation des Communications Electroniques et des Postes

AS Autonomous System

BDP Bandwidth Delay Product

CAIDA Center for Applied Internet Data Analysis

CDCS Comoros Domestic Cable Sytem

CDF Cumulative Density Function

CIL Correspondant Informatique et Liberteacutes

CWND Congestion Window

CWR Congestion Window Reduce

DNS Domain Name System

DSI Direction des Services Informatiques

DupAck Duplicate Acknowledgement

EASSY Eastern Arfrica Submarine SYstem

ECE ECN Echo

ECN Explicit Congestion Notification

FAI Fournisseurs drsquoAccegraves Internet

FTTH Fiber To The Home

GIX Global Internet eXchange

GNU GNUrsquos Not Unix

GPL General Public Licence

HTTP HyperText Transfer Protocol

HTTPS HyperText Transfer Protocol Secured

IANA Internet Assigned Numbers Authority

ICMP Internet Control Message Protocol

IETF Internet Engineering Task Force

IX

IGMP Internet Group Management Protocol

IMAP Internet Message Access Protocol

IP Internet Protocol

IPPM IP Performance Metrics

IW Initial Window

IXP Internet eXchange Point

LAN Local Area Network

LER Label Edge Router

LFN Long Fat Network

LIM Laboratoire drsquoInformatique et de Matheacutematiques

LION Lower Indian Ocean Network

LSP Label Switched Path

LSR Label Switch Router

MAN Metropolitan Area Network

MPLS MultiProtocol Label Switch

MSS Maximun Segment Size

NRA Noeud de Raccordement drsquoAbonneacutes

NS Nonce Sum

OS Operating System

PDF Probability Density Function

POP Post Office Protocol

PSAMP Packet Sampling

RENATER REseau NAtional de communication eacutelectroniques pour la Technologie lrsquoEnseigne-ment et la Recherche

RIR Regional Internet Registry

RITE Reducing Internet Transport Latency

RSSI Responsable Seacutecuriteacute et Systegravemes drsquoInformation

RTO Retransmission TimeOut

RTT Round-Trip delay Time

SAFE South-Africa Far East

SAT-3 South Africa Transit-3

SCP Ssh CoPy

SEAS Seychelles to East Africa System

SMTP Simple Mail Transfert Protocol

SSH Secure SHell

ssthresh slow-start threshold

TAI Technologies drsquoAccegraves agrave Internet

X

TCP Transmission Control Protocol

TTL Time-To-Live

UDP User Datagram Protocol

VDSL Very-high-bit-rate Digital Subscriber Line

VLAN Virtual Local Area Network

VOD Video on demand

VPN Virtal Private Network

WAN Wide Area Network

WASC West Africa Submarine Cable

ZOI Zone Oceacutean Indien

XI

XII

Introduction

1 Contexte geacuteneacuteral

Depuis sa premiegravere deacutemonstration publique en 1972 Internet a fortement eacutevolueacute[Leiner1997] Dans une premiegravere phase nous avons les changements de services Les uti-lisateurs ont basculeacute des services historiques que sont lrsquoeacutechange drsquoe-mail et la navigationweb vers une utilisation interactive de lrsquoInternet Ces nouveaux services tels que la Voixsur IP les Jeux en ligne le Streaming etc sont maintenant possibles peu importe lrsquoendroitougrave lrsquoon se situe Cela gracircce agrave la seconde phase des innovations de lrsquoInternet lrsquoeacutevolu-tion des technologies logicielles et mateacuterielles Les technologies sont devenues de plusen plus mobiles et proposent des deacutebits drsquoaccegraves agrave lrsquoInternet de plus en plus importantsAinsi nous sommes passeacutes drsquoun accegraves physique de chez soi connecteacutes agrave un ordinateurfixe et une liaison 56 kbits (kilo-bitsseconde) agrave des smartphones et des connexions mo-biles avec un deacutebit theacuteorique minimal descendant de 20 Gbits (Giga-bitsseconde) dansun futur proche pour la technologie 5G En parallegravele lrsquoaccegraves agrave Internet srsquoest deacutemocra-tiseacute Drsquoapregraves une eacutetude de lrsquoOrganisation des Nations Unies le nombre de teacuteleacutephonesmobiles est devenu supeacuterieur au nombre drsquohabitants sur la planegravete [ONU2013] Ces eacutevo-lutions parallegraveles ont bouleverseacute lrsquousage de lrsquoInternet Est-ce que ces eacutevolutions ont eu unimpact sur lrsquoInternet reacuteunionnais

2 Contexte reacutegional

21 LrsquoInternet agrave La Reacuteunion

Pour comprendre la situation de lrsquoInternet agrave La Reacuteunion il est neacutecessaire de relaterlrsquohistoire de la connectiviteacute Internet et de dresser un bilan de lrsquoeacutetat actuel Cet historiqueest effectueacute agrave partir du document [Pretet2000] qui preacutesente lrsquoavancement du projet deconnexion de lrsquoicircle de La Reacuteunion au cacircble sous-marin South-Africa Far East (SAFE)

La premiegravere connexion de La Reacuteunion agrave lrsquoInternet date de 1992 avec la mise en servicedu projet Telecom-2 Agrave cette eacutepoque la seule liaison connectant La Reacuteunion agrave Interneteacutetait une connexion satellitaire Jusqursquoen 2001 et lrsquoarriveacutee du cacircble SAT-3WASCSAFEles deacutebits drsquoaccegraves reacutesidentiels ne deacutepassaient pas les 56 kbits La bande passante totalede lrsquoaccegraves Internet de lrsquoicircle par ce canal satellite eacutetait de 400 Mbits (Meacutega-bitsseconde)tous opeacuterateurs confondus Le coucirct drsquoutilisation de la liaison satellite avoisinait les17 000DMbmois et par opeacuterateur La technologie drsquoaccegraves et le tarif eacuteleveacute limitaient lesusages de lrsquoInternet priveacute agrave des services basiques comme lrsquoeacutechange drsquoe-mail Lrsquoarriveacuteedes cacircbles South Africa Transit-3 (SAT-3)West Africa Submarine Cable (WASC)SAFE en2001 visaient agrave deacutesenclaver numeacuteriquement lrsquoicircle

Ce cacircble drsquoune longueur totale de 28 000 Km (Kilo-megravetres) connecte lrsquoEurope (Es-pagne et Portugal) agrave lrsquoAsie (Inde et Malaisie) en longeant la cocircte Ouest africaine telqursquoillustreacutee par la carte figure 1 Le lien est composeacute de deux paires de fibres optiquesavec une capaciteacute globale de 135 Gbits La reacutepartition des capaciteacutes fut faite en fonction

1

du montant investi par les opeacuterateurs France Teacuteleacutecom fut seacutelectionneacutee pour la Franceavec un deacutebit total de 13 6 Gbits dont 155 Mbits furent alloueacutes agrave la connexion de LaReacuteunion Ce deacutebit eacutetait eacutequivalent agrave la capaciteacute maximale theacuteorique du lien satellite deFrance Teacuteleacutecom Outre la seacutecuriteacute apporteacutee par la fibre optique crsquoest la qualiteacute de la trans-mission qui a eacuteteacute ameacutelioreacutee avec ce support Ce cacircble a eacuteteacute une premiegravere eacutetape dans lamise en place drsquoune autoroute de lrsquoinformation entre lrsquoEurope lrsquoAsie et lrsquoAfrique PourLa Reacuteunion cette autoroute a eacuteteacute un facteur pour la baisse des coucircts de communication eten parallegravele le deacuteploiement de la technologie Asymmetric Digital Subscriber Line (ADSL)Les tarifs de consommation de la bande passante du lien ont connu une baisse impor-tante suite agrave une deacutecision de lrsquoAutoriteacute de Reacutegulation des Communications Electroniques etdes Postes (ARCEP) en 2004 [ARCEP2004] Les tarifs sont passeacutes de 17 000 DMbmois agrave1 550 DMbmois

FIGURE 1 ndash Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000])

Malgreacute la baisse des tarifs lrsquoADSL nrsquoeacutetait preacutesent que dans 6 villes agrave forte densiteacutede population Afin drsquoaugmenter la couverture de lrsquoaccegraves Internet de lrsquoicircle une dorsalefaisant le tour de lrsquoicircle est installeacutee Crsquoest le reacuteseau nommeacute Gazelle dont le deacutebut du deacute-ploiement fut effectueacute dans le courant de lrsquoanneacutee 2003 [SDTAN2013] Cette fibre est ins-talleacutee en hauteur en suivant le reacuteseau Haute Tension drsquoEDF selon le plan de la figure 2(en trait bleu ou fonceacute) Le but de ce reacuteseau est de raccorder lrsquoensemble des Noeud de Rac-cordement drsquoAbonneacutes (NRA) Un NRA est un local heacutebergeant un central teacuteleacutephonique delrsquoopeacuterateur historique France Teacuteleacutecom dans lequel aboutissent les lignes teacuteleacutephoniquesdes abonneacutes communeacutement appeleacutees boucles locales Au delagrave de ces locaux les boucleslocales forment le reacuteseau capillaire Lrsquointerconnexion entre le reacuteseau Gazelle et les NRAest repreacutesenteacutee en vert sur la figure 2

En 2004 La Reacuteunion srsquoest doteacutee drsquoun point drsquoeacutechange (Global Internet eXchange (GIX)ou Internet eXchange Point (IXP)) nommeacute Reunix Il fut pendant pregraves de 10 ans le seul IXPpreacutesent dans la Zone Oceacutean Indien (ZOI) Geacutereacute par le REseau NAtional de communicationeacutelectroniques pour la Technologie lrsquoEnseignement et la Recherche (RENATER) il vise agrave inter-connecter les fournisseurs drsquoaccegraves Internet de La Reacuteunion afin drsquoeacuteviter que le trafic localne sorte de lrsquoicircle et consomme des capaciteacutes sur le cacircble sous-marin En plus de cet eacutequi-pement des technologies de cache ont eacuteteacute deacuteployeacutees sur le territoire LrsquoUniversiteacute de LaReacuteunion a eacuteteacute un des acteurs de ce deacuteploiement

2

FIGURE 2 ndash Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000])

Depuis la deacutecision de lrsquoARCEP en 2004 chaque anneacutee une baisse de 20 agrave 40 duprix du Meacutegabit sur le cacircble sous-marin est enregistreacutee En 2006 pour 50D un abonneacutenrsquoavait droit qursquoagrave la connexion ADSL de 1 Mbits sans aucun service additionnel Lrsquoan-neacutee suivante pour le mecircme tarif la teacuteleacutephonie illimiteacutee vers certains pays a eacuteteacute ajouteacuteeau forfait Dans le courant de lrsquoanneacutee 2010 le forfait est resteacute le mecircme mais le deacutebit alloueacuteest augmenteacute pour atteindre 8 Mbits La Reacuteunion nrsquoa vu lrsquoarriveacutee du triple play (Teacuteleacutevi-sion Teacuteleacutephone Internet) qursquoagrave partir des anneacutees 20112012 avec lrsquoarriveacutee drsquoun nouveaucacircble Lower Indian Ocean Network (LION) Le LION est un cacircble sous-marin reliant LaReacuteunion Maurice et Madagascar depuis 2009 En 2012 une extension est rajouteacutee sousle nom de LION-2 connectant le LION agrave Mayotte et au Kenya Ce nouveau cacircble proposedegraves sa mise en service une capaciteacute deacutepassant le 1 Tbs (Teacuterabitseconde)

Lrsquoaugmentation continue des deacutebits et de la capaciteacute disponible sur le cacircble SAT-3WASCSAFE actuellement agrave 900 Gbits a acceacuteleacutereacute le deacuteploiement de nouveaux ser-vices et de nouvelles technologies drsquoaccegraves agrave Internet pour les abonneacutes Lrsquoicircle de La Reacuteuniondispose actuellement en dehors des connexions mobiles de trois Technologies drsquoAccegraves agrave In-ternet (TAI) La premiegravere est la technologie ADSL preacutesente depuis 2001 Elle propose desdeacutebits asymeacutetriques allant jusqursquoagrave 20 Mbitss en descente Crsquoest le deacutebit qursquoaura lrsquoutilisa-teur en teacuteleacutechargement Depuis 2014 lrsquoopeacuterateur historique Orange (ex-France Teacuteleacutecom)propose la technologie Very-high-bit-rate Digital Subscriber Line (VDSL) 2 avec des deacutebitsallant jusqursquoagrave 100 Mbits descendant La limite physique de cette TAI impose une dis-tance entre lrsquoabonneacute et le distributeur infeacuterieure agrave 1 Km La derniegravere technologie preacutesentesur lrsquoicircle est la fibre optique Deacuteployeacutee depuis 2007 par lrsquoopeacuterateur priveacute ZEOP elle eacutetaitjusqursquoagrave peu principalement deacuteployeacutee dans les villes du Port Sainte Marie et Saint Pierre

Chaque opeacuterateur dispose drsquoune ou plusieurs technologies drsquoaccegraves Chaque technolo-

3

gie est associeacutee agrave un deacutebit maximal theacuteorique La carte 3 1 preacutesente les deacutebits theacuteoriquesqui sont preacutesents sur lrsquoicircle [France2017]

Cette carte montre une dispariteacute des deacutebits selon les zones geacuteographiques de lrsquoicircleLe Plan France Tregraves Haut Deacutebit a pour objectif drsquouniformiser sur lrsquoensemble du territoirefranccedilais les deacutebits avec le deacuteploiement de la technologie drsquoaccegraves fibre optique

FIGURE 3 ndash Carte des deacutebits agrave La Reacuteunion

Reacutecapitulatif

La connexion agrave Internet donne agrave La Reacuteunion des capaciteacutes importantes La preacutesencedrsquoun GIX sur le territoire a limiteacute le trafic reacuteunionnais sur les cacircbles sous-marins La figure4 montre lrsquoensemble des eacuteveacutenements qui ont marqueacute le deacuteveloppement de lrsquoInternet agrave LaReacuteunion jusqursquoagrave nos jours

Depuis la deacutecision de lrsquoARCEP en 2004 [ARCEP2004] et lrsquoarriveacutee du cacircble LION lesopeacuterateurs ont fait le choix drsquoaugmenter les services proposeacutes avec un prix reacutesidentielstable Les derniers services ajouteacutes sont ceux de la Video on demand (VOD) et de la rediffu-sion (Replay) En 2014 le prix moyen du MeacutegabitMois sur le cacircble SAT-3WASCSAFEavoisinait les 25 D En pregraves de 15 ans on note la baisse du coucirct moyen du Meacutegabitmoisde 17 000 D agrave 25 D

Lrsquoeacutevolution de la connectiviteacute Internet agrave La Reacuteunion est lieacutee au deacuteveloppement de laconnectiviteacute des diffeacuterents pays preacutesents dans la Zone Oceacutean Indien

1 Source Observatoire France Tregraves Haut Deacutebit

4

FIGURE 4 ndash Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion

22 LrsquoInternet dans la Zone de lrsquoOceacutean Indien

Les acteurs du deacuteveloppement du numeacuterique dans la Zone Oceacutean Indien

Dans le cadre de nos eacutetudes nous restreignons la ZOI agrave 6 icircles ou archipels suivants(rangeacutes par ordre alphabeacutetique) les Comores Madagascar Maurice Mayotte La Reacuteunionet les Seychelles Agrave lrsquoexception de Mayotte et de La Reacuteunion qui sont des reacutegions fran-ccedilaises les autres icircles et archipels citeacutes sont des pays indeacutependants Nous allons dansun premier temps faire une preacutesentation des principaux acteurs du deacuteveloppement nu-meacuterique dans chaque territoire Le deacuteveloppement de lrsquoInternet dans la ZOI se fait encollaboration avec lrsquoensemble des pays Nous poursuivrons avec les futures installationsdes cacircbles sous-marins dans la ZOI

LrsquoUnion des Comores est une reacutepublique feacutedeacuterale drsquoAfrique Lrsquoarchipel est connecteacuteagrave Internet depuis le 19 Janvier 1998 via une connexion satellite En 2010 le gouverne-ment deacuteploie le Comoros Domestic Cable Sytem (CDCS) qui relie lrsquoensemble des icircles delrsquoarchipel entre elles avec en parallegravele le raccordement au cacircble Eastern Arfrica SubmarineSYstem (EASSY) [Comores2002] Ce cacircble relie lrsquoAfrique du Sud au Soudan en longeantla cocircte Est du continent En 2009 lrsquoAutoriteacute Nationale de Reacutegulation des TIC (ANRTIC) voitle jour De nombreuses missions sont donneacutees agrave cette autoriteacute comme appliquer et fairerespecter la loi des Technologies de lrsquoInformation et de la Communication (TIC) reacuteguler lesecteur des TIC favoriser la coopeacuteration entre les acteurs et geacuterer les diffeacuterends garan-tir une concurrence saine et loyale entre les opeacuterateurs et de deacutevelopper la recherche laformation et les innovations technologiques [ANRTIC2016] En deacutecembre 2016 un troi-siegraveme cacircble connecte lrsquoarchipel agrave Mayotte Actuellement un Vice-Preacutesident chargeacute desTIC travaille en collaboration avec un Conseiller du preacutesident en matiegravere de transports etteacuteleacutecommunications

La Reacutepublique de Madagascar est relieacutee agrave Internet par deux cacircbles sous-marins Lepremier est lrsquoEASSY Le second cacircble est le LION Au niveau des prises de deacutecisions 3 or-ganismes principaux existent Le plus important est le ministegravere des Teacuteleacutecommunicationset des Nouvelles Technologies Il a mis en place le Projet drsquoInfrastructure de Communicationpour Madagascar (PICOM) Lrsquoobjectif est la reacuteduction des coucircts drsquoaccegraves aux services deteacuteleacutecommunications Le second est lrsquoAutoriteacute de Reacutegulation des TEchnologies de Communica-tion (ARTEC) Cet administration octroie les licences aux proprieacutetaires des reacuteseaux arbitreles diffeacuterends entre opeacuterateurs et assure la gestion des spectres [ARTEC2016] Le dernierorganisme est le Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de la Commu-nication (GOTICOM) Il a pour objectif drsquoaccompagner et drsquoameacuteliorer les infrastructuresde teacuteleacutecommunication et de favoriser lrsquointeacutegration des TIC [GOTICOM2011] Depuis2016 un GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Africaine [MGIX2017]

5

La Reacutepublique de Maurice regroupe les icircles Rodrigues et Maurice Sous lrsquoimpulsiondu gouvernement anglais la premiegravere ligne teacuteleacutephonique fut installeacutee en 1883 Actuel-lement en plus drsquoune connexion satellitaire reliant les deux icircles le SAFE et le LIONconnectent Maurice agrave Internet Un ministegravere des Technologies de lrsquoInnovation et desCommunications existe au sein du gouvernement Crsquoest ce mecircme gouvernement quinomme le directeur de lrsquoInformation and Communication Technologies Authority (ICTA) Crsquoestlrsquoautoriteacute de reacutegulation des Teacuteleacutecoms et des Postes Il existe 2 principaux opeacuterateurs quesont Mauritius Telecom et Emtel Une dizaine drsquoopeacuterateurs cohabitent sur lrsquoicircle [ICTA2017]Depuis 2016 un nouveau GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Afri-caine [MIXP2017]

Mayotte est un deacutepartement franccedilais depuis Mars 2011 Le raccordement au cacircbleLION-2 extension du cacircble LION en avril 2012 rend possible lrsquoarriveacutee du haut deacutebit surce territoire En 2013 un GIX geacutereacute par RENATER est installeacute au sein du Rectorat Il senomme Mayotix

Les Seychelles ont vu leur premiegravere connexion Internet introduite dans lrsquoarchipel parAtlas Seychelles Ltd en septembre 1996 En 2012 les Seychelles sont connecteacutes agrave une fibreen provenance de Tanzanie Crsquoest le cacircble Seychelles to East Africa System (SEAS) Crsquoestlrsquounique cacircble sous-marin connectant lrsquoarchipel Le Ministegravere des Technologie de lrsquoInforma-tion et des Communications (MITC) fait office drsquoautoriteacute de Reacutegulation des Teacuteleacutecommuni-cations dans le pays [DICT2017]

Chaque autoriteacute de reacutegulation agrave un impact sur le deacuteveloppement de lrsquoInternet dansson pays Ce deacuteveloppement se reacutepercute sur lrsquoameacutelioration de lrsquoaccegraves Internet dans laZOI

Deacuteveloppement de lrsquointerconnexion de la Zone Oceacutean Indien

Cette reacutegion a connu un premier bouleversement de sa connectiviteacute agrave Internet avecle deacuteploiement du cacircble sous-marin SAT-3WASCSAFE en 2001 pour La Reacuteunion etMaurice Lrsquoarriveacutee du LION en 2009 a connecteacute Madagascar aux deux icircles En 2010 lesComores et Madagascar se sont ouverts une voie vers lrsquoAfrique avec le cacircble EASSY Lrsquoin-terconnexion du LION 2 a deacuteveloppeacute lrsquoInternet agrave Mayotte tandis que le deacuteploiement ducacircble SEAS a ouvert les Seychelles agrave lrsquoInternet haut deacutebit La carte 5 indique les diffeacuterentscacircbles sous-marins preacutesents dans la ZOI

La ZOI srsquoengage dans le deacuteploiement de nouveaux liensLe cacircble MElting poT Indianoceanic Submarine System (METISS) drsquoune longueur de

3 500 kilomegravetres reliera Madagascar Maurice et La Reacuteunion agrave lrsquoAfrique du Sud La bandepassante du cacircble sera de 24 Tbs Sa mise en service est preacutevue pour le courant de lrsquoan-neacutee 2019 [Lemauricien]

Africa-1 est un cacircble reliant lrsquoAfrique du Sud le Moyen Orient et lrsquoAsie centrale Cecacircble de plus de 12 0000 kilomegravetres passera le long de la cocircte Est africaine avant de relierlrsquoArabie Saoudite lrsquoEacutegypte et le Pakistan La mise en service du cacircble est preacutevue pour lecourant de lrsquoanneacutee 2020 [Africa1]

En 2019 sera mis en service le cacircble IOX IOX est un cacircble sous-marin deacutedieacute agrave lrsquoicircleMaurice Il a pour but drsquooffrir une nouvelle liaison agrave Maurice en reliant lrsquoicircle agrave lrsquoAfrique etau reste du monde Il sera doteacute drsquoune capaciteacute de 54 Tbs [IOX]

La carte 6 repreacutesente lrsquoensemble des IXP preacutesents dans la Zone Oceacutean Indien En vertce sont les points drsquoeacutechanges deacutejagrave en service La France a degraves lrsquoanneacutee 2004 mis en placele point drsquoeacutechange agrave La Reacuteunion et en 2012 celui de Mayotte Ceux de Maurice et de

6

FIGURE 5 ndash Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source [Cablesmap])

Madagascar ont eacuteteacute mis en service en 2016 avec lrsquoaide de lrsquoUnion Africaine de lrsquoInter-net Society et du projet AXIS [AXIS] Les points bleus repreacutesentent les points drsquoeacutechangequi sont preacutevus drsquoecirctre deacuteployeacutes dans la zone oceacutean indien par le projet AXIS dans le fu-tur Drsquoici quelques anneacutees lrsquoensemble des territoires de la zone sera eacutequipeacute drsquoun pointdrsquoeacutechange Cet eacutequipement vise a maintenir le trafic de type Metropolitan Area Network(MAN) du pays ougrave il est installeacute Il facilite les eacutechanges entre les opeacuterateurs locaux enreacuteduisant la latence et en augmentant la qualiteacute de service

FIGURE 6 ndash Carte des points drsquoeacutechange preacutesents actuellement et dans un futur prochedans la ZOI

7

3 Probleacutematique

LrsquoInternet et ses applications ont eacuteteacute deacuteveloppeacutes dans des territoires ougrave les routes sontnombreuses Lrsquoicircle de La Reacuteunion comme beaucoup de territoires insulaires ne beacuteneacuteficiepas drsquoun nombre de liaisons physiques directes important Lrsquoeacutevolution de lrsquoInternet al-lant des applications toleacuterantes aux deacutelais vers des applications temps-reacuteel neacutecessite unerobustesse et une qualiteacute de service deacutependantes drsquoun maillage fort et de deacutelais courts

Lrsquoeacutetude drsquo[Anelli2012] a deacutemontreacute que les deacutelais agrave destination drsquoadresses aleacuteatoiressont sensiblement plus longs depuis La Reacuteunion que depuis Paris avec un eacutecart drsquoenvi-ron 180 ms Suite agrave ce constat lrsquoauteur a reacutealiseacute des simulations estimant les deacutebits asso-cieacutes avec un taux de pertes de 10 Ces simulations ont mis en avant des deacutebits eacutecouleacutesplus faibles pour un usager situeacute agrave La Reacuteunion qursquoun usager baseacute agrave Paris Une augmen-tation de la bande passante nrsquoentraicircnerait pas une diminution des deacutelais Le groupe detravail europeacuteen Reducing Internet Transport Latency (RITE) a reacutealiseacute une videacuteo explicativede ce pheacutenomegravene [RITE2014-2]

Cette thegravese vise agrave mettre en lumiegravere les principaux freins des deacutebits eacutecouleacutes

Dans une premiegravere eacutetape nous eacutetudierons lrsquoeacutevolution des deacutelais depuis La Reacuteunionen prenant comme base lrsquoeacutetude reacutealiseacutee par [Anelli2012]

Dans un second temps nous eacutetudierons les routes logiques de lrsquoInternet reacuteunionnais

Dans un dernier temps nous reacutealiserons une proposition drsquoeacutetude de meacutetrologie Cetteeacutetude vise agrave identifier la correacutelation des eacuteveacutenements de congestion entre les flots lrsquoimpor-tance des anomalies affectant Transmission Control Protocol (TCP) (pertes initiales fauxeacuteveacutenements de congestion) la reacutepartition des flots (en taille en protocole en application)et les paramegravetres de performances (taux de pertesRTT deacutebit eacutecouleacute)

4 Organisation de la thegravese

Suite agrave lrsquoexposition de notre probleacutematique le chapitre 1 preacutesente le contexte scienti-fique de nos travaux Dans un premier temps nous allons preacutesenter les caracteacuteristiquesde TCP et sa probleacutematique lieacutee aux reacuteseaux agrave forte capaciteacute de stockage Nous continue-rons avec une preacutesentation de quelques solutions Nous deacuteterminerons si lrsquoaccegraves Internetde La Reacuteunion doit ecirctre consideacutereacute comme un reacuteseau agrave forte capaciteacute de meacutemorisation Lasuite du chapitre inclura la deacutefinition de la meacutetrologie dans les reacuteseaux et une preacutesenta-tion des techniques de mesures active et passive

La premiegravere eacutetude est deacutecrite dans le chapitre 2 et deacutebute par la preacutesentation des ob-jectifs Un cahier des charges permettant de reacutepondre aux objectifs a eacuteteacute reacutedigeacute Ce cahierdes charges a deacuteboucheacute sur le deacuteploiement de la plate-forme de meacutetrologie active RunPLet du deacuteveloppement de deux outils drsquoaide agrave lrsquoanalyse rgeoloc et rtraceroute La preacutesen-tation du protocole de mesure a eacuteteacute reacutealiseacutee dans la partie preacuteceacutedant celle des reacutesultatsLe chapitre se conclut par une synthegravese des reacutesultats qui ont servi agrave nos contributions

La seconde eacutetude est preacutesenteacutee dans le chapitre 3 Les objectifs du chapitre sont preacute-senteacutes dans un premier temps et diviseacutes en deux Ce chapitre preacutesente la mise en oeuvredrsquoune plate-forme de meacutetrologie et du protocole de mesure associeacute Une section reacutesultatassocieacutee agrave une conclusion termine le chapitre Ce chapitre a fait lrsquoobjet drsquoune contributionscientifique

Nous concluons notre thegravese par un reacutesumeacute des diffeacuterentes contributions Un apportsur les perspectives qursquoautorisent nos travaux est proposeacute dans le chapitre 35

8

Chapitre 1

Eacutetat de lrsquoart

Transmission Control Protocol (TCP) est le protocole de transport le plus utiliseacute sur lrsquoIn-ternet Lrsquoeacutetude reacutealiseacutee par Center for Applied Internet Data Analysis (CAIDA) sur une du-reacutee de 2 ans du trafic passant par le point drsquoeacutechange (IXP) EQUNIX de Chicago a montreacuteque 90 97 des paquets Internet Protocol (IP) acheminent des segments TCP [EQUINIX]TCP est un protocole de transport qui rend un service de transfert fiable de donneacuteesLorsque la somme du deacutebit des eacutemetteurs TCP partageant une mecircme ressource du reacute-seau excegravede la capaciteacute de cette ressource il se produit de la congestion La congestionest un pheacutenomegravene indeacutesirable qui met le reacuteseau dans un eacutetat ougrave le service rendu est deacute-gradeacute Cette deacutegradation peut ecirctre seacutevegravere en fonction de lrsquointensiteacute du pheacutenomegravene Poureacuteviter que lrsquoeffet de la congestion empire quand elle apparaicirct TCP integravegre une fonctionde reacutesolution connue sous le nom de controcircle de congestion Le principe est que chaqueeacutemetteur deacutetecte la congestion et diminue son deacutebit drsquoeacutemission Pour se faire le controcirclede congestion srsquoappuie sur la boucle de controcircle constitueacutee entre lrsquoeacutemission drsquoun segmentde donneacutees et la reacuteception de lrsquoacquittement correspondant Le controcircle de congestionagit sur le deacutebit drsquoeacutemission de lrsquoeacutemetteur avec une latence lieacutee au Round-Trip delay Time(RTT) Lorsque le produit du RTT avec la capaciteacute drsquoeacutecoulement offerte par le reacuteseau estrelativement important le controcircle de congestion de TCP peine agrave utiliser les ressourcesdu reacuteseau efficacement Ce produit du deacutelai et du deacutebit repreacutesente la quantiteacute de donneacuteesnon acquitteacutees qui peut circuler On peut assimiler ce produit agrave la capaciteacute de stockage dedonneacutees dans le reacuteseau

Ces derniegraveres anneacutees lrsquoaugmentation de la bande passante a fait croicirctre significative-ment cette capaciteacute de stockage En effet comme les deacutelais nrsquoont pas diminueacute dans lesmecircmes proportions la capaciteacute de stockage nrsquoa fait que croicirctre Cette eacutevolution pose undeacutefi au controcircle de congestion de TCP pour maintenir ses performances Cette eacutevolutiona entraicircneacute une activiteacute intense de recherche pour traiter ce problegraveme de produit deacutelai-bande passante pour TCP Ainsi de nouvelles versions du controcircle de congestion de TCPont eacuteteacute eacutetudieacutees pour lrsquoadapter aux speacutecificiteacutes des reacuteseaux agrave forte capaciteacute de stockageLong Fat Network (LFN)

Si le stockage important de donneacutees dans le reacuteseau pose un problegraveme pour le controcirclede congestion de TCP qursquoen est-il en pratique dans le cas de lrsquoInternet agrave La Reacuteunion Pourreacutepondre agrave cette question il faut pouvoir mesurer lrsquoexistant Depuis quelques anneacutees ily a un inteacuterecirct croissant pour la mesure Une science de la mesure sur lrsquoInternet se deacute-veloppe Il faut chercher dans la croissance continue et soutenue de lrsquoInternet ainsi quedans lrsquoabsence drsquoune exploitation coordonneacutee les motivations agrave deacutevelopper la meacutetrologiesur Internet Cette meacutetrologie vise agrave mieux comprendre le fonctionnement de lrsquoInternet

Ce chapitre se compose de deux sections theacutematiques La premiegravere section 11 traitede la probleacutematique du controcircle de congestion de TCP utiliseacute sur les reacuteseaux agrave grande

9

capaciteacute de stockage La sous-section 111 rappelle le principe du controcircle de conges-tion et sa mise en œuvre dans TCP Dans la partie 112 les problegravemes speacutecifiques ducontrocircle de congestion de TCP appliqueacute dans le contexte des reacuteseaux agrave forte capaciteacute demeacutemorisation sont indiqueacutes Face agrave ces problegravemes des propositions ont eacuteteacute eacutetudieacutees quenous preacutesenterons dans les parties 113 et 114 Pour conclure cette section nous pose-rons dans la sous-section 115 les arguments qui permettent drsquoavancer que lrsquoicircle de LaReacuteunion a une connectiviteacute qui srsquoapparente agrave celle des reacuteseaux agrave forte capaciteacute de sto-ckageLa seconde section 12 est consacreacutee agrave la meacutetrologie du trafic Internet La deacutefinition et lesmeacutethodologies de la meacutetrologie sont indiqueacutees dans la partie 121 La preacutesentation de lameacutetrologie active sera reacutealiseacutee dans la section 122 suivie par celle de la meacutetrologie pas-sive dans la section 123 La comparaison entre la meacutetrologie active et passive termineracette preacutesentation et sera faite dans la partie 124 Pour conclure ce chapitre une synthegraveseest reacutealiseacutee par la section 13 dans laquelle nous tirons les enseignements pour mener deseacutetudes depuis et vers La Reacuteunion

11 Le controcircle de congestion TCP et les reacuteseaux agrave grande capa-citeacute de stockage

TCP est un protocole de transport creacuteeacute en 1980 et deacutecrit pour la premiegravere fois dans le[RFC793] il a subi depuis de nombreuses eacutevolutions comme lrsquoindique le [RFC7414] Lesuccegraves de TCP repose sur son service de transmission fiable et ordonneacutee drsquoun flux de don-neacutees asynchrones Crsquoest un protocole fonctionnant de point agrave point et de bout en bout au-trement dit entre lrsquoeacutemetteur et le reacutecepteur des donneacutees sans concerner les eacutequipementsintermeacutediaires TCP offre un service de communication eacutequivalent agrave un canal virtuel bi-directionnel entre 2 entiteacutes applicatives Le canal de communication se caracteacuterise par satransparence seacutemantique crsquoest-agrave-dire par lrsquoabsence drsquoalteacuteration des donneacutees transfeacutereacuteesPour reacutealiser cette fiabiliteacute de lrsquoeacutechange TCP supervise les eacutechanges de donneacutees par desacquittements (Acknowledgement (ACK)) Cette supervision forme une boucle de controcirclecorrespondant agrave lrsquoeacutemission de donneacutees et agrave la reacuteception de lrsquoacquittement correspondantElle se caracteacuterise par le deacutelai pris nommeacute RTT La correction des donneacutees perdues oualteacutereacutees en cours de transit srsquoeffectue par retransmission de ces donneacutees Si le principe defonctionnement de TCP srsquoeacutenonce facilement sa mise en œuvre est complexe du fait de lanon fiabiliteacute du protocole IP sous-jacent et de la diversiteacute des contextes drsquoutilisation deTCP Lrsquoarticle [Ros2005] deacutetaille les diffeacuterentes caracteacuteristiques du protocole lieacutees agrave lrsquoeacuteta-blissement de connexion la numeacuterotation des donneacutees et agrave la fiabilisation des eacutechanges

Outre lrsquoobjectif de fiabiliteacute TCP a aussi un objectif de performance pour le servicerendu en termes de deacutebit eacutecouleacute et drsquoutilisation des capaciteacutes de transmission du reacuteseauPour atteindre cet objectif pour le service TCP integravegre une fonction de controcircle de flux quirepose sur une fenecirctre glissante geacutereacutee par le reacutecepteur Ainsi le deacutebit drsquoeacutemission peut srsquoali-gner sur le deacutebit de reacuteception de sorte qursquoun reacutecepteur lent ne puisse ecirctre satureacute par unexpeacutediteur rapide La speacutecification initiale de TCP a eacuteteacute conccedilue sans prendre en compteles ressources du reacuteseau Cet oubli a eacuteteacute agrave la source de dysfonctionnements seacutevegraveres du reacute-seau comme lrsquoeffondrement ducirc agrave la congestion (congestion collapse) [Afanasyev2010] Lafonction de controcircle de congestion vise agrave une prise en compte des ressources disponiblesdu reacuteseau et agrave leurs utilisations efficaces Le controcircle de congestion a susciteacute un travail derecherche intensif et ce sujet reste encore drsquoactualiteacute comme lrsquoindique le [RFC6077]

111 Controcircle de congestion de TCP

Drsquoapregraves [Jain1990] la congestion srsquoexprime par lrsquoeacutequation matheacutematique 11

10

sumDemande gt Ressources (11)

Du point de vue drsquoun reacuteseau par commutation de paquets les ressources sont princi-palement les meacutemoires tampon des nœuds de commutation et la capaciteacute de transmissiondes artegraveres de communication La congestion apparaicirct au niveau des nœuds de commu-tation et plus particuliegraverement sur leurs interfaces de sortie La condition pour voir ap-paraicirctre une congestion est laquo si la somme des deacutebits des flux arrivant sur lrsquointerface desortie est supeacuterieure agrave la capaciteacute de transmission du lien en sortie raquo Dans cette situationune file drsquoattente se constitue et quand elle deacuteborde les effets neacutefastes de la congestionse concreacutetisent A savoir que le taux de pertes des paquets augmente dans le reacuteseau cequi se traduit au niveau du service par un deacutebit eacutecouleacute qui chute et un deacutelai de trans-fert qui augmente Dans [Chiu1989] les auteurs montrent que la performance du reacuteseauest lieacutee agrave la charge appliqueacutee au reacuteseau Formellement la charge srsquoexprime comme tauxdrsquoarriveacutee sur le taux de service Informellement la charge repreacutesente la proportion de lademande autrement dit du trafic eacutemis par rapport agrave la capaciteacute de transfert La figure11 illustre lrsquoeacutevolution du deacutebit eacutecouleacute (throughput) et du RTT en fonction de la chargeappliqueacutee au reacuteseau (load) Au deacutebut le deacutebit eacutecouleacute srsquoaccroicirct avec la charge alors queles deacutelais nrsquoaugmentent presque pas On est dans une phase de remplissage des liensLorsque la charge srsquoapproche du taux de remplissage maximum des liens du reacuteseau Ledeacutebit eacutecouleacute nrsquoaugmente presque plus alors que les deacutelais augmentent fortement Crsquoestla phase de remplissage des files drsquoattente Ces deux phases sont seacutepareacutees par un pointcaracteacuteristique qui srsquoappelle le point drsquoinflexion (knee) Lorsque les files drsquoattente sontpleines et que la charge du reacuteseau continue de srsquoaccroicirctre les files drsquoattente vont deacutebor-der Agrave partir de ce point appeleacute le point de retournement (cliff ) le reacuteseau rentre dans lrsquoeacutetatdit drsquoeffondrement ducirc agrave la congestion (congestion collapse)

FIGURE 11 ndash Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989])

Lrsquoeffondrement ducirc agrave la congestion est rapporteacute par [Nagle1984] Dans cet eacutetat le reacute-seau enregistre des retransmissions abusives effectue des transferts avec des deacutelais ten-dant vers lrsquoinfini et rend un service avec un deacutebit eacutecouleacute proche de zeacutero Lrsquoeffondrementducirc agrave la congestion srsquoexplique par le gaspillage des ressources utiliseacutees en amont du point

11

de perte du paquet La solution agrave lrsquoeffondrement ducirc agrave la congestion reacuteside en lrsquoalignementdu deacutebit de lrsquoeacutemetteur agrave la capaciteacute drsquoeacutecoulement du canal de communication offert parle reacuteseau afin de ne produire aucune perte Ainsi les objectifs assigneacutes au controcircle decongestion de TCP sont drsquoeacuteviter lrsquoeacutetat drsquoeffondrement ducirc agrave la congestion drsquoallouer eacutequi-tablement les ressources du reacuteseau entres les flux concurrents et drsquooptimiser les perfor-mances obtenues par chaque flux [RFC2914]

Le controcircle de congestion de TCP fonctionne sur le principe de la boucle fermeacutee avecle reacuteseau vu comme une boicircte noire ainsi preacutesenteacute par la figure 12 Apregraves une stimu-lation sous la forme de lrsquoenvoi de paquets lrsquoobservation du comportement de la boicirctenoire agrave ce stimulus sera analyseacute par le controcircleur situeacute dans lrsquoeacutemetteur Le controcircleur rap-proche lrsquoobservation faite en retour du stimulus (feedback) par rapport agrave lrsquoobjectif affecteacuteau controcircleur Celui-ci par reacutetro-action ajustera le nombre des paquets suivants envoyeacutesCet ajustement est le reacutesultat drsquoune fonction de controcircle qui se base sur une perceptionbinaire des retours agrave savoir absence ou preacutesence de congestion

FIGURE 12 ndash Boucle fermeacutee du CC de TCP

Dans [Gevros2001] lrsquoauteur liste les moyens pour effectuer les observations que lrsquoonnomme en fait des notifications dans le contexte des reacuteseaux Les notifications de lacongestion dans le reacuteseau peuvent ecirctre implicites ou explicites Dans le premier caselles sont deacuteduites par lrsquoabsence drsquoACK Lrsquoaugmentation des deacutelais et les pertes des don-neacutees sont des causes possibles pour la non-reacuteception de lrsquoACK A lrsquoinverse lrsquoabsence decongestion est deacuteduite par la reacuteception drsquoun ACK Cette reacuteception autorise lrsquoenvoi drsquounnouveau paquet comme le montre [Jacobson1988-1] Les notifications peuvent ecirctre ex-plicites si les paquets veacutehiculent une marque mise par lrsquoeacuteleacutement congestionneacute commecrsquoest le cas avec la proposition Explicit Congestion Notification (ECN) [RFC3168] Nous re-viendrons sur cette proposition dans la sous-section 113 Lorsque le controcircleur deacuteduitla preacutesence de congestion il reacuteduit le deacutebit drsquoeacutemission de la source Le deacutebit est controcircleacuteagrave lrsquoaide drsquoune fenecirctre appeleacutee la fenecirctre de congestion (Congestion Window (CWND) ω)Elle indique la quantiteacute de donneacutees qui peut ecirctre eacutemise sur un RTT Autrement dit elleindique combien de donneacutees non acquitteacutees peut recevoir le canal de communicationSa taille eacutevolue dans le temps en fonction de lrsquoeacutetat du reacuteseau et selon une fonction decontrocircle Additive Increase and Multiplicative Decrease (AIMD) La fenecirctre drsquoeacutemission uti-liseacutee par un eacutemetteur TCP est le minimum entre la fenecirctre de congestion et la fenecirctreglissante du controcircle de flux Le controcircle de congestion comporte deux phases distinctes[Gevros2001]

mdash La premiegravere phase se nomme eacutevitement de la congestion (congestion avoidance) et sesitue autour du point drsquoinflexion de la figure 11

mdash La seconde phase se nomme reacutesolution de la congestion (congestion recovery) Ellese deacuteclenche quand lrsquoeacutetat du reacuteseau se situe au delagrave du point drsquoinflexion

Dans la phase de congestion avoidance le controcircle de congestion de TCP utilise deux al-gorithmes le deacutemarrage en douceur (slow-start (SS)) et lrsquoeacutevitement de congestion (conges-tion avoidance (CA)) Au deacutebut de la connexion TCP nrsquoa aucune connaissance de lrsquoeacutetat dureacuteseau autrement dit de lrsquoeacutetat du canal de communication entre lrsquoeacutemetteur et le reacutecep-teur TCP utilise lrsquoalgorithme du deacutemarrage en douceur pour sonder le canal Lrsquoobjectif

12

est drsquoatteindre le point drsquoinflexion rapidement et sans risquer de congestionner le canalpar des rafales Pour cela lrsquoalgorithme du deacutemarrage en douceur va eacutetaler sur plusieursRTT la croissance de la taille fenecirctre de congestion jusqursquoagrave atteindre une estimation dupoint drsquoinflexion Ainsi lrsquoeacutemetteur commence avec une fenecirctre de congestion assez pe-tite et lrsquoouvre au fur et agrave mesure et de plus en plus vite avec lrsquoarriveacutee des acquittementsPlus preacuteciseacutement le rythme de croissance de la taille de la fenecirctre de congestion est surle doublement tous les RTT Quant la fenecirctre de congestion atteint un certain seuil noteacuteslow-start threshold (ssthresh) le deacutemarrage en douceur srsquoarrecircte et lrsquoalgorithme drsquoeacutevite-ment de congestion est maintenant utiliseacute Cet algorithme augmente lineacuteairement et pluslentement que le deacutemarrage en douceur la taille de la fenecirctre de congestion En lrsquoabsencedrsquoindication explicite par le reacuteseau du deacutebit disponible sur le canal de communicationlrsquoeacutemetteur TCP continue de faire le sondage du canal et veacuterifie si le deacutebit eacutecouleacute peut ecirctreencore augmenteacute Pour lrsquoauteur de [Sallantin2014] lorsque la connexion TCP utilise lrsquoal-gorithme drsquoeacutevitement de congestion elle entre alors dans un eacutetat stable Dans cet eacutetat laconnexion doit se deacuterouler avec un deacutebit eacutecouleacute eacuteleveacute Crsquoest une indication que le pointdrsquoinflexion est atteint

La figure 13 donne une repreacutesentation simplifieacutee des eacutetats du controcircle de congestionde TCP Elle indique que lrsquoeacutetat stable peut ecirctre quitteacute si la connexion est libeacutereacutee ou si ily a un eacuteveacutenement de congestion TCP assimile les pertes implicitement agrave un eacuteveacutenementde congestion Lrsquoeacuteveacutenement de congestion fait basculer le controcircle de congestion de TCPdans la phase de reacutesolution de la congestion Dans cette phase la reprise de la perte oudes pertes est effectueacutee et la taille de la fenecirctre de congestion est diminueacutee et ceci afin dediminuer le deacutebit drsquoeacutemission

On distingue deux faccedilons de deacutetecter un eacuteveacutenement de congestion Une meacutethodesrsquoappuie sur la reprise de perte de TCP par retransmission des donneacutees perdues sur ex-piration drsquoun temporisateur (Retransmission TimeOut (RTO)) Une autre meacutethode utilisela caracteacuteristique de TCP qui consiste agrave ce que le reacutecepteur envoie un acquittement agravechaque segment de donneacutees reccedilu en seacutequence Ce segment porte le numeacutero des derniegraveresdonneacutees reccedilues seacutequentiellement Ainsi la reacuteception de donneacutees entraicircnant une rupturede la numeacuterotation en seacutequence geacutenegravere lrsquoeacutemission drsquoun acquittement dupliqueacute (Dupli-cate Acknowledgement (DupAck)) par le reacutecepteur Agrave la reacuteception de trois DupAck parlrsquoeacutemetteur les donneacutees indiqueacutees par la rupture de seacutequencement sont consideacutereacutees per-dues et retransmises sans attendre lrsquoexpiration du RTO Ce principe de retransmissionrapide porte le nom de fast retransmit (FR) Lrsquoalgorithme de reacutecupeacuteration rapide (fast reco-very (FR)) va maintenir la quantiteacute de donneacutees en transit dans le canal de communicationpour eacuteviter lrsquoeacutemission drsquoune rafale lorsqursquoun nouvel acquittement sera reccedilu En lrsquoabsencedu fast recovery agrave la reacuteception drsquoun nouvel acquittement la fenecirctre pourrait se vider parune rafale correspondant agrave des eacutemissions de paquets de donneacutees dos agrave dos sur un deacute-bit supeacuterieur agrave celui du deacutebit drsquoeacutecoulement du canal Ceci aurait pour effet de saturer lecanal et de renvoyer la connexion TCP dans une phase de reacutesolution de la congestion

Lorsque les eacutemissions de lrsquoeacutemetteur sont bloqueacutees par des donneacutees eacutemises et jamaisacquitteacutees le blocage est rompu par le RTO et ceci quel que soit lrsquoeacutetat Les deacutetails dela mise en œuvre des algorithmes du controcircle de congestion TCP sont deacutecrits par le[RFC5681]

Historiquement la version deacutenommeacutee TCP Tahoe incorporait la fonction de controcirclede congestion deacuteveloppeacutee en 1888 Elle comportait les algorithmes de slow-start conges-tion avoidance et de fast retransmit [Jacobson1988-1] La reprise de perte par fast retransmitsouffrait drsquoinefficaciteacute elle a eacuteteacute corrigeacutee avec lrsquoalgorithme du fast recovery Cette versionagrave quatre algorithmes est la version connue sous le nom de Reno et publieacutee la premiegraverefois en 1997 par le [RFC2001] Le couplage fast retransmit - fast recovery souffrait de deacutefauts

13

Deacutebut13

de13

connexion

Deacutemarrage13

en13

douceur

Etat13

stable

FRFR

Fin13

de13

connexion

3 Dupack

nouvel 13

ack

RTO

RTO

cwnd gt ss

tresh

SYN13

SYNACK

FIN-FINACK

FIGURE 13 ndash Etats du controcircle de congestion de TCP

lorsqursquoun eacuteveacutenement de congestion comportait plusieurs pertes Le [RFC2582] apportaitun correctif en 1999 On parla alors de version NewReno du controcircle de congestion En2005 une eacutetude montra que crsquoeacutetait la version du controcircle de congestion de TCP la plusutiliseacutee sur lrsquoInternet [Medina2005] Depuis de nouvelles versions ont eacuteteacute deacuteployeacutees dansles systegravemes drsquoexploitation tels que Windows et Linux appeleacutes respectivement C-TCP[Tan2006] et CUBIC [Ha2008] Dans la section 112 ces versions seront deacutetailleacutees

Le fonctionnement caracteacuteristique du controcircle de congestion de TCP est illustreacute parla figure 14 extraite de [Huston2000] Elle montre lrsquoeacutevolution de la fenecirctre de conges-tion dans le temps (exprimeacutee en terme de RTT) sur un canal de communication virtuelentre 2 stations Il srsquoagit ici drsquoun sceacutenario ideacutealiseacute dans lequel la connexion TCP nrsquoest pasen concurrence avec drsquoautres connexions La congestion se produit toujours agrave la mecircmevaleur de fenecirctre et pour laquelle la file drsquoattente deacuteborde Cette figure montre les deuxcaracteacuteristiques du controcircle de congestion de TCP qui deacutecoulent de la phase drsquoeacutevitementde congestion et de reacutesolution de la congestion et qui sont

mdash Lrsquoagressiviteacute elle provient du sondage du canal de communication LrsquoeacutemetteurTCP va chercher agrave accroicirctre le deacutebit eacutecouleacute en augmentant graduellement son deacutebitdrsquoeacutemission par lrsquoagrandissement de la taille de la fenecirctre de congestion

mdash La reacuteactiviteacute lorsque le canal de communication est plein et qursquoil deacuteborde quandcette perte est deacutetecteacutee lrsquoeacutemetteur TCP reacuteagit et diminue la taille de sa fenecirctre afinde diminuer son deacutebit drsquoeacutemission

Ces deux caracteacuteristiques donnent cette figure en dents de scie de la fenecirctre de conges-tion

112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de sto-ckage

Un reacuteseau agrave forte capaciteacute de stockage est un reacuteseau avec un produit deacutelai-bandepassante (Bandwidth Delay Product (BDP)) eacuteleveacute Dans lrsquoouvrage [Peterson2007] lrsquoauteureffectue une analogie du produit deacutelai-bande passante avec un tuyau Le deacutelai corres-pond agrave la longueur du tuyau et la bande passante au diamegravetre du tube Ainsi le BDPest le volume du tube Dans le cas drsquoun reacuteseau informatique le volume du tuyau srsquoex-prime en bits Ainsi lorsqursquoun canal de communication entre un eacutemetteur et un reacutecepteurpreacutesente un produit deacutelai-bande passante important un volume important de bits (autre-ment dit de donneacutees) peut ecirctre eacutemis avant de recevoir une notification Du point de vue

14

FIGURE 14 ndash Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP

de lrsquoeacutemetteur TCP ce volume de donneacutees injecteacute dans le reacuteseau sont des donneacutees nonencore acquitteacutees Les reacuteseaux qui offrent des canaux de communication avec un pro-duit deacutelai-bande passante important sont nommeacutes en anglais Long Fat Network (LFN) Le[RFC1072] preacutecise qursquoun LFN agrave un produit deacutelai-bande passante supeacuterieur agrave 12 5 Ko

Sachant que le controcircle de congestion de TCP srsquoappuie sur une reacutetro-action selon unepeacuteriode de RTT et que le deacutebit eacutecouleacute maximal est atteint lorsque la fenecirctre drsquoeacutemissionest au moins supeacuterieure au produit deacutelai(RTT)-bande passante du canal de communica-tion lrsquoutilisation de TCP sur un reacuteseau LFN a des conseacutequences neacutegatives sur la perfor-mance Les causes sont agrave chercher du cocircteacute du RTT et du produit deacutelai-bande passante quiprennent tous les deux des valeurs importantesDans le cas du RTT crsquoest le deacutelai de reacuteactiviteacute de TCP qui est impacteacute En effet quandle RTT est eacuteleveacute la dynamique de TCP est ralentie car lrsquoeacutemetteur TCP doit attendre pluslongtemps pour recevoir un ACK et savoir quoi faire par la suite

Pour ce qui concerne le produit deacutelai-bande passante crsquoest le deacutebit eacutecouleacute qui peutecirctre faible par rapport au deacutebit du canal de communication (sa bande passante) La fe-necirctre drsquoeacutemission de TCP nrsquoatteint pas la valeur du produit deacutelai-bande passante lrsquoeacutemet-teur se trouve alors bloqueacute en attente de lrsquoACK pour eacutemettre de nouvelles donneacutees Cespeacuteriodes de blocage concourent agrave faire chuter le taux drsquoutilisation du canal de communi-cation

Par la suite nous allons deacutetailler les conseacutequences de la faible reacuteactiviteacute et drsquoune fe-necirctre drsquoeacutemission importante agrave atteindre sur lrsquoefficaciteacute de TCP La probleacutematique se poseen terme de deacutemarrage de connexion et son implication pour le transfert des flots courtsde taille maximale possible de la fenecirctre de congestion et de reacutesolution de la congestion

Le deacutemarrage de connexion

Le deacutebut des connexions de TCP se fait agrave lrsquoaide de lrsquoalgorithme du deacutemarrage en dou-ceur Nous avons vu preacuteceacutedemment que ce meacutecanisme double la fenecirctre de congestionen un RTT Lorsque la fenecirctre de congestion atteint la valeur seuil ssthresh lrsquoalgorithmedrsquoeacutevitement de congestion est utiliseacute La valeur initiale du seuil est fixeacutee arbitrairementce qui soumet TCP agrave deux problegravemes Le doublement de la fenecirctre de congestion quandelle atteint des valeurs importantes constitue des increacutements avec une granulariteacute de plusen plus grosse Si la valeur de ssthresh est trop grande par rapport au BDP avec un grosincreacutement le deacutepassement du BDP peut conduire agrave eacutemettre trop de paquets causantdes pertes multiples induisant une augmentation de la latence et une reacuteduction du deacute-bit eacutecouleacute Dans le cas ougrave la valeur du ssthresh est trop basse par rapport au BDP la

15

connexion TCP va utiliser preacutematureacutement lrsquoalgorithme drsquoeacutevitement de congestion avecune increacutementation lineacuteaire Ce changement preacutematureacute aura pour conseacutequence une sous-utilisation de lrsquoalgorithme de deacutemarrage en douceur speacutecialement dans le cas ougrave le BDPest tregraves eacuteleveacute [Wang2004]

Le deacutemarrage de connexion est particuliegraverement important pour les flots courts TCP(short lived TCP flow) Un flot court TCP se deacutefinit comme un flot dont la taille est in-feacuterieure ou eacutegale agrave 10 segments TCP [Sallantin2014] La probleacutematique des flots courtsprovient du fait qursquoils nrsquoont pas assez de donneacutees pour quitter lrsquoeacutetape du deacutemarrage endouceur En effet la taille de la fenecirctre de congestion nrsquoa pas le temps drsquoatteindre la va-leur du produit deacutelai-bande passante que la totaliteacute des donneacutees ont eacuteteacute transmises Laconseacutequence est qursquoils ont fonctionneacute avec une fenecirctre de congestion qui est resteacutee rela-tivement petite Dans le cas drsquoun LFN le rapport de la taille de la fenecirctre de congestionsur le produit deacutelai-bande passante tend vers zeacutero et neacutecessite plusieurs RTT Il srsquoensuitque le deacutebit eacutecouleacute est extrecircmement faible De plus si le flot court souffre drsquoun eacuteveacutene-ment de congestion il sera particuliegraverement peacutenaliseacute Il a de fortes chances que la reprisesrsquoeffectue avec un RTO avec un deacutelai maximum de 1 agrave 3 secondes [RFC6298] Ce genrede flots nrsquoa pas toujours assez de donneacutees eacutemises apregraves la perte pour geacuteneacuterer trois Du-pAck et proceacuteder agrave une reprise par fast retransnmit Comme ces flots repreacutesentent drsquoapregraves[Ciullo2009] 90 des flux preacutesents dans lrsquoInternet leur sous-performance sur les LFN estprobleacutematique

La reacutesolution de la congestion

TCP deacutetecte une perte par lrsquoexpiration du RTO ou par la reacuteception de trois DupAckTCP va reacuteagir en deux temps en renvoyant le paquet perdu et en divisant par deux lafenecirctre de congestion Si la taille de la fenecirctre est importante la division par deux vaentraicircner une chute significative de la capaciteacute drsquoenvoi Par rapport au produit deacutelai-bande passante cette division par deux peut entraicircner une sur-reacuteaction de lrsquoeacutemetteur Ledeacutebit eacutecouleacute apregraves un eacuteveacutenement de congestion peut devenir faible et se pose le problegravemede la dynamique de sondage

Dynamique du sondage

TCP a un objectif de performance en terme de deacutebit eacutecouleacute et drsquoutilisation des capa-citeacutes de transmission du reacuteseau TCP possegravede un comportement conservateur Avec lafonction de controcircle AIMD TCP aura besoin drsquoun cycle eacutegal agrave ω2 RTT pour reacutecupeacutererune taille de fenecirctre eacutegale agrave celle avant reacuteduction Dans les reacuteseaux agrave forte capaciteacute destockage TCP tend agrave ecirctre trop prudent agrave ouvrir sa fenecirctre de congestion trop lentementLa capaciteacute de stockage importante demande un nombre de cycles important pour quela fenecirctre de congestion puisse couvrir le BDP Durant ce temps il est important de nepas avoir de pertes Lrsquoexemple donneacute par le [RFC3649] preacutesente un reacuteseau agrave une capa-citeacute de 10 Gbits un deacutelai de 100 ms et une taille de paquets drsquoun maximum de 1500octets Cela demanderait un eacutechange drsquoune dureacutee de deux heures environ De plus la to-taliteacute des paquets devront ecirctre transmis dans la dureacutee indiqueacutee preacuteceacutedemment Le tauxde perte maximal permettant lrsquousage de la totaliteacute de la bande passante est de lrsquoordrede 10minus10 Crsquoest un taux de perte irreacutealiste Il faut donc appliquer une autre fonction decontrocircle pour utiliser efficacement la capaciteacute des liens et pour reacutepondre rapidement auxchangements drsquoeacutetats du reacuteseau

16

113 Un controcircle de congestion de TCP adapteacute aux LFN

Pour rappel dans la partie 111 nous avons vu que le controcircle de congestion de TCPse deacutecoupait en deux phases La premiegravere phase de congestion avoidance comporte les al-gorithmes de sondage alors que la seconde phase dite de congestion recovery comporte lesalgorithmes de reacutesolution de la congestion Nous preacutesentons les propositions qui visentagrave changer le controcircle de congestion de TCP sur ces deux phases pour les adapter auxcontraintes des LFN et donc traiter les problegravemes que nous avons mis en eacutevidence dansla sous-section 112 Lrsquoutilisation de TCP sur des reacuteseaux agrave forte capaciteacute de stockage asusciteacute des propositions qui sont classeacutees dans le tableau 11 Ces propositions vont ecirctredeacutetailleacutees dans la suite de ce manuscrit

TABLE 11 ndash Tableau de synthegravese des propositions

Phase Problegraveme SolutionsCongestion avoidance Deacutemarrage de

connexionInitial Spreading Reacuteduc-tion du RTO Quick-startJump Start

Congestion recoveryReacutesolution decongestion

MulTCP

Dynamique dusondage

HighSpeed TCP C-TCPBIC CUBIC

Le deacutemarrage de connexion

Lrsquoideacutee de la premiegravere solution est de reacuteduire le nombre de cycles au deacutemarrage drsquounflot Le doublement de la taille lorsque la fenecirctre de congestion vaut 2 segments parexemple conduit agrave un increacutement qui reste faible sur un RTT Le principe de la premiegraveresolution est drsquoaugmenter la taille initiale de la fenecirctre de congestion (Initial Window (IW))[RFC6928] Avec une taille initiale de fenecirctre de congestion eacutequivalent agrave 10 Maximun Seg-ment Size (MSS) lrsquoeacutemetteur peut transmettre degraves le deacutebut de connexion une rafale de 10segments Parmi les avantages de cette solution on peut citer la reacuteduction de la latencedu transfert de donneacutees en consideacuterant que le canal ne sera pas congestionneacute Un des in-conveacutenients de cette solution est la possibiliteacute de congestionner la file drsquoattente du goulotdrsquoeacutetranglement Afin de reacutesoudre ce problegraveme [Sallantin2014] propose lrsquoInitial SpreadingCette proposition combine lrsquoaugmentation de la fenecirctre drsquoeacutemission et le meacutecanisme drsquoes-pacement meacutecanisme limitant la preacutesence de rafales Ces travaux ont fait lrsquoobjet drsquouneproposition aupregraves de lrsquoInternet Engineering Task Force (IETF) [Arnal2014]

La deacutetection drsquoune perte au deacutepart du deacutemarrage en douceur se fait agrave travers lrsquoex-piration du RTO soit trois secondes Pour ameacuteliorer la reprise sur erreur le [RFC6298]propose de reacuteduire la dureacutee du RTO agrave une seconde Cette reacuteduction du RTO autorise uneretransmission plus rapide des paquets perdus et apporte un gain relativement importantpour des flots qui ont une latence tregraves faible comme celle des flots courts

Une autre solution eacutevalueacutee par [Scharf2008-1] et deacutecrite par le [RFC4782] se nommeQuick-start Lrsquoeacutemetteur eacutemet une requecircte contenant le deacutebit drsquoeacutemission qursquoil souhaite uti-liser Chaque nœud traverseacute peut alors accepter rejeter ignorer ou modifier la requecircteen fonction de son deacutebit disponible Pour bien fonctionner ce meacutecanisme de neacutegociationneacutecessite que lrsquoensemble des routeurs traverseacutes aient reacutepondu agrave la requecircte La figure 15compare les performances du deacutemarrage en douceur (en rouge) et de Quick-start sur unteacuteleacutechargement vu depuis le serveur Le serveur a eacutemis deux requecirctes la premiegravere agrave undeacutebit de 8192 Mbits (en vert) et lrsquoautre pour un deacutebit drsquoune valeur de 512 Mbits (en

17

bleu) Lrsquoaxe des abscisses repreacutesente la latence (dureacutee de la connexion) depuis lrsquoeacutemissionde la demande drsquoeacutetablissement de connexion et en ordonneacutee le deacutebit drsquoeacutemission Les deacute-bits ont eacuteteacute calculeacutes agrave partir de la quantiteacute de donneacutees moyenne eacutemises en un RTT Les reacute-sultats montrent des performances supeacuterieures de Quick-start par rapport au deacutemarrageen douceur En effet une requecircte de Quick-start avec un deacutebit suffisamment eacuteleveacute per-met drsquoatteindre rapidement lrsquoutilisation maximale de la bande passante disponible Ledeacutemarrage en douceur limite la croissance du deacutebit drsquoeacutemission On remarque eacutegalementque si la valeur seuil du deacutemarrage est trop basse le deacutebit drsquoeacutemission croicirct beaucoupmoins rapidement (lien en pointilleacute sur la figure 15) Quick-start reste performant sur lesflots courts en appliquant un deacutebit drsquoeacutemission qui sera eacutequivalent agrave un flot long

FIGURE 15 ndash Principe de Quick-Start (Source [Scharf2008-1])

Dans lrsquoarticle [Liu2007] lrsquoauteur preacutesente Jump Start Cette proposition reacutealise uneestimation des donneacutees precirctes agrave ecirctre envoyeacutees ainsi que du RTT Lrsquoobjectif est drsquoeacutemettreles segments de faccedilon reacuteguliegravere en un RTT Ce meacutecanisme srsquoavegravere trop agressif dans lesenvironnements congestionneacutes Le nombre de segments envoyeacutes en un RTT peut ecirctreimportant et ainsi causer de seacutevegraveres deacutegradations de performance

La reacutesolution de la congestion

Quand TCP a atteint lrsquoeacutetat stable et qursquoune perte est deacutetecteacutee la fenecirctre de conges-tion va ecirctre diviseacutee par deux Cette reacuteduction diminuera le deacutebit eacutecouleacute Il est importantpour TCP drsquoecirctre reacuteactif vis agrave vis des pertes Pour cela de nouveaux algorithmes doiventecirctre mis en place dans la phase drsquoeacutevitement de congestion Ces algorithmes devront ecirctrereacuteactifs aux pertes mais sans sur-reacuteagir Ces nouveauteacutes doivent permettre de retrouverrapidement un deacutebit eacutecouleacute important

Lorsque plusieurs flux TCP empruntent une route congestionneacutee ils sont soumis aumecircme taux de pertes Le but eacutetant de reacutepartir eacutequitablement la bande passante dispo-nible Une approche de diminution moins agressive de la fenecirctre de congestion consistea reacutealiser des connexions TCP parallegraveles Lrsquoobjectif est drsquoavoir un flux TCP se comportantcomme lrsquoagreacutegation de plusieurs flux

Dans lrsquoarticle [Crowcroft1998] les auteurs proposent une version du controcircle de conges-tion de TCP qui se comporte drsquoune maniegravere eacutequivalente agrave N sessions TCP parallegraveles Ilsrsquoagit de MulTCP MulTCP geacutenegravere un flux TCP unique ougrave les sessions virtuelles sont reacute-parties uniformeacutement afin drsquoobtenir le reacutesultat maximal en terme de deacutebit Le controcircle decongestion de TCP change lorsqursquoil utilise lrsquoalgorithme drsquoeacutevitement de congestion et qursquoil

18

deacutetecte un eacuteveacutenement de congestion (par deacutetection drsquoau moins une perte drsquoun segmentdans une fenecirctre de congestion) Les eacutequations suivantes sont utiliseacutees dans chacun descas MulTCP

ACK ω larr ω +N

ω

DROP ω larr ω times (1minus 1

2N)

(12)

En eacutevitement de congestion lorsqursquoun ACK est reccedilu MulTCP augmente sa fenecirctre decongestion (ω) de N segments par RTT Lors de la perte de segments (DROP) MulTCPreacuteduit sa fenecirctre de ω(2N) plutocirct que la valeur par deacutefaut de ω2 La figure 16 montrelrsquoeacutevolution de la fenecirctre de congestion de MulTCP par rapport agrave TCP On voit sur la fi-gure 16 que MulTCP a de meilleures performances qursquoun flux TCP normal Lorsque lesperformances sont combineacutees le reacutesultat est supeacuterieur agrave un flux unique

FIGURE 16 ndash Simulation de MulTCP avec N=5 (Source [Huston2006])

Dynamique du sondage

Lrsquoobjectif de lrsquoeacutemetteur de TCP est drsquoenvoyer le plus de donneacutees le plus vite possibleMais agrave condition qursquoelles arrivent sans produire de la congestion sinon les donneacutees se-ront perdues et il faudra les reacute-eacutemettre Il faut eacutegalement tenir compte des autres flotsen partageant eacutequitablement les ressources du reacuteseau Une approche pour traiter le pro-blegraveme de la dynamique du sondage consiste agrave changer la fonction de controcircle de TCP

Lrsquoobjectif de HighSpeed-TCP (HS-TCP) est drsquoatteindre les hauts deacutebits en ayant desperformances comparables agrave TCP classique dans les environnements agrave faible BDP [RFC3649]La version du controcircle de congestion HighSpeed-TCP utilise le meacutecanisme drsquoAdditive In-crease and Multiplicative Decrease combineacute agrave un facteur calculeacute en fonction de la taille dela fenecirctre de congestion tel qursquoindiqueacute par les eacutequations 13 En deccedila drsquoun certain seuilde ω la reacuteponse de HighSpeed-TCP est eacutequivalente agrave TCP Reno HS-TCP est limiteacute durantla phase de deacutemarrage en douceur Durant cette phase HS-TCP peut normalement en-voyer un grand nombre de paquets Lrsquoenvoi drsquoun trop grand nombre de donneacutees risquedrsquooccasionner de la congestion Le [RFC3742] propose de limiter agrave 100 paquets la capaciteacutedrsquoenvoi drsquoHS-TCP durant la phase de deacutemarrage en douceur

ACK ω larr ω +α(ω)

ωDROP ω larr (1minus β(ω))times ω

(13)

19

La figure 17 illustre le comportement de la fenecirctre de congestion de HighSpeed-TCPLorsqursquoune perte est deacutetecteacutee la diminution de la fenecirctre est moins importante gracircceau facteur β Le retour a la valeur preacuteceacutedente se fait beaucoup plus rapidement qursquoavecReno ou NewReno (en gris clair sur la figure) gracircce au facteur α Ainsi HS-TCP offre unemeilleure utilisation de la capaciteacute disponible sur le lien

FIGURE 17 ndash Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source [Afanasyev2010])

Dans [Tan2006] lrsquoauteur propose une version de TCP alliant lrsquoapproche pro-activeet reacuteactive Une approche pro-active utilise les variations du RTT pour estimer lrsquoeacutetat dureacuteseau Alors qursquoune approche reacuteactive agit quand lrsquoeacuteveacutenement de congestion srsquoest pro-duit Lrsquoobjectif est de maintenir de bonnes performances sur reacuteseaux avec un haut deacutebitet un grand RTT Compound-TCP (C-TCP) maintient deux fenecirctres de congestion Lrsquounecroicirct de faccedilon lineacuteaire mais deacutecroicirct via un certain coefficient en cas de perte La secondefenecirctre est lieacutee agrave lrsquoapproche pro-active de TCP-Vegas [Brakmo1994] La taille de la fenecirctrede congestion reacuteellement utiliseacutee est la somme des deux fenecirctres Lrsquoeacutequation 14 illustrecette addition

ACK ω larr ωreno + ωfast (14)

Si le RTT est bas alors la fenecirctre ωfast va croicirctre rapidement Si C-TCP rencontre uneperte alors ωreno diminuera rapidement pour compenser lrsquoaugmentation preacuteceacutedente deωfast Ce systegraveme cherche agrave garder une valeur constante de la fenecirctre drsquoeacutemission C-TCPutilise efficacement des liens sur les reacuteseaux agrave forte capaciteacute de stockage C-TCP est sujetau mecircme deacutefaut que TCP-Vegas sur lrsquoexactitude des mesures RTT Si les flux en concur-rence les uns avec les autres dans le reacuteseau observent des valeurs RTT minimales diffeacute-rentes le flux se voyant un RTT plus eacuteleveacute sera beaucoup plus agressif et injuste pourlrsquoautre flux La figure 18 illustre le fonctionnement de la fenecirctre de congestion de C-TCPLa partie convexe de la courbe repreacutesente un fonctionnement plus proche de TCP RenoCela indique donc une valeur de ωfast faible Nous remarquons qursquoapregraves une perte TCPessaye de reacutecupeacuterer rapidement la valeur preacuteceacutedente Lors de pertes multiples la fenecirctrede congestion suit une forme proche agrave ce moment de la courbe de HighSpeed-TCP (voirfigure 17) Ce comportement est la conseacutequence drsquoune valeur eacuteleveacutee de ωfast C-TCP per-met ainsi drsquoatteindre le deacutebit maximum disponible sur le lien tout en lissant sa capaciteacutedrsquoenvoi en se basant sur le RTT C-TCP est la version de TCP installeacutee nativement sur lesystegraveme drsquoexploitation Windows de Microsoft

Lrsquoalgorithme de controcircle de congestion de TCP connu sous le nom Binary IncreaseCongestion control (BIC) vise agrave une convergence rapide [Xu2004] La fenecirctre doit atteindrela taille maximale possible sans qursquoil y ait de pertes Pour cela il met en œuvre une nou-velle fonction du controcircle de la taille de la fenecirctre de congestion La fonction de controcircle

20

FIGURE 18 ndash Comportement de la fenecirctre de congestion de Compound-TCP (Source [Afanasyev2010])

de BIC est structureacutee en trois phases (Additive Increase Binary Search Max Probing) tellesqursquoillustreacutees par la figure 19a Au deacutemarrage de la connexion BIC va increacutementer lineacuteai-rement la fenecirctre de congestion Crsquoest la phase drsquoAdditive Increase

Durant la phase Binary Search BIC va essayer de deacutecouvrir la taille optimale de lafenecirctre de congestion La taille optimale est la taille permettant drsquoeacutemettre le maximum dedonneacutees sans essuyer de pertes Elle se base sur lrsquoeacutetude entre la valeur minimale (ωmin)et la valeur maximale (ωmax) de la fenecirctre de congestion Ces variables vont permettredrsquoaffiner la valeur de la fenecirctre de congestion Au deacutebut de la connexion ωmin est mise agrave1 et ωmax est mis arbitrairement agrave une valeur eacuteleveacutee

Lorsqursquoune perte est deacutetecteacutee la fenecirctre de congestion va ecirctre reacuteduite et prendre pourvaleur la moyenne entre ωmin et ωmax ωmin prend alors pour valeur la taille de la fenecirctrede congestion apregraves reacuteduction et ωmax la valeur de la fenecirctre de congestion avant la perteSi lrsquoeacutecart entre la valeur de la fenecirctre de congestion avant et apregraves la perte est supeacuterieuragrave une constante Smax alors la fonction de controcircle de BIC entre en phase dite AdditiveIncrease Durant cette phase Smax va servir de valeur drsquoincreacutementation pour la fenecirctrede congestion agrave chaque RTT Par la suite et si aucune perte nrsquoest de nouveau deacutetecteacuteela fonction de controcircle de BIC retourne en phase de Binary Search Lrsquoobjectif est de stabi-liser la taille de la fenecirctre aux alentours de la valeur de ωmax rencontreacutee avant la pertepreacuteceacutedente

Lorsque cette valeur est deacutepasseacutee BIC entre dans la phase dite Max Probing Lrsquoaug-mentation de la fenecirctre de congestion est alors lineacuteaire Lrsquoobjectif eacutetant la recherche drsquounnouvel ωmax La figure 19b illustre le fonctionnement de la fenecirctre de congestion dansle temps Lors du deacutebut de connexion BIC se comporte comme Reno avec le meacutecanismedu deacutemarrage en douceur Degraves qursquoune perte est deacutetecteacutee la diminution de la fenecirctre estalors moins agressive qursquoavec Reno Au centre de la courbe nous remarquons la fonctiondrsquoaccroissement avec les trois phases

BIC est un controcircle de congestion performant dans les reacuteseaux agrave forte capaciteacute destockage Neacuteanmoins BIC peut ecirctre trop agressif pour les flux qui ont des courts deacutelaisCela a pour conseacutequence un partage ineacutequitable de la bande passante disponible avec lesflux qui ont des longs deacutelais

Afin de reacutesoudre le problegraveme drsquoiniquiteacute lieacute au RTT lrsquoalgorithme CUBIC propose dechanger la fonction de controcircle de la taille de la fenecirctre de congestion pour la rendreplus agressive La fonction retenue est cubique et son eacutevolution est repreacutesenteacutee par la fi-gure 110a Contrairement agrave la figure drsquoaccroissement de BIC (fig 19a) qui comporte troisphases la fonction drsquoaccroissement de CUBIC nrsquoen compte que deux (fig 110a) Sur lafigure 110b on constate que ces deux phases sont preacutesentes tout au long de lrsquoeacutevolutionde la fenecirctre de congestion de CUBIC Ces deux phases ne sont pas forceacutement conseacute-cutives lrsquoune de lrsquoautre Apregraves la deacutetection drsquoune perte CUBIC va essayer de croicirctre le

21

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez BIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deBIC-TCP (Source [Afanasyev2010])

FIGURE 19 ndash Fonctionnement de BIC TCP

plus rapidement possible jusqursquoagrave ωMax Lorsque ωMax est atteint la taille de la fenecirctre vasrsquoincreacutementer lentement Mais plus la valeur drsquoω est eacuteloigneacutee en taille de ωMax plus lacroissance va srsquoacceacuteleacuterer Lrsquoavantage de CUBIC sur BIC est le remplacement la fonction decontrocircle lineacuteaire par une fonction cubique pour plus drsquoagressiviteacute Lrsquoalgorithme CUBICest deacutecrit par le [RFC8312]

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez CUBIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deCUBIC-TCP (Source [Afanasyev2010])

FIGURE 110 ndash Fonctionnement de CUBIC

114 Controcircle de congestion avec implication des routeurs

Drsquoautres approches ont eacuteteacute eacutetudieacutees pour aider le controcircle de congestion de TCP Cesapproches impliquent les routeurs et ne reposent plus que sur le principe de bout-en-boutpropre agrave TCP

Explicit Congestion Notification (ECN) vise agrave renforcer lrsquoindication drsquoun eacuteveacutenement decongestion [RFC3168] Avec ECN la congestion est signaleacutee avant que la perte drsquoun pa-quet ne se produise Lors de la reacuteception drsquoun paquet indiquant une congestion lrsquoeacutemet-teur va alors reacuteduire sa fenecirctre de congestion et sa fenecirctre drsquoeacutemission La reacuteduction dela capaciteacute drsquoeacutemission de lrsquoeacutemetteur eacutevitera pertes et retransmissions et une reacuteductiondes deacutelais de reprise Lrsquousage de cette option neacutecessite que lrsquoeacutemetteur le reacutecepteur et lesrouteurs du chemin soient capables de geacuterer les notifications explicites Avec ECN lrsquoin-formation de congestion est transmise agrave lrsquoeacutemetteur Aucune indication sur le lieu preacutecisde la congestion est indiqueacutee

eXplicit Control Protocol (XCP) est un protocole de controcircle de congestion utilisantles notifications explicites de deacutebit [Katabi2002] En cela il reprend lrsquoideacutee de Quick-startCependant il se diffeacuterencie par le deacutecouplage opeacutereacute entre la probleacutematique du partageeacutequitable entre les flots et celle de lrsquoefficaciteacute du transfert Dans lrsquoarchitecture de proto-coles XCP se situe entre TCP et IP XCP repose sur un en-tecircte qui va servir aux routeurs

22

traverseacutes pour indiquer le deacutebit drsquoeacutemission pour le flot La valeur drsquoadaptation de la fe-necirctre de congestion est calculeacutee agrave partir des informations contenues dans lrsquoen-tecircte XCPXCP propose un controcircle de congestion qui fonctionne sur un reacuteseau 100 XCP Uneseconde limite est lrsquoiniquiteacute avec les autres protocoles de transport Les performancessont fortement deacutegradeacutees si diffeacuterents protocoles de bout en bout sont exeacutecuteacutes dans lemecircme reacuteseau tels que TCP XCP possegravede de mauvaises performances si des routeurs IPclassiques (non-XCP) se trouvent au niveau du goulot drsquoeacutetranglement

Afin de reacutesoudre le problegraveme drsquointeropeacuterabiliteacute Dans [Lopez2006] lrsquoauteur proposeXCP-interoperable (XCP-i) une version XCP qui garde les meacutecanismes de controcircle XCPsans ajouter drsquoeacutetat de flux Lrsquoobjectif drsquoXCP-i est de deacuteployer XCP sur un reacuteseau com-prenant des routeurs XCP et non-XCP Pour cela XCP-i va fonctionner en deux phasesDans une premiegravere phase il va deacutecouvrir les nuages non-XCP Un nuage non-XCP est unensemble de routeurs non capables de traiter XCP En comparant les champs Time-To-Live(TTL) drsquoIP et drsquoXCP le nombre de routeurs non-XCP preacutesents dans le reacuteseau peut ecirctredeacuteduit La seconde phase consiste agrave deacuteterminer les ressources du nuage non-XCP En ra-joutant un champ last_xcp_routeur XCP-i garde en meacutemoire lrsquoadresse du dernier routeurXCP traverseacute Agrave partir drsquoalgorithmes drsquoestimation de bande passante la bande passantedu nuage non-XCP sera estimeacutee entre les deux nœuds XCP La derniegravere phase pour reacutea-liser une inter-opeacuterabiliteacute complegravete entre routeurs classiques et routeurs XCP consiste agraveprendre en consideacuteration la bande passante estimeacutee dans les calculs du feedback de XCPLe protocole XCP-i va creacuteer un routeur XCP virtuel agrave la place du nuage non-XCP Gracirccea ces meacutecanismes un reacuteseau heacuteteacuterogegravene devient virtuellement homogegravene pour XCP Lesperformances de XCP-i sont comparables agrave celle de XCP [Lopez2006] XCP-i reacutesout leproblegraveme drsquointer-opeacuterabiliteacute de XCP sur des reacuteseaux non 100 XCP

Ces solutions preacutesentent le deacutesavantage de devoir ecirctre deacuteployeacutees eacutegalement au seindes routeurs Le principal avantage de ces solutions est une indeacutependance au deacutelai Lesprobleacutematiques lieacutees au deacutelai que lrsquoon a preacutesenteacutees preacuteceacutedemment sont alors inopeacute-rantes Dans le cadre de La Reacuteunion les deacutelais peuvent ecirctre importants

115 Caracteacuterisation de La Reacuteunion

Lrsquoaugmentation des deacutebits drsquoaccegraves srsquoaccompagne de lrsquoaugmentation de la capaciteacute desliens drsquointerconnexion comme celles des cacircbles sous-marins Malgreacute cette augmentationdes deacutebits le temps de propagation reste inchangeacute Dans cette partie nous deacuteterminonsagrave partir de quel deacutebit un accegraves Internet agrave La Reacuteunion peut ecirctre sujet aux problegravemes ren-contreacutes sur les LFN

Dans la section 21 nous avons vu que La Reacuteunion est raccordeacutee agrave Internet par deuxaccegraves reposant sur des cacircbles sous-marins le SAFE et le LION Le cacircble SAFE est prolongeacutepar le cacircble SAT-3WASC Le temps de propagation (tp) sur un cacircble peut ecirctre estimeacutepar la formule matheacutematique 15 dans laquelle d repreacutesente la distance et c la vitesse depropagation du signal sur le support

tp =d

c(15)

Si nous retenons la route directe entre La Reacuteunion et la France hexagonale qui passepar le plus long des accegraves constitueacute par les cacircbles SAFE et SAT-3WASC Sachant que lecacircble SAFE a une longueur totale de 13 500 km pour aller de lrsquoAfrique du Sud agrave lrsquoAsie Sion fait lrsquohypothegravese que lrsquoicircle de La Reacuteunion se situe agrave une distance eacutequivalente agrave la moitieacutedu cacircble SAFE La longueur du cacircble pour La Reacuteunion est de 6 750 Km La vitesse de

23

propagation du signal pour une fibre optique est eacutegale agrave la vitesse de la lumiegravere (299 792Kms) Lrsquoapplication de la formule 15 donne tp1 avec

tp1 = 12times dSAFEc = 22 52ms (16)

tp1 approxime le temps de propagation entre La Reacuteunion et le point de sortie du cacircbleSAFE en Afrique du Sud ou en Asie Pour obtenir le RTT ce temps est agrave doubler Onobtient alors la valeur RTT1 = 45 04 ms

La seconde partie du trajet de lrsquoAfrique du Sud jusqursquoen Europe emprunte le cacircbleSAT-3WASC Drsquoapregraves [Cablesmap] la longueur du cacircble est de 14 350 Km Le temps depropagation entre lrsquoAfrique du Sud et lrsquoEurope noteacute tp2 srsquoexprime comme

tp2 = (dSATminus3WASC)c = 47 87ms (17)

Le RTT sur ce cacircble est de RTT2 = 95 74 msAu total le RTT incompressible pour joindre lrsquoEurope en passant par les cacircbles SAFESAT-3WASC consiste agrave additionner le RTT de chaque cacircble agrave savoir RTT1 et RTT2 Le RTTincompressible est donc minimal de 140 78ms Ce deacutelai comme nous venons de le calcu-ler ne prend en compte que la propagation Il neacuteglige le temps de transmission du paquetainsi que les temps drsquoattente avant la transmission

Lrsquoeacutetude preacutesenteacutee dans[Anelli2012] a mesureacute un RTT minimal pour les paquets quit-tant lrsquoicircle de La Reacuteunion de 185 ms Ce reacutesultat a eacuteteacute obtenu par une eacutetude de mesuresdepuis les locaux de lrsquoUniversiteacute de La Reacuteunion La figure 111 repreacutesente la Probabi-lity Density Function (PDF) des RTT mesureacutes Cette fonction est compareacutee agrave celle qui estobtenue depuis la France hexagonale et de Paris en particulier On constate une forte si-militude sur la forme des courbes La courbe de La Reacuteunion enregistre un deacutecalage dansle temps de 185 ms par rapport agrave celle de Paris Ce deacutecalage repreacutesente le RTT minimummesureacute pour rejoindre la meacutetropole et acceacuteder agrave lrsquoInternet

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

FIGURE 111 ndash Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

Si lrsquoon considegravere la valeur de BDP de 12 5 Ko indiqueacutee par le [RFC1072] comme lalimite basse drsquoun LFN et si nous reprenons les diffeacuterentes TAI preacutesenteacutees dans la section21 nous pouvons calculer le produit deacutelai-bande passante drsquoun canal de communica-tion entre La Reacuteunion et la meacutetropole Il est fait lrsquohypothegravese pour ce calcul que le goulotdrsquoeacutetranglement est donneacute par lrsquoaccegraves agrave Internet Le tableau 12 preacutesente les reacutesultats ob-tenus

24

TABLE 12 ndash Approximation du produit deacutelai bande passante de la connectiviteacute de LaReacuteunion agrave lrsquoInternet

NomhhhhhhhhhhhhhhhhhhhBande passante

RTT (en secondes)Estimeacute 0141

Mesureacute 0185

Modem56 Kbits 987 o 130 Ko128 Kbits 226 Ko 296 Ko512 Kbits 902 Ko 118 Ko

ADSL1 Mbits 176 Ko 231 Ko8 Mbits 141 Ko 185 Ko20 Mbits 353 Ko 463 Ko

VDSL 50 Mbits 881 Ko 116 Mo

Fibre

35 Mbits 617 Ko 809 Ko100 Mbits 176 Mo 231 Mo200 Mbits 353 Mo 463 Mo

1 Gbits 176 Mo 231 Mo

Le tableau preacutesente en gras les produits deacutelai-bande passante deacutepassant la limite des12 5 Ko Ainsi les reacutesultats sont assez eacuteloquents Degraves que lrsquoon arrive sur un accegraves ADSLavec un deacutebit minimal drsquo1 Mbits nous avons un BDP supeacuterieur agrave la limite fixeacutee par le[RFC1072] Ainsi rapidement lrsquoeacutevolution des deacutebits proposeacutes sur lrsquoicircle et les capaciteacutes descacircbles sous-marins associeacutes agrave un deacutelai eacuteleveacute ont fait de lrsquoInternet reacuteunionnais un reacuteseauqui a les caracteacuteristiques drsquoun LFN

Nous avons vu que TCP est un protocole de transport dont la performance est deacutepen-dante du RTT et du BDP Les deacutelais sont une des caracteacuteristiques des LFN La Reacuteunionest un reacuteseau agrave forte capaciteacute de stockage due agrave des deacutelais importants Il est important demesurer pour comprendre lrsquoimpact de cette caracteacuterisation sur les performances de TCP

12 Meacutetrologie du trafic Internet

Avec lrsquoInternet qui devient de plus en plus gros et de plus en plus complexe la meacutetro-logie est une activiteacute qui vise agrave mieux comprendre le fonctionnement de lrsquoInternet Nousallons dans cette partie du manuscrit preacutesenter les techniques de meacutetrologie appliqueacuteesagrave lrsquoInternet

121 Deacutefinition

Meacutetrologie est un mot composeacute de deux termes grecs Le premier metron signifie lamesure tandis que logos fait reacutefeacuterence agrave la science Par deacutefinition la meacutetrologie deacutesignela science de la mesure Par la suite le terme meacutetrologie fera uniquement reacutefeacuterence agrave la meacute-trologie appliqueacutee aux reacuteseaux informatiquesLa meacutetrologie signifie donc la mesure des caracteacuteristiques drsquoun reacuteseau sous de nombreuxaspects Cette science est devenue un outil indispensable pour avoir une compreacutehensionde divers aspects de lrsquoInternet On peut citer la complexiteacute la qualiteacute de service et laqualiteacute utilisateur la performance du reacuteseau la performance des protocoles le fonction-nement ou encore la validation des modegravelesLa meacutetrologie Internet englobe deux types drsquoactiviteacutes La premiegravere est lrsquoeacutetude des para-megravetres physiques de la qualiteacute de service La seconde consiste a mettre en eacutevidence lesproblegravemes lieacutes agrave lrsquoInternet [Larrieu2010]

25

Dans [Paxson2001] lrsquoauteur preacutesente lrsquoapproche research driven et lrsquoapproche measure-ment driven pour deacutefinir les objectifs drsquoune eacutetude de meacutetrologie Le choix drsquoune approcheva aider une personne souhaitant faire de la meacutetrologie sur la bonne faccedilon drsquoaborderlrsquoeacutetude qursquoelle veut mettre en place

Lrsquoexpression research driven peut ecirctre traduite par axeacutee sur la recherche Elle consisteagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires de lancer les campagnes de mesures et drsquointerpreacuteter les reacute-sultats Une meacutetrique se deacutefinit comme une grandeur mesurable et speacutecifieacutee de maniegravererigoureuse Une bonne meacutetrique doit pouvoir se mesurer de faccedilon reproductible ecirctreutile en pratique pour les utilisateurs et les administrateurs du reacuteseau [RFC2330] Cetteapproche est celle geacuteneacuteralement utiliseacutee par les opeacuterateurs et les groupes de recherchesElle est deacuteveloppeacutee par le groupe de travail IP Performance Metrics (IPPM) de lrsquoIETF Cegroupe de travail a produit de nombreux documents pour deacutefinir les mesures de per-formances Lrsquoapproche research driven comporte un deacutefaut principal En laissant de cocircteacutecertaines meacutetriques des aspects du comportement du reacuteseau ne sont pas eacutetudieacutes Parexemple une eacutetude restreinte aux deacutelais ne peut indiquer les raisons de la variation desdeacutelais dans le temps

Lrsquoapproche measurement driven peut se traduire en la mesure pour la mesure Cettemeacutethode consiste agrave mettre en place une infrastructure de mesures afin de reacutecupeacuterer lemaximum drsquoinformations puis effectuer toutes les analyses possibles sur les traces col-lecteacutees et interpreacuteter les reacutesultats obtenus Une telle meacutethode peut srsquoutiliser lorsque lrsquoonsouhaite mettre en avant le comportement geacuteneacuteral drsquoun lien Cette approche permet agrave ladiffeacuterence de la preacuteceacutedente drsquoanalyser agrave plusieurs reprises une mecircme source de donneacuteesen fonction des reacutesultats obtenus

Le tableau 13 reacutesume les deux approches de conduite de projet en meacutetrologie

TABLE 13 ndash Comparatif entre les approches de meacutetrologie

Research Driven Measurement Driven1 - Meacutetriques deacutefinies preacutealablement2 - Utilisation drsquoun outil adapteacute

1 - Collecte des donneacutees2 - Analyse exhaustive

Ces deux approches sont compleacutementaires lrsquoune de lrsquoautre et srsquoappliquent dans lesdeux classes de techniques de mesures les techniques de mesures actives et les tech-niques de mesures passives

122 Meacutetrologie active

La meacutetrologie active consiste agrave injecter un trafic speacutecifique et agrave mesurer en reacuteceptionlrsquoeffet sur le reacuteseau agrave eacutetudier Lrsquohypothegravese faite par la meacutetrologie active est que la mesurefaite de bout en bout est reacuteveacutelatrice de la performance du service du reacuteseau telle qursquoellepeut ecirctre perccedilue par une application Les paquets eacutemis sont des sondes qui en emprun-tant la route entre la source et la destination expeacuterimentent la performance du canal decommunication Il convient de limiter le trafic des sondes afin qursquoil ne vienne pas pertur-ber le trafic et donc fausser la mesure Les meacutetriques mesureacutees par les mesures activessont geacuteneacuteralement des meacutetriques associeacutees agrave la topologie du reacuteseau ou au trafic commeles routes ou les deacutelais Dans le cas de la meacutetrologie active il se peut que lrsquoeacutemetteur soiteacutegalement le collecteur La figure 112 illustre ce principe

La meacutetrologie active est opeacutereacutee agrave lrsquoaide drsquooutils speacutecifiques de geacuteneacuteration et de collectede sondes Le tableau 14 indique les meacutetriques obtenues avec les outils de meacutetrologiepreacutesenteacutes par la suite

26

FIGURE 112 ndash Principe de la meacutetrologie active

TABLE 14 ndash Classement des outils

XXXXXXXXXXXOutilMeacutetriques

RTT Routes Deacutebits

Ping XTraceroute X XParis Traceroute X XReverse-traceroute X XTraceIXroute X XPathchar XClink XIperf X

La mesure du RTT est geacuteneacuteralement obtenue par lrsquooutil ping (Packet Internet Groper)Cet outil se preacutesente sous la forme drsquoune commande dans un systegraveme de type Unix Ellesert en premier lieu agrave veacuterifier la connectiviteacute agrave Internet et lrsquoaccessibiliteacute drsquoun nœud Ensecond lieu avec cette veacuterification le RTT et la longueur de la route exprimeacutee en nombrede sauts sont deacutetermineacutes Elle utilise le protocole Internet Control Message Protocol (ICMP)pour effectuer la mesure Un message ICMP Echo request est eacutemis Le destinataire renvoieagrave lrsquoeacutemetteur un message ICMP Echo reply La peacuteriode qui seacutepare lrsquoeacutemission de la reacuteceptiondu coteacute eacutemetteur est mesureacutee

Pour en savoir plus sur la connectiviteacute drsquoun nœud et notamment sur la route emprun-teacutee pour atteindre une destination donneacutee lrsquooutil traceroute offre le moyen de cette deacute-couverte [Jacobson1989-1] Cet outil se preacutesente comme pour ping sous la forme drsquounecommande de type Unix Son principe de fonctionnement est baseacute sur un envoi successifde messages avec un champ TTL du paquet IP qui va croissant Le routeur qui reccediloit unmessage dont le TTL du paquet a atteint la valeur zeacutero envoie un message ICMP TimeExceeded pour reporter lrsquoerreur agrave lrsquoeacutemetteur Par ce message il indique en adresse sourcelrsquoadresse IP de son interface qui a rejeteacute le paquet Ainsi si un paquet ayant un TTL posi-tionneacute agrave n est envoyeacute vers une destination donneacutee le routeur situeacute agrave n sauts de la sourceva faire connaicirctre son adresse IP et ceci tant que le chemin vers la destination est supeacute-rieur agrave n sauts [Crovella2006] Le reacutesultat est lrsquoensemble des nœuds traverseacutes reacutepondantau protocole ICMP De nouveaux outils utilisant le principe de traceroute furent deacutevelop-peacutes pour reacutepondre agrave drsquoautres probleacutematiques comme la preacutesence des points drsquoeacutechangeou encore lrsquoasymeacutetrie des liens

La reacuteponse afficheacutee par la commande traceroute nrsquoest pas la seule route existanteEn exeacutecutant agrave plusieurs reprises la mecircme commande traceroute les reacuteponses obtenuespeuvent ecirctre diffeacuterentes A cause de lrsquoeacutequilibrage de charge (load-balancing) la sortie drsquounrouteur ne sera pas toujours la mecircme Lrsquoeacutequilibrage des charges sert agrave reacutepartir le traficsur diffeacuterents liens Ainsi il est possible que deux paquets provenant de la mecircme sourcevers la mecircme destination nrsquoempruntent pas la mecircme route Sur la figure 113 les liensphysiques entre les diffeacuterents nœuds sont indiqueacutes en rouge Les traits en pointilleacute repreacute-sentent le chemin emprunteacute par les messages ICMP envoyeacutes par la source La figure 113amontre le reacutesultat trouveacute par traceroute La route emprunteacutee est SRC A D DST

27

Traceroute va envoyer 3 paquets avec un champ TTL eacutegal agrave 2 Dans le cas de cet exemplelrsquoensemble des paquets est dirigeacute vers B Ainsi malgreacute lrsquoabsence de liaison physique di-recte entre les nœuds A et D traceroute nous indique la preacutesence drsquoune route entre ceuxdeux eacutequipements Lrsquooutil Paris-traceroute vise agrave traiter ce problegraveme [Augustin2006]La figure 113b montre la route deacutecouverte par Paris-traceroute La route afficheacutee estSRC A C DST On remarque que la route obtenue existe physiquement Pour obte-nir ce reacutesultat Paris-traceroute change le numeacutero drsquoidentification du flux agrave lrsquoeacutemission despaquets ICMP Cette modification oblige les routeurs agrave suivre une seule et unique routeParis-traceroute autorise eacutegalement lrsquoaffichage des numeacuteros de voies logiques MPLS

(a) Traceroute

(b) Paris-traceroute

FIGURE 113 ndash Illustration du pheacutenomegravene drsquoeacutequilibrage des charges

MultiProtocol Label Switch (MPLS) est un meacutecanisme de commutation rapide de pa-quets fondeacute sur des adresses de format fixe et sans structure hieacuterarchique [RFC3031]Ces adresses sont des numeacuteros de voies logiques appeleacutees des eacutetiquettes ou labels (paranglicisme) Dans le cas de lrsquoutilisation de traceroute avec MPLS il faut que le routeurMPLS puisse envoyer un message ICMP Le [RFC4950] documente une simple extensionagrave ICMP pour retourner de lrsquoinformation speacutecifique agrave MPLS autrement dit pour qursquounrouteur MPLS puisse indiquer des informations speacutecifiques agrave MPLS dans le paquet ICMPeacutemis en cas de problegraveme [Donnet2012] a eacutetudieacute les possibiliteacutes offertes par des routeursMPLS

Dans les explicit tunnels la structure interne du tunnel est entiegraverement visible et chaquenœud dans le Label Switched Path (LSP) est marqueacute comme nœud MPLS Dans ce type detunnel le champ ttl-propagate qui est dans lrsquoen-tecircte MPLS des paquets et le [RFC4950] sontappliqueacutes Cela signifie que le champ TTL du datagramme IP est deacutecreacutementeacute agrave chaquerouteur rencontreacuteDans les implicit tunnels le LER drsquoentreacutee active lrsquooption ttl-propagate mais les LSR nrsquoim-pleacutementent pas le [RFC4950] La deacutecreacutementation du TTL est effective mais aucune infor-mation de routeur MPLS nrsquoest visibleDans les opaque tunnels crsquoest lrsquoinverse de lrsquoimplicit tunnels Les routeurs impleacutementent le[RFC4950] Le nœud drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Le TTL est alors deacutecreacute-menteacute agrave la sortie du tunnel MPLS Le paquet ICMP-reply indique quand mecircme lrsquoexistencedrsquoun tunnel MPLSPour les invisible tunnels le LER drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Dans ce casle TTL est deacutecreacutementeacute uniquement lors du dernier routeur du tunnel Le [RFC4950] nrsquoestpas impleacutementeacute par le dernier routeur du LSP Cela implique lrsquoabsence drsquoinformation

28

sur le meacutecanisme MPLS au sein des paquets ICMP On nrsquoa alors pas drsquoinformations surlrsquoexistence drsquoun tunnel ICMP sur la route emprunteacutee

Avec lrsquoacheminement avec MPLS des mauvaises valeurs de TTL peuvent ecirctre obte-nues agrave cause du type de tunnel mis en œuvre Il est donc important que le [RFC4950] soitimpleacutementeacute dans les routeurs

FIGURE 114 ndash Taxonomie des configurations de tunnels MPLS et des comportements detraceroute correspondants (Source [Donnet2012] )

Paris-traceroute propose lrsquoaffichage des informations MPLS lorsque celles-ci sont dis-ponibles [Augustin2007] La texte ci-dessous illustre les reacutesultats obtenus par Paris-traceroutesur un Explicit tunnel On y voit lrsquoaffichage des marques MPLS avec le TTL associeacute agravechaque nœud

traceroute [(412131413533456) -gt (818216615733457)]protocol icmp algo hopbyhop duration 3 s1 4121314133 23266 ms 2542 ms 3696 ms2 4121313397 6811 ms 5613 ms 4635 ms3 10322161 5779 ms 6841 ms 4073 msMPLS Label 16445 TTL=1 | 2129964 1032237 2223 ms 2249 ms 2264 msMPLS Label 16386 TTL=2 | 2129965 4121312850 2185 ms 2245 ms 2097 msMPLS Label 16442 TTL=3 | 2129966 10322193 3551 ms 9330 ms 7775 ms7 41213133158 2337 ms 3088 ms 2250 ms8 4121312854 195439 ms 195555 ms 195512 ms9 213242121233 211737 ms 211724 ms 212013 ms10 469148181 234190 ms 234271 ms 234323 ms11 4687222 236854 ms 236798 ms 237063 ms12 213224250110 237108 ms T0 236580 ms T0 236570 msT013 2132242502 237213 ms 236631 ms 236694 ms14 213224201252 239100 ms 239461 ms 238680 ms15 8182166157 250874 ms 249608 ms 248057 ms

Avec traIXroute lrsquoobjectif est de deacutecouvrir les diffeacuterents points de peering (IXP) sur unchemin vers une destination [Nomikos2016] Pour lrsquoidentification des nœuds drsquoeacutechangecette version de traceroute combine deux bases de donneacutees compleacutementaires qui sontPeeringDB [PeeringDB] et Packet Clearing House [PCH] Avec une geacuteolocalisation desadresses retourneacutees la liste des pays traverseacutes peut ecirctre eacutetablie

29

Drsquoapregraves [Steenbergen2009] laquo lrsquooutil de deacutepannage numeacutero 1 pour veacuterifier la connec-tiviteacute drsquoun nœud reste traceroute raquo pour les administrateurs reacuteseaux mais laquo les liens asy-meacutetriques sont les fleacuteaux numeacutero un de lrsquooutil raquo car laquo le chemin de retour est entiegraverementmasqueacute raquo Afin de corriger cela lrsquooutil reverse-traceroute propose drsquoobtenir une routenon pas entre la source et la destination mais entre la destination et la source [Katz2010]pour cela lrsquooutil va utiliser lrsquoenregistrement des adresses IP des routeurs sur le chemindu retour agrave lrsquoaide des options drsquoen-tecircte Record-Route et Timestamp drsquoIP

Pour deacuteterminer le deacutebit pathchar [Jacobson1997] vise agrave donner le deacutebit saut par sautvers une destination Aussi il reprend le principe de traceroute en eacutemettant des sondesavec le champ TTL avec une valeur croissante Lorsqursquoil injecte le trafic de sondes vers unnœud du chemin il le fait avec des paquets de taille variable Ainsi pathchar deacuteterminela bande passante disponible entre chaque nœud rencontreacute

Lrsquooutil Clink [Downey1999] est similaire agrave pathchar La diffeacuterence se fait au niveausur le nombre de paquets envoyeacutes Clink envoie un nombre de paquets plus importantque Pathchar Ainsi les mesures reacutealiseacutees par Clink auront une meilleure preacutecision

Iperf [Tirumala2005] est un outil pour mesurer la bande passante et la qualiteacute drsquounlien reacuteseau Ce dernier est deacutelimiteacute par deux machines sur lesquelles est installeacute IperfUne machine tient le rocircle de serveur tandis que la seconde machine sera parameacutetreacuteecomme client

Pour des mesures plus repreacutesentatives il est neacutecessaire drsquoaugmenter les points decollectes Des outils de meacutetrologie active ont eacuteteacute conccedilus pour ecirctre reacutepartis sur plusieursnœuds Ces outils se preacutesentent sous la forme de plates-formes de meacutetrologie active deacute-ployeacutees agrave travers le monde De nos jours on compte de nombreuses plates-formes demeacutetrologie active Comme chaque plate-forme a un objectif preacutecis et pour identifier laplate-forme approprieacutee pour reacutealiser une eacutetude preacutecise lrsquoauteur de [Bajpai2015-1] effec-tue une comparaison des diffeacuterentes plates-formes selon 5 critegraveres qui sont

1 lrsquoeacutechelle la couverture et la dureacutee de vie de la plate-forme

2 le mateacuteriel physique utiliseacute pour la sonde

3 les meacutetriques disponibles

4 lrsquoarchitecture de mesure de la plate-forme

5 lrsquoimpact de son utilisation pour la recherche

De cette comparaison nous avons gardeacute 4 plates-formes que sont Atlas RIPE NCC BIS-Mark DASU SamKnows Ces plates-formes ont eacuteteacute gardeacutees car elles autorisent lrsquoeacutetudedes performances des reacuteseaux drsquoaccegraves Nous y avons ajouteacute les plates-formes Archipe-lago et Planet-Lab Ces deux plates-formes ne font pas partie du document drsquoorigine maisfont lrsquoobjet drsquoune utilisation par de nombreux participants tel que lrsquoindique le nombrede sondes actives de ces deux plates-formes

En 2007 le CAIDA a deacuteployeacute sa propre plate-forme de mesures [Archipelago] Atravers le deployement de nœuds (des sondes dans le vocabulaire de Archipelago) surlrsquoensemble de la planegravete lrsquoobjectif est drsquooffrir des accegraves pour effectuer des mesures avecdes outils tels que ping et traceroute Archipelago est composeacutee agrave la date du 1er Mars2017 de 170 sondes reacuteparties dans 59 pays et sur tous les continents

Dans le courant de lrsquoanneacutee 2010 le Regional Internet Registry (RIR) europeacuteen RIPENCC a deacutemarreacute la distribution de sondes pour la creacuteation de la plate-forme Atlas [Ripe2010]Cette plate-forme vise agrave creacuteer un reacuteseau de sondes pour lrsquoeacutetude de la connectiviteacute de lrsquoIn-ternet Composeacutee actuellement de pregraves de 10 000 sondes reacuteparties agrave travers le monde elleest capable drsquoeffectuer des tests de meacutetrologie active autour des commandes ping DNSHTTP NTP traceroute et Paris-traceroute

30

Agrave lrsquoinitiative de Georgia Tech la plate-forme Broadband Internet Service Benchmark (BIS-Mark) a vu le jour en 2010 Lrsquoobjectif est la reacutealisation drsquoun eacutetat des lieux des performancesdes accegraves Internet [Sundaresan2011] La plate-forme est composeacutee de 405 routeurs instru-menteacutes avec OpenWrt laquo Le projet OpenWrt est un systegraveme drsquoexploitation Linux ciblantles appareils embarqueacutes OpenWrt fournit un systegraveme de fichiers entiegraverement inscriptibleavec gestion des modules drsquoinstallation de logiciels Cela libegravere la seacutelection et la configu-ration des applications fournies par le fournisseur et permet de personnaliser lrsquoappareilgracircce agrave lrsquoutilisation de progiciels adapteacutes agrave nrsquoimporte quelle application raquo [OpenWrt] Lessondes sont distribueacutees dans 34 pays agrave travers le monde

DASU est un utilitaire deacuteveloppeacute en 2010 agrave lrsquoUniversiteacute de Northwestern Le logicielcouple meacutetrologie active et passive avec pour objectif de caracteacuteriser les performancesdes utilisateurs Lrsquooutil fut deacuteveloppeacute comme une extension drsquoun logiciel peer-to-peer Bit-Torrent [Sanchez2013] Depuis Juillet 2010 plus de 90 000 personnes reacuteparties agrave travers147 pays utilisent DASU

En 2003 des chercheurs ameacutericains ont deacuteployeacute une plate-forme de test Planet-Lab[Chun2003] En 2008 une extension europeacuteenne [PlanetLabEurope] a vu le jour Planet-Lab deacutepasse le seul objectif de meacutetrologie elle vise aussi de tester des nouveaux servicesde communication en situation reacuteelle Les nœuds Planet-Lab ont pour Operating System(OS) Fedora Il est possible drsquoinstaller nrsquoimporte quel logiciel du moment qursquoil est com-patible avec cet OS Avec une certaine liberteacute il est possible drsquoeffectuer des tests et desmesures depuis 425 sites reacutepartis sur tous les continents

La plate-forme SamKnows a vu le jour en 2008 [SamKnows] SamKnows sert agrave lrsquoeacutetudedes performances des connexions des particuliers et des entreprises Elle est composeacuteede pregraves de 440 000 sondes Cette infrastructure est partenaire de 36 Fournisseurs drsquoAccegravesInternet (FAI) de tous les continents

Le tableau 15 reacutesume les possibiliteacutes offertes par les plates-formes La colonne Impactsur la recherche est deacutetermineacutee agrave partir du nombre de citations par des articles scientifiquessuivis par le site Google Scholar

La plate-forme de mesures Atlas RIPE NCC [Ripe2010] a eacuteteacute utiliseacutee dans le contexteinsulaire de Cuba Dans lrsquoarticle [Bischof2015] lrsquoauteur cherche agrave caracteacuteriser lrsquoaccegraves In-ternet cubain Dans ses reacutesultats lrsquoauteur a montreacute une forte asymeacutetrie des routes in-ternationales pour le trafic cubain Drsquoun point de vue de la topologie physique cette icirclepossegravede une connectiviteacute qui peut par certains aspects ressembler agrave de celle de lrsquoicircle de LaReacuteunion

Lrsquoicircle de La Reacuteunion bien que Franccedilaise est rattacheacutee administrativement au RIR dela zone Afrique (AfriNIC) LrsquoAfriNIC est le dernier RIR creacuteeacute et les eacutetudes de meacutetrolo-gie concernant cette zone sont peu nombreuses Nous pouvons citer [Gupta2014] qui sepenche sur lrsquointerconnexion des FAI sur le continent africain Cette eacutetude montre que leseacutechanges de paquets ne se font pas au sein du continent africain mais en Europe La rai-son avanceacutee par lrsquoauteur est un coucirct drsquointer-connexion infeacuterieur en Europe Ces regravegles deroutage on des conseacutequences sur les deacutelais et donc sur les performances sur le servicede transport rendu par TCP Ces reacutesultats ont eacuteteacute confirmeacutes par [Fanou2015] Cette eacutetudesrsquointeacuteresse en plus agrave la stabiliteacute des routes Les reacutesultats ont montreacute que les chemins afri-cains restent stables sur une longue dureacutee Pour les auteurs lrsquoeacutemergence de nouveauxpoints drsquoeacutechanges sur le continent doit aider agrave la reacuteduction des deacutelais agrave conditions queles coucircts drsquointerconnexion soient proches de ceux pratiqueacutes en Europe

Enfin lrsquoarticle [Chavula2017] publieacute en 2017 preacutesente la latence pour les transferts defichiers agrave partir de 53 pays africains diffeacuterents Ces mesures srsquoappuient sur la plate-formeRIPE Atlas [Ripe2010] et Speedchecker [Speechecker] Agrave partir des mesures reacutealiseacutees les

31

TABLE 15 ndash Tableau des plates-formes de mesures de meacutetrologie active

Nom Nombre desondes deacuteployeacutees

Meacutetriques dispo-nibles

Impact sur la re-cherche

Archipelago ~200 Longueur duchemin RTTDNS Autono-mous System(AS)

109

Atlas RIPE NCC ~12 000 RTT RouteHTTP GET etrequecirctes SSL

38

BISMark ~420 RTT taux depertes deacutebiteacutecouleacute tempsde chargementdrsquoune page web

304

DASU ~100 000 Informations surles flux TCP RTTroutes emprun-teacutees reacutesolutionDNS HTTP GETdeacutebit eacutecouleacute

84

PlanetLab ~400 1218SamKnows ~70 000 RTT deacutebit

eacutecouleacute deacutebitutile giguetaux de perteperformance decertains services

154

auteurs avancent que lrsquoAfrique est un continent ineacutegalitaire en terme de latence intra etinter pays Ils ont conclu que lrsquoexistence drsquoune faible latence entre deux FAI drsquoun mecircmepays provient drsquoaccord de peering au sein drsquoun IXP heacutebergeacute soit par le pays concerneacutesoit par un pays voisin

123 Meacutetrologie passive

La meacutetrologie passive a pour objectif la mesure des flots de paquets agrave partir drsquounpoint particulier du reacuteseau appeleacute le point de collecte Elle consiste agrave eacutecouter captureret analyser les paquets IP La figure 115 illustre le principe de la meacutetrologie passiveElle montre que le point de collecte nrsquoest pas forceacutement localiseacute du coteacute eacutemetteur oureacutecepteur Les paquets IP transitant par le point de collecte sont captureacutes et sauvegardeacutesOn appelle alors les fichiers contenant les paquets IP collecteacutes des traces Les mesurespassives peuvent ecirctre effectueacutees agrave diffeacuterents niveaux de granulariteacute

Au niveau microscopique les mesures passives tendent agrave eacutetudier les flots au niveaude la connexion de transport On peut par exemple eacutetudier le nombre de paquets per-dus durant une connexion TCP Au niveau macroscopique les mesures passives sonteffectueacutees sur des meacutetriques agreacutegeacutees comme le deacutebit eacutecouleacute total ou le nombre total deconnexions

32

FIGURE 115 ndash Principe de la meacutetrologie passive

La meilleure faccedilon de reacutealiser des mesures passives au niveau microscopique est decapturer tous les paquets traversant le point de collecte Mais comme il est difficile decapturer tous les paquets lorsque le deacutebit du lien est eacuteleveacute il faut avoir recours agrave lrsquoeacutechan-tillonnage du trafic Dans ce cas les mesures ne sont pas faites sur la totaliteacute des pa-quets traversant le point de collecte mais sur un sous-ensemble bien speacutecifique de cespaquets Le groupe de travail Packet Sampling (PSAMP) de lrsquoIETF travaille sur un algo-rithme drsquoeacutechantillonnage adapteacute au trafic Internet [PSAMP]

Une combinaison entre lrsquoanalyse des deux granulariteacutes est capable de donner uneeacutevaluation reacuteelle du trafic Les informations que lrsquoon peut obtenir par la meacutetrologie pas-sive sont nombreuses Elles reposent sur lrsquoeacutetude des informations contenues dans le da-tagramme IP que ccedila soit dans lrsquoen-tecircte du datagramme IP ou dans celle du message duprotocole de transport Les meacutetriques sont eacutegalement deacutependantes des outils utiliseacutes Onpeut classer les meacutetriques en deux cateacutegories que sont la supervision et la performance

La supervision donne des informations sur le fonctionnement du reacuteseau et la carac-teacuterisation du trafic On peut ainsi eacutetudier les diffeacuterents services et protocole de transportutiliseacutesLa performance se rapporte agrave celle du protocole de transport crsquoest-agrave-dire son fonction-nement ou sur lrsquoanalyse des flots par rapport soit agrave la composante temporelle ou soit agravela composante seacutemantique On peut alors comparer le deacutebit drsquoaccegraves theacuteorique et le deacutebitmesureacute Pour cela on va eacutetudier le taux de perte le RTT et la MSS

La meacutethode de capture peut reposer sur des eacutequipements mateacuteriels deacutedieacutes ou par unsystegraveme logiciel fonctionnant sur un eacutequipement standard Le logiciel srsquoappuie majori-tairement sur la bibliothegraveque Libpcap [Jacobson1989-2] Cette bibliothegraveque capture lespaquets reccedilus mais elle srsquoutilise eacutegalement en lisant des traces de paquets preacutealablementcaptureacutes Le problegraveme principal des solutions logicielles viennent de la vitesse des liensPlus le lien a un deacutebit eacuteleveacute plus la capture au niveau logiciel devient difficile Il fautalors se tourner vers des solutions de mateacuteriels deacutedieacutes La carte DAG [Graham1997] deacute-veloppeacutee par lrsquoeacutequipe [WAND] de lrsquoUniversiteacute de Waikato en Nouvelle Zeacutelande en est unparfait exemple Cette carte de capture est capable de capter les paquets sur des liens detregraves haut deacutebit Ce mateacuteriel se charge drsquoextraire les entecirctes des paquets de les estampillersuivant une horloge synchroniseacutee et de les stocker sur un disque dur

Lrsquoanalyse des donneacutees est reacutealiseacutee selon deux techniques temps reacuteels ou Batch Leprincipe du temps reacuteel est de pouvoir reacutecupeacuterer extraire et restituer de lrsquoinformation entemps reacuteel sur des flux continus de donneacutees Le mode Batch va englober tous les traite-ments de donneacutees neacutecessitant un temps de calcul plus conseacutequent Le premier proceacutedeacutese propose drsquoanalyser agrave la voleacutee ce qui se passe dans le reacuteseau par le branchement drsquouneacutequipement drsquoeacutecoute sur le reacuteseau On se concentre alors sur la performance du lien Desoutils comme Tstat [Mellia2005] ou Netflow [Claise2004] reacutealisent ce genre drsquoanalyse La

33

seconde technique se deacutecompose en deux phases distinctes que sont la capture et lrsquoana-lyse La premiegravere eacutetape est de reacutealiser la capture du trafic appeleacutee des traces Des outilscomme TCPDump [Jacobson1989-1] ou Wireshark [Chappell2010] peuvent enregistrerdes traces sous format DUMP ou PCAP La seconde phase consiste agrave analyser les tracescollecteacutees Les formats de sortie des donneacutees analyseacutees sont deacutependants des outils Lesinformations peuvent ecirctre retranscrites au format texte ou graphique Des outils commeTCPTrace [Ostermann2000] ou TCPStat [Herman2001] peuvent effectuer ce genre drsquoana-lyse de donneacutees Crsquoest avec cette technique qursquoil est possible drsquoeacutetudier les performancesdrsquoun protocole

Il nrsquoexiste pas de plate-forme drsquoaccegraves publique reacutealisant des captures de trafic au ni-veau international Malgreacute cela des traces collecteacutees sont disponibles sur Internet agrave desfins de recherche Dans [Allman2007] les auteurs preacutesentent les regravegles agrave respecter avantde publier des traces Un point est agrave souligner et concerne les adresses IP des paquets Lanon-anonymisation des adresses IP constitue une violation de la vie priveacutee de plus ellepreacutesente un risque drsquoinseacutecuriteacute pour les machines impliqueacutees par les paquets captureacutesCAIDA gegravere un deacutepocirct de partage et propose drsquoacceacuteder agrave des traces collecteacutees agrave traversplusieurs points drsquoeacutechange ameacutericains Pour y acceacuteder il faut indiquer la finaliteacute de lrsquouti-lisation des traces demandeacutees Drsquoautres plates-formes deacutedieacutees agrave des projets ont eacuteteacute misesen place agrave travers le monde

Le projet IPMon de lrsquoopeacuterateur ameacutericain SPRINT consiste agrave identifier les problegravemesdrsquoun reacuteseau deacutejagrave deacuteployeacute afin de pouvoir anticiper son eacutevolution future[IPMon] Danslrsquoarticle [Fraleigh2001] lrsquoauteur preacutesente lrsquoinfrastructure de mesure qui est deacuteployeacutee endivers points du reacuteseau de lrsquoopeacuterateur Les premiers reacutesultats publieacutes dans [Fraleigh2003]ont montreacute une utilisation de plus en plus importante par du trafic multimeacutedia sur le pro-tocole TCP De plus les flots TCP preacutesentent des performances eacuteleveacutees avec des taux dedeacute-seacutequencement faibles et un deacutelai minimal proche du temps de propagation

Le projet METROPOLIS srsquoest inspireacute du projet IPMon Il srsquoagit drsquoun projet franccedilaisavec des points de mesures sur deux types de reacuteseaux Internet diffeacuterents RENATER etle reacuteseau ADSL de France Teacuteleacutecom laquo Lrsquoobjectif de METROPOLIS eacutetait de concevoir denouvelles meacutethodologies pour la meacutetrologie des reacuteseaux IP raquo [METROPOLIS] Dans lecadre de ce projet un outil de caracteacuterisation et drsquoanalyse des traces fut deacuteveloppeacute Cenouvel outil srsquointitule ZOO Une preacutesentation de lrsquooutil sera reacutealiseacutee dans la sous-section322 Les reacutesultats ont mis une eacutevidence lrsquousage preacutedominant du protocole de transportTCP Les applications de type peer-to-peer repreacutesentaient plus de 80 du trafic eacutetudieacute

La position geacuteographique de La Reacuteunion et son rattachement au RIR AfriNIC attirentnotre attention sur les travaux de meacutetrologie passive africains La carte [AfterFibre] preacute-sente les reacuteseaux fibres terrestres et maritimes lieacutes au continent africain On voit ainsi queles reacuteseaux sont ineacutegalement reacutepartis sur le territoire La grandeur du continent et les in-terconnections preacutesentes font du territoire un espace drsquoeacutetude inteacuteressant Crsquoest pourquoide nombreux chercheurs privileacutegient lrsquoeacutetude de la connectiviteacute et des performances delrsquoInternet africain

Dans lrsquoarticle [Johnson2011] une eacutetude sur une zone rurale connecteacutee par satelliteest reacutealiseacutee Les reacutesultats ont montreacute que le trafic est principalement composeacute de fluxweb dont une forte proportion pourrait ecirctre mise en cache Au niveau des deacutelais le RTTmoyen sur la peacuteriode de mesure varie entre 3 et 10 secondes Ce deacutelai rend lrsquoutilisationdes applications temps-reacuteel difficile Le dernier reacutesultat notable de cette analyse est lapreacutesence de trafic geacuteneacutereacute par des logiciels malveillants (malware) Des attaques pour listerles ports UDP et TCP ouverts ont eacuteteacute remarqueacutees

En 2015 les auteurs de [Zheleva2015] ont eacutetudieacute les performances du reacuteseau et le com-portement des usagers apregraves une augmentation de la bande passante en Zambie Lrsquoun des

34

premiers reacutesultats indique une augmentation de plus de 58 de la quantiteacute des donneacuteeseacutechangeacutees Au niveau des performances ils ont pu eacutegalement remarquer une tregraves leacutegegraveredeacutegradation du canal de communication avec un taux de retransmission en hausse Cepourcentage est passeacute de 1 12 agrave 1 16 Le dernier reacutesultat noteacute porte sur lrsquoaugmenta-tion du RTT moyen de plus de 100 passant de 0 1436 s agrave 0 3190 s Lrsquoaugmentation dela bande passante a permis lrsquoaccegraves agrave de nouveaux services entraicircnant des changementspour les usagers

Dans [Fanou2016] lrsquoauteur srsquointeacuteresse aux services proposeacutes et compare la localisa-tion des serveurs Le premier reacutesultat montre lrsquoexternalisation continentale de nombreuxserveurs Ceci a pour conseacutequence drsquoaugmenter les deacutelais et de deacutegrader la performancedu service de communication Il faut pour lrsquoauteur arrecircter de raisonner en terme drsquoin-frastructure mais plus en terme de service et mettre lrsquoutilisateur au centre du systegravemePour cela il propose de rapatrier les services sur le territoire et drsquoaugmenter les accordsdrsquoeacutechanges entre les opeacuterateurs continentaux

Enfin dans [Johnson2016] les auteurs srsquointerrogent sur les faibles performances deTCP en Afrique La preacutesence de zone reculeacutees avec des accegraves satellitaires poussent lesdeacutelais vers des valeurs allant au delagrave des 400 ms Ces longs deacutelais sont agrave rapprocher desdeacutebits faibles De plus une expeacuterimentation sur les performances de TCP en fonction dusystegraveme drsquoexploitation a eacuteteacute meneacutee Les reacutesultats ont mis en eacutevidence que le systegraveme Li-nux avec la version TCP CUBIC est moins sensible au long deacutelais La solution proposeacutee auproblegraveme de la diffeacuterence de connectiviteacute agrave travers le continent est la creacuteation drsquoune ingeacute-nierie reacuteseau (liaison physique protocole de transport nouveau service) tenant comptedu contexte Africain

124 Comparatif entre mesures actives et mesures passives

La meacutetrologie active et la meacutetrologie passive preacutesentent des points communs et despoints de divergences Une fois des objectifs fixeacutes et au moment du choix de la meacutethodeil est important de connaicirctre les avantages et les inconveacutenients lieacutes agrave chaque type demesure Le tableau 16 reacutecapitule syntheacutetiquement ce qui vient drsquoecirctre preacutesenteacute

TABLE 16 ndash Comparatif entre mesures actives et mesures passives

Meacutetrologie Active Meacutetrologie Passive

Avantages

1 - Pour la mesure directe des pa-ramegravetres de QoS principalementle deacutelai le taux de pertes et lagigue

1 - Non intrusives2 - Permettent une mesure directedes paramegravetres utiliseacutes dans lrsquoin-geacutenierie des reacuteseaux

Inconveacutenients

1 - Intrusives le trafic de mesurepeut dans certains cas fausser lesmesures elles-mecircmes2 - Le fait que certains adminis-trateurs et entreprises bloquentou limitent le trafic ICMP peutfausser les reacutesultats obtenus parles techniques actives car ces der-niegraveres font souvent usage de ceprotocole

1 - Elles sont locales (relatives agraveun lien) et il est difficile de leseacutetendre agrave la globaliteacute du reacuteseau2 - Elles ne permettent pas la me-sure directe des paramegravetres deQoS3 - Elles neacutecessitent des ressourcesdisque et meacutemoire vive impor-tantes

35

13 Synthegravese

Ce chapitre a rappeleacute le fonctionnement du controcircle de congestion de TCP Le controcirclede congestion de TCP vise agrave maximiser lrsquoutilisation des ressources et agrave maximiser le deacute-bit utile eacutecouleacute de la connexion Ce controcircle est reacutegi par une boucle fermeacutee caracteacuteriseacuteepar un RTT Plus le deacutelai est eacuteleveacute moins TCP est susceptible de reacuteagir dynamiquementaux eacuteveacutenements de congestion Lorsque le produit du RTT et de la capaciteacute du canalde communication est trop important TCP peine agrave atteindre les objectifs preacuteceacutedemmentpreacutesenteacutes Lrsquoaugmentation progressive de la bande passante sans diminution des deacutelais apour effet lrsquoaugmentation de la capaciteacute de stockage des liens Cet accroissement a uneffet neacutegatif sur les performances de TCP Cet effet neacutegatif impacte le deacutemarrage deconnexion les flots courts la reacutesolution de la congestion et la dynamique du sondagePour diminuer lrsquoeffet de la capaciteacute de stockage des liens sur les performances de TCPde nouveaux controcircles de congestion furent deacuteveloppeacutes Chaque nouvelle version ducontrocircle de congestion ambitionne de reacutesoudre une agrave plusieurs probleacutematiques des reacute-seaux agrave forte capaciteacute de stockage Le deacutemarrage de connexion et les flots courts ont dessolutions communes comme une augmentation de la capaciteacute drsquoeacutemission de TCP agrave lrsquoini-tialisation de la connexion ou la reacuteduction du RTO Les probleacutematiques de reacutesolution decongestion et de dynamique de sondage ont permis la creacuteation de nouvelles versions ducontrocircle de congestion de TCP Ces versions de TCP sont des solutions de bout-en-boutDrsquoautres solutions neacutecessitent un changement de paradigme et lrsquointeraction avec les rou-teurs Ces solutions ont lrsquoavantage drsquoecirctre reacuteactives mais neacutecessitent la mise agrave jour deseacutequipements intermeacutediaires du reacuteseau

Le localisation geacuteographique de La Reacuteunion au milieu de lrsquooceacutean indien place lrsquoicircledans une situation ougrave la capaciteacute de stockage du reacuteseau peut ecirctre importante Nous avonsainsi estimeacute cette capaciteacute agrave lrsquoaide des deacutebits theacuteoriques des accegraves et les deacutelais de propa-gation estimeacutes et mesureacutes Les reacutesultats obtenus ont mis en eacutevidence une capaciteacute destockage autorisant la caracteacuterisation de lrsquoInternet reacuteunionnais comme un reacuteseau agrave fortecapaciteacute de stockage Lrsquoimpact de cette capaciteacute de meacutemorisation nrsquoa pas encore eacuteteacute me-sureacute Crsquoest pourquoi nous nous sommes concentreacutes sur la meacutetrologie Internet

La meacutetrologie active est une science invasive en injectant des paquets dans le reacuteseauLa meacutetrologie active mesure directement des paramegravetres de qualiteacute de service comme lesdeacutelais les routes le taux perte et la gigue Nous avons vu que des outils sont en capa-citeacute de mesurer deux meacutetriques simultaneacutement Certains outils peuvent ecirctre distribueacuteset ainsi former des plates-formes de mesure Ces plates-formes offrent la possibiliteacute auxpersonnes inteacuteresseacutees du monde entier de geacuteneacuterer des donneacutees de mesure agrave travers lemonde Les performances de TCP sont deacutependantes du deacutelai Les deacutelais sont eux-mecircmedeacutependants des routes physiques et logiques emprunteacutees Il est donc important drsquoeacutetudierces deux paramegravetres Connaissant nos besoins nous utiliserons lrsquoapproche research drivenpour lrsquoeacutetude de meacutetrologie active Lrsquoapproche research driven est une approche consistantagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires agrave lrsquoeacutetude Notre eacutetude de meacutetrologie active est preacutesenteacutee dansle chapitre 2

La meacutetrologie passive permet une mesure directe des paramegravetres utiliseacutes Cette classede meacutetrologie est centreacutee sur un lien de mesure Elle utilise lrsquoeacutecoute et la capture desdatagrammes IP La meacutetrologie passive eacutetudie la caracteacuterisation du trafic et la perfor-mance des protocoles Nous avons vu que des outils sont en capaciteacute de reacutealiser les deuxeacutetudes en parallegravele Ne pouvant reacutealiser des eacutetudes de meacutetrologie passive agrave distance denombreux chercheurs ont mis agrave disposition de la communauteacute scientifique des donneacuteespubliques La litteacuterature scientifique propose un grand nombre de meacutetriques pour lrsquoeacutetudedes performances du protocole de transport TCP et de la supervision du trafic Afin de

36

ne pas nous concentrer sur une meacutetrique en particulier nous faisons le choix de ne pasdresser une liste de meacutetriques Notre eacutetude de meacutetrologie passive que nous preacutesente-rons dans le chapitre 3 utilisera lrsquoapproche measurement driven Cette approche consiste agravemettre en place une infrastructure de mesures afin de reacutecupeacuterer le maximum drsquoinforma-tions puis drsquoeffectuer toutes les analyses possibles sur les donneacutees collecteacutees Neacuteanmoinsla meacutetrologie passive souffre de deux faiblesses essentielles (1) elle reste locale et il estdifficile drsquoeacutetendre les reacutesultats agrave la globaliteacute du reacuteseau (2) au niveau microscopique lescaptures aboutissent tregraves rapidement agrave des volumes de traces colossaux

37

38

Chapitre 2

Caracteacuterisation de la connectiviteacute deLa Reacuteunion

Le rapport [Mediametrie2018-2] sur lrsquoaccegraves Internet agrave La Reacuteunion a montreacute que 856de la population reacuteunionnaise de plus de 13 ans srsquoest deacutejagrave connecteacutee agrave Internet 747 deces personnes sont des usagers reacuteguliers En comparaison le rapport [Mediametrie2018-1]montre qursquoaux alentours de 68 de la population franccedilaise meacutetropolitaine se connectequotidiennement Ces sondages montrent lrsquointeacuterecirct pris par lrsquoInternet pour la populationreacuteunionnaise

En 2013 une eacutetude de meacutetrologie reacutealiseacutee par BinarySec vise a effectuer un classementdes fournisseurs drsquoaccegraves Internet de La Reacuteunion Dans le rapport associeacute [Vergoz2013] 9meacutetriques sont preacutesenteacutees Parmi elles le deacutebit descendant moyen est mesureacute agrave 9 36MbsEn comparaison le deacutebit descendant moyen en France meacutetropolitaine mesureacute par[Akamai2015] srsquoeacutelegraveve agrave 8 2 Mbits Akamai utilise la plate-forme Intelligent PlatformTM

pour reacutecolter des donneacutees dont le deacutebit reacuteel La Reacuteunion posseacutedait ainsi un meilleurdeacutebit descendant que la France meacutetropolitaine Le deacutebit moyen franccedilais preacutesenteacute par[Akamai2017] est de 10 75 Mbits Le deacutebit descendant minimum reacuteunionnais mesureacutepar [nPerf2017] est de 18 63 Mbits Ainsi lrsquoeacutecart entre les deacutebits franccedilais et reacuteunionnaissrsquoest accentueacute Malgreacute un deacutebit plus eacuteleveacute La Reacuteunion preacutesente des deacutelais plus eacuteleveacutesque la France

Lrsquoeacutevolution des deacutebits pose la question sur lrsquoeacutevolution des deacutelais depuis la derniegraverecampagne de mesure La figure 111 montre des deacutelais plus importants agrave La Reacuteunion qursquoagraveParis Lrsquoobjectif de ce chapitre est drsquoeacutetudier lrsquoeacutevolution des deacutelais depuis 2012 On srsquointeacute-resse eacutegalement agrave la connectiviteacute de La Reacuteunion en terme de deacutelai et de routes Lrsquoasymeacute-trie des liens est une chose courante dans lrsquoInternet Les questions que lrsquoon se pose de-puis La Reacuteunion doivent eacutegalement ecirctre poseacutees lorsque lrsquoon essaye de joindre lrsquoicircle Dansce chapitre nous allons explorer la connectiviteacute de La Reacuteunion Pour cela nous avonsmis en place un protocole de mesures se basant sur notre propre plate-forme de mesuresrespectant la reacutepartition des destinations Notre plate-forme a pour objectif lrsquoeacutetude desroutes et des deacutelais speacutecifiques de lrsquoicircle par rapport agrave son accegraves Internet via les cacircblessous-marins

Une seconde question est alors apparue Est-ce que ces speacutecificiteacutes sont uniquementcelles de La Reacuteunion ou alors communes aux icircles de la Zone Oceacutean Indien

Dans la section 21 nous preacutesentons les objectifs de notre eacutetude de meacutetrologie et lescontraintes associeacutees Afin de reacutepondre agrave ces contraintes un cahier des charges est preacute-senteacute dans la section 22 Le protocole drsquoeacutetude est deacutecrit dans la section 23 Les reacutesultatsobtenus pour La Reacuteunion suivis de ceux des icircles de lrsquoOceacutean Indien sont preacutesenteacutes dansla section 24

39

21 Objectifs

En 2012 [Anelli2012] a reacutealiseacute une campagne de mesure des deacutelais depuis La Reacuteunionet Paris Cette campagne de meacutetrologie active baseacutee sur la commande ping a pour ob-jectif de deacutemontrer la diffeacuterence de deacutelai et de deacutebit entre La Reacuteunion et Paris Le premierobjectif de nos travaux consiste agrave la mise jour des donneacutees par une nouvelle eacutetude desdeacutelais Nous ferons par la suite reacutefeacuterence agrave cet objectif par le titre Evolution

Le second objectif est lrsquoanalyse de la connectiviteacute Internet de La Reacuteunion Pour arri-ver agrave obtenir une analyse preacutecise de la connectiviteacute Internet reacuteunionnaise une eacutetude surles routes emprunteacutees par les paquets IP en provenance et agrave destination de La Reacuteunionsera reacutealiseacutee Pour cela on utilisera un outil de type traceroute On utilisera les donneacuteesreacutecolteacutees pour lrsquoidentification des portes de lrsquoInternet reacuteunionnais La reacutefeacuterence utiliseacuteepour cet objectif dans le suite du manuscrit est Connectiviteacute

Ayant cibleacute les meacutetriques nous avons fait le choix de la meacutethode research-driven Cettemeacutethode preacutesenteacutee dans la section 121 a lrsquoavantage de se concentrer uniquement surdes meacutetriques deacutecideacutees preacutealablement Dans le cas de notre eacutetude ce sont les deacutelais et lesroutes

22 Cahier des charges

Deux paramegravetres doivent ecirctre pris en consideacuteration lors de la reacutedaction du cahier descharges lrsquooutil de mesure et lrsquooutil drsquoanalyse

221 Evolution

Pour reacutepondre agrave lrsquoobjectif nous allons effectuer une reprise de lrsquoexistant Lrsquooutil demesure sera la commande ping associeacutee agrave la plate-forme Planet-Lab [PlanetLabEurope]Lrsquooutil drsquoanalyse sera identique agrave celui utiliseacute par [Anelli2012]

222 Connectiviteacute

Identification des besoins

Dans le tableau 14 nous avons vu que diffeacuterents outils sont capables de mesurer lesroutes et les deacutelais Lrsquooutil retenu devra limiter les erreurs lieacutees aux meacutecanismes de lrsquoeacutequi-librage de charge et de MPLS Cet outil devra reacutealiser des mesures depuis des nœudsreacutepartis sur lrsquoensemble de lrsquoicircle Pour cela il est neacutecessaire drsquoeffectuer un choix de plate-forme de meacutetrologie active Ce choix se fera sur 2 points la distribution geacuteographiquedes nœuds de mesure et la couverture des diffeacuterents fournisseurs drsquoaccegraves internet

Lrsquooutil drsquoanalyse devra ecirctre en capaciteacute drsquoidentifier les portes de lrsquoInternet reacuteunion-nais agrave travers la geacuteolocalisation des adresses IP drsquoidentifier les marques MPLS preacutesentesdans les donneacutees pour une meilleure compreacutehension des regravegles de routage geacuteneacuterer unecarte des relations entre pays agrave travers les eacutechanges de paquets envoyeacutes et reacutealiser desstatistiques sur les diffeacuterents nœuds emprunteacutes

Mise en œuvre drsquoune infrastructure de meacutetrologie active

Dans la section preacuteceacutedente nous avons vu que notre cahier des charges devra respec-ter 3 principaux critegraveres outil de mesure plate-forme de mesure et outil drsquoanalyse

40

Paris-traceroute

Nous avons vu dans la partie 122 que lrsquoeacutetude des routes et des deacutelais peut se faire agravelrsquoaide drsquoun seul outil traceroute Or cet outil est sujet agrave des impreacutecisions lieacutees agrave lrsquoeacutequili-brage des charges par exemple Souhaitant limiter lrsquoimpact de ces aleacuteas dans nos donneacuteesnous faisons le choix de Paris-traceroute Pour rappel une preacutesentation de lrsquooutil et deses meacutecanismes est faite agrave la section 122

La plate-forme RunPL

Les plates-formes disponibles Similairement dans la section 122 nous avons preacute-senteacute des plates-formes de meacutetrologie active La plate-forme seacutelectionneacutee devra respecterles critegraveres preacutesenteacutes preacuteceacutedemment

Parmi les plates-formes seules Atlas et Planet-Lab ont des sondes preacutesentes sur lrsquoicirclerespectivement 21 et 2 Ces sondes sont reacuteparties de maniegravere ineacutequitable sur lrsquoicircle Lareacutegion Est de lrsquoicircle ne compte qursquoune sonde quand le minimum est de 6 dans les autresreacutegions De plus certains des Fournisseurs drsquoAccegraves Internet (FAI) nrsquoheacutebergent pas de sondede mesure Le reacutesumeacute de notre comparaison est indiqueacute dans le tableau 21

TABLE 21 ndash Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet

Archipelago Atlas BISMark DASU Planet-Lab SamKnowsParis-traceroute

Oui Oui Oui Non Oui Non

Disponibiliteacutesur lrsquoicircle

Non Oui Non Non Oui Non

Couverturede lrsquoicircle

Non Oui Non Non Non Non

Reacutepartitionfournis-seurs

Non Non Non Non Non Non

On constate ainsi qursquoaucune des plates-formes preacutesenteacutees ne remplit la totaliteacute descritegraveres de seacutelection Nous avons souhaiteacute deacuteployer notre propre infrastructure Cettenouvelle plate-forme reacutepondra agrave nos critegraveres en offrant une meilleure couverture de lrsquoicirclesur les aspects geacuteographiques FAI et Technologies drsquoAccegraves agrave Internet (TAI) Lrsquoeacutechantillon depopulation est repreacutesenteacute par un ensemble drsquoeacutetudiants Notre plate-forme nous autoriseeacutegalement agrave ecirctre maicirctre de lrsquoinfrastructure de mesures que lrsquoon souhaite mettre en placeAfin de seacutelectionner les outils (physiques et logiciels) les plus adapteacutes agrave nos objectifsnous avons deacutecideacute des speacutecificiteacutes de notre plate-forme

Creacuteation et deacuteploiement de la plate-forme RunPL La plate-forme que lrsquoon souhaitedeacuteployer devra respecter un scheacutema de connectiviteacute bien preacutecis repreacutesenteacute par la figure21 La Sonde de mesure est le cœur de la plate-forme La Destination correspond agrave uneadresse IP ou un nom de domaine agrave joindre pour obtenir des informations sur les routesemprunteacutees et les deacutelais associeacutes Le Serveur de stockage est preacutesent pour deacutelester la sondede mesure LrsquoOrdinateur distant repreacutesente lrsquoadministrateur de la plate-forme Ne pouvantse deacuteplacer pour configurer la sonde un accegraves distant doit ecirctre reacutealiseacute Il est illustreacute parle train en pointilleacute sur la figure Le trait plein entre la sonde et la destination correspondagrave lrsquointeraction entre la sonde et la destination Cette interaction repreacutesente les mesuresque lrsquoon obtiendra sur les performances des liens Les sondes de mesure devront pou-voir effectuer les mesures sans limitation de destinations Elles devront afin de limiter

41

le stockage effectuer un deacutelestage des mesures collecteacutees sur un serveur de stockage Ceserveur de stockage tout comme la sonde de mesure devra pouvoir ecirctre joint par lrsquoordi-nateur distant Cette communication a un double objectif Le premier est la reacutecupeacuterationdes donneacutees pour les analyses Le second est la mise agrave jour du protocole de mesure sineacutecessaire Une interaction seacutecuriseacutee est eacutetablie entre lrsquoordinateur distant la sonde et leserveur de stockage Cette liaison est caracteacuteriseacutee par les pointilleacutes sur la figure 21

FIGURE 21 ndash Scheacutema drsquointerconnexion de la plate-forme

Les speacutecificiteacutes de notre plate-forme se deacutecomposent en deux grandes parties quesont la partie mateacuterielle et la partie systegraveme

Mateacuterielle Un cahier des charges speacutecifique agrave notre plate-forme de mesure doit ecirctrereacutealiseacute La premiegravere partie concerne le choix du mateacuteriel physique

La partie mateacuterielle de la plate-forme de mesure est formeacutee de deux composants lasonde de mesure et le serveur de stockage des donneacutees Le serveur de stockage serafourni par le Laboratoire drsquoInformatique et de Matheacutematiques (LIM) Seule la sonde de me-sure sera indiqueacutee dans le cahier des charges Le mateacuteriel seacutelectionneacute devra respecter lescritegraveres preacutecis Ces critegraveres ont eacuteteacute deacutecideacutes en eacutetudiant les solutions proposeacutees par lesplates-formes preacuteceacutedemment eacutetudieacutees

mdash Peu encombrant de nombreuses sondes proposeacutees par les diffeacuterentes plates-formessont tregraves discregravetes Notre sonde devra eacutegalement ecirctre peu visible Nous souhaitonsque la sonde soit directement connecteacutee sur le routeur de lrsquousager

mdash Peu coucircteux le coucirct unitaire de chaque kit ne devait pas deacutepasser 50D afin que lrsquoonpuisse avoir un nombre de nœuds conseacutequent Un kit sera composeacute de la sonde deson cacircble alimentation drsquoune carte meacutemoire et drsquoun cacircble reacuteseau

mdash Peu eacutenergivore la facture drsquoeacutelectriciteacute eacutetant agrave la charge de lrsquousager nous souhai-tions une solution agrave faible consommation drsquoeacutenergie

mdash Diversiteacute du systegraveme drsquoexploitation (OS) Le systegraveme drsquoexploitation choisi devrasupporter lrsquoinstallation de Paris-traceroute

La seconde partie du cahier des charges de notre plate-forme se concentre sur le choixdu systegraveme drsquoexploitation

Pour rappel sur la figure 21 nous avons repreacutesenteacute en pointilleacute des interactions seacute-curiseacutees Ces eacutechanges concernent lrsquoaccegraves distant agrave la sonde au serveur de stockage et agravela sauvegarde des donneacutees de mesures sur le serveur Le systegraveme drsquoexploitation devracorrespondre aux critegraveres de seacutelection suivants

42

mdash Paris-traceroute Le systegraveme drsquoexploitation devra inteacutegrer Paris-traceroute dans seslibrairies drsquoinstallations ou supporter lrsquoinstallation du code source

mdash Licence GNU-GPL Des modifications du systegraveme seront potentiellement neacuteces-saires

mdash Accegraves distant Le mateacuteriel devant ecirctre geacutereacute agrave distance Un accegraves Secure SHell (SSH)devra donc ecirctre configureacute Le protocole SSH [RFC4250] fut deacuteveloppeacute pour per-mettre lrsquoaccegraves agrave distance de terminaux

mdash Transmission seacutecuriseacutee Lrsquoaccegraves au diffeacuterents composants de la plate-forme devrase faire drsquoune faccedilon seacutecuriseacutee La restriction se fera agrave travers un systegraveme drsquoidentifi-cation

Seacutelection du mateacuteriel [Maksimovic2014] reacutealise une comparaison de diffeacuterents micro-ordinateurs tels que Arduino [Arduino] BeagleBone [Beaglebone] Phidgets [Phidgets]Udoo [Udoo] et RaspberryPi [RaspberryPi] Dans ce comparatif les critegraveres utiliseacutes sontproches de ceux que lrsquoon a seacutelectionneacutes Le tableau 22 reacutesume lrsquoensemble des critegraveres deseacutelection du mateacuteriel Il provient directement de lrsquoarticle [Maksimovic2014]

TABLE 22 ndash Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

Critegraveres Arduino BeagleBone Phidegts Raspberry Pi UdooEncombrement(en mm)

7553 863533 813533 8565398 11085

Coucirct (en $ parnœud

30 45 50-200 25-35 99-135

Eacutenergie (en V) 7-12 5 6-15 5 6-15

Systegraveme

drsquoexploitation

Linux ang-strom

Linux

RaspbianUbuntuAndroidArchLinuxFreeBSDFedoraRISC OS

UbuntuAn-droidLinuxArchLi-nux

Nous avons mis en eacutevidence les valeurs respectant les critegraveres Nous faisons le choixdu Raspberry Pi car il possegravede le plus de critegraveres respecteacutes

Seacutelection du systegraveme drsquoexploitation Le premier critegravere de seacutelection est lrsquoinstalla-tion de Paris-traceroute Drsquoapregraves [Paris-traceroute] lrsquooutil est disponible sur les systegravemesRaspbian Ubuntu ArchLinux et FreeBSDConcernant les licences lrsquoensemble des OS ne sont pas eacutequivalents Ainsi seul RaspbianUbuntu et ArchLinux proposent une licence General Public Licence (GPL) RISC OS est as-socieacute agrave une licence proprieacutetaire Android FreeBSD et Fedora sont sous licence de logiciellibre et open source Les licences de distribution open source vont nous autoriser agrave ajou-ter modifier voire supprimer des parties du code pour qursquoil corresponde plus facilementagrave nos besoinsDe nombreux OS proposent nativement la version cliente du protocole SSH La versionserveur peut ecirctre activeacutee lors de lrsquoinstallation du systegraveme drsquoexploitation Lrsquoaccegraves distantnous permettra eacutegalement la mise agrave jour des outils et des OS pour des raisons de seacutecu-riteacuteLa seacutecurisation des eacutechanges se fera au travers drsquoun Virtal Private Network (VPN) Un

43

VPN est un systegraveme permettant de creacuteer un lien direct entre des ordinateurs distants[Coonjah2015] reacutealise une comparaison entre deux outils permettant la creacuteation de VPNOpenSSH et OpenVPN OpenSSH propose de meilleures performances qursquoOpenVPN auniveau de lrsquoutilisation de la bande passante et des temps de transferts de fichiers Malgreacutecela nous avons pris le parti drsquoutiliser OpenVPN car crsquoest un outil majoritairement uti-liseacute par les entreprises [Coonjah2015] Cet utilitaire nous propose la mise en place drsquouneconnexion seacutecuriseacutee baseacutee sur lrsquoidentification agrave travers un certificat drsquoauthentificationLe VPN permet de joindre agrave travers un adressage priveacute les diffeacuterentes sondes qui se-ront distribueacutees sur lrsquoicircle de La Reacuteunion Drsquoapregraves le site officiel drsquo[OpenVPN] lrsquooutil peutsrsquoinstaller facilement sur les distributions Rapsbian Ubuntu et Fedora

Le choix du systegraveme drsquoexploitation va deacutependre des critegraveres de seacutelection Nous reacuteca-pitulons les critegraveres preacutesenteacutes preacuteceacutedemment dans le tableau 23

TABLE 23 ndash Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur RaspberryPi

Critegraveres Raspbian Ubuntu Android ArchLinux FreeBSD Fedora RISC OSParis-traceroute

Oui Oui Non Oui Oui Non Non

Licence GPL GPL ASL GNULinux

BSD CreativeCom-mons

CastleTechno-logiesLtdLicence

Accegraves dis-tant (SSH)

Oui Oui Oui Oui Oui Oui Oui

OpenVPN Oui Oui Non Non Non Oui Non

Deux systegravemes disponibles pour Raspberry Pi reacutepondent agrave nos critegraveres Raspbian etUbuntu Nous faisons le choix du systegraveme Raspbian Cet OS est une distribution Linuxentiegraverement revue pour des performances optimales sur la carte Raspberry Pi Fortementinspireacutee par la distribution Linux Debian elle propose les mecircmes caracteacuteristiques que ladistribution dite de Bureau Les sondes nrsquoeacutetant pas eacutequipeacutees drsquoun systegraveme drsquoaffichagenous optons pour lrsquoinstallation la plus leacutegegravere possible avec uniquement les paquets neacute-cessaires agrave notre eacutetude

Lrsquooutil drsquoanalyse rTraceroute

Dans la section 21 nous avons preacutesenteacute les contraintes lieacutees agrave la seacutelection drsquoun outildrsquoanalyse des donneacutees de type traceroute Pour rappel ces contraintes sont les suivantes la geacuteolocalisation des adresses IP lrsquoidentification des liens MPLS la geacuteneacuteration drsquounecarte des liens logiques et la geacuteneacuteration drsquoun fichier comportant des statistiques sur lesdiffeacuterents nœuds rencontreacutes

Les outils disponibles Il existe diffeacuterents outils drsquoanalyse des routes que lrsquoon peut ran-ger en trois cateacutegories les geacuteneacuterateurs de donneacutees brutes les plates-formes de mesures etles outils drsquoanalyse graphiques Lrsquooutil que lrsquoon souhaite utiliser entre dans la troisiegravemecateacutegorie La litteacuterature autour drsquooutils graphiques pour lrsquoanalyse des routes nrsquoest pasaussi complegravete que lrsquoon pourrait croire

Gtrace est un outil creacuteeacute par [Periakaruppan1999] Cet outil reproduit graphiquementles reacutesultats obtenus par Traceroute Le logiciel geacutenegravere ses propres donneacutees avant de les

44

repreacutesenter sous forme graphique La geacuteolocalisation ne se fait pas sur les adresses IPmais sur le nom Domain Name System (DNS) des nœuds rencontreacutes La localisation drsquounnœud nrsquoest valideacutee qursquoapregraves croisement des informations entre les abreacuteviations des villeset aeacuteroports drsquoinformations contenues dans deux bases de donneacutees Une derniegravere veacuteri-fication est reacutealiseacutee agrave lrsquoaide de la commande nslookup Actuellement cet outil nrsquoest plusmaintenu Il nrsquoimpleacutemente pas le [RFC4950] permettant lrsquoidentification des nœuds MPLSdans les routes

[Aben2015] preacutesente un outil drsquoanalyse des routes inteacutegreacute agrave Atlas RIPE NCC Cet outildrsquoanalyse se nomme OpenIPMap Il utilise la base de donneacutees de RIPE pour effectuer lageacuteolocalisation des donneacutees Les routes sont ensuite traceacutees sur une carte interactive Lesmesures geacuteneacutereacutees par Atlas sont directement visibles et peuvent srsquointeacutegrer dans OpenIP-Map Lrsquoidentification des nœuds MPLS ainsi que la partie statistique ne sont pas inclusesdans les sorties proposeacutees par OpenIPMap

Dans [Yang2016] lrsquoauteur preacutesente un outil drsquoanalyse des routes centreacute sur le conti-nent africain African Visual Route Le design de lrsquooutil srsquoinspire largement du projetOpenIPMap [Aben2015] Lrsquooutil possegravede un deacutefaut important Il lit uniquement les fi-chiers provenant de la plate-forme Atlas

Le tableau 24 preacutesente les possibiliteacutes offertes par chaque outil preacutesenteacute preacuteceacutedem-ment

TABLE 24 ndash Fonctions disponibles dans les outils graphiques drsquoanalyse des routes

African Visual Route Gtrace OpenIPMapGeacuteolocalisation Oui Oui OuiIdentificationdes liens MPLS

Non Non Non

Cartographie Oui Oui OuiStatistiques Non Non Non

On peut constater que par rapport agrave nos besoins les outils listeacutes preacutesentent des la-cunes Les critegraveres drsquoaffichage des liens MPLS et la partie statistique sur les nœuds inter-meacutediaires nrsquoont pu ecirctre remplis Pour ces raisons nous avons deacuteveloppeacute un outil drsquoana-lyse rTraceroute

Deacuteveloppement de rTraceroute

Geacuteolocalisation Dans le cadre de nos travaux la geacuteolocalisation drsquoadresse IP consi-degravere la position geacuteographique de lrsquoadresse les informations sur le deacutetenteur de lrsquoadresseet lrsquoAutonomous System (AS) associeacutes Un AS est un ensemble drsquoeacutequipements et de reacuteseauxsous une mecircme autoriteacute rTraceroute geacuteolocalise les adresses IP rencontreacutees agrave travers unebase de donneacutees impleacutementeacutee au sein du LIM Cette base de donneacutees est remplie au furet agrave mesure que de nouvelles adresses IP sont remonteacutees par les mesures Lrsquoidentificationdes nouvelles adresses se fait par un script deacuteveloppeacute en python sous ma direction parun eacutetudiant de Licence 3eme anneacutee [LanYanFock2015] Cet outil nommeacute rgeoloc utiliseles commandes de lrsquoApplication Programming Interface (API) de RIPE NCC En interro-geant une base de donneacutees drsquoun RIR nous espeacuterons limiter les erreurs lieacutees agrave la geacuteoloca-lisation Pour nos besoins nous limitons les informations lieacutees agrave la localisation et au FAICes informations sont Pays Latitude Longitude Nom du FAI Numeacutero de lrsquoASLes informations (pays longitude latitude) seront utiliseacutees par la suite pour effectuer

45

des calculs de distance entre deux adresses IP Le nom du FAI autorise le suivi des ac-cords drsquoeacutechanges de paquets sur les routes Le numeacutero de lrsquoAS nous offre la possibiliteacutede suivre les diffeacuterents chemins emprunteacutes en termes drsquoAS diffeacuterents

rgeoloc est capable drsquoextraire les informations de deacutelais et de longueurs de routesdrsquoun fichier traceroute Il peut eacutegalement deacutecouper un fichier contenant plusieurs don-neacutees traceroute en fichier unitaire

La geacuteolocalisation des adresses associeacutees agrave lrsquoidentification des liens MPLS va aider agravela compreacutehension des routes de lrsquoInternet dans le monde

Identification des liens MPLS Paris-traceroute indique dans ses sorties les liensMPLS rencontreacutes [Augustin2007] indique que lrsquoidentification des liens se fait par la lec-ture des informations contenues dans les paquets reccedilus par lrsquooutil rTraceroute va identi-fier les marques MPLS et les repreacutesenter en un coloris diffeacuterent sur les cartes

Cartographie Lors de la geacuteolocalisation des adresses IP lrsquoinformation neacutecessaire agravela cartographie est le pays Lors de cette identification deux nouvelles informations sontassocieacutees agrave lrsquoIP Ce sont les coordonneacutees du pays pour la carte passeacutee en paramegravetre Agravepartir de ces nouvelles coordonneacutees rTraceroute va geacuteneacuterer une nouvelle carte affichantlrsquoensemble des liens logiques (entre pays) preacutesents dans les traces analyseacutees

Statistique rTraceroute geacutenegravere des statistiques sur chaque nœud rencontreacute La cleacutedrsquoidentification drsquoun nœud est son adresse IP et sa position sur la route analyseacutee Les sta-tistiques geacuteneacutereacutees sont lrsquooccurrence de la paire drsquoidentification le deacutelai minimal obtenupour joindre ce nœud agrave cette position et le pays rattacheacute agrave lrsquoadresse IP

Notre outil est actuellement disponible sur le site du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrrtraceroute [rtraceroute] Cet outil est distribueacute sous licencelibre pour une large diffusion dans la communauteacute scientifique

23 Protocole de mesure

La connectiviteacute particuliegravere de lrsquoicircle par les deux cacircbles sous-marins provoque un in-teacuterecirct de lrsquoeacutetude des routes emprunteacutees Lrsquoun des objectifs de nos mesures est drsquoeacutetudierlrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012 et 2016 Le second objec-tif est lrsquoeacutetude de la connectiviteacute en terme de routes de deacutelais et des accegraves logiques delrsquoInternet reacuteunionnais

Notre protocole de mesure se divise en 3 parties La premiegravere partie preacutesente lespoints communs entre les deux objectifs La seconde consiste agrave effectuer une comparai-son de lrsquoeacutetat actuel avec le travail effectueacute preacuteceacutedemment par [Anelli2012] Le troisiegravemepoint concerne les mesures drsquoidentification des portes de lrsquoaccegraves Internet de La Reacuteunion

231 Eacutechantillon de mesure

Lrsquoeacutechantillon drsquoadresses IP que lrsquoon va utiliser dans nos eacutetudes se doit drsquoecirctre repreacute-sentatif et preacutecis La preacutecision srsquoobtient par la taille drsquoun eacutechantillon La repreacutesentativiteacutepar le respect de la distribution des adresses IP dans lrsquoInternet

Il existe 232 adresses IPv4 avec une reacutepartition bien speacutecifique Drsquoapregraves les [RFC3232RFC5735 RFC6761] 592 708 865 adresses sont reacuteserveacutees On peut citer en exemple lesadresses de type 1921680016 Ce bloc est reacuteserveacute aux reacuteseaux priveacutes Son utilisationpreacutevue est documenteacutee dans le [RFC1918] Telles que deacutecrites dans ce standard les adresses

46

de ce bloc nrsquoapparaissent pas leacutegitimement sur lrsquoInternet publicApregraves soustraction il ne reste que 3 702 258 431 adresses agrave reacutepartir dans les diffeacuterentspays et FAI Ces IP sont distribueacutees par preacutefixes par les RIR dont RIPE NCC pour lrsquoEu-rope et AfriNIC pour le continent africain Afin drsquoavoir un eacutechantillon preacutecis nous avonsgeacuteneacutereacute aleacuteatoirement 1 000 000 drsquoadresses non reacuteserveacutees Ces adresses ont eacuteteacute testeacutees parle protocole ICMP Ce test nous assure que les adresses IP sont des adresses que nouspourrons utiliser par la suite Nous avons ainsi valideacute 84 000 adresses Neacuteanmoins nousnrsquoavons aucune garantie sur la modification des attributions des adresses IP au fil dutemps

Pour que notre jeu de destinations soit repreacutesentatif nous avons geacuteolocaliseacute les adressesvalides Nous avons regroupeacute les reacutesultats par continent pour une meilleure lisibiliteacute Lereacutesultat obtenu est illustreacute par la figure 22a

Nous pouvons constater une forte dispariteacute entre les diffeacuterents continents LrsquoOceacuteanieet lrsquoAfrique ont moins de 1 de preacutesence dans notre jeu On constate eacutegalement une fortepreacutesence drsquoadresse de type BOGONS Ces adresses font parti de blocs encore non alloueacutespar les RIR ou alors reacuteserveacutees par lrsquoInternet Assigned Numbers Authority (IANA) maispreacutesentes au sein de lrsquoInternet On peut citer lrsquoadresse 10012016100 en exemple Cetteadresse est marqueacutee comme reacuteserveacutee par lrsquoIANA par RIPE NCC Ce nombre drsquoadressesest en diminution avec lrsquoattribution des blocs restant aux diffeacuterents FAI Pour validerce reacutesultat nous lrsquoavons compareacute agrave la distribution datant de Mai 2016 du site CountryIP-Blocks 1 Le regroupement est illustreacute par la figure 22b On remarque un certain eacutequilibreentre lrsquoEurope et lrsquoAsie et une domination de lrsquoAmeacuterique du Nord

Notre reacutepartition est diffeacuterente en de trop nombreux points agrave celle de CountryIP-Blocks Les donneacutees communiqueacutees par CountryIPBlocks proviennent des RIR Cettedistribution est donc plus proche de la reacutepartition reacuteelle Crsquoest pourquoi agrave partir de notreensemble drsquoadresses initales nous seacutelectionnerons un sous ensemble en respectant la dis-tribution preacutesenteacutee par la figure 22b

232 Eacutevolution

En 2012 [Anelli2012] a effectueacute une campagne de ping depuis Paris et La ReacuteunionCette campagne reacutealiseacutee sur le FAI RENATER avait pour objectif la mise en eacutevidence dela diffeacuterence des deacutelais entre Paris et La Reacuteunion Afin drsquoeacutetudier lrsquoeacutevolution des deacutelaiset de la longueur des routes depuis lrsquoeacutetude preacuteceacutedente nous avons reacutealiseacute une nouvellecampagne de ping depuis Paris et La Reacuteunion Cette campagne a mis a contribution lesnœuds [PlanetLabEurope] de lrsquoUniversiteacute de La Reacuteunion et de lrsquoUniversiteacute Pierre et Ma-rie Curie

Agrave partir du jeu drsquoadresses preacutepareacute preacutesenteacute preacuteceacutedemment nous avons tireacute le maxi-mum drsquoadresses IP possibles tout en respectant la reacutepartition geacuteographique de la figure22b Nous avons obtenu un jeu de 40 000 adresses Nous avons fait le choix drsquoutiliserun eacutechantillon drsquoadresses diffeacuterentes par rapport agrave la premiegravere eacutetude Cette deacutecision pro-vient de notre volonteacute drsquoobtenir des donneacutees repreacutesentatives de lrsquoeacutetat actuel de lrsquoInterneten terme de reacutepartition des adresses Chaque mesure sera indeacutependante lrsquoune de lrsquoautreEn effet pour qursquoune mesure se lance il faut que la preacuteceacutedente soit finie

Lrsquoanalyse se deacuteroulera agrave lrsquoidentique de ce qui srsquoest fait pour lrsquoeacutetude preacuteceacutedente agravelrsquoexception drsquoune modification Nous y ajouterons la comparaison de la longueur desroutes Les reacutesultats associeacutes agrave cette eacutetude seront preacutesenteacutes dans la section 241

1 Source httpswww countryipblocks net

47

(a) IP seacutelectionneacutee au hasard (b) CountryIPBlocks

FIGURE 22 ndash Distribution geacuteographique des adresses IPv4 publiques

233 Connectiviteacute

La seconde eacutetude de meacutetrologie active concerne lrsquoeacutetude de la connectiviteacute de La ReacuteunionPour reacutepondre agrave notre objectif nous mettons en place deux protocoles de mesure Unprotocole eacutetudiant la connectiviteacute Depuis La Reacuteunion et un protocole dans le sens Vers LaReacuteunion

Depuis La Reacuteunion

Notre eacutetude de meacutetrologie se compose de plusieurs phases

1 la preacuteparation du jeu de destinations

2 la reacutealisation des mesures par les sondes

3 la quantification des perturbations de nos mesures sur lrsquoaccegraves des usagers

4 la collecte des reacutesultats obtenus par les sondes

5 lrsquoanalyse des reacutesultats

Preacuteparation La reacutepartition geacuteographique preacutesenteacutee dans la figure 22b ne peut pas srsquoap-pliquer agrave lrsquointeacutegraliteacute de notre ensemble de deacutepart Afin de pouvoir garder cette reacutepar-tition nous avons reacuteduit notre jeu de destinations agrave 10 000 adresses Cette reacuteduction estneacutecessaire afin que lrsquoensemble de nos mesures puissent ecirctre reacutealiseacutees en un deacutelai de 24heures Bien que le nombre drsquoadresses seacutelectionneacutees repreacutesente moins de 1 des adressesIP publiques de lrsquoInternet il est neacuteanmoins suffisant pour que notre jeu reste preacutecis

48

Reacutealisation Chaque sonde eacutetant indeacutependante lrsquoautomatisation du lancement des me-sures degraves le deacutemarrage est neacutecessaire De fait une proceacutedure a eacuteteacute implanteacutee au seinde lrsquoOS Cette proceacutedure va autoriser le deacutemarrage des mesures degraves la fin de la phasedrsquoinitialisation de lrsquoensemble des services de Raspbian La mise en place des mesures estdiviseacutee en 2 eacutetapes

La premiegravere consiste pour chaque sonde agrave creacuteer ses propres sceacutenarios de mesuresUn sceacutenario est un fichier contenant deux colonnes destination et intervalle de temps Lapremiegravere colonne contient les 10 000 adresses IP de destination La seconde colonne re-groupe des valeurs qui serviront drsquoeacutecart entre deux mesures Ces valeurs ont eacuteteacute geacuteneacutereacuteessuivant une loi exponentielle de taux 864 Ce taux provient de lrsquoeacutequation 21 ci-dessous

taux = nombre de secondes par journombre dprimeadresses IP = 8640010000 = 8 64(21)

Les valeurs obtenues seront identiques sur lrsquoensemble des sondes de mesures Chaquesceacutenario sera creacuteeacute en tirant aleacuteatoirement une adresse IP et un eacutecart Une fois que lrsquoen-semble des sceacutenarios est eacutecrit et numeacuteroteacute de 1 agrave 28 la sonde va programmeacute dans le tempslrsquoexeacutecution de la seconde eacutetape gracircce agrave la commande at

La seconde eacutetape consiste agrave lire le sceacutenario du jour et agrave joindre la destination par lrsquooutilde mesure La commande exacte exeacutecuteacutee par chaque test est

Paris-traceroute -m 255 -n -p icmp ip

Dans laquelle les options indiquent

mdash -m 255 la valeur du champ TTL du paquet est mise agrave sa valeur maximale (255)Nous faisons le choix drsquoautoriser lrsquooutil agrave essayer de joindre la destination jusqursquoagraveeacutepuisement de la valeur maximale autoriseacutee par le protocole pour identifier certainsproblegravemes de routage

mdash -n pas de reacutesolution de DNS Afin drsquooptimiser les mesures nous avons eacutelimineacute lareacutesolution des noms des routeurs Seules les adresses IP seront afficheacutees

mdash -p icmp le protocole utiliseacute pour la mesure [Wenwei2006] effectue une eacutetude com-parative entre les protocoles ICMP et TCP pour les mesures de deacutelai Ils ont montreacuteque dans certaines conditions les reacutesultats sont similaires Quand le ratio α calculeacuteentre le RTT moyen et le RTT minimal tend agrave ecirctre important (supeacuterieur agrave 20) TCPest moins stable que son concurrent Crsquoest pour cette raison que nous avons fait lechoix de lrsquoICMP

mdash ip adresse IP de destination que la commande va essayer de joindre

Veacuterification La sonde va consommer de la bande passante de chaque connexion Inter-net Lrsquoestimation du deacutebit de la mesure deacutepend du nombre moyen de paquets eacutemis parmesure et de la dureacutee moyenne drsquoune mesure Agrave lrsquoaide drsquoune peacuteriode de test nous avonspu calculer divers paramegravetres drsquoune mesure reacutealiseacutee avec Paris-traceroute Les informa-tions obtenues concernent la dureacutee drsquoune mesure et le nombre de paquets eacutechangeacutes Lesreacutesultats obtenus montrent qursquoune mesure dure en moyenne 28 secondes et se composede 54 paquets de 64 octets Une mesure geacutenegravere donc un deacutebit drsquoeacutemission de 987 bitss agravelrsquoentreacutee de lrsquointerface reacuteseau Le deacutebit geacuteneacutereacute effectif (au niveau du support) est de 1265bitss Le deacutebit geacuteneacutereacute par rapport au deacutebit drsquoaccegraves drsquoun accegraves ADSL est alors neacutegli-geable

49

Drsquoapregraves le rapport [Vergoz2013] le deacutebit montant le plus faible mesureacute est de 128 33KbsLa charge calculeacutee repreacutesente pregraves de 1 de la capaciteacute du lien drsquoaccegraves Comme il yaura en moyenne 4 mesures simultaneacutees la capaciteacute consommeacutee correspond donc agrave 4Cette situation correspond au pire cas Dans la situation courante drsquoun accegraves theacuteorique enMbits nous pouvons avancer que la sonde nrsquoaura aucun impact sensible sur la connec-tiviteacute du participant

Collecte Une phase de collecte des donneacutees de mesures est reacutealiseacutee Le but de cetteeacutetape est de libeacuterer de lrsquoespace disque sur la sonde Chaque jour agrave minuit un nouveausceacutenario est lanceacute Une fois que 7 sceacutenarios ont eacuteteacute lus la sonde va creacuteer une archive Lenom de lrsquoarchive sera composeacute de la date de creacuteation de lrsquoarchive du nom de la sonde etde la TAI Le nom propose un classement rapide des donneacutees que ccedila soit par TAI ou pardate Lrsquoarchive contiendra les mesures des 7 jours preacuteceacutedents Lrsquoarchive est envoyeacutee sur leserveur de stockage localiseacute au sein du laboratoire Une comparaison de lrsquoempreinte MD5de lrsquoarchive preacutesente sur le serveur et sur la sonde de mesure sera reacutealiseacutee Si les deuxempreintes sont identiques alors la suppression de lrsquoarchive heacutebergeacutee sur le RaspberryPi est reacutealiseacutee Le jour drsquoenvoi des donneacutees sur le serveur aucune mesure nrsquoest effectueacuteeafin de ne pas geacuteneacuterer de bruit suppleacutementaire sur le lien Le lendemain de la copiedes donneacutees la sonde va amorcer 7 nouveaux jours de mesures Un cycle de mesuresest composeacute de 7 jours de mesures conseacutecutifs et drsquoun jour drsquoenvoi des donneacutees versle serveur de stockage Ce cycle est reacutepeacuteteacute 4 fois par mois La figure 23 scheacutematise lefonctionnement drsquoune sonde de mesure sur une dureacutee de 32 jours soit 4 cycles de mesureet de collecte

La plate-forme reacutealise des mesures en continue jusqursquoagrave lrsquoarrecirct complet de lrsquoappareil demesures Nous nrsquoavons pour lrsquoinstant pas programmeacute drsquoarrecirct des mesures Dans le cadrede lrsquoanalyse reacutealiseacutee dans ce manuscrit nous avons pris un cycle complet de mesure soit32 jours Nous nrsquoeffectuons pas drsquoanalyse comparative temporelle de nos mesures

Analyse La plate-forme reacutealise les mesures par cycle de 7 jours Lrsquoanalyse des tracesreacutecolteacutees se fait en plusieurs eacutetapes Le processus drsquoanalyse commence par la deacutecoupedu fichier de donneacutees en fichiers atomiques Chaque fichier atomique contiendra uni-quement le reacutesultat drsquoune mesure Chaque fichier de donneacutees reacutecolteacutees par jour va doncecirctre deacutecouper en 10 000 fichiers atomiques Cette deacutecoupe est reacutealiseacutee par lrsquooutil rgeolocLrsquoanalyse des fichiers atomiques diffegravere selon lrsquoobjectif

Lrsquoextraction des deacutelais srsquoeffectue agrave lrsquoaide de rgeoloc Lors de lrsquoextraction les informa-tions sur les deacutelais sont accompagneacutees de la longueur du chemin et des adresses IP sourceet destination

Nous souhaitons deacuteterminer si les routes Internet provenant de La Reacuteunion sont sy-meacutetriques ou non Pour cela une eacutetude des deacutelais et des routes vers La Reacuteunion est effec-tueacutee

Vers La Reacuteunion

Les routes asymeacutetriques sont freacutequentes et principalement dues agrave des politiques deroutage et agrave lrsquoingeacutenierie de trafic Des meacutecanismes comme lrsquoeacutequilibrage de charge (load-balancing) Hot Potato Routing ou encore BGP (Border Gate Protocol) peuvent eacutegalementgeacuteneacuterer un pheacutenomegravene drsquoasymeacutetrie des liensHot Potato Routing est un pheacutenomegravene lieacute au routage sans regraveglement Le routeur transfegraverele paquet aussi vite que possible vers un routeur situeacute en aval sur la route [Feige1992Wang2018]

50

FIGURE 23 ndash Fonctionnement de la sonde

BGP est protocole de routage inter-AS deacutefini dans le [RFC1105] En fonction des informa-tions eacutechangeacutees deux paquets peuvent ne pas suivre la mecircme chemin IP mais suivre unchemin AS identique

Afin de veacuterifier la preacutesence des liens asymeacutetriques nous avons mis en place le proto-cole suivant en utilisant la plate-forme Atlas RIPE NCC [Ripe2010]

Preacuteparation Pour notre eacutetude et en accord avec les Conditions Geacuteneacuterales drsquoUtilisation(CGU) drsquoAtlas nous avons seacutelectionneacute le nombre maximal de sondes autoriseacutees soit1 000 Ces sondes serviront de sources pour nos mesures La seacutelection des sondes srsquoestfaite selon deux critegraveresLe premier est le fait que la sonde soit active En effet mecircme si la sonde nrsquoest pas joi-gnable Atlas continue drsquoindiquer la sonde dans ses donneacuteesLa seconde indication neacutecessaire agrave la seacutelection drsquoune sonde est son pays drsquoheacutebergementIl est neacutecessaire de garder la mecircme reacutepartition geacuteographique que les destinations seacutelec-tionneacutees pour lrsquoeacutetude preacuteceacutedente (voir Figure 22b)

La seacutelection des destinations srsquoest effectueacutee sur les critegraveres drsquoidentification des FAI etdes TAI disponibles sur lrsquoicircle Tout comme notre plate-forme de mesure de la section 233

51

il est pour nous important que nos destinations respectent une pariteacute sur ces critegraveres deseacutelection Afin de nous assurer que nos destinations soient physiquement heacutebergeacutees surlrsquoicircle nous avons pris la deacutecision de seacutelectionner des sondes de mesure de lrsquoeacutetude preacuteceacute-dente Lrsquoutilisation drsquoAtlas eacutetant reacutegi par un systegraveme drsquoutilisation et de creacuteation de creacuteditnous avons ducirc limiter le nombre de nos destinations agrave 10 IP publiques de la plate-formeRunPL Nous avons pleinement conscience que ce nombre nrsquoest pas forceacutement repreacute-sentatif du nombre drsquoadresse IP disponibles sur lrsquoIcircle de La Reacuteunion mais nous sommesrestreint par les CGU drsquoAtlas

Reacutealisation Atlas propose deux possibiliteacutes de programmation des sondes La premiegraveresrsquoeffectue agrave travers son interface graphique Le second choix est drsquoutiliser une API Commeil est fastidieux de programmer un nombre important de mesures agrave travers lrsquointerfacegraphique nous faisons le choix drsquoutiliser lrsquoAPI Pour effectuer 10 000 mesures par journous avons fait le choix de garder le taux de la loi exponentielle de lrsquoeacutetude preacuteceacutedentesoit 8 64 secondes Afin de limiter les pheacutenomegravenes de synchronisation le calendrier demesures a eacuteteacute geacuteneacutereacute aleacuteatoirement Nous nous sommes assureacutes que chaque sonde demesures allait effectivement joindre lrsquoensemble des destinations par jour

Veacuterification La veacuterification des perturbations se fait sur la bande passante descendanteEn effet ce sont les sondes de la plate-forme RunPL qui geacutenegraverent du trafic en continu Ilne faut pas que les mesures de la section 233 soient impacteacutees par lrsquoarriveacutee des paquetsentrants Le nombre maximal de paquets arrivant jusqursquoau routeur de lrsquoheacutebergeur estde 3 Un paquet possegravede un poids maximal de 64 octets Un poids total de 1536 bitsest envoyeacute agrave la destination Une mesure eacutetant programmeacutee toutes les 8 secondes nousutilisons cette valeur comme variable pour calculer le deacutebit Nous avons donc un deacutebitde 192 bits

Drsquoapregraves le rapport [Vergoz2013] le deacutebit descendant le plus faible mesureacute est de 1 58Mbits Notre mesure impact repreacutesente donc approximativement 0 12 de la capaciteacutedu lien Cet impact est neacutegligeable agrave un instant donneacute

Collecte La plate-forme Atlas stocke automatiquement les reacutesultats lieacutes agrave ses expeacuteri-mentations sur son propre serveur Une fois lrsquoensemble des mesures reacutealiseacutees nous avonsreacutecupeacutereacute les reacutesultats Un total de 300 000 fichiers correspondant aux 300 000 mesuresont eacuteteacute teacuteleacutechargeacutes du serveur drsquoAtlas

Analyse Cette partie de lrsquoeacutetude est fortement similaire agrave lrsquoanalyse effectueacutee pour lrsquoeacutetudedes routes et deacutelais depuis La Reacuteunion Une seule partie diffegravere En effet comme indiqueacutedans la section preacuteceacutedente chaque fichier collecteacute repreacutesente une mesure Nous nrsquoavonsdonc pas la neacutecessiteacute drsquoeffectuer une phase de deacutecoupage de nos donneacutees en fichiersatomiques

Reacutecapitulatif

Afin de pouvoir effectuer une comparaison entre les deux protocoles de mesures surlrsquoeacutetude des routes et des deacutelais associeacutes le tableau 25 reacutesume les deux protocoles sur lemois de mesure analyseacute

Nous constatons une diffeacuterence notable en terme de sources et de destinations Cettediffeacuterence impacte le nombre de fichiers atomiques que lrsquoon a obtenus Le nombre defichiers atomiques provient de la multiplication entre le nombre de sources le nombre dedestinations et le nombre de jours de mesures Cela correspond au nombre maximal de

52

TABLE 25 ndash Reacutesumeacute des caracteacuteristiques du jeu de donneacutees

Depuis VersSondes de mesures Raspberry Pi Atlas RIPE NCC

Nombres de Destinations 10 000 IP 10 raspberry-piNombres de sources 27 1 000

Nombres de jours de mesures 28 30Outil de mesure Paris-traceroute

Nombres de fichiers atomiques 7 560 000 300 000

Nombres de fichiers analyseacutes 1 015 180 38 714

fichiers que lrsquoon peut obtenir La derniegravere ligne du tableau indique le nombre de fichiersque lrsquoon a pu analyser apregraves veacuterification des mesures et nettoyage des fichiers erroneacutesCe nettoyage se fait par lrsquooutil drsquoanalyse rTraceroute Dans la section 233 nous avons puanalyser 13 43 des donneacutees De la section 233 12 91 des donneacutees ont eacuteteacute exploiteacutesNous avons dans les deux cas un taux de pertes de donneacutees important

24 Reacutesultats

Dans la suite de notre manuscrit et pour des raisons pratiques nous avons reacuteduit lenom des continents agrave deux lettres La correspondance entre lrsquoacronyme et le nom completest indiqueacutee dans le tableau 26

TABLE 26 ndash Correspondance entre acronymes et noms des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

Cette correspondance provient de lrsquoutilisation des deux premiegraveres lettres de chaquecontinent en version anglophone

241 Eacutevolution

La comparaison avec lrsquoexistant fut diviseacutee en deux Dans un premier temps nousavons compareacute les deacutelais Par la suite nous avons utiliseacute une partie des donneacutees nonencore exploiteacutees pour reacutealiser une comparaison de la longueur des routes

Distribution du RTT

Les mesures obtenues ont permis drsquoeffectuer une comparaison avec les donneacutees reacute-colteacutees en 2012 par [Anelli2012] Nous avons effectueacute une campagne de ping en 2016 afindrsquoeacutetudier lrsquoeacutevolution des deacutelais depuis Paris et La Reacuteunion La figure 24 illustre lrsquoeacutevolu-tion de la distribution du RTT en 4 ans

Entre 2012 et 2016 le jeu drsquoadresses IP de destination fut diffeacuterent En 2012 aucunereacutepartition geacuteographique ne fut eacutetablie En 2016 la distribution des adresses est cellepreacutesenteacutee dans la partie 231 Malgreacute ces diffeacuterences nous remarquons que les courbesont les mecircmes tendances en 2012 et en 2016 Des pics sont preacutesents aux environs desvaleurs 005 01 et 03 secondes pour Paris en 2012 Des pics sont identifieacutes aux valeurs02 035 et 05 secondes pour La Reacuteunion en 2012 Les pics sont preacutesents aux alentours desmecircmes valeurs sur les deux campagnes de mesure Nous eacutemettons lrsquohypothegravese que ces

53

pics correspondent aux 3 continents les plus repreacutesenteacutes dans nos eacutechantillons agrave savoirlrsquoAmeacuterique du Nord lrsquoAsie et lrsquoEurope Nous veacuterifierons cela par la suite

Malgreacute un eacutecart de 4 ans entre les deux campagnes de mesures on constate une sta-biliteacute du deacutelai minimal aux alentours de 02 secondes La stabiliteacute du deacutelai srsquoest elle ac-compagneacutee drsquoune stabiliteacute de la longueur des routes

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(a) 2012

0

0002

0004

0006

0008

001

0012

0014

0016

01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(b) 2016

FIGURE 24 ndash Comparaison des deacutelais entre Paris et La Reacuteunion

Longueur du chemin

Dans le section preacuteceacutedente nous avons constateacute que le deacutelai minimal pour quitter lrsquoicircleest resteacute stable en 4 ans Nous allons essayer de corroborer cette stabiliteacute du deacutelai par unestabiliteacute de la longueur des routes sur la mecircme peacuteriode

La longueur des routes fut obtenue par lrsquoanalyse inverse du TTL Le [RFC1700] preacute-conise une valeur de deacutepart de 64 Or le site Wikipeacutedia [WikiPing] indique que le TTLinitial peut varier Les valeurs les plus communes sont 64 128 voire 255 dans certains casNous avons donc en fonction de la valeur du TTL soustrait une valeur de deacutepart agrave la va-leur indiqueacutee pour obtenir la longueur de la route Dans les donneacutees datant de 2012 leslongueurs de certaines routes sont eacutegales agrave 127 Ne pouvant deacutecider de la valeur de TTLde deacutepart nous avons fait le choix de ne garder que les reacutesultats dont le TTL afficheacute parping est supeacuterieur ou eacutegal agrave 128 Pour les donneacutees de 2016 nous nrsquoavons pas reacutepertorieacutede valeurs comprises dans lrsquointervalle [ 120 208] De fait nous avons gardeacute lrsquoensembledes valeurs obtenues

La figure 25 illustre lrsquoeacutevolution des routes entre les deux jeux de reacutesultats En 2012la longueur des routes eacutevolue entre 10 et 40 nœuds avec un pic agrave 24 nœuds En 2016les routes ont une longueur qui varie entre 5 et 30 sauts avec un pic agrave 17 Un eacutecart de 7nœuds repreacutesenteacute sur notre figure

Les deacutelais entre La Reacuteunion et Paris sont resteacutes stables entre 2012 et 2016 Sur la mecircmepeacuteriode la longueur des routes depuis La Reacuteunion a diminueacute

242 Connectiviteacute de La Reacuteunion

La section 241 a montreacute lrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012et 2016 Malgreacute ces eacutetudes aucune caracteacuterisation de la connectiviteacute de La Reacuteunion nrsquoaeacuteteacute reacutealiseacutee Dans cette section nous allons effectuer cette caracteacuterisation en termes dedeacutelais et des routes emprunteacutees

54

FIGURE 25 ndash Eacutevolution de la longueur des routes entre 2012 et 2016

Geacuteneacuteraliteacutes

Nous avons en plus des informations sur les deacutelais et la longueur des routes desinformations sur les adresses IP rencontreacutees tout au long des mesures Ainsi nous avonsdeacutecideacute de reacutepartir notre analyse sur 4 principales meacutetriques que sont

mdash La longueur du chemin est deacutetermineacutee par le nombre de nœuds rencontreacute par Paris-traceroute

mdash Le deacutelai analyseacute est le RTT Il est associeacute agrave la destination jointe

mdash La localisation des adresses IP avant (resp apregraves) le passage par les cacircbles sous-marins quand nos donneacutees arrivent (resp quittent) agrave La Reacuteunion

mdash La distance geacuteographique correspond agrave la distance reacuteelle (en Km) entre la source etla destination Pour cela on utilise lrsquoeacutequation (22) Ils srsquoagit de lrsquoeacutequation de calculde distance entre deux points sur une sphegravere

d = arccos[cos(x)times cos(y)times cos(m)times cos(n) ++ cos(x)times sin(y)times cos(m)times sin(n) ++ sin(x)times sin(m)]times 6371 1 [km]

(22)

ougrave

mdash (xy) (mn) sont respectivement la latitude et la longitude de la source et de la des-tination (en radians)

mdash 63711 km est la reacutefeacuterence en radius de la Terre

Les coordonneacutees geacuteographiques des adresses IP ont eacuteteacute obtenues par notre outil degeacuteolocalisation Nous avons ainsi pu calculer la distance geacuteographique entre deux adressesIP Si nous prenons lrsquoexemple de la reacutepartition geacuteographique des adresses IP des sondesatlas et des destinations seacutelectionneacutees nous obtenons la figure 26 Les deux courbes sontsimilaires en terme de reacutepartition des distances La diffeacuterence des valeurs de lrsquoaxe des

55

ordonneacutees provient du nombre plus important drsquoeacutechantillons pour la figure 26a Surcette figure il est difficile de visualiser la distance des adresses relatives au continentoceacuteanique La faible eacutepaisseur de la probabiliteacute des adresses oceacuteaniques est eacutegalementpreacutesente sur la figure 26b On constate sur cette figure une preacutesence plus importantedrsquoadresses IP africaines et asiatiques

(a) Depuis (b) Vers

FIGURE 26 ndash Distribution de la distance geacuteographique par continent

La reacutepartition des adresses IP dans le monde et leur distance geacuteographique ont-ellesun impact sur la distribution des deacutelais Crsquoest agrave cette question que nous allons essayerde reacutepondre dans la section suivante

Distribution du RTT par continent

La figure 27 repreacutesente la distribution des deacutelais obtenus par nos mesures incluantla reacutepartition par continent Nous avons utiliseacute un regroupement des deacutelais par eacutecart de10 ms On constate rapidement que les deux figures nrsquoont pas la mecircme tendance Dans lasection 241 nous avions eacutemis lrsquohypothegravese que les pics preacutesents sur les courbes des deacutelaiseacutetaient associeacutes aux continents les plus preacutesents dans la geacuteolocalisation des adresses IP

La comparaison que lrsquoon peut effectuer avec les donneacutees de lrsquoexistant est celle delrsquoeacutetude Depuis Ainsi on remarque que la figure garde la mecircme forme avec la preacutesencedes 3 pics Sur la figure 27a nous pouvons identifier ces pics Ces pics repreacutesentent lrsquoEu-rope lrsquoAmeacuterique du Nord et lrsquoAsie On constate que le deacutelai minimal est stable avec unevaleur proche des 200 ms

Dans lrsquoexpeacuterimentation Vers La Reacuteunion nous constatons la preacutesence de non pas 3mais de 2 pics Le pic relatif au continent asiatique a disparu De plus les deacutelais associeacutesagrave ce continent sont moins concentreacutes Pour les autres continents la distribution des deacute-lais est relativement identique agrave lrsquoexpeacuterimentation preacuteceacutedente Nous pouvons remarquerla preacutesence de deacutelais africains vers La Reacuteunion aux alentours des 100 ms Les deacutelais de-puis lrsquoEurope sont sensiblement eacutequivalents agrave ceux de lrsquoeacutetude Depuis avec des deacutelaiscompris entre 180 et 190ms

Agrave la lecture des reacutesultats nous pouvons confirmer que lrsquohypothegravese avanceacutee preacuteceacute-demment est juste

Nous avons connaissance drsquoune relation entre la distance et le temps mis pour parcou-rir cette distance Ayant constateacute lrsquoeacutevolution des deacutelais nous allons maintenant eacutetudierlrsquoeacutevolution de la distance parcourue

56

(a) Depuis (b) Vers

FIGURE 27 ndash Distribution du RTT par continent

Longueur du chemin par continent

Nous avons pu dans la section 241 constater une diminution des routes entre 2012et 2016 Les figures 28 indiquent la reacutepartition de la longueur des routes obtenues enfonction des continents La premiegravere constatation est la forte similitude entre les deuxcourbes

Sur la figure 28a on remarque la preacutesence drsquoun pic pour une longueur de 18 nœudsCela indique que peu importe le continent de destination la probabiliteacute drsquoavoir une routedrsquoune longueur de 18 sauts est importante

Dans le sens Vers le pic est quasiment identique selon le continent de deacutepart Lavaleur geacuteneacuterale se situe agrave une valeur de 15 nœuds pour lrsquoAmeacuterique du Nord lrsquoOceacuteanieet lrsquoAmeacuterique du Sud et agrave une valeur de 16 sauts pour les autres continents

Avec un eacutecart de 2 agrave 3 sauts selon le sens on peut donc consideacuterer que la longueur duchemin reste identique pour lrsquoInternet reacuteunionnais

(a) Depuis (b) Vers

FIGURE 28 ndash Distribution de la longueur des routes par continent

Longueur du chemin et distance geacuteographique

Le premier reacutesultat analyseacute concerne la distance logique par rapport agrave la distancephysique Dans lrsquoarticle [Leguay2004] lrsquoauteur a calculeacute la moyenne des chemins dans

57

lrsquoInternet agrave partir drsquoun jeu incluant plus de 7 000 000 de donneacutees La valeur obtenue estde 15 57 sauts

Dans nos reacutesultats la valeur moyenne calculeacutee est de 17 11 eacutequipements traverseacutesavant de joindre la destination Cette valeur regroupe lrsquoensemble de nos donneacutees sansaucune distinction de la localisation de la source drsquoeacutemission En eacutetudiant uniquementles donneacutees Depuis les routes ont une longueur moyenne de 17 37 sauts Si on analysela longueur des routes des donneacutees entrant sur lrsquoicircle on obtient une moyenne de 16 85eacutequipements On observe deacutejagrave une premiegravere asymeacutetrie des routes selon que lrsquoon quitteou que lrsquoon joint lrsquoicircle de La Reacuteunion

Les figures 29a et 29b illustrent les reacutesultats obtenus Chaque figure est diviseacutee endeux On a inseacutereacute en bas de chaque figure la PDF de la longueur du chemin en fonctionde la distance entre sources et destinations Tandis qursquoen haut les aires dessineacutees parles ellipses contiennent 95 des eacutechantillons rattacheacutes agrave chaque continent Les barresdrsquoerreurs repreacutesentent quant agrave elles la moyenne et lrsquoeacutecart-type de la longueur du cheminassocieacutes agrave chaque continent

Nous remarquons que depuis La Reacuteunion la majoriteacute des distance sont situeacutees danstrois grandes reacutegions Le premier regroupement se situe entre 8 000 et 12 000 km Cebloc inclus lrsquoAsie lrsquoOceacuteanie lrsquoEurope et lrsquoAmeacuterique du sud Le second bloc comporteque lrsquoAmeacuterique du Nord et se situe au delagrave des 14 000 km Reste le cas africain Ce conti-nent est tregraves proche de La Reacuteunion Les destinations et sources africaines sont toutesinfeacuterieures agrave 10 000 km

Lrsquoanalyse geacuteneacuterale des reacutesultats obtenus montre que le nombre de sauts nrsquoest pas deacute-pendant de la distance geacuteographique Sur la figure 29a on constate des chemins aussilongs sur la boucle locale que pour joindre certaines destinations lointaines On a eacutegale-ment repreacutesenteacute sur les figures PL(d) = α times d + β qui est la fonction lineacuteaire de la lon-gueur du chemin comme fonction de la distance geacuteographique Le tableau 27 regroupeles eacutequations obtenues selon lrsquoexpeacuterimentation

TABLE 27 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

Expeacuterimentation Eacutequation PL(d)Depuis La Reacuteunion 1 58 lowast 10minus5 timesD + 16 65

Vers La Reacuteunion 7 50 lowast 10minus5 timesD + 18 32

La valeur obtenue pour α qui est le coefficient directeur de la droite possegravede unmultiplicateur eacutegal agrave 10minus5 Cette valeur indique le nombre de sauts suppleacutementaires pourchaque kilomegravetre Les valeurs de α proches de zeacutero indiquent clairement que la distancegeacuteographique nrsquoimpacte pas la longueur du chemin quelle que soit lrsquoexpeacuterimentation

Impact de la longueur du chemin sur le RTT

Les figures 210a et 210b repreacutesentent la distribution du RTT comme fonction dunombre de sauts ainsi que la meacutediane et les PDF Est eacutegalement preacutesente en bas dechacune des figures la probabiliteacute de densiteacute de la longueur du chemin

Les figures montrent une croissance du deacutelai avec lrsquoaugmentation du nombre denœuds jusqursquoagrave une certaine limite Sur la figure 210a repreacutesentant lrsquoeacutetude Depuis nousremarquons des deacutelais importants deacutepassant les 3 secondes Cette valeur des 3 secondespeut ecirctre atteinte degraves que lrsquoon deacutepasse le 9eme saut Agrave lrsquoinverse sur lrsquoeacutetude Vers illustreacuteepar la figure 210b nous constatons une certaine stabiliteacute du deacutelai Les valeurs restent

58

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 29 ndash Relation entre la longueur de la route et la distance geacuteographique

majoritairement infeacuterieures agrave 2 secondes Lrsquoeacutetude de la meacutediane nous indique des routesplus courtes lorsque lrsquoon essaye de joindre La Reacuteunion Il y a une forte variation de lameacutediane agrave la fin de la figure due au nombre drsquoeacutechantillons pour chaque valeur de lalongueur des routes Afin drsquoidentifier le deacutelai associeacute agrave chaque nouveau nœud la fonc-tion lineacuteaire D(d) = α times d + β du deacutelai comme fonction de la longueur du chemin esteacutegalement repreacutesenteacutee

Le tableau 28 indique les eacutequations obtenues lors de lrsquoanalyse des donneacuteesLa variable drsquoajustement β ne sera pas analyseacutee bien qursquoelle repreacutesente un deacutelai mi-

nimal Nous avons vu dans la partie preacuteceacutedente que ce deacutelai eacutetait eacutequivalent peu importe

59

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 210 ndash Relation entre la longueur de la route et les deacutelais

TABLE 28 ndash Formule de correacutelation du deacutelai en fonction de la longueur du chemin

Expeacuterimentation Eacutequation D(PL)Depuis La Reacuteunion 11 11times PL+ 204 92

Vers La Reacuteunion 6 22times PL+ 249 66

lrsquoexpeacuterimentation La pente de la droite repreacutesenteacutee par le coefficient α indique la valeurassocieacutee agrave chaque nouvel eacutequipement Cette valeur diffegravere fortement selon lrsquoexpeacuterimen-tation mise en place Ainsi le temps accordeacute agrave chaque eacutequipement est beaucoup pluslong lorsque nos donneacutees quittent La Reacuteunion que dans le sens inverse avec un coef-ficient proche du double Cela signifie que pour chaque saut suppleacutementaire un deacutelaiadditionnel de 6 22ms (resp 11 11ms) doit ecirctre pris en compte lorsque lrsquoon joint (resp

60

quitte) La Reacuteunion On passe quasiment du simple au double

Nous avons preacuteceacutedemment analyseacute les Cumulative Density Function (CDF) des lon-gueurs des routes logiques par continent Nous avions constateacute pour certains continentsune forte similitude entre les diffeacuterentes courbes Cette observation est de nouveau preacute-sente ici Les deux PDF sur la longueur des chemins emprunteacutes sont similaires Neacutean-moins le fait drsquoavoir un plus grand nombre drsquoeacutechantillons sur lrsquoexpeacuterimentation Depuisa permis un lissage de la courbe

Correacutelation entre deacutelai et distance geacuteographique

Dans [Krajsa2011] les auteurs se sont inteacuteresseacutes agrave lrsquoimpact de la distance sur le RTTLes reacutesultats ont eacuteteacute obtenus a partir drsquoune eacutetude de meacutetrologie active reacutealiseacutee dans despays agrave forte connectiviteacute en terme de liaisons sous-marines Les auteurs ont deacutetermineacuteune fonction lineacuteaire repreacutesenteacutee par lrsquoeacutequation suivante

y = 0 0128times x (23)

Cette eacutequation preacutedit le deacutelai en fonction drsquoune distance geacuteographique donneacutee Nousallons eacutetudier la pertinence de ce modegravele dans le cas de lrsquoicircle de La Reacuteunion On se reacutefegravereagrave ce modegravele par la notation Expected Internet RTT for a given geographical Distance (EIRD)

La figure 211 est composeacuteee de trois parties En haut nous avons repreacutesenteacute les dis-tances couvertes par chaque continent La figure 211a (resp fig 211b) graphe la fonctionExpected RTT (ER) pour le cas Depuis (resp Vers) et le modegravele EIRD Le modegravele ER(d) vientde la repreacutesentation sous forme lineacuteaire de lrsquoimpact de la distance geacuteographique sur lesdeacutelais obtenus Nous avons eacutegalement repreacutesenteacute les 5eme 10eme 25eme 75eme 90eme et95eme percentiles Les points preacutesents agrave lrsquointeacuterieur des barres drsquoerreurs indiquent le 50eme

percentile Au bas de chaque figure la PDF de la distance geacuteographique est repreacutesenteacutee

Lrsquoeacutetude de la reacutepartition de nos destinations (resp sources) pour notre eacutetude montreque les distances vont drsquoune valeur infeacuterieure agrave 10 km jusqursquoagrave pregraves de 20 000 km Nousconstatons un regroupement des continents entre 5 000 et 10 000 km pour lrsquoeacutetude DepuisLe regroupement se fait agrave une distance plus grande (comprise en 7 500 et 14 000 km)pour Vers Ces valeurs sont remarqueacutees dans la PDF de chaque eacutetude Malgreacute la preacutesenceseule du continent Nord Ameacutericain apregraves 15 000 km la densiteacute de probabiliteacute drsquoavoir unedestination prise dans cet ensemble est importante

Les figures montrent une complegravete opposition entre le modegravele EIRD et nos reacutesul-tats Afin drsquoeffectuer une meilleure comparaison nous avons traduit nos reacutesultats sousla forme ER(d) = αtimes d+ β fonction lineacuteaire du deacutelai en fonction de la distance geacuteogra-phique Une repreacutesentation graphique de ER(d) est indiqueacutee sur les figures Les eacutequa-tions obtenues sont indiqueacutees dans le tableau 29

TABLE 29 ndash Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique

Expeacuterimentation Eacutequation d(t) R2

EIRD y = 0 0128times t 0 9794

ER(d) (Depuis La Reacuteunion) y = minus62 92 lowast 10minus4 times t+ 477 6 16 80 lowast 10minus3ER(d) (Vers La Reacuteunion) y = minus29 4 lowast 10minus5 times t+ 358 1 14 81 lowast 10minus5

Les coefficients de deacutetermination (R2) entre les fonctions lineacuteaires et nos donneacutees in-diquent que nous nrsquoavons pas pu trouver de modegravele de preacutediction suffisamment preacuteciscontrairement au modegravele EIRD Nous constatons eacutegalement que les pentes de nos mo-degraveles ER(d) sont toutes deux neacutegatives Cela signifie que le deacutelai sera plus court pour

61

(a) Depuis La Reacuteunion

(b) Vers La Reacuteunion

FIGURE 211 ndash Relation entre les deacutelais et la distance geacuteographique

joindre une distance eacuteloigneacutee physiquement degraves que lrsquoon emprunte les cacircbles sous-marins La preacutesence du GIX Reunix sur lrsquoicircle permet drsquoavoir des deacutelais courts du mo-ment que lrsquoon reste sur la boucle locale Gazelle (cf section 21) Par exemple le deacutelai pourjoindre un pays europeacuteen est plus court que le deacutelai pour joindre les pays de la ZOI Cereacutesultat est contraire agrave lrsquoanalyse EIRD Il peut srsquoexpliquer en partie par le fait lrsquoeacutetude preacute-senteacute dans [Krajsa2011] est reacutealiseacutee dans des lieux ougrave la connectiviteacute (en terme de liaisonssous-marines) est importante

La partie drsquoanalyse des routes emprunteacutees va nous aider agrave valider ou infirmer lrsquohy-pothegravese suivante Les coefficients α obtenus sur nos eacutequations ER(d) proviennent du routage

Analyse des routes

Dans la section 22 nous avons montreacute lrsquoexistence de liens physiques reliant lrsquoen-semble des icircles de la ZOI Nous cherchons agrave caracteacuteriser lrsquoefficaciteacute des routes emprunteacutees

62

drsquoun point de vue geacuteographique La figure 212 repreacutesente les diffeacuterents points drsquoentreacuteeset de sorties logiques de lrsquoInternet reacuteunionnais que nous avons extraits de nos donneacutees

Des donneacutees obtenues de lrsquoeacutetude Depuis nous avons extrait le pays du premier nœudbaseacute agrave lrsquoexteacuterieur de lrsquoicircle Cette information nous permet drsquoeacutetudier les sorties logiques delrsquoInternet reacuteunionnais Le reacutesultat obtenu est indiqueacute par la figure 212a La taille du lienest proportionnelle au nombre drsquoeacutechantillons passant par ce pays Nous deacutenombrons4 sorties dont 3 en Europe Malgreacute lrsquoabsence de lien direct avec lrsquoAmeacuterique du Norddepuis La Reacuteunion nous avons identifieacute une sortie dans la moitieacute ouest des Eacutetats-UnisLes sorties physiques directes de La Reacuteunion qui sont baseacutees en Afrique Asie et sur lesicircles de la ZOI ne sont pas utiliseacutees La majoriteacute du routage de nos donneacutees avec pregraves de97 srsquoeffectue en France

Dans la figure 212b nous indiquons le dernier eacutequipement localiseacute en dehors deLa Reacuteunion pour une destination finale localiseacutee sur lrsquoicircle Ce sont les entreacutees logiquesde lrsquoInternet reacuteunionnais que nous avons pu obtenir des donneacutees provenant de lrsquoeacutetudeVers Le nombre drsquoentreacutees est double par rapport au nombre de sorties et plus reacuteparti enterme de continent Quatre continents sont directement relieacutes agrave notre icircle lrsquoAfrique lrsquoAsielrsquoEurope et lrsquoAmeacuterique du Sud Le continent europeacuteen est largement repreacutesenteacute dans nosdonneacutees avec 99 51 transitant sur ce territoire La France hexagonale capte 99 33 desdonneacutees soit la quasi-totaliteacute de nos donneacutees Nous avons tout de mecircme pu identifier desliaisons minimales avec lrsquoAfrique du Sud lrsquoInde le Sri Lanka et le Paraguay Ce dernierest le seul agrave ne pas ecirctre directement relieacute agrave lrsquoicircle par un cacircble sous-marin

Le tableau 210 reacutesume les informations contenues dans les figures 212a et 212b Leslignes sont rangeacutees par taux drsquoutilisation deacutecroissant

TABLE 210 ndash Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunionnais

Depuis La Reacuteunion Vers La Reacuteunion

France (9699) 18101 msAllemagne (1 03) 299 26 msEacutetat-Unis (1 03) 293 15 msItalie (1 03) 289 46 ms

France (9933) 18330 msAfrique du Sud (0 45) 66 42 msBelgique (0 1) 197 48 msItalie (0 04) 202 59 msSloveacutenie (0 04) 205 50msInde (0 01) 161 45 msParaguay (0 01) 454 36 msSri Lanka (0 01) 207 88 ms

La preacutesence de liens directs entre La Reacuteunion et des pays beaucoup plus eacuteloigneacutestels que les Eacutetats-Unis ou le Paraguay sans cacircbles physiques directs est symptomatiquede lrsquoabsence drsquoinformations ou drsquoerreurs de geacuteolocalisation Nous pouvons preacutesenter etexpliquer quelques points preacutesents dans nos reacutesultats

1 Les erreurs de geacuteolocalisation Les erreurs de geacuteolocalisation sont principalementdues agrave une mauvaise utilisation des blocs drsquoadresses IP par les opeacuterateurs Ils preacute-fegraverent utiliser des adresses qui leur ont deacutejagrave eacuteteacute attribueacutees que drsquoeffectuer une de-mande drsquoadresse IP aupregraves drsquoun RIR Un exemple est lrsquoadresse IP rsquo19416714221rsquoCette adresse est attribueacutee agrave lrsquoopeacuterateur franccedilais RENATER Comme RENATERpossegravede la nationaliteacute franccedilaise le pays de localisation de lrsquoadresse est rsquoFRANCErsquoOr il srsquoavegravere que cette adresse est utiliseacutee comme adresse publique de lrsquoUniversiteacutede La Reacuteunion Elle est donc localiseacutee sur lrsquoicircle Un raisonnement similaire peut srsquoef-fectuer sur les autres reacutegions drsquooutre-mer posseacutedant des relations avec lrsquoopeacuterateurRENATER Les filiales drsquoopeacuterateur meacutetropolitain comme Orange peuvent eacutegale-ment utiliser ce systegraveme sur lrsquoensemble de leur reacuteseau Pour reacutesoudre ce problegraveme

63

(a) Sorties

(b) Entreacutees

FIGURE 212 ndash Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais

nous avons effectueacute une analyse du deacutelai Si le deacutelai associeacute agrave certaines adresses IPcorrespond au deacutelai theacuteorique associeacute au continent nous avons consideacutereacute que lageacuteolocalisation est correcte Dans les cas contraires nous nrsquoavons pas la possibiliteacutedrsquoecirctre sucircrs agrave 100 de la bonne localisation

2 Les accords de peering se font dans un pays avant que le paquet nrsquoemprunte le cacircblesous-marin Lrsquoexemple illustreacute par la figure 213 montre que les eacutechanges entre deuxadresses IP srsquoeffectuent au sein drsquoun IXP Ces eacutechanges peuvent se faire entre deuxpays distants au sein drsquoun troisiegraveme pays Dans notre exemple lrsquoeacutechange entre LaReacuteunion et les USA se fait en France

3 Lrsquoencapsulation des donneacutees au sein du systegraveme MPLS geacutenegravere eacutegalement des in-coheacuterences au sein de nos analyses Lrsquoexemple que lrsquoon peut indiquer est lrsquoanalysede la mesure numeacuteroteacutee 4178740 2 chez Atlas RIPE NCC Cette trace est composeacuteede 5 sauts entre le Paraguay et La Reacuteunion avec un lien direct Or il nrsquoexiste aucuncacircble physique entre ces deux points du monde Une encapsulation au niveau In-

2 httpsatlasripenetmeasurements4178740

64

Internet InternetUtilisateur DestinationIXP (FR)

RE US

FIGURE 213 ndash Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dansun pays tiers

visible des donneacutees nrsquoindique pas le parcours preacutecis des donneacutees tel que lrsquoindiquelrsquoauteur de lrsquoarticle [Donnet2012]

Ces explications ne sont pas les seules mais potentiellement les plus freacutequemmentrencontreacutees Dans notre cas les points 2 et 3 semblent ecirctre les raisons preacutedominantesLes marques du systegraveme MPLS sont dues agrave la division de la capaciteacute des cacircbles pour lesdiffeacuterents opeacuterateurs et agrave la connexion en diffeacuterents points pour reacutegeacuteneacuterer le signal

Des reacutesultats de nos eacutetudes nous deacuteplorons lrsquoabsence de peering reacutegional Cette ano-malie est la principale cause de la tendance des courbes obtenues dans le tableau 29 Eneacutetudiant les diffeacuterents IXP nous constatons lrsquoabsence drsquoopeacuterateurs communs entre les 3icircles comme lrsquoillustre la figure 214 Ces informations proviennent directement des sitesinternet officiels des IXP [MIXP2017 MGIX2017 REUNIX2017] On peut neacuteanmoins no-ter la preacutesence des filiales de lrsquoopeacuterateur Orange agrave Madagascar et agrave La Reacuteunion Il srsquoagitdans le cas drsquoOrange Madagascar de lrsquoexploitation du nom sans ecirctre dirigeacutee par lrsquoen-treprise Orange De cette figure on peut deacuteduire que les eacutechanges drsquoinformations et dedonneacutees se font dans une reacutegion eacuteloigneacutee de la ZOI et agrave un niveau plus eacuteleveacute On peutsupposer que ce sont des Tiers-1 qui se chargent du peering de cette zone Afin de vali-der cette hypothegravese nous avons deacuteployeacute des sondes de mesures de RunPL sur les icirclesvoisines

FIGURE 214 ndash FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien

243 Connectiviteacute des icircles de la Zone Oceacutean Indien

Nous avons vu dans la section 22 que les icircles de la ZOI partagent des routes phy-siques en commun Nous avons constateacute dans la section 242 que La Reacuteunion possegravede

65

une connectiviteacute Internet particuliegravere Nous sommes donc en droit de nous demander sicette connectiviteacute est commune agrave lrsquoensemble des icircles de la ZOI ou non Nous avons pu deacute-ployer un minimum de deux sondes par pays eacutetudieacute Le protocole de mesure et drsquoanalysemis en place est en tout point identique agrave celui utiliseacute pour lrsquoeacutetude de la connectiviteacute deLa Reacuteunion Ainsi nous avons utiliseacute les mecircmes meacutetriques pour valider la comparaison

Distribution du RTT par pays eacutetudieacute

La figure 215 illustre la reacutepartition des deacutelais des icircles de la ZOI selon le pays drsquooriginedes mesures (215a) et du continent de destination (215b) Comme pour La Reacuteunion nousremarquons la preacutesence des trois pics

Drsquoapregraves la figure 215b ces pics ont la mecircme signification que dans la situation preacute-ceacutedente crsquoest-agrave-dire la preacutesence des deacutelais pour joindre lrsquoEurope lrsquoAmeacuterique du Nord etlrsquoAsie

Sur la figure 215a on remarque eacutegalement des valeurs minimales et maximales dif-feacuterentes selon le pays Ainsi les Seychelles ont les deacutelais les plus courts de la ZOI Agravelrsquoinverse crsquoest La Reacuteunion qui possegravede le plus de deacutelais au delagrave des 800 ms

Le comportement des deacutelais eacutetant communs agrave lrsquoensemble de la ZOI nous allons main-tenant eacutetudier la longueur des routes pour chaque icircle eacutetudieacutee

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 215 ndash Distribution des deacutelais des icircles de la ZOI

Longueur des routes par pays eacutetudieacute

La figure 216 repreacutesente la densiteacute de probabiliteacute de la longueur des routes En confon-dant les destinations nous pouvons eacutetudier la reacutepartition de la distance en fonction delrsquoicircle source (216a) Nous avons appliqueacute le mecircme raisonnement en meacutelangeant les icirclessources pour se concentrer sur la destination (216b) Les figures eacutetudieacutees nrsquoont pas lamecircme forme que celles uniquement deacutedieacutees agrave La Reacuteunion En effet la courbe 216 pos-segravede 2 pics

Sur la figure 216a on remarque que cette diffeacuterence est fortement accentueacutee par lapreacutesence des donneacutees reacuteunionnaises

Sur la figure 216b on voit une diffeacuterence de comportement en fonction du contientjoint Ainsi lrsquoAfrique lrsquoAsie et lrsquoEurope ont la preacutesence drsquoun seul pic Cela signifie queces continents seront majoritairement joints par des routes comprises entre 10 en 20 sautsPour les Ameacuteriques et lrsquoOceacuteanie il y a deux pics Cela sous-entend la preacutesence de deuxgrandes routes avec lrsquoune plus courte que lrsquoautre La plus petite est composeacutee de 13sauts La seconde route est quant agrave elle drsquoune longueur de 16 sauts

66

Cette diffeacuterence peut srsquoexpliquer par la preacutesence de routes emprunteacutees diffeacuterentes enfonction des pays de destinations Pour corroborer cela nous allons poursuivre lrsquoeacutetudeen fonction des meacutetriques preacutesenteacutees dans la section 242

0

003

006

009

012

0 5 10 15 20 25 30 35 40

P [

X=

x]

Longueur du chemin (en noeuds)

Mayotte

Seychelles

Reunion

Maurice

Madagascar

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 216 ndash Longueur des routes emprunteacutees

Longueur du chemin et distance geacuteographique

Dans cette section on va eacutetudier la relation entre la longueur du chemin et la distancegeacuteographique On a vu agrave travers le reacutesultat preacuteceacutedent que le choix du continent avaitun impact sur la longueur du chemin Pour plus de lisibiliteacute nous avons repreacutesenteacute lesreacutesultats sous la forme drsquoeacutequations lineacuteaires repreacutesenteacutes par lrsquoeacutequation 24

PL(d) = αtimes d+ β (24)

Les eacutequations obtenues sont indiqueacutees dans le tableau 211 et repreacutesenteacutees graphique-ment par la figure 217

TABLE 211 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation PL(d)Madagascar y = minus0 000303631times d+ 26 1771

Maurice y = minus0 000183807times d+ 18 4231

Reacuteunion y = minus9 18819 lowast 10minus5 times d+ 17 1201

Seychelles y = minus0 000183362times d+ 18 9892

Mayotte y = minus7 15288 lowast 10minus5 times d+ 18 4781

Nous pouvons seacuteparer nos reacutesultats en 3 groupes Drsquoun cocircteacute les deacutepartements fran-ccedilais avec La Reacuteunion et Mayotte Dans un second groupe lrsquoicircle Maurice et les SeychellesEt dans un troisiegraveme groupe Madagascar Les reacutesultats de La Reacuteunion et de Mayotte sontsimilaires La pente α est quasi-nulle et lrsquoeacutecart sur le coefficient β est de 1 saut Ce reacutesul-tat est similaire agrave celui obtenu preacuteceacutedemment Maurice et les Seychelles ont eacutegalementdes coefficients proches Les pentes sont leacutegegraverement neacutegatives Cela implique une petitedeacutependance du nombre de sauts en fonction de la distance geacuteographique Le cas le plusinteacuteressant est Madagascar Nous allons nous inteacuteresser plus en deacutetail agrave son comporte-ment

Madagascar possegravede les coefficients α et β les plus eacuteleveacutes Cela signifie que le payspossegravede une route minimale plus longue que les autres icircles Son coefficient α neacutegatif

67

10

20

30

0 5000 10000 15000 20000

Pat

h L

ength

PL

(N

um

ber

of

hops)

Distance d (Km)

MGMURESCYT

FIGURE 217 ndash Relation entre la longueur de la route et la distance geacuteographique

est presque deux fois plus eacuteleveacute que pour Maurice et les Seychelles Lrsquoimpact de la dis-tance sur le nombre de sauts est donc plus fort La figure 218 a eacuteteacute reacutealiseacutee selon le mecircmescheacutema que les figures 28 La repreacutesentation de la PDF de la distance des destinations parrapport aux sondes deacuteployeacutees agrave Madagascar montre deux grands groupes Le premiersitueacute entre 5 000 et 10 000 kilomegravetres Ce groupe regroupe Asie Europe Oceacuteanie et Ameacute-rique du Sud Le second groupe eacutevoluant aux alentours des 15 000 kilomegravetres englobe latotaliteacute des adresses IP geacuteolocaliseacutees en Ameacuterique du Nord Le nombre drsquoadresses prove-nant du continent africain est compris entre 0 et 10 000 La pente neacutegative suggegravere doncque les routes vers les continents eacuteloigneacutes sont plus courtes que les routes vers des desti-nations proches geacuteographiquement Neacuteanmoins la lecture des cercles montre des routesglobalement aussi longues quel que soit le continent

Impact de la longueur du chemin sur le RTT

Tout comme la section preacuteceacutedente nous avons repreacutesenteacute les reacutesultats sous formedrsquoeacutequations lineacuteaires Le tableau 212 regroupe les eacutequations obtenues tandis que la fi-gure 219 les repreacutesente graphiquement

TABLE 212 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation D(PL)Madagascar y = 13 5709times t+ 119 717

Maurice y = 14 296times t+ 171 69

Reacuteunion y = 14 2259times t+ 166 84

Seychelles y = 17 3953times t+ 35 3596

Mayotte y = 16 3138times t+ 90 9087

Comme on pouvait srsquoy attendre le deacutelai srsquoaccroicirct avec le nombre de sauts Les coef-ficients α obtenus sont proches les uns des autres La diffeacuterence se fait plus sur la valeurdrsquoajustement β Cette valeur correspond au deacutelai minimal Les Seychelles ont la pente

68

FIGURE 218 ndash Relation entre la longueur de la route et la distance geacuteographique pourMadagascar

la plus eacuteleveacutee et la valeur drsquoajustement la plus basse Cela signifie que malgreacute un deacute-lai minimal faible le temps mis par un paquet dans chaque routeur est plus importantque pour les autres icircles Mayotte est sensiblement dans le mecircme cas Pour Maurice et LaReacuteunion les pentes sont proches et la valeur de β eacutegalement Ces deux icircles auraient doncun comportement similaire

0

50

100

150

200

250

300

350

400

10 20 30

RT

T D

elay

(m

s)

Path Length PL (Number of hops)

MGMURESCYT

FIGURE 219 ndash Relation entre la longueur de la route et les deacutelais

69

Correacutelation entre deacutelai et distance geacuteographique

Nous avions vu que pour La Reacuteunion il y avait une incoheacuterence sur la relation entrele deacutelai et la distance geacuteographique En effet nous avions comme reacutesultat le fait que ledeacutelai deacutecroissait avec la distance Ce scheacutema se reproduit eacutegalement pour les autres icirclesde la ZOI tel qursquoillustreacute par la figure 220 Les eacutequations associeacutees agrave chaque pays sontpreacutesenteacutees dans le tableau 213

TABLE 213 ndash Formule de correacutelation de la distance geacuteographique et du RTT

icircle de deacutepart Eacutequation PL(t)Madagascar y = minus0 0053913times t+ 476 626

Maurice y = minus0 00418997times t+ 438 177

Reacuteunion y = minus0 00370839times t+ 440 249

Seychelles y = minus0 00344991times t+ 368 501

Mayotte y = minus0 0015904times t+ 397 1

On constate des pentes fortement diffeacuterentes en fonction des pays Ainsi Mayotte aune pente beaucoup plus douce que les autres icircles Malgreacute un β proche on voit que lrsquoeacutecartdes deacutelais entre La Reacuteunion et Maurice srsquoaccroicirct avec la distance La pente de Madagascarest tregraves importante Ccedila indique une forte deacutecroissance du deacutelai avec la distance Ainsi ledeacutelai pour joindre lrsquoicircle Maurice sera beaucoup plus important que pour joindre les paysdrsquoAmeacuterique du Nord

Lrsquoune des conseacutequences de ces reacutesultats est la preacutesence drsquoun deacutelai plus eacuteleveacute pourjoindre les icircles de la ZOI que pour joindre des destinations plus lointaines Et cela malgreacutedes routes toutes aussi longues Cela montre une contradiction agrave travers nos reacutesultatsPour comprendre cela il est neacutecessaire drsquoeacutetudier les portes de sorties de lrsquoInternet desicircles de la ZOI

300

350

400

450

500

0 5000 10000 15000 20000

RT

T D

elay

(m

s)

Distance d (Km)

MGMURESCYT

FIGURE 220 ndash Relation entre les deacutelais et la distance geacuteographique

Analyse des portes de sortie

Chaque icircle de la ZOI possegravede ses propres routes avec ses propres regravegles et ses propressorties Agrave la fin de la section 242 nous avons eacutemis lrsquohypothegravese suivante les eacutechanges de

70

paquets entre les FAI des icircles de la ZOI ne se font pas au sein de la ZOILa figure 221 indique le nombre de sorties que lrsquoon a pu relever durant nos mesures

(221a) et le pourcentage de leur reacutepartition geacuteographique (221b)

En analysant la figure 221b on constate que la majoriteacute des pays de sortie est situeacuteeen Europe avec 9463 On remarque lrsquoabsence de sortie au niveau Africain et drsquointer-connexion directe entre les icircles de la ZOI

Sur la figure 221a on remarque qursquoagrave lrsquoexception de Mayotte chaque pays a plus de20 sorties diffeacuterentes Pour La Reacuteunion crsquoest un reacutesultat fortement diffeacuterent de celui ob-tenu dans la section 242 Cela peut srsquoexpliquer par les mecircmes raisons que lors de lrsquoeacutetudepreacuteceacutedente pour rappel les raisons invoqueacutees sont potentiellement des erreurs de geacuteolo-calisation des accords de peering direct dans un pays tiers ou encore de lrsquoencapsulationMPLS

0

5

10

15

20

25

30

35

40

45

50

MG

MU

RE

SC YT

Num

ber

of

links

(a) Nombre de points de sorties pour chaqueicircle de la ZOI

0

20

40

60

80

100

AS

EU NA

Use

d l

inks

()

(b) En fonction du continent

FIGURE 221 ndash Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI

La figure 222 montre la reacutepartition des sorties en pourcentage selon les pays (fig222a) et les continents (222b) pour La Reacuteunion En comparaison avec les reacutesultats ob-tenus preacuteceacutedemment on constate une forte diminution du pourcentage de sorties geacuteo-localiseacutees en France hexagonale (FR) Nous sommes passeacutes de 9699 agrave une valeur de55408 Neacuteanmoins le pourcentage par continent reste extrecircmement eacuteleveacute avec 951636de sorties localiseacutees en Europe

Agrave travers lrsquoanalyse des points de sorties de lrsquoInternet des icircles de la ZOI nous validonslrsquohypothegravese preacutesenteacutee selon laquelle les accords drsquoeacutechanges entre opeacuterateurs des icircles dela ZOI se font agrave travers un Tiers-1

244 Synthegravese des reacutesultats

Lrsquoeacutetude des routes et des deacutelais meneacutee durant nos travaux de thegravese a eacuteteacute diviseacutee entrois grandes parties La premiegravere consistait agrave comparer lrsquoeacutetat actuel avec une eacutetude reacutea-liseacutee quatre ans auparavant La seconde phase de meacutetrologie active a mis en avant uneanalyse plus fine de la connectiviteacute Internet de La Reacuteunion avec lrsquoeacutetude des routes Laderniegravere partie avait pour objectif de comparer la connectiviteacute Internet de La Reacuteunionavec les autres icircles de la ZOI

La campagne de ping meneacutee agrave lrsquoUniversiteacute de La Reacuteunion au sein du LIM a montreacuteune reacuteduction de la longueur des routes depuis La Reacuteunion En deacutepit de la reacuteduction desroutes nous avons constateacute une stabiliteacute des deacutelais aux alentours des 200 ms

71

0

20

40

60

80

100

US-C

O

US

GB

FR

Use

d l

inks

()

(a) par pays

0

20

40

60

80

100

EU NA

Use

d l

inks

()

(b) par continent

FIGURE 222 ndash Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion

Notre seconde eacutetude faite agrave partir de donneacutees de type traceroute meneacutee depuis dif-feacuterents points de mesures reacutepartis sur lrsquoicircle a montreacute des reacutesultats inteacuteressants Le pre-mier reacutesultat est la correacutelation des deacutelais et de la localisation des destinations jointesdepuis lrsquoicircle de La reacuteunion Nous avions constateacute des pics sur la PDF des deacutelais Cespics correspondaient bien agrave la reacutepartition des continents dans notre jeu de destinationsLa longueur des routes est quant agrave elle moins impacteacutee par cette reacutepartition des des-tinations Nous avons tout de mecircme trouveacute une forte symeacutetrie aux courbes peu im-porte le sens de lrsquoeacutetude Agrave partir de ces donneacutees nous avons eacutetudieacute les relations sui-vantes Longueur du chemin Distance geographique Longueur du chemin RTTet RTT Distance geographique La premiegravere concordance a montreacute que la longueurdu chemin nrsquoest pas deacutependante de la distance geacuteographique La seconde correacutelation amontreacute une premiegravere asymeacutetrie des liens En effet le temps associeacute agrave chaque nœud dutrajet est tregraves diffeacuterent selon que lrsquoon quitte ou que lrsquoon essaye de joindre La Reacuteunion Ledernier rapport a mis en eacutevidence une particulariteacute de lrsquoaccegraves Internet de La Reacuteunion Agravelrsquoinverse de tout sens commun les deacutelais provenant et agrave destination de La Reacuteunion vonten deacutecroissant en fonction de la distance geacuteographique Lrsquoanalyse des routes et plus par-ticuliegraverement les points drsquoentreacutees et de sorties logiques de lrsquoInternet reacuteunionnais a permisdrsquoexpliquer ce comportement

Notre derniegravere eacutetude utilise le mecircme protocole et la mecircme plate-forme que lrsquoeacutetudepreacuteceacutedente Nous avons reacuteussi agrave distribuer des sondes sur les icircles de la ZOI Agrave traverscette eacutetude nous avons pu constater un comportement proche pour lrsquoensemble des icircleseacutetudieacutees Ainsi nous avons pu trouver des speacutecificiteacutes de lrsquoInternet de la ZOI La dis-tance geacuteographique a un impact sur la longueur de la route le deacutelai associeacute agrave chaquenœud de la route est similaire Mais surtout le deacutelai pour toute destination baseacutee agrave lrsquoex-teacuterieur drsquoune icircle est plus long pour les distances geacuteographiques courtes Ce comporte-ment srsquoexplique par une inter-connexion des FAI reacutegionaux agrave travers des Tiers-1 situeacutesmajoritairement en Europe

25 Conclusion

Dans ce chapitre nous avons eacutetudieacute la connectiviteacute de La Reacuteunion en terme de deacutelaiset de routes emprunteacutees

Lors de la premiegravere section nous avons vu que La Reacuteunion ne propose pas drsquoinfra-structure permettant la mise en place de notre eacutetude La premiegravere eacutetape fut le deacuteploie-ment de raspberry-pi sur lrsquoensemble de lrsquoicircle Ces sondes connecteacutees agrave lrsquoensemble des FAI

72

et TAI utilisent lrsquooutil Paris-traceroute pour reacutealiser des mesures de deacutelais et de routesCet outil est moins sensible au pheacutenomegravene drsquoeacutequilibrage de charges que le traceroutetraditionnel

Une fois notre plate-forme deacuteployeacutee nous avons reacutealiseacute des mesures durant plusieursmois Ces mesures actives eacutetudient la connectiviteacute depuis et vers La Reacuteunion Cette vo-lonteacute drsquoeffectuer les mesures dans les deux sens provient de la forte preacutesence de routesasymeacutetriques dans lrsquoInternet

Nos donneacutees ont montreacute que La Reacuteunion est confronteacutee agrave ce pheacutenomegravene Nous avonseffectueacute une analyse selon 4 paramegravetres le deacutelai la distance geacuteographique la longueurdu chemin et les routes emprunteacutees La litteacuterature ne proposant pas drsquooutil respectantnos critegraveres de seacutelection nous avons deacuteveloppeacute notre propre outil drsquoanalyse rTrace-route Nous avons souhaiteacute partager notre outil drsquoanalyse agrave travers une publicationDans lrsquoattente drsquoune publication scientifique un site internet deacutedieacute agrave lrsquooutil est dispo-nible [rtraceroute]

Le premier reacutesultat concerne la longueur des routes Les routes reacuteunionnaises sontplus longues que la moyenne mondiale On constate eacutegalement une diffeacuterence selon lesens de communication En eacutetudiant lrsquoimpact de la distance kilomeacutetrique sur la longueuron voit qursquoaucune correacutelation nrsquoexiste entre les deux paramegravetres Les routes Internet dela boucle locale sont aussi longues que les routes reliant des points situeacutes agrave plus de 15 000kmLorsqursquoun paquet traverse un nœud un deacutelai associeacute au traitement agrave lrsquoeacutemission et agrave lapropagation des donneacutees vers le saut suivant peut ecirctre calculeacute Cette valeur diffegravere eacutenor-meacutement selon que lrsquoon quitte ou que lrsquoon joint La Reacuteunion On a un coefficient de 1 79entre les deux valeurs Cela corrobore lrsquoasymeacutetrie des liens mais aucunement un com-portement speacutecifique agrave la connectiviteacute reacuteunionnaiseLrsquoun des reacutesultats les plus inteacuteressants concerne la relation entre la distance geacuteogra-phique et les deacutelais associeacutes Contrairement agrave ce que lrsquoon pouvait attendre la connectiviteacutereacuteunionnaise deacutecroicirct les deacutelais avec lrsquoincreacutementation de la distance lorsque le trafic em-prunte les cacircbles sous-marinsDans lrsquoanalyse des routes nous avons constateacute que lrsquointer-connexion reacutegionale se faitnon pas au sein de la ZOI mais dans une zone eacuteloigneacutee La Reacuteunion possegravede 3 sortiesphysiques que sont lrsquoAsie lrsquoAfrique et lrsquoEurope Pour autant seule la France hexagonalesemble ecirctre inteacuteressante pour les FAI locaux Plus de 97 de nos donneacutees sortent agrave traversce pays localiseacute agrave plus de 10 000 km

Nous avons confirmeacute le fait que lrsquointer-connexion se fait dans une zone eacuteloigneacutee agravetravers lrsquoeacutetude de la connectiviteacute de la ZOI Cette eacutetude a deacutemontreacute un comportementsimilaire entre La Reacuteunion et les icircles de la zone La seule diffeacuterence notable provient dunombre de portes de sorties pour les icircles Neacuteanmoins elles sont agrave une tregraves forte majoriteacutegeacuteolocaliseacutees en Europe

Le deacutelai minimal mesureacute pour La Reacuteunion et la configuration actuelle de la connec-tiviteacute Internet reacuteunionnaise peuvent avoir des conseacutequences sur les performances desprotocoles de transport comme TCP Pour veacuterifier cela une eacutetude de meacutetrologie passivea eacuteteacute reacutealiseacutee Cette eacutetude est preacutesenteacutee dans le chapitre 3

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors dela confeacuterence Asian INTernet Engineering Conference (AINTEC) en 2016 [Noordally2016]Cette publication a eacuteteacute axeacutee sur les reacutesultats reacuteunionnais Une seconde contribution deacute-dieacutee agrave la connectiviteacute des icircles de la ZOI a eacuteteacute publieacutee lors de la confeacuterence Global Informa-tion Infrastructure and Networking Symposium (GIIS) en 2017 [Nicolay2017-2]

73

74

Chapitre 3

Meacutetrologie sur le service de transportagrave La Reacuteunion

TCP est un protocole de transport dont la performance est deacutependante du RTT etdu taux de perte des segments Plus exactement ces deux paramegravetres entrent en comptepour deacuteterminer le deacutelai pris par la fenecirctre de congestion pour qursquoelle atteigne une taillequi couvre le produit deacutelai-bande passante du canal virtuel qui relie la source agrave la desti-nation Aussi TCP voit ses performances reacuteduites lorsque ce produit augmente et changede facteur drsquoeacutechelle Les reacutesultats obtenus par lrsquoeacutetude de la connectiviteacute de lrsquoicircle de LaReacuteunion ont montreacute un RTT minimal de 180 ms pour le trafic quittant lrsquoicircle de La Reacuteunion(cf tableau 210) Avec les technologies drsquoaccegraves agrave haut deacutebit il devient techniquementpossible que des connexions TCP depuis ou vers La Reacuteunion souffrent des symptocircmesque lrsquoon retrouve avec lrsquoutilisation drsquoun LFN

Dans ce chapitre nous allons eacutetudier quel peut ecirctre lrsquoimpact de la capaciteacute de stockagedes canaux de communication depuis et vers lrsquoicircle La Reacuteunion sur les performances deTCP Pour cela nous allons nous appuyer sur de la meacutetrologie passive afin de pouvoirfaire des observations sur la performance de TCP Dans ce chapitre nous preacutesentonsla meacutethode que nous avons appliqueacutee afin drsquoestimer par la meacutetrologie le service quenous obtenons agrave La Reacuteunion Lrsquoobjectif ici nrsquoest pas drsquoobtenir des reacutesultats repreacutesentatifsde lrsquoInternet applicables agrave La Reacuteunion dans sa globaliteacute mais de mener une premiegravereexpeacuterience pour valider la meacutethode et les outils que nous pourrions ensuite appliqueraupregraves des diffeacuterents opeacuterateurs locaux

Ce chapitre se compose de quatre sections La premiegravere section 31 fixe les objectifs delrsquoeacutetude de meacutetrologie Elle preacutesente les meacutetriques agrave deacuteterminer pour pouvoir atteindreces objectifs La partie 32 preacutesente la meacutethode de mise en œuvre de la plate-forme demeacutetrologie Le protocole de mesure mis en place pour la reacutealisation drsquoune eacutetude est preacute-senteacute dans la section 33 Enfin cette section est suivie par la partie 34 qui preacutesente lesreacutesultats que lrsquoon peut obtenir et lrsquointerpreacutetation qui peut en ecirctre faite

31 Objectifs

Lrsquoeacutetude des deacutelais aller-retour (RTT) et des routes Internet de lrsquoicircle de La Reacuteunion quenous avons preacutesenteacutee dans le chapitre preacuteceacutedent a mis en eacutevidence une connectiviteacute speacute-cifique Lrsquoaccegraves agrave lrsquoInternet passe principalement par la meacutetropole avec un RTT minimalde 180 ms Ce RTT multiplieacute par un deacutebit drsquoaccegraves de 1 Mbits deacutebit theacuteorique minimalproposeacute dans les diffeacuterentes offres par les FAI donne une quantiteacute de donneacutees eacutemisespar anticipation de 22 5 Ko Ce calcul prend comme hypothegravese que le goulot drsquoeacutetran-glement est le lien drsquoaccegraves de lrsquohocircte Ce produit deacutelai bande passante repreacutesente la taille

75

de la fenecirctre drsquoeacutemission agrave partir de laquelle une transmission continue de lrsquoeacutemetteur de-vient possible Avec une valeur de 22 5 Ko cela place le canal de communication de LaReacuteunion dans la cateacutegorie des reacuteseaux agrave forte capaciteacute de stockage (LFN) Dans la section21 nous avons vu que La Reacuteunion est pleinement inteacutegreacutee au plan tregraves haut deacutebit delrsquoeacutetat franccedilais Ce plan a pour objectif de deacuteployer une infrastructure de distribution enfibre optique (Fiber To The Home (FTTH)) sur lrsquoensemble du territoire franccedilais Cela aurapour conseacutequence si les deacutelais ne sont pas en diminution drsquoaugmenter la capaciteacute destockage du canal de communication

311 Les objectifs de lrsquoeacutetude

Le lien drsquoaccegraves de La Reacuteunion conduit agrave consideacuterer lrsquoInternet avec les caracteacuteristiquesdrsquoun reacuteseau agrave forte capaciteacute de stockage Ceci est ducirc agrave un deacutelai minimal eacuteleveacute Avec cedeacutelai des deacutegradations potentielles des performances de TCP sont envisageables La miseen place drsquoune eacutetude de meacutetrologie passive agrave lrsquoeacutechelle reacutegionale nrsquoa pas encore eacuteteacute reacuteali-seacutee Les opeacuterateurs ont une connaissance partielle de la situation de lrsquoicircle Afin drsquoobtenirune vision globale de lrsquousage de lrsquoInternet sur lrsquoicircle de La Reacuteunion il nous faut reacutepondreaux diffeacuterentes questions suivantes

mdash Quel est lrsquoimpact de lrsquoaugmentation de la capaciteacute de stockage sur les performancesdu protocole TCP

mdash Est-ce que lrsquoaugmentation des deacutebits theacuteoriques est reacutecupeacutereacutee dans les deacutebits me-sureacutes par TCP

Dans la section 123 nous avons preacutesenteacute lrsquoarticle [Zheleva2015] Pour rappel dans cettepublication les auteurs ont mis en avant un changement drsquoutilisation des services Internetapregraves une augmentation de la bande passante Nous allons eacutegalement reacutepondre agrave desquestions orienteacutees vers la supervision du trafic Ces questions sont les suivantes

mdash Quels sont les protocoles de transport utiliseacutes

mdash Quels sont les services les plus freacutequents

mdash Quelle est la distribution geacuteographique des services joints

Les reacuteponses agrave ces questions impliqueront lrsquoapparition drsquoautres questions

312 Les meacutetriques de lrsquoeacutetude

Le tableau 31 indique les meacutetriques que lrsquoon va eacutetudier Chaque meacutetrique eacutetudieacuteesera mise en relation avec une des questions poseacutees preacuteceacutedemment

Meacutetriques de supervision

La supervision du trafic consiste agrave analyser le flux geacuteneacuteral de paquets qui transite ausein drsquoun eacutequipement comme un routeur ou un commutateur On parle drsquoeacutetude macro-scopique telle qursquoindiqueacutee dans le rapport [Owezarski2003-1] Les informations analy-seacutees par la supervision sont geacuteneacuteralement les informations analyseacutees par un adminis-trateur Reacuteseau ou encore un FAI En reacuteponse aux questions sur la supervision nousavons seacutelectionneacute dans un premier temps lrsquoidentification des protocoles de transportLe champ protocole de lrsquoen-tecircte IP indique le protocole de niveau suivant utiliseacute dans lapartie des donneacutees du datagramme Internet [RFC760] Les valeurs des diffeacuterents proto-coles sont speacutecifieacutees en reacutefeacuterence [RFC3232 IANA-port]

76

TABLE 31 ndash Les meacutetriques de meacutetrologie passive

Meacutetriques En-tecircte Champs

Supervisiondu trafic

Caracteacuterisation des destinationsIP

Adressessources etdestinations

Protocole de transport employeacute ProtocoleService utiliseacute

TCP

Numeacutero deport

Performanceprotocolaire

Performance deTCP

Eacuteveacutenement de congestion ECNNS+ CWRNumeacutero deseacutequence

RTT TimestampPertes Numeacutero de

seacutequencedeacute-seacutequencementsRetransmissions

Deacutebits binaires

EacutecouleacuteTimestampNumeacutero deseacutequencefenecirctre

DescendantMontant

UtileCaracteacuterisationdes flots

DeacutebitDureacutee Timestamp

Longueur Nombrede paquetseacutechangeacutes

Nous avons vu preacuteceacutedemment que les services eacutevoluent dans le temps et selon lesdeacutebits [Zheleva2015] Lrsquoanalyse du champ numeacutero de port de lrsquoen-tecircte TCP aide agrave lrsquoidenti-fication du Service utiliseacute Chaque numeacutero de port est associeacute agrave un service preacutecis deacutefinidans le [RFC776]

En regravegle geacuteneacuterale le trafic Internet est diviseacute en trois cateacutegories en fonction de ladestination par rapport agrave la source Crsquoest le groupe de travail 802 de lrsquoIETF qui est encharge des caracteacuterisations

mdash Local Area Network (LAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir une zonede quelques kilomegravetres carreacutes ou moins Parce que le reacuteseau est connu pour necouvrir qursquoune petite zone des optimisations peuvent ecirctre faites dans les protocolesde signal de reacuteseau qui permettent des deacutebits de donneacutees jusqursquoagrave 100 Mbits raquo[RFC1983]

mdash Metropolitan Area Network (MAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir unezone proche de celle drsquoune grande ville Ces reacuteseaux sont mis en œuvre par destechniques innovantes comme le passage de cacircbles agrave fibres optiques dans les tun-nels du meacutetro raquo [RFC1983]

mdash Wide Area Network (WAN) laquo Un reacuteseau geacuteneacuteralement construit avec des lignesseacuteries qui couvrent une large zone geacuteographique raquo [RFC1983]

La reacutepartition des adresses IP de destination va permettre drsquoidentifier le pays ougrave se si-tue lrsquoinformation Cette information peut permettre de connaicirctre la pertinence du lieudrsquoheacutebergement de lrsquoinformation par rapport au service et agrave lrsquoapplication utiliseacutee Nousutilisons pour cela la base de donneacutees associeacutee agrave lrsquooutil rTraceroute outil drsquoanalyse gra-phique des traces preacutesenteacute dans la section 222 Dans le cas ougrave une adresse IP nrsquoest pas

77

reacutepertorieacutee dans notre base de donneacutees lrsquoinformation sera extraite de la base de donneacuteesde RIPE NCC avec lrsquooutil rgeoloc [LanYanFock2015]

Meacutetriques de performance

Le groupe de travail IPPM de lrsquoIETF a deacutefini dans diffeacuterents documents des meacutetriquesde bases comme la mesure de connectiviteacute [RFC2678] le deacutelai unidirectionnel [RFC2679]le taux de perte unidirectionnel [RFC2680] Ces deux derniegraveres meacutetriques sont eacutegalementdeacutefinies dans le sens aller-retour avec le [RFC2681]

Nous avons comme objectif la comparaison du deacutebit theacuteorique et le deacutebit mesureacute Lecalcul du deacutebit mesureacute par TCP se fait agrave travers 3 meacutetriques le RTT la taille de la fe-necirctre drsquoeacutemission et la probabiliteacute de perte de paquets Le RTT est le deacutelai entre la misedu premier bit de la question sur le cacircble et la reacuteception du dernier bit de la reacuteponse[RFC2681] Il est calculeacute par la diffeacuterence de temps entre lrsquoeacutemission du paquet et la reacute-ception de lrsquoACK correspondant Si le RTT est trop important TCP peut consideacuterer unpaquet comme perdu

Une perte est deacutefinie comme laquo lrsquoeacutemission drsquoun paquet par la source mais non reccedilupar la destination raquo [RFC2680] Si le paquet est perdu alors TCP va reacuteduire la fenecirctredrsquoeacutemission

La fenecirctre drsquoeacutemission est calculeacutee agrave partir du champ Fenecirctre des segments TCP Cechamp est deacutefini dans le [RFC6528] comme le nombre drsquooctets de donneacutees commenccedilantpar celui indiqueacute dans le champ drsquoaccuseacute de reacuteception que lrsquoexpeacutediteur de ce segment estprecirct agrave accepter

Agrave lrsquoaide de la formule indiqueacutee par lrsquoeacutequation 31 il est possible de calculer le deacutebitmesureacute par TCP

Debit =FenetreRTTradic

Probabilite perte(31)

Les deacutebits mesureacutes pourront ecirctre classeacutes selon qursquoils soient montants descendantsconfondus ou utiles Cette diffeacuterenciation srsquoexplique par le fait que la comparaison avecle deacutebit theacuteorique est montant et descendant Le deacutebit eacutecouleacute (throughput) correspond laquo aunombre de paquets ou de bits par seconde raquo [RFC6201] Le deacutebit utile (goodput) corres-pond laquo au nombre de paquets ou de bits utiles (non retransmis) par seconde raquo[RFC5166]

Lrsquoeacutetude des performances du protocole TCP passe dans un premier temps par lrsquoeacutetudedes pertes et des retransmissions

Une retransmission est deacutefinie par le [RFC6298] comme eacutetant le laquo segment le plusancien qui nrsquoa pas eacuteteacute acquitteacute par le reacutecepteur TCP raquo Pour obtenir le nombre de re-transmissions on regarde les numeacuteros de seacutequences des segments TCP Si dans un flotIP un numeacutero de seacutequence apparaicirct plusieurs fois alors cela implique la retransmissiondu paquet Les retransmissions seront seacutepareacutees selon la raison de la retransmission (fastretransmit) ou retransmissions abusives (spurious retransmit)Le [RFC5681] explique le pheacutenomegravene pouvant provoquer une retransmission par le meacute-canisme de fast retransmit La retransmission drsquoun paquet due au meacutecanisme de fast re-transmit est calculeacutee en fonction du nombre drsquoacquittements dupliqueacutes et de la diffeacuterencetemporelle entre le paquet de donneacutees observeacutees et le preacuteceacutedent acquittementLes paquets spurious retransmit sont des paquets subissant des fausses retransmissions Sile numeacutero de seacutequence du paquet attendu est infeacuterieur ou eacutegal au numeacutero drsquoacquittementdu preacuteceacutedent ACK alors le paquet observeacute est un paquet retransmis abusivement

78

Lorsque le paquet est reacute-eacutemis il va se produire du deacute-seacutequencement Le deacute-seacutequencementse deacutefinit dans le [RFC6248] laquo Lrsquoarriveacutee ordonneacutee est une proprieacuteteacute que lrsquoon trouve dansles paquets qui transitent par leur chemin ougrave le numeacutero de seacutequence des paquets aug-mente avec chaque nouvelle arriveacutee et il nrsquoy a pas de reacutegression La deacutetection du reacute-ordonnancement agrave destination est baseacutee sur lrsquoordre drsquoarriveacutee des paquets par rapport agraveune valeur de reacutefeacuterence non inverseacutee raquo

Les paquets retransmis peuvent eacutegalement servir agrave lrsquoidentification des eacuteveacutenementsde congestion Pour identifier ces eacuteveacutenements deux techniques peuvent ecirctre mises enplaceLa premiegravere consiste a eacutetudier la preacutesence des drapeaux ECN et Congestion Window Re-duce (CWR) dans les en-tecirctes des paquets TCP [RFC8311]La seconde technique se propose drsquoeacutetudier les variations de la fenecirctre drsquoeacutemission de TCPCette eacutetude doit ecirctre coupleacutee avec lrsquoanalyse des pheacutenomegravenes de pertes et de retransmis-sion autour de cet eacuteveacutenement

Dans la section 112 nous avons constateacute que la capaciteacute de stockage drsquoun lien estprobleacutematique pour les flots courts Afin de poursuivre lrsquoeacutetude de lrsquoimpact de la capa-citeacute de stockage des liens de lrsquoInternet reacuteunionnais nous allons caracteacuteriser les flux Lacaracteacuterisation drsquoun flot peut se faire selon la dureacutee (temps eacutecouleacute entre le premier etle dernier paquet) la taille (nombre de paquets eacutechangeacutes) et le ratio entre la dureacutee et lataille Drsquoapregraves les travaux reacutealiseacutes par [Lan2006] un flot se caracteacuterise par la deacutefinitionsuivante laquo a flow is an unidirectional series of IP packets with same source and destinationaddresses port numbers and protocol numbers raquo Ce qui peut se traduire par la deacutefinition sui-vante laquo un flot est une seacuterie de paquets IP avec le mecircme tuple suivant (adresse IP sourceport source adresse IP destination port destination protocole IP) raquo Dans ce cas preacutecisune connexion TCP de par son coteacute bi-directionnel est constitueacutee de deux flots

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie

La mise en place drsquoune eacutetude de meacutetrologie passive au sein du territoire reacuteunionnaissoulegraveve trois contraintes

La premiegravere est la mise en place drsquoun accord de partenariat avec un ou plusieurs FAILrsquoobjectif de ce partenariat est la mise en place drsquoun systegraveme drsquoeacutecoute et de capture dedonneacutees au sein de leur infrastructure tout en garantissant une confidentialiteacute maximaleagrave leur clients et agrave lrsquoentreprise

Une seconde contrainte est la seacutelection drsquoun outil de mesure Cet outil sera capablenon seulement drsquoeacutecouter les donneacutees circulant sur une interface mais eacutegalement de cap-turer les donneacutees sous diverses extensions

La derniegravere contrainte est lieacutee agrave la seacutelection drsquoun outil drsquoanalyse Cet outil sera ca-pable drsquoapporter un support de reacuteponses aux questions poseacutees preacuteceacutedemment Il devrareacutepondre agrave des critegraveres que lrsquoon deacutetaillera par la suite

Le trafic eacutetant variable drsquoun instant t agrave lrsquoinstant t+1 nous allons mettre en place un sys-tegraveme de capture de donneacutees Ce systegraveme permettra lrsquoanalyse a posteriori des meacutetriquesEn fonction des reacutesultats drsquoautres meacutetriques pourront ecirctre extraites des donneacutees Deplus la capture nous autorise apregraves quelques deacutemarches administratives de partagerles traces aupregraves de la communauteacute scientifique

321 Pour la capture du trafic

Nous avons vu dans le chapitre 1 que les outils neacutecessaires agrave la reacutealisation drsquoeacutetudes demeacutetrologie passive sont nombreux Notre analyse sera la plus large possible en terme de

79

meacutetriques Nous devrons en fonction des reacutesultats obtenus eacutetudier drsquoautres meacutetriquesque celles choisies en premier lieu Pour ces raisons nous faisons le choix de reacutealiser descaptures du trafic Dans la section 123 nous avons preacutesenteacute les outils disponibles pourla capture de trafic Nous allons dans un premier temps utiliser une solution logicielleDans le cas ougrave les deacutebits sur les liens seraient trop eacuteleveacutes nous basculerons alors vers unesolution mateacuterielle

322 Pour analyser les traces

De nombreux outils drsquoanalyse de traces existent dans la litteacuterature Afin drsquoen choi-sir un nous allons deacutetailler des critegraveres de seacutelection Nous preacutesenterons quelques outilsdrsquoanalyse existants en mettant en avant leurs reacuteponses aux critegraveres preacutesenteacutes Nous fini-rons par la preacutesentation drsquoun outil drsquoanalyse de traces deacuteveloppeacute au sein du LIM

Deacutefinition des critegraveres

Lrsquooutil drsquoanalyse pour la plate-forme de meacutetrologie passive devra reacutepondre aux cri-tegraveres de seacutelection suivants

1 Protection de la vie priveacutee des utilisateurs Pour respecter ce critegravere une fonctiondrsquoanonymisation des traces doit ecirctre appliqueacutee La loi Informatique et Liberteacute de1978 reacuteglemente le traitement des donneacutees personnelles [LIL1978] Une trace estune eacutecoute drsquoun trafic initieacute par un utilisateur Les donneacutees transporteacutees nrsquoont pasagrave ecirctre lues En plus des donneacutees ce sont aussi les adresses IP qui ne doivent pasapparaitre en clair

2 traiter une volumeacutetrie importante Le volume des traces eacutetant variable il est neacuteces-saire que lrsquooutil soit capable de traiter des traces de grande taille Potentiellementce sont des fichiers de traces de plusieurs dizaines de Go (Giga-octets) qui peuventecirctre ameneacutes agrave ecirctre traiteacutes

3 proposer des meacutetriques adapteacutees Pour reacutealiser une analyse approfondie il fautque la liste des meacutetriques proposeacutees par lrsquooutil drsquoanalyse soit la plus large possibleAgrave ce titre nous avons preacutesenteacute dans le tableau 31 une base de meacutetriques a analyser

Les outils drsquoanalyse disponibles

Il existe de nombreux outils drsquoanalyse de donneacutees de meacutetrologie passive Nous pro-posons une classification selon les possibiliteacutes offertes par chaque outil CAIDA pro-pose sur son site internet une partie deacutedieacutee aux diffeacuterents outils de meacutetrologie passive[CAIDA-Tools]

BRO est un outil pour la deacutetection drsquointrus sur le reacuteseau en temps-reacuteel agrave partir demeacutetrologie passive Il est preacutesenteacute pour la premiegravere fois dans lrsquoarticle [Paxson1999] Agravepartir drsquoun systegraveme de script il accepte en entreacutee des fichiers de taille importante Leprincipal deacutefaut de Bro par rapport agrave nos critegraveres de seacutelection est le non-respect de la viepriveacutee

CoralReef [Moore2001] est une suite logicielle deacuteveloppeacutee par CAIDA en 1999 Cetoutil reacutealise des analyses de donneacutees que ccedila soit en temps reacuteel ou sur des traces Le critegraverede respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pas respecteacuteLrsquooutil est plus adapteacute agrave lrsquoeacutetude des caracteacuteristique du trafic qursquoau performance de TCPAinsi les meacutetriques lieacutees agrave lrsquoeacutetude des performances ne sont pas incluses dans le code delrsquooutil

Netflow est un outil proprieacutetaire Il neacutecessite lrsquoutilisation drsquoun mateacuteriel de la marqueCISCO plus la licence du logiciel Lrsquooutil reacutealise principalement la supervision du trafic

80

transitant sur le mateacuteriel Le respect de la vie priveacutee est ici respecteacute mais les meacutetriques deperformance protocolaire ne sont pas inclues

TCPStat [Herman2001] rapporte certaines statistiques du trafic transitant agrave traversune interface reacuteseau Crsquoest un outil qui peut travailler sur un flot en temps reacuteel ou enanalysant un fichier de trace Cet outil ne permet pas lrsquoanonymisation des adresses IPPeu de meacutetriques sont ainsi renseigneacutees On pourrait obtenir les deacutebits et la volumeacutetriedes paquets IPv4 eacutechangeacutes

TCPTrace [Ostermann2000] est un logiciel qui permet le traitement de traces drsquoeacutecouteOutil tregraves complet il a deacutejagrave fait ses preuves sur drsquoautres projets de meacutetrologie passive Lecritegravere de respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pasrempli La meacutetrique de caracteacuterisation des destinations et la reacutepartition geacuteographique nesont pas incluses dans les meacutetriques proposeacutees par lrsquooutil

Tstat [Mellia2003-1] est un outil qui peut reacutealiser la collecte et lrsquoanalyse du trafic Cetteanalyse se fait sur diffeacuterents niveaux passant des paquets agrave la couche applicative Cetteanalyse reacutealise une anonymisation des adresses IP Les meacutetriques de caracteacuterisations desdestinations et de reacutepartitions geacuteographiques ne sont pas inteacutegreacutees dans lrsquooutil

Wireshark [Orebaugh2006] est un outil graphique drsquoanalyse reacuteseau tregraves reacutepandu Cetoutil permet de filtrer et drsquoanalyser des donneacutees entrantes et sortantes drsquoun point entemps reacuteel ou sur des traces collecteacutees Il autorise eacutegalement la capture et la lecture detraces Lrsquooutil preacutesente des lacunes sur les trois critegraveres preacutesenteacutes

ZOO est un outil deacuteveloppeacute dans le cadre du projet Metropolis Creacuteeacute par le Labora-toire drsquoAnalyse et drsquoArchitecture des Systegravemes (LAAS) le logiciel essaie de trouver un moyende mesurer la qualiteacute du service de trouver des paramegravetres pour deacutefinir le processus detrafic et drsquoaider agrave eacutemettre un modegravele adapteacute pour le trafic [Owezarski2004] Au niveaudes meacutetriques preacutesenteacutees ce sont principalement des statistiques et des informations desupervision qui sont disponibles Lrsquoanonymisation des adresses IP nrsquoest pas incluse dansles caracteacuteristiques de lrsquooutil

Le tableau 31 sert de base pour la reacuteponse aux critegraveres deacutedieacutes des meacutetriques Netflowpossegravede un catalogue de meacutetriques restreint agrave la supervision du trafic TCPTrace et Tstatsont des outils qui auraient pu correspondre agrave nos besoins mais les meacutetriques de caracteacute-risation des destinations et la reacutepartition geacuteographiques sont absentes Nrsquoayant pu faireun choix sur un outil pouvant reacutepondre agrave la totaliteacute des critegraveres nous nous orientons versle deacuteveloppement drsquoun analyseur de traces

Deacuteveloppement de Xanalyse

Lrsquoanalyse des traces de meacutetrologie passive peut srsquoeffectuer avec de nombreux outilsDans la section preacuteceacutedente nous avons preacutesenteacute les critegraveres de diffeacuterenciation de cesoutils Tstat et TCPTrace sont des outils tregraves complets Ces deux outils auraient pu nousconvenir Neacuteanmoins le temps de traitement des fichiers de volumeacutetrie importante estbeaucoup trop important Ducirc agrave cela nous avons pris le parti de deacutevelopper un nouveloutil drsquoanalyse de traces Xanalyse

Le premier critegravere concerne le respect de la vie priveacutee Une approche simple pouranonymiser une adresse IP est de la faire correspondre avec une adresse IP aleacuteatoireUne telle meacutethode rend la trace inutilisable dans des situations utilisant la logique desadressages IP Lrsquoanonymisation drsquoadresse est performante si elle preacuteserve le mecircme preacute-fixe Autrement dit si deux adresses IP partagent k-bits de preacutefixes leurs eacutequivalencesanonymiseacutees conserveront ces k-bits de preacutefixes en commun La meacutethode crypto-pan deacute-crite dans lrsquoarticle [Xu2002] sert de base agrave la fonction drsquoanonymisation mise en œuvreLrsquoanonymisation srsquoappliquera que lors de lrsquoaffichage des reacutesultats Nous avons besoin de

81

lrsquoadresse pour deux meacutetriques de supervision que sont la reacutepartition du trafic et la geacuteo-localisation Concernant le champ Donneacutees des paquets TCP il nrsquoest pas utiliseacute Lrsquoeacutetudene recommande que les en-tecirctes

Sur lrsquoaspect du traitement drsquoune volumeacutetrie importante Xanalyse fut deacuteveloppeacute avecla volonteacute de maximiser lrsquoutilisation des ressources de la machine hocircte Pour cela nousavons eu lrsquoideacutee drsquoutiliser la programmation parallegravele (thread) La paralleacutelisation permetlrsquoexeacutecution de plusieurs instructions simultaneacutement

Le calcul des meacutetriques fut directement reacutealiseacute en consideacuterant leurs deacutefinitions dansles diffeacuterents RFC tel que nous lrsquoavons deacutecrit dans la section 312 Une partie statistiquefut eacutegalement inteacutegreacutee agrave notre outil Des calculs de moyenne de variance et drsquoeacutecart-typefurent inteacutegreacutes Ces calculs se font agrave la toute fin du programme Durant le deacuteveloppe-ment nous avons corroboreacute lrsquoensemble de nos reacutesultats avec les reacutesultats de TCPTraceCette comparaison a eacuteteacute mise en place pour veacuterifier lrsquoexactitude de nos reacutesultats Le deacuteve-loppement de lrsquooutil fut reacutealiseacute sous ma direction dans le cadre drsquoun stage de fin drsquoeacutetudede Master 2 [Ravoavahy2017]

Pour finir nous avons reacutealiseacute une validation par comparaison entre Xanalyse et TCP-Trace Le tableau 32 montre le bilan de cette comparaison

TABLE 32 ndash Comparaison de performances

TCPTrace XanalyseTemps drsquoanalyse sur une trace de 20 Go 10 jours 7 joursTemps drsquoanalyse sur une trace de 1 Go 1 Heure 3 Min

Xanalyse se reacutevegravele ecirctre un outil beaucoup plus rapide que TCPTrace avec des reacutesul-tats identiques sur le calcul des meacutetriques Cet outil est actuellement disponible sur lesite du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrxanalyse

33 Protocole de mesure

Le protocole de mesure preacutesente les diffeacuterentes phases que lrsquoon souhaite mettre enplace durant lrsquoeacutetude Elles sont ainsi au nombre de cinq les contraintes reacuteglementairesla veacuterification des perturbations la capture du trafic la collecte et lrsquoanalyse Ce protocolefut reacutedigeacute en prenant en consideacuteration les conseils indiqueacutes dans [John2010] Dans cetarticle les auteurs deacutelivrent diffeacuterents conseils et indications baseacutes sur lrsquoexpeacuterience deplusieurs acteurs de meacutetrologie passive

Notre protocole a eacuteteacute mis en place dans le but de rassurer lrsquoensemble des acteurs Ceprotocole fut testeacute dans le cadre drsquoune eacutetude de meacutetrologie passive du LIM

Contraintes reacuteglementaires Avant toute eacutetude de meacutetrologie Internet passive au seinde lrsquoUniversiteacute de La Reacuteunion il faut obtenir lrsquoautorisation du preacutesident de lrsquoeacutetablisse-ment Le preacutesident consultera le Correspondant Informatique et Liberteacutes (CIL) et le Respon-sable Seacutecuriteacute et Systegravemes drsquoInformation (RSSI) de lrsquouniversiteacute Ces personnes deacutefiniront enfonction des objectifs de lrsquoeacutetude les limites de notre eacutetude en accord avec les lois fran-ccedilaises Les limites imposeacutees par la preacutesidence de lrsquoUniversiteacute indiqueacutees par le CIL et leRSSI furent celles autour de la vie priveacutee Agrave ce titre nous nrsquoavions pas le droit drsquoeacutetudierle trafic en temps reacuteel nrsquoy drsquoeacutetudier le champ Donneacutees des paquets TCP Nous avionseacutegalement lrsquoobligation drsquoanonymiser lrsquoensemble des adresses IP priveacutees rencontreacutees Laderniegravere obligation fut la restriction de nos eacutecoutes au LIM Ces obligations furent res-pecteacutees dans le deacuteveloppement de lrsquooutil drsquoanalyse

82

Afin de ne capturer que le trafic du Laboratoire nous avons travailleacute en collaborationavec la Direction des Services Informatiques (DSI) de lrsquoUniversiteacute Ce partenariat a pourobjectif drsquoisoler le trafic du LIM dans un Virtual Local Area Network (VLAN) speacutecifique UnVLAN est laquo un meacutecanisme par lequel les hocirctes qui reacutesident dans la mecircme infrastructurephysique commuteacutee mais des domaines de diffusion virtuelle seacutepareacutes sont adresseacutes agravepartir du mecircme sous-reacuteseau IPv4 et partagent une adresse IP de passerelle par deacutefautcommune supprimant ainsi lrsquoexigence drsquoun sous-reacuteseau IP deacutedieacute pour chaque reacuteseaulocal virtuel (Local Area Network (LAN) ou MAN) raquo [RFC3069] Les VLAN seacuteparent lesusagers selon leur autorisations et les types de connexion Par exemple un enseignant-chercheur a plus de droits qursquoun eacutetudiant Une personne connecteacutee par connexion filairea des droits diffeacuterents drsquoune personne connecteacutee par agrave un reacuteseau sans fil Le RSSI delrsquoUniversiteacute ne souhaitant pas obliger les membres du LIM agrave participer agrave cette eacutetudeune campagne de preacutevention fut organiseacutee Les personnes ayant explicitement eacutemis lesouhait de ne pas participer agrave notre eacutetude seraient de facto connecteacutees agrave un autre VLANpar la DSI Au sein du laboratoire tout le personnel a accepteacute de participer agrave notre eacutetude

Veacuterification des perturbations La figure 31 illustre lrsquointer-connectiviteacute mise en placepour lrsquoeacutecoute du LIMChaque ordinateur du laboratoire geacutenegravere un trafic Internet qui passe par le VLAN dulaboratoire Par le systegraveme de port-mirroring le routeur va creacuteer une copie des paquetstransitant par le port du VLAN laboratoire Le paquet copieacute sera alors redirigeacute vers lasonde de capture La sonde de capture aura deux interfaces reacuteseaux La premiegravere (Eth0)sera deacutedieacutee agrave la capture des paquets provenant de la technique de port-mirroring La se-conde carte reacuteseau (Eth1) servira pour lrsquoaccegraves distant agrave la sonde de captureLrsquoordinateur drsquoaccegraves possegravede une cleacute priveacutee permettant lrsquoaccegraves agrave distance agrave la sonde decapture Cette porte drsquoentreacutee seacutecuriseacutee permet une gestion agrave distance de la sonde Lestraces collecteacutees seront transfeacutereacutees sur un serveur de stockage deacutedieacute au sein du LIM Letransfert se fera agrave lrsquoaide de la commande SCP et lrsquoaccegraves seacutecuriseacute preacutesenteacute preacuteceacutedemmentLrsquoaccegraves distant et le transfert des traces font partie inteacutegrante du trafic geacuteneacutereacute par lesmembres du laboratoire Les perturbations peuvent survenir agrave deux niveaux au routeuret agrave la sonde Au niveau de la sonde drsquoeacutecoute le deacutebit affecteacute en entreacutee-sortie du VLANdu laboratoire est eacutegal agrave 1 000 Mbits Ce deacutebit est devenu freacutequent sur les cartes reacuteseauxvendues sur les ordinateurs grand public Les caracteacuteristiques de la carte reacuteseau deacutedieacuteeagrave la capture accepte un deacutebit maximum eacutegal au deacutebit du VLAN du LIM On considegraverealors que le taux de pertes occasionneacute par la carte de capture peut ecirctre neacutegligeableAu niveau du routeur la fonction port-mirroring copie lrsquointeacutegraliteacute des segments IP en-trant sur un port Le paquet original est redirigeacute vers lrsquoadresse de destination incluse dansle champ destination de lrsquoen-tecircte IP Le paquet forgeacute au sein du routeur est dirigeacute versun port deacuteclareacute lors de la programmation de lrsquoeacutequipement La fonction de port-mirroringfait partie des techniques deacuteveloppeacutees dans le but drsquoeacutetudier le comportement drsquoun reacute-seau [Zhang2007] a eacutetudieacute les deacuterives lieacutes agrave la fonction port-mirroring Cette fonctionneacutecessite la mise en meacutemoire tampon des paquets provenant du lien eacutetudieacute jusqursquoagrave ceqursquoils puissent ecirctre transmis sur le lien miroir Cette mise en meacutemoire tampon joue sur lasynchronisation des paquets entre le lien eacutetudieacute et le lien miroir Lors de la transmissiondes paquets sur le lien miroir est-ce que la transmission srsquoest faite dans lrsquoordre drsquoarriveacuteesur le port eacutetudieacute Il y a donc une question drsquoordonnancement des paquets agrave eacutetudier Lameacutemoire tampon du routeur nrsquoest pas infinie Il existe donc des cas ougrave la meacutemoire estremplie occasionnant agrave ce moment lagrave des pertes Les reacutesultats de [Zhang2007] ont misen avant une diffeacuterence de synchronisation entre les paquets du lien eacutetudieacute et les paquetsdu lien miroir La diffeacuterence de synchronisation implique eacutegalement des erreurs dans lereacute-ordonnancement des paquets Ces erreurs auront pour conseacutequences des erreurs dans

83

lrsquoanalyse des performances de TCP Pour reacutesoudre ces problegravemes les auteurs preacuteconisentlrsquousage drsquoune carte physique speacutecifique agrave lrsquoeacutetude passive comme les cartes DAG

FIGURE 31 ndash Scheacutema de distribution de la plate-forme de mesure

Capture du trafic La mise en place des mesures se fait degraves la mise sous tension de lasonde et la fin du chargement du systegraveme drsquoexploitation La capture des donneacutees auraune dureacutee comprise entre 1 et 23 heures Elle srsquoeffectue agrave lrsquoaide de la commande

tcpdump -i eth0 -w trace-$timestamptrace amp

Dans laquelle les options indiquent

mdash -i eth0 indique lrsquointerface de capture Nous avons preacutevu une seconde interfacereacuteseau pour lrsquoaccegraves distant seacutecuriseacute

mdash -w trace-$timestamptrace cette option deacutesigne le fichier drsquoeacutecriture Les fichiers sontnommeacutes par le timestamp de deacutebut

Une fois la capture finie la sonde va deacutecider du temps avant la prochaine eacutecouteCette dureacutee nrsquoexceacutedera pas 24 heures Lrsquoobjectif est drsquoavoir des mesures quotidiennesmais programmeacutees de maniegravere aleacuteatoire sur la dureacutee drsquoeacutecoute et sur lrsquoeacutecart entre deuxmesures

Le paragraphe de veacuterifications des perturbations a deacutemontreacute qursquoil est difficile demettre en place une capture de la totaliteacute des paquets Une solution de capture est lrsquoeacutechan-tillonnage Dans notre cas nous avons reacutealiseacute un eacutechantillonnage indeacutependant du contenu[RFC5475] Cet eacutechantillonnage est reacutealiseacute sans prendre en consideacuteration le contenu dupaquet Ayant une volonteacute drsquoobtenir un grand nombre de donneacutees nous avons mis enplace une dureacutee de capture maximale de 23 heures et un eacutecart entre deux captures de 24heures

Collecte Une phase de collecte des traces est reacuteguliegraverement reacutealiseacutee Lrsquoobjectif est delibeacuterer de lrsquoespace disque au niveau de la sonde de capture Lorsque la sonde a fini dereacutealiser sa capture elle va envoyer le fichier de capture vers un serveur de stockage ausein du LIM Nous avons vu que le fichier de capture est nommeacute selon une nomenclaturespeacutecifique Pour rappel cette nomenclature comporte la date (au format timestamp) dudeacutebut de lrsquoeacutecoute La deacutenomination du fichier autorise un classement des traces par datede capture Ce classement peut permettre une eacutetude temporelle du trafic

Lrsquoenvoi du fichier se fait agrave travers lrsquointerface eth1 La technique utiliseacutee pour le trans-fert est la commande SCP Lrsquoutilisation de lrsquoempreinte MD5 du fichier nous assure que letransfert des donneacutees srsquoest reacutealiseacute correctement En cas de diffeacuterence entre les empreintes

84

le transfert srsquoeffectue agrave nouveau Lrsquoobjectif est de veacuterifier lrsquointeacutegriteacute des donneacutees transfeacute-reacutes

Le scheacutema 32 scheacutematise le fonctionnement de notre sonde de mesure Nous consi-deacuterons que la fonction de port-mirroring est deacutejagrave programmeacutee sur le routeur DSI

Degraves que la sonde est alimenteacutee eacutelectriquement et que lrsquoOS est chargeacute la sonde vaveacuterifier qursquoune capture est programmeacutee Si aucune capture de trace nrsquoest programmeacuteela sonde va en planifier une dans les prochaines 24 heures Si la sonde a connaissancedrsquoune programmation elle va alors reacutealiser la capture La sonde va enregistrer le traficsur une dureacutee allant entre 1 et 23 heures Lorsque la capture est finie la sonde va alorsprogrammer le prochain enregistrement La sonde va eacutegalement envoyer la trace vers leserveur de stockage

Capture

Alimentation

eacutelectrique

Veacuterification

dune capture

Programmation

dune capture

Collecte

PreacutesenteAbsente

24 heures maximum

1 - 23 heures maximum

FIGURE 32 ndash Scheacutema de fonctionnement de la plateforme de mesure

Analyse Lrsquoanalyse des donneacutees obtenues se fait en deux eacutetapes La premiegravere consiste agraveutiliser lrsquooutil Xanalyse pour obtenir les reacutesultats bruts La seconde eacutetape est lrsquoextractiondes donneacutees pour les repreacutesenter sous forme graphique

34 Reacutesultats

Notre eacutetude se cantonne agrave mesurer les performances du trafic au sein du LIM Le LIMfait partie inteacutegrante de lrsquoUniversiteacute de La Reacuteunion et agrave ce titre les usages de lrsquoInternetau sein de lrsquoeacutetablissement sont reacuteglementeacutes Ainsi lrsquoeacutetude des meacutetriques de supervisionpourraient ne pas correspondre agrave un usage plus libeacuteral de lrsquoInternet Pour rappel lesmeacutetriques eacutetudieacutees sont indiqueacutees dans le tableau 31

Nous avons fait le choix de seacuteparer notre eacutetude en deux La partie supervision donneun aperccedilu de lrsquousage du reacuteseau Internet au sein du LIM Nous essaierons dans la mesuredu possible de faire des extrapolations avec lrsquousage de lrsquoInternet agrave La Reacuteunion La sectionperformance est celle qui est la plus inteacuteressante Crsquoest elle qui va nous indiquer les deacutegra-dations occasionneacutees par les longs deacutelais pour La Reacuteunion

85

341 Supervision du trafic

Le tableau 33 montre la distribution des 4 protocoles de transport rencontreacutes

TABLE 33 ndash Distribution des protocoles encapsuleacutes dans IP

Protocole ICMP IGMP TCP UDPPourcentage 572 001 9249 178

La preacutesence du protocole ICMP agrave plus de 5 srsquoexplique par la preacutesence des sondesde mesures de RunPL Pour rappel lrsquoobjectif de cette plate-forme est drsquoeacutetudier la connec-tiviteacute de La Reacuteunion et des icircles de la Zone Oceacutean Indien agrave travers de la meacutetrologie activeNous avons dans le chapitre 2 preacutesenteacute des reacutesultats lieacutes agrave ces eacutetudes Lrsquousage du pro-tocole ICMP est freacutequent au sein de lrsquoInternet Une eacutetude du trafic reacuteunionnais mettraiteacutegalement lrsquousage de ce protocole

Le protocole Internet Group Management Protocol (IGMP) deacutefini dans le [RFC3376] estun protocole utiliseacute par les systegravemes IPv4 (hocirctes et routeurs) pour signaler leur appar-tenance agrave un groupe de multidiffusion IP agrave tout routeur multicast voisin Son usage estrestreint au sein drsquoun reacuteseau priveacute

Le protocole User Datagram Protocol (UDP) a une preacutesence infeacuterieure agrave 2 Son rocircleest la transmission de donneacutees simples sans fiabiliteacute Son usage est geacuteneacuteralement li-miteacute au service DNS Reacutecemment lrsquoentreprise Google a deacuteveloppeacute lrsquooption QUIC QUICpermet au navigateur Google Chrome drsquoeffectuer des requecirctes HyperText Transfer Protocol(HTTP)HyperText Transfer Protocol Secured (HTTPS) sur le protocole UDP [Carlucci2015]a eacutetudieacute les performances de ce systegraveme Les reacutesultats obtenus ont montreacute un meilleurgoodput que TCP-CUBIC malgreacute un taux de perte plus important Lrsquousage de QUIC estlimiteacute au navigateur Google Chrome navigateur le plus reacutepandu agrave La Reacuteunion drsquoapregraves[GSCounter] Neacuteanmoins cette option est deacutesactiveacutee par deacutefaut

Les reacutesultats de TCP sont en accord avec lrsquoeacutetude reacutealiseacutee par [EQUINIX] Avec unpourcentage de 92 49 TCP est majoritaire Les services proposeacutes par TCP sont plusnombreux que ceux offerts par les autres protocoles de transport

Le tableau 34 indique les services utiliseacutes Les services ont eacuteteacute rangeacutes par pourcentagereleveacute

TABLE 34 ndash Reacutepartition des services utiliseacutes par TCP

Service SSH DNS Mail Non identi-fieacutes

Autres HTTPS HTTP

Percent 002 163 491 721 945 3297 4379

La preacutesence du service Secure SHell (SSH) srsquoexplique par les accegraves distants agrave diffeacuterentsoutils propres au laboratoire On peut citer les nœuds Planet-Lab [PlanetLab] agrave traversle monde les sondes de la plate-forme RunPL lrsquoaccegraves agrave la sonde de capture pour cetteeacutetude lrsquoaccegraves agrave des serveurs distants etc

163 des paquets eacutechangeacutes dans nos traces sont des requecirctes de DNS Ces paquetspermettent de convertir un nom de domaine en adresse IP Lrsquoutilisation du DNS avec leprotocole TCP a eacuteteacute restreint aux transferts de zone et aux reacuteponses dont la taille est tropimportante pour UDP [RFC5936 RFC6691 RFC7766]

Le service intituleacute Mail regroupe les services identifieacutes par les ports numeacuteroteacutes 25110 143 465 995 et 993 Ces ports correspondent respectivement agrave Simple Mail TransfertProtocol (SMTP) Post Office Protocol (POP) Internet Message Access Protocol (IMAP) et leursversions seacutecuriseacutees SMTPs POPs IMAPs Lrsquoutilisation de ces ports est faite par les agents

86

de messagerie comme Windows Live Mail Mozilla Thunderbird ou Mail Lrsquoeacutechange decourriel repreacutesente 4 91 des paquets eacutechangeacutes Ce pourcentage est fausseacute par lrsquoutilisa-tion des interfaces web des messageries Par exemple on peut utiliser la page web duservice de message Gmail de Google pour envoyer directement des mails Le service uti-liseacute est alors un service web HTTP ou HTTPS

Le service nommeacute Non identifieacutes est une connexion dont le numeacutero de port nrsquoest pasrattacheacute agrave un service en particulier Ce sont geacuteneacuteralement des numeacuteros supeacuterieurs agrave 1 000

La partie Autres regroupe plusieurs services Ces services sont assez divers On peutainsi y retrouver lrsquoutilisation du port numeacuteroteacute 139 correspondant agrave netbios-ssn Ce servicede NetBIOS autorise lrsquoeacutechange de message en mode connecteacute On peut eacutegalement citerlrsquousage du service Hyper Text Caching Protocol (HTCP) [RFC2756] Ce service est utiliseacutepour partager et deacutecouvrir les contenus des caches (anteacutemeacutemoires) HTTP entre serveursmandataires

Nous avons deacutecideacute de garder la seacuteparation entre les services HTTP et HTTPS HTTPSest lrsquousage de HTTP avec un chiffrement Ce chiffrement permet au visiteur de veacuterifierlrsquoidentiteacute du site web gracircce agrave un certificat Ces services sont preacute-dominants au sein duLIM

Lrsquousage de ces services peut ecirctre deacutegradeacute si lrsquoon quitte La Reacuteunion Le tableau 35 in-dique la reacutepartition du trafic selon le type drsquoadresse de destination

TABLE 35 ndash Distribution du trafic

Trafic LAN MAN WANPourcentage 2165 0 7835

La reacutepartition srsquoest faite selon la geacuteolocalisation des adresses IP Le trafic LAN cor-respond agrave des eacutechanges entre adresses priveacutees Le trafic identifieacute MAN correspond agrave deseacutechanges entre adresses geacuteolocaliseacutees agrave La Reacuteunion On constate ainsi qursquoaucune infor-mation chercheacutee par les utilisateurs nrsquoest geacuteolocaliseacutee agrave La Reacuteunion Le trafic Wide AreaNetwork (WAN) repreacutesente le trafic transitant par les cacircbles sous-marins Ce deacutecoupageest rendu possible par lrsquointer-connexion des opeacuterateurs au sein du GIX Reunix Ce deacutecou-page ne serait pas le mecircme si on eacutetudiait la totaliteacute du trafic de La Reacuteunion Ainsi onconstate qursquoil nrsquoy a aucun service dont la destination finale serait La Reacuteunion

Le tableau 37 indique la reacutepartition des destinations de type WAN Le tableau 36rappelle la correspondance entre lrsquoacronyme et le nom complet de chaque continent

TABLE 36 ndash Correspondance entre acronymes et nom des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

TABLE 37 ndash Distribution geacuteographique des destinations WAN

Continent AF AS EU NA OC SAPourcentage 019 168 4850 4867 064 032

On constate que la reacutepartition des continents est fortement ineacutegale LrsquoEurope et lrsquoAmeacute-rique du Nord concentrent plus de 97 des destinations reacuteunies Lrsquoeacutetude reacutealiseacutee par[Fanou2016] a montreacute une incoheacuterence dans lrsquoaccegraves aux contenus Les reacutesultats ont ainsiprouveacute que malgreacute la preacutesence drsquoune infrastructure web deacuteveloppeacutee sur le continent afri-cain la majoriteacute du contenu eacutetait stockeacute sur les continents europeacuteen et nord-ameacutericain

87

Dans le cadre de La Reacuteunion les regravegles de routage vues dans le chapitre preacuteceacutedent sonten coheacuterence avec la reacutepartition des continents

342 Performance de TCP

Un flot peut ecirctre caracteacuteriseacute selon sa longueur (nombre de paquets ou octets eacutechan-geacutes) sa dureacutee (dureacutee des eacutechanges entre le premier et le dernier paquet captureacute) et sonratio Chaque caracteacuterisation est associeacutee agrave deacutenomination selon que le flux est court oulong Il existe plusieurs deacutefinitions de limites de chaque caracteacuterisation Dans le tableau38 nous indiquons le nom associeacute agrave chaque flux selon sa caracteacuterisation ainsi que desexemples de limites

Pour rappel nous avons deacutefini un flot comme laquo une seacuterie de paquets IP avec le mecircmetuple suivant ldquoadresse IP source port source adresse IP destination port destinationprotocole IPrdquo raquo Dans notre eacutetude nous consideacutererons un flot TCP sans tenir compte desmeacutecanismes drsquoeacutetablissement et de fermeture de connexion Ainsi un flot pourra conteniruniquement des paquets de donneacutees et drsquoacquittement

TABLE 38 ndash Tableau de deacutenomination des flux selon [Lan2006]`````````````Meacutetrique

Taille des fluxCourts Longs limites

Longueur Souris Eacuteleacutephant 10 paquets [Sallantin2014]1 de lrsquoutilisation du lien[Estan2001] 100 Ko[Lan2006]

Dureacutee Libellule Tortue 2 secondes[Brownlee2002] 15 mi-nutes [Lan2006]

Deacutebit Gueacutepard Escargot 100 Kos [Lan2006]

Les limites varient selon les eacutetudes Pour notre eacutetude les limites seront choisies enfonction des reacutesultats Nous comparerons nos limites avec celles indiqueacutees dans le ta-bleau ci-dessus Dans notre preacutesentation la caracteacuterisation des flux confond flux montantet flux descendant Drsquoapregraves la loi de Pareto environ 80 des effets sont le produit de 20des causes Dans lrsquoInternet 80 du trafic est reacutealiseacute par seulement 20 de flux eacuteleacutephants[Paxson1995] Nous regarderons si cette loi est respecteacutee par les limites proposeacutees

Dans la figure 33 nous avons repreacutesenteacute les CDF de la longueur des flux selon lespaquets (33a) et le nombre drsquooctets (33b) Les traits verticaux repreacutesentent les limitesindiqueacutees dans le tableau 38 Sur la figure 33a le trait vertical repreacutesente la limite des10 paquets de [Sallantin2014] Sur la figure 33b le trait vertical drsquoune valeur de 10 000octets repreacutesente la limite indiqueacutee par [Lan2006] Le trait de droite repreacutesente les 1 dela capaciteacute du lien drsquoaccegraves soit 107 octets (100 Ko)

Sur la figure 33a plus de 50 des flux sont des flux mono-paquet Les flux infeacuterieursagrave la limite proposeacutee par [Sallantin2014] de 10 paquets ont une probabiliteacute de 0 67 Notretrafic est donc constitueacute drsquoune majoriteacute de flots courts sur les paquets La seacuteparation de80 du trafic se fait agrave partir de 18 paquets

Lrsquoaxe des abscisses de la figure 33b deacutemarre agrave 500 octets avec une probabiliteacute de 0 28La valeur de deacutepart de lrsquoaxe des abscisses repreacutesente le pas utiliseacute pour le calcul de laCDF Le premier axe vertical repreacutesenteacute agrave 10 000 octets seacutepare 79 27 des flux sont desflux courts La limite proposeacutee par [Estan2001] est repreacutesenteacutee agrave 107 octets Cette seacutepara-tion indique que 99 des flux sont des flux courts Aucune des deux limites proposeacutees

88

ne permet une eacutetude fine de la seacuteparation des flux La limite proposeacutee par [Lan2006]approche la reacutepartition de Pareto

(a) Paquets (b) Octets

FIGURE 33 ndash Longueur des flux

La dureacutee drsquoun flot TCP correspond au deacutelai qui seacutepare la capture du premier et dudernier paquets du flot La figure 34 repreacutesente la PDF pour la dureacutee des flots en se-condes Le pas utiliseacute pour effectuer le traceacute est de 1 seconde Ce pas srsquoexplique par lavaleur minimale que peut prendre le RTO comme deacutefini dans le [RFC6298] La ligne ver-ticale repreacutesente la limite de [Brownlee2002] eacutegale agrave 2 secondes

La dureacutee maximale enregistreacutee pour un flot est de 61 192 secondes soit plus de 10heures drsquoeacutechange Au delagrave des 60 secondes la probabiliteacute drsquoavoir un flot supeacuterieur agravecette dureacutee est eacutegale agrave 0 081 Nous consideacuterons cette probabiliteacute neacutegligeable Plus de 59de nos flux sont infeacuterieurs agrave la limite repreacutesenteacutee par lrsquoexpiration du RTO (1 seconde) Lalimite des deux secondes indique que 64 des flux eacutechangeacutes sont des flux courts Pouratteindre la reacutepartition indiqueacutee par la loi de Pareto la seacuteparation devrait atteindre les 10secondes

Les figures 35 repreacutesentent la reacutepartition du deacutebit utile moyen de chaque flux selonle nombre de paquets par seconde (35a) et le nombre drsquooctets par seconde (35b) Laligne verticale sur la figure 35a repreacutesente la limite seacuteparant les flux courts et les fluxlongs Drsquoune valeur de 10 paquetsseconde elle est deacuteduite de la limite de 10 paquetsde la longueur des flux preacutesenteacutes preacuteceacutedemment La limite de 100 Ko de [Lan2006] suitle mecircme raisonnement Ils sont partis de la limite de la longueur des flux pour choisir lalimite de caracteacuterisation des flux sur les deacutebits

La figure 35a deacutemarre avec des deacutebits peu eacuteleveacutes mais nombreux Ainsi les flux infeacute-rieurs agrave la limite des 10 paquetsseconde repreacutesentent plus de 90 des flux rencontreacutesOn peut donc en deacuteduire que le trafic analyseacute a tregraves forte majoriteacute de flux agrave tregraves bas deacutebit

La figure 35b est calculeacutee avec le mecircme pas que pour la longueur des flux soit 500 oc-tets En analysant la figure on remarque ainsi que les flux infeacuterieurs ou eacutegaux agrave 500 octetsont une probabiliteacute drsquoexister proche de 09 La limite preacutesenteacutee par [Lan2006] autorise unecaracteacuterisation de 99 de nos flux en tant que flux courts

Tout comme lrsquoindiquaient [Paxson1995 Ciullo2009] le trafic est constitueacute en majoriteacutede flots courts Dans les trois caracteacuterisations effectueacutees (longueur dureacutee deacutebit) le traficeacutetudieacute est constitueacute agrave plus 50 voire 90 comme pour les deacutebits de flots courts

TCP est un protocole srsquoappuyant sur les deacutelais et le systegraveme drsquoacquittement pouradapter ses eacutemissions On a vu dans le chapitre 2 que lrsquoicircle de La Reacuteunion possegravede un

89

FIGURE 34 ndash Flux TCP - Densiteacute de la dureacutee de communication

(a) Paquetsseconde (b) Octetsseconde

FIGURE 35 ndash Deacutebits des flux

comportement particulier vis-agrave-vis de ce paramegravetre Nous faisons lrsquohypothegravese qursquoune desconseacutequences de ce fonctionnement est que La Reacuteunion possegravede une forte sensibiliteacute auxeacuteveacutenements de congestions Nous avons deux outils permettant de confirmer ce postulat

1 Le premier est lrsquoidentification des diffeacuterentes options preacutesentes dans lrsquoen-tecircte TCPplus particuliegraverement les options ECN Echo (ECE) Explicit Congestion Notification(ECN)Nonce Sum (NS) et CWR Le passage du bit de ces options agrave 1 indique unegestion des eacuteveacutenements de congestion

2 La seconde possibiliteacute est de repeacuterer les reacuteductions de la fenecirctre de TCP et les typesde retransmissions qui ont lieu aux alentours de cette diminution

Avec la premiegravere meacutethode nous nrsquoavons trouveacute aucun paquet avec une option degestion de la congestion (ECN) agrave 1 Cela indique que les eacuteveacutenements de congestion nepeuvent ecirctre identifieacutes par la lecture des drapeaux Les auteurs de [Trammell2015] ontmontreacute que le nombre de serveurs reacutepondant agrave la neacutegociation de lrsquooption ECE agrave traversle monde a augmenteacute ces derniegraveres anneacutees Lrsquoabsence de paquets deacutebutant la neacutegociation

90

donc provenant des utilisateurs du reacuteseau du laboratoire peut srsquoexpliquer par 3 hypo-thegravesesLa premiegravere est lrsquoobsolescence des ordinateurs du Laboratoire drsquoInformatique et de Ma-theacutematiques En effet il faut un systegraveme drsquoexploitation reacutecent pour que la version de TCPpuisse marquer les paquets avec lrsquooption Cette hypothegravese est vite abandonneacutee sachantque plusieurs participants agrave notre eacutetude possegravedent des ordinateurs acheteacutes agrave partir delrsquoanneacutee 2014La seconde hypothegravese est la suppression de lrsquooption par un eacutequipement reacuteseau traverseacute agravelrsquoUniversiteacute de La Reacuteunion Cette piste fut abandonneacutee apregraves un test de mesures Ce testconsistait agrave envoyer des paquets avec lrsquooption ECN agrave 1 et agrave regarder leurs options agrave leurarriveacutee au point de capture Les reacutesultats obtenus ont montreacute que lrsquooption eacutetait inchan-geacuteeLa derniegravere possibiliteacute est que le systegraveme drsquoexploitation ne marque pas lrsquoensemble despaquets avec le drapeau de neacutegociation Certains routeurs ou pare-feux incompatiblespeuvent bloquer le trafic entre deux hocirctes impleacutementant ECN [Bauer2011] Crsquoest pourcette raison qursquoelle est deacutesactiveacutee implicitement sur la plupart des systegravemes drsquoexploita-tion contemporains Nous avons confirmeacute cette hypothegravese agrave travers une demande drsquouti-lisation de la commande sysctl et des options de TCP des systegravemes drsquoexploitation DebianUbuntu et Mac OS X Les reacutesultats ont ainsi montreacute que les systegravemes drsquoexploitation eacutetu-dieacutes nrsquoactivaient pas cette option de TCP

Dans tous les cas lrsquoabsence des options ECE ECNNS et CWR est neacutefaste pour lesperformances de TCP Les travaux reacutealiseacutes par [Mellia2003-2] ont montreacute que les per-formances de TCP sont accrues lorsque les paquets sont marqueacutes avec ces options Sanselles les eacuteveacutenements de congestion sont plus difficiles agrave identifier

La seconde faccedilon drsquoidentifier les eacuteveacutenements de congestion est plus compliqueacutee agravemettre en place Il srsquoagit drsquoidentifier les reacuteductions de fenecirctre et drsquoeacutetudier des pertes etoudes retransmissions de paquets Elle provoque des incertitudes Sur un total de 42 386 540paquets nous avons identifieacute 21 022 400 paquets indiquant une diminution de fenecirctreSoit pregraves drsquoun paquet sur deux

Le tableau 39 indique les pourcentages des paquets retransmis etou perdus

TABLE 39 ndash Reacutepartition des paquets

fast retrans-mit

spurious retrans-mit

Paquetsperdus

Non retransmiset non perdus

Pourcentage 5 2times 10minus3 7 8times 10minus3 14times10minus3 99 97

On constate que le pourcentage des paquets retransmis ou perdus sont ridicules avecmoins de 1 des paquets eacutechangeacutes Ces pourcentages sont en deccedilagrave des valeurs que TCPpeut produire dans certaines zones Aux Eacutetat-Unis [Gettys2011] a eacutetudieacute le taux de pertesur un lien montant agrave 2 Mbits lors drsquoun transfert de fichiers drsquoun poids de 20 Go Letaux de perte est tregraves eacuteleveacute avec 33 de moyenne En comparaison avec ces eacutetudes reacuteali-seacutees lrsquoicircle de La Reacuteunion possegravede des performances de TCP que lrsquoon pourrait qualifier denormales

343 Synthegravese des reacutesultats

Lrsquoanalyse mise en place a pour objectif de tester en conditions reacuteelles notre plate-forme de mesure et la chaicircne drsquoanalyse

Lrsquoeacutetude du trafic du LIM a eacuteteacute deacutecoupeacutee en deux parties La premiegravere concerne lasupervision du trafic et traite de la composition La seconde partie se concentre sur les

91

performances du protocole de transport TCP sur le trafic agrave destination de lrsquoexteacuterieur delrsquoicircle de La ReacuteunionLrsquoeacutetude des donneacutees collecteacutees a mis en avant la preacutedominance drsquoun trafic empruntantles cacircbles sous-marins agrave destination de lrsquoEurope et de lrsquoAmeacuterique du Nord Ces deuxdestinations heacutebergent de nombreux serveurs de donneacutees scientifiquesLrsquointerrogation de ces serveurs se fait agrave partir du protocole TCP en utilisant les servicesHTTP ou HTTPS Le protocole TCP est majoritaire dans les protocoles rencontreacutes toutcomme les services preacutesenteacutes

Sur lrsquoeacutetude des performance du protocole TCP nous avons effectueacute une caracteacuteri-sation des flots en terme de longueur (paquets eacutechangeacutes) de dureacutee et de vitesse Lamajoriteacute de nos flots sont des flots courts contenant peu de donneacutees

35 Conclusion

Dans ce chapitre nous avons preacutesenteacute la meacutethode mise en place pour la reacutealisationdrsquoune eacutetude de meacutetrologie passive sur lrsquoicircle de La Reacuteunion

La Reacuteunion est une icircle dont la connectiviteacute en terme de deacutelais et de routes est par-ticuliegravere telle que le chapitre 2 preacutesente Lrsquoaugmentation progressive des deacutebits drsquoaccegravesa pour conseacutequence lrsquoaugmentation de la capaciteacute de stockage des liens On considegravereqursquoun lien possegravede une forte capaciteacute de stockage quand le produit deacutelai bande passante(BDP) associeacute agrave ce lien deacutepasse la limite de 12 5 Ko Pour La Reacuteunion la capaciteacute destockage minimale calculeacutee est de 22 5 ko Cette capaciteacute de stockage entraicircne des deacutegra-dations sur les performances du protocole TCP Nous avons souhaiteacute eacutetudier lrsquoimpact dela capaciteacute de stockage des liens sur les performances du protocole TCP agrave La ReacuteunionLrsquoaugmentation de la capaciteacute des liens entraicircne eacutegalement un changement des usagesNous souhaitons eacutegalement eacutetudier les diffeacuterents services utiliseacutes dans lrsquoInternet agrave LaReacuteunion

Le cahier des charges fut preacutesenteacute dans la section 31 Le cahier mis en place preacutesenteles meacutetriques de lrsquoeacutetude Ces meacutetriques ont eacuteteacute seacutelectionneacutees afin de reacutepondre aux objec-tifs preacutesenteacutes ci-dessus Elles couvriront un aspect supervision du trafic pour lrsquoeacutetude desservices et la reacutepartition geacuteographique Lrsquoaspect des performances du protocole TCP seraanalyseacute agrave travers les deacutebits les deacutelais les pertes les retransmissions et la preacutesence deseacuteveacutenements de congestion

Pour obtenir ces meacutetriques il est neacutecessaire de mettre en place une infrastructure demesure et une chaicircne drsquoanalyse La section 32 preacutesente lrsquoinfrastructure mise en place Lavariabiliteacute du trafic dans le temps nous a encourageacutes agrave mettre en place une plate-formede capture de trafic Le choix de lrsquooutil de capture nrsquoest pas deacutefinitif Il est deacutependant dudeacutebit associeacute au lien de capture Diffeacuterents outils drsquoanalyses de donneacutees passives existentDans le paragraphe 322 nous avons reacutealiseacute une comparaison des diffeacuterents outils selondes critegraveres de seacutelection Ces critegraveres sont au nombre de 3 protection de la vie priveacutee trai-tement drsquoune volumeacutetrie de donneacutees importante et le calcul des meacutetriques seacutelectionneacuteesAucun des outils preacutesenteacutes ne reacutepondait agrave la totaliteacute des critegraveres A la suite de ce constatnous avons fait le choix de deacutevelopper un outil reacutepondant agrave ces 3 critegraveres Lrsquoavantage decet outil est qursquoil pourra eacutevoluer en parallegravele agrave lrsquoeacutevolution de lrsquoeacutetude

Ces outils furent mis en place au sein du Laboratoire drsquoInformatique et de Matheacutematiquesdans le cadre drsquoune phase de test Les reacutesultats obtenus ont eacuteteacute compareacutes avec les reacutesultatsobtenus par TCPTrace afin de nous assurer de lrsquoexactitude de nos reacutesultats Le protocolede mesure mis en place pour cette eacutetude est deacutecrit dans la section 33 Dans ce protocolenous avons preacutesenteacute les contraintes reacuteglementaires imposeacutees par lrsquoUniversiteacute Nous nous

92

sommes ensuite assureacutes que le systegraveme mis en place pour la capture du trafic nrsquoeacutetaitsoumis agrave aucune perturbation Le systegraveme choisi pour eacutecouter le lien fut celui de port-mirroring Cette fonction des routeurs permet de copier lrsquoensemble des paquets entrantsur un lien vers un second lien Cette recopie est soumise agrave la limitation de la capaciteacutede meacutemoire des eacutequipements Elle peut entraicircner des erreurs au niveau de la datationdes paquets et dans lrsquoordre de reacute-eacutemission des paquets vers le lien miroir Dans cetteeacutetude la capture du trafic srsquoest faite agrave lrsquoaide du logiciel TCPDump Reacuteguliegraverement unephase de deacutelestage de la meacutemoire de la sonde de capture vers un serveur de stockage dulaboratoire a eacuteteacute mise en place

Les reacutesultats preacutesenteacutes dans la section 34 nous donnent une vision biaiseacutee du com-portement de lrsquoInternet reacuteunionnais Ces reacutesultats ne peuvent correspondre au compor-tement de TCP pour lrsquoensemble de lrsquoInternet de La Reacuteunion Ces reacutesultats nous donnentdes indications sur le comportement de TCP dans le cadre drsquoune connexion agrave forte capa-citeacute de meacutemorisation

Dans la partie supervision on a vu la preacutedominance du protocole TCP des servicesHTTP et HTTPS Ces usages srsquoaccompagnent drsquoune reacutepartition geacuteographique tregraves in-eacutegale LrsquoEurope et lrsquoAmeacuterique du Nord sont les deux continents avec lesquels les interac-tions sont les plus nombreuses (plus de 48 du trafic pour chaque continent)

Au niveau des performances de TCP nous avons pu voir que la majoriteacute des flotseacutetudieacutes sont des flots courts que ccedila soit en longueurs en dureacutees et en deacutebits Aucun eacuteveacute-nement de congestion ne fut releveacute Cela indique que la capaciteacute drsquoenvoi des eacutemetteursnrsquoa pas couvert le BDP du lien Cela srsquoest ressenti au niveau de la reacutepartition des paquetsRetransmissions et pertes nrsquoont repreacutesenteacute pregraves de 0 03 des paquets eacutechangeacutes

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors de laconfeacuterence Next Generation Computing Applications (NextComp) en 2017 [Noordally2017]

93

94

Conclusion amp Perspectives

1 Synthegravese des travaux

Les travaux de cette thegravese sont placeacutes dans le cadre reacutegional de lrsquoaccegraves de lrsquoicircle de LaReacuteunion agrave lrsquoInternet Ils visent agrave identifier les caracteacuteristiques qui ont une influence sur lesperformances de lrsquoInternet agrave La Reacuteunion La Reacuteunion est un deacutepartement drsquooutre-mer si-tueacute dans lrsquoOceacutean Indien Lrsquoicircle est connecteacutee agrave Internet agrave travers deux cacircbles sous-marins le SAFE et le LION Le SAFE relie lrsquoAfrique agrave lrsquoAsie Le LION interconnecte Madagascarlrsquoicircle Maurice et La Reacuteunion Lrsquoarriveacutee de ces cacircbles sur lrsquoicircle a permis le deacuteveloppement duhaut deacutebit et du tregraves haut deacutebit sur lrsquoicircle avec lrsquoarriveacutee des technologies ADSL VDSL etFTTH Des extensions agrave ces cacircbles permettent de remonter jusqursquoen Europe La Reacuteunionpossegravede REUNIX un point drsquointer-connexion (IXP) pour les opeacuterateurs locaux Ce typedrsquoaccegraves agrave Internet est speacutecifique aux icircles de la zone oceacutean indien Dans un premier tempsnous avons eacutetudieacute la connectiviteacute de lrsquoicircle sous lrsquoangle des deacutelais et des routes Dans unsecond temps lrsquoeacutetude a porteacute sur les flots TCP

TCP est le protocole de transport majoritaire dans lrsquoInternet qui rend un service detransport fiable et efficace de donneacutees Lrsquoefficaciteacute srsquoappreacutecie en terme de deacutebit eacutecouleacutepour le service rendu et drsquoutilisation des capaciteacutes de transmission du reacuteseau Lrsquoobjectifdrsquoefficaciteacute est du ressort du controcircle de flux et du controcircle de congestion Ces fonctionsagissent selon une peacuteriode correspondant au RTT de la connexion On voit alors que laperformance de TCP est deacutependante du deacutelai que va expeacuterimenter la connexion TCP

Nous avons dans un premier temps eacutetudieacute lrsquoeacutevolution du deacutelai et de la longueur desroutes entre 2012 et 2016 Cette eacutetude a mis en eacutevidence une stabiliteacute des deacutelais malgreacuteune reacuteduction de la longueur des routes Cette eacutetude a eacuteteacute reacutealiseacutee depuis un seul pointde mesure Afin drsquoeacutetudier en deacutetail la connectiviteacute de La Reacuteunion nous avons deacuteployeacuteune plate-forme de meacutetrologie active speacutecifique agrave lrsquoeacutetude Durant plusieurs mois nousavons mesureacute les deacutelais et les routes depuis et vers La Reacuteunion agrave lrsquoaide de lrsquooutil Paris-traceroute Lrsquoanalyse des reacutesultats a eacuteteacute reacutealiseacutee agrave partir de deux outils deacuteveloppeacutes pourle besoin de lrsquoeacutetude rgeoloc et rtraceroute rgeoloc sert agrave la geacuteolocalisation des adressesIP et agrave lrsquoextraction des deacutelais et de la longueur des routes depuis un fichier de sortiede traceroute rtraceroute est un outil drsquoanalyse graphique des routes Il va utiliser lesdonneacutees obtenues depuis rgeoloc pour placer sur une carte les diffeacuterents pays traverseacutespar les donneacutees collecteacutees

Les reacutesultats ont eacuteteacute eacutetudieacutes selon quatre critegraveres les deacutelais la longueur des routesla distance geacuteographique entre la source et la destination et lrsquoidentification des portesde lrsquoInternet reacuteunionnais Nous avons ainsi pu mettre en eacutevidence lrsquoindeacutependance de lalongueur de la route en fonction de la distance geacuteographique Nous avons calculeacute le deacutelaineacutecessaire agrave chaque noeud traverseacute Cette valeur est fortement deacutependante du sens decirculation de lrsquoinformation La relation entre le deacutelai et la distance geacuteographique a misen eacutevidence une incoheacuterence Le deacutelai neacutecessaire pour joindre une destination ou ecirctrejoint depuis lrsquoexteacuterieur de lrsquoicircle est inversement proportionnel agrave la distance geacuteographiqueCela signifie donc que plus la distance est importante moins le deacutelai est eacuteleveacute Nous

95

avons eacutetudieacute ce comportement vis agrave vis des portes de lrsquoInternet reacuteunionnais et mis enavant le fait que plus de 97 du trafic reacuteunionnais passe par la France hexagonale sanstenir compte si crsquoest du trafic montant ou descendant Ce comportement a eacutegalement eacuteteacuteeacutetudieacute pour les icircles de la ZOI dans le sens montant Le deacutelai minimal mesureacute accompagneacutedu routage analyseacute peut avoir des conseacutequences sur les performances drsquoun protocole detransport deacutependant au deacutelai comme lrsquoest TCP

Lrsquoaugmentation de la bande passante sur le reacuteseau de distribution de lrsquoicircle et sur lesliens reliant lrsquoIle agrave lrsquoInternet nrsquoont pas permis la reacuteduction des deacutelais Cela a pour conseacute-quence lrsquoaugmentation de la capaciteacute de stockage des canaux de communication La ca-paciteacute de stockage est calculeacutee agrave partir de la bande passante et du RTT On parle de Pro-duit Deacutelai-Bande passante (BDP) Si le BDP deacutepasse la valeur seuil de 12 5 Ko alors lecanal est consideacutereacute comme un reacuteseau agrave forte capaciteacute de stockage (LFN) Si on considegravereque le deacutebit drsquoaccegraves theacuteorique fourni par les FAI est le goulot drsquoeacutetranglement alors uncanal de communication sur lrsquoInternet depuis La Reacuteunion possegravede un BDP minimal eacutegalagrave 22 5 Ko Lorsque le transport des donneacutees srsquoeffectue avec TCP en passant par un LFNceci agrave des implications sur les performances du service rendu par TCP Lrsquoobjectif a eacuteteacute deconcevoir un systegraveme meacutetrologique pour pouvoir eacutetudier le service et analyser le fonc-tionnement du protocole Nous avons mis en place et expeacuterimenteacute une infrastructure demeacutetrologie passive interne au laboratoire En parallegravele nous avons conccedilu un outil drsquoana-lyse de traces drsquoeacutecoute speacutecifiques agrave notre eacutetude Lrsquoensemble de la chaicircne de mesure etdrsquoanalyse a eacuteteacute testeacute durant un mois au sein du LIM Les reacutesultats obtenus ont eacuteteacute valideacutespar comparaison agrave ceux fournis par drsquoautres outils

2 Perspectives

icircle de La Reacuteunion

La mise en place drsquoune eacutetude de meacutetrologie passive en collaboration avec les diffeacute-rents FAI permettrait drsquoeacutetudier le reacuteel impact de lrsquoeacuteloignement de La Reacuteunion sur lesperformances du protocole de transport TCP De plus lrsquoanalyse de supervision permet-trait drsquoidentifier des leviers pour limiter le rapatriement de trafic commun par les cacircblessous-marins

Zone Oceacutean Indien

Cette thegravese a mis en eacutevidence une connectiviteacute particuliegravere en terme de deacutelais et deroutes depuis lrsquoicircle de La Reacuteunion et les icircles de la Zone Oceacutean Indien dans le sens De-puis Lrsquoasymeacutetrie des routes est freacutequente dans lrsquoInternet Crsquoest pourquoi une eacutetude desdeacutelais et des routes depuis le monde agrave destination des sondes de la plate-forme RunPLbaseacutees sur les icircles de la ZOI peut ecirctre pertinente

Par la suite une eacutetude de meacutetrologie passive similaire agrave celle que lrsquoon veut mettreen place sur le territoire reacuteunionnais pourrait ecirctre reacutealiseacutee Lrsquoobjectif est de mettre eneacutevidence un comportement speacutecifique en terme drsquousage et de performance protocolairepour lrsquoensemble des usagers de la zone Cette eacutetude aura eacutegalement comme but le calculde la volumeacutetrie eacutechangeacutee et des services utiliseacutes entre les diffeacuterents territoires Si lesreacutesultats montrent une preacutedominance des trafics de consultation (accegraves agrave un serveur)la technique drsquooffloading pourrait ecirctre envisageacutee Cette meacutethode inspireacutee des travaux de[Baron2016] impliquerait lrsquousage des transports aeacuteriens pour charger des caches locauxDrsquoautres solutions seront eacutegalement eacutetudieacutees comme lrsquoimpleacutementation de serveurs departage de contenus localiseacutes sur lrsquoicircle

96

Territoires ultra-marins franccedilais

La Reacuteunion et Mayotte sont deux territoires franccedilais localiseacutes dans la ZOI Mais drsquoautresreacutegions ultra-marines peuvent ecirctre soumises agrave des comportements similaires Pour veacuteri-fier cette hypothegravese des eacutetudes de meacutetrologie active et passive pourraient venir validerou non cette hypothegravese Pour reacutepondre agrave cela nous privileacutegierons lrsquoenvoi de sondes dela plate-forme RunPL

Zone Isoleacutee

La derniegravere perspective que lrsquoon souhaite mettre en avant est le concept de ZoneIsoleacutee Si plusieurs reacutesultats des perspectives preacuteceacutedentes sont en adeacutequation avec lesreacutesultats obtenus et preacutesenteacutes dans cette thegravese nous aimerions deacutefinir ce concept Unepremiegravere deacutefinition serait axeacutee sur les trois points suivants

mdash Un routage limiteacute Un maillage important est un standard dans les zones bienconnecteacutees Les routes et les possibiliteacutes de trouver le plus court chemin sont nom-breuses Une faible valeur signifie de faibles alternatives ce qui sous-entend que laroute prise nrsquoest pas forceacutement la plus courte mais celle par deacutefaut

mdash Peering reacutegional et trafic interne Lrsquoensemble du trafic drsquoune zone va vers un GIXdrsquoautres pays pour des raisons de coucirct Lrsquoabsence drsquoaccords de peering entre lesFAI drsquoun mecircme pays ou ceux drsquoune mecircme zone geacuteographique ne permet pas ladiversiteacute des routes et augmente ainsi le deacutelai [Obar2012]

mdash Forts deacutelais Le deacutelai est un paramegravetre important de lrsquoaccegraves Internet Les forteslatences peuvent impacter les autres paramegravetres des connexions TCP [RITE2014-1]

97

98

Table des figures

1 Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000]) 2

2 Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000]) 33 Carte des deacutebits agrave La Reacuteunion 44 Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion 55 Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source

[Cablesmap]) 76 Carte des points drsquoeacutechange preacutesents actuellement et dans un futur proche

dans la ZOI 7

11 Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989]) 11

12 Boucle fermeacutee du CC de TCP 1213 Etats du controcircle de congestion de TCP 1414 Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP 1515 Principe de Quick-Start (Source [Scharf2008-1]) 1816 Simulation de MulTCP avec N=5 (Source [Huston2006]) 1917 Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source

[Afanasyev2010]) 2018 Comportement de la fenecirctre de congestion de Compound-TCP (Source

[Afanasyev2010]) 2119 Fonctionnement de BIC TCP 22110 Fonctionnement de CUBIC 22111 Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

24112 Principe de la meacutetrologie active 27113 Illustration du pheacutenomegravene drsquoeacutequilibrage des charges 28114 Taxonomie des configurations de tunnels MPLS et des comportements de

traceroute correspondants (Source [Donnet2012] ) 29115 Principe de la meacutetrologie passive 33

21 Scheacutema drsquointerconnexion de la plate-forme 4222 Distribution geacuteographique des adresses IPv4 publiques 4823 Fonctionnement de la sonde 5124 Comparaison des deacutelais entre Paris et La Reacuteunion 5425 Eacutevolution de la longueur des routes entre 2012 et 2016 5526 Distribution de la distance geacuteographique par continent 5627 Distribution du RTT par continent 5728 Distribution de la longueur des routes par continent 5729 Relation entre la longueur de la route et la distance geacuteographique 59210 Relation entre la longueur de la route et les deacutelais 60211 Relation entre les deacutelais et la distance geacuteographique 62

99

212 Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais 64213 Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dans

un pays tiers 65214 FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien 65215 Distribution des deacutelais des icircles de la ZOI 66216 Longueur des routes emprunteacutees 67217 Relation entre la longueur de la route et la distance geacuteographique 68218 Relation entre la longueur de la route et la distance geacuteographique pour

Madagascar 69219 Relation entre la longueur de la route et les deacutelais 69220 Relation entre les deacutelais et la distance geacuteographique 70221 Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI 71222 Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion 72

31 Scheacutema de distribution de la plate-forme de mesure 8432 Scheacutema de fonctionnement de la plateforme de mesure 8533 Longueur des flux 8934 Flux TCP - Densiteacute de la dureacutee de communication 9035 Deacutebits des flux 90

100

Liste des tableaux

11 Tableau de synthegravese des propositions 1712 Approximation du produit deacutelai bande passante de la connectiviteacute de La

Reacuteunion agrave lrsquoInternet 2513 Comparatif entre les approches de meacutetrologie 2614 Classement des outils 2715 Tableau des plates-formes de mesures de meacutetrologie active 3216 Comparatif entre mesures actives et mesures passives 35

21 Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet 4122 Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

4323 Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur Raspberry

Pi 4424 Fonctions disponibles dans les outils graphiques drsquoanalyse des routes 4525 Reacutesumeacute des caracteacuteristiques du jeu de donneacutees 5326 Correspondance entre acronymes et noms des continents 5327 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 5828 Formule de correacutelation du deacutelai en fonction de la longueur du chemin 6029 Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique 61210 Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunion-

nais 63211 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 67212 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 68213 Formule de correacutelation de la distance geacuteographique et du RTT 70

31 Les meacutetriques de meacutetrologie passive 7732 Comparaison de performances 8233 Distribution des protocoles encapsuleacutes dans IP 8634 Reacutepartition des services utiliseacutes par TCP 8635 Distribution du trafic 8736 Correspondance entre acronymes et nom des continents 8737 Distribution geacuteographique des destinations WAN 8738 Tableau de deacutenomination des flux selon [Lan2006] 8839 Reacutepartition des paquets 91

101

102

Bibliographie

[ANRTIC2016] ANRTIC Autoriteacute Nationale de Reacutegulation des TIC 2016

[ARCEP2004] Autoriteacute de Reacutegulation des Teacuteleacutecommunications Deacutecision n04-375 delrsquoautoriteacute de reacutegulations des teacuteleacutecommunications en date du 4 mai 2004 seprononccedilant sur un diffeacuterent opposant mobius agrave france teacuteleacutecom 2004

[ARTEC2016] Autoriteacute de Reacutegulation des TEchnologies de Communication Artec 2016

[AXIS] African internet exchange system project 2016

[Aben2015] Emile Aben Infrastructure geolocation - plan of action 2015

[Afanasyev2010] A Afanasyev N Tilley P Reiher and L Kleinrock Host-to-hostcongestion control for tcp IEEE Communications Surveys amp Tutorials 12(3)Third quarter 2010

[Africa1] Telegeography Submarine Cable Submarine cable map 2018

[AfterFibre] Steve Song African undersea and terrestrial fibre optic cables Last visit 09262017

[Akamai2015] Akamai Akamairsquos [state of the internet] 2015

[Akamai2017] Akamai Akamairsquos [state of the internet] 2017

[Allman2007] Mark Alllman and Vern Paxson Issues and etiquette concerning use ofshared measurement data In Proceedings of the 7th ACM SIGCOMM confe-rence on Internet measurement pages 135ndash140 ACM 2007

[Anelli2012] Pascal Anelli Des aleacuteas de la communication de la transmission au trans-port Habilitation agrave diriger des recherches en informatique Universiteacute deLa Reacuteunion 2012

[Archipelago] Kimberly Claffy Young Hyun Ken Keys Marina Fomenkov and DmitriKrioukov Internet mapping from art to science In Conference For Home-land Security 2009 CATCHrsquo09 Cybersecurity Applications amp Technology pages205ndash211 IEEE 2009

[Arduino] Arduino AG Arduino home

[Arnal2014] F Arnal E Dubois E Chaput and A Beylot Internet-draft r sallantin in-tended status Proposed standard e bouttier expires April 30 2015 cnes-tastesa c baudoin 2014

[Augustin2006] Brice Augustin Xavier Cuvellier Benjamin Orgogozo Fabien Viger Ti-mur Friedman Matthieu Latapy Cleacutemence Magnien and Renata TeixeiraAvoiding traceroute anomalies with paris traceroute In Proceedings of the 6thACM SIGCOMM conference on Internet measurement pages 153ndash158 ACM2006

[Augustin2007] Brice Augustin Timur Friedman and Renata Teixeira Multipath tracingwith paris traceroute In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

103

[Bajpai2015-1] Vaibhav Bajpai and Juumlrgen Schoumlnwaumllder A survey on internet perfor-mance measurement platforms and related standardization efforts IEEECommunications Surveys amp Tutorials 17(3) 1313ndash1341 2015

[Baron2016] Benjamin Baron Transport intermodal de donneacutees massives pour le deacutelestage desreacuteseaux drsquoinfrastructure PhD thesis Paris 6 2016

[Bauer2011] Steven Bauer Robert Beverly and Arthur Berger Measuring the state of ecnreadiness in servers clients and routers In Proceedings of the 2011 ACM SIG-COMM conference on Internet measurement conference pages 171ndash180 ACM2011

[Beaglebone] BeagleBoardorg Foundation Beagleboardorg - community supportedopen hardware computers for making

[Bischof2015] Zachary S Bischof John P Rula and Fabiaacuten E Bustamante In and out ofCuba Characterizing Cubarsquos connectivity In Proceedings of the 2015 ACMConference on Internet Measurement Conference pages 487ndash493 ACM 2015

[Brakmo1994] Lawrence S Brakmo Sean W OrsquoMalley and Larry L Peterson TCP Vegas New techniques for congestion detection and avoidance volume 24 ACM 1994

[Brownlee2002] Nevil Brownlee and KC Claffy Understanding internet traffic streams dragonflies and tortoises Communications Magazine IEEE 40(10) 110ndash1172002

[CAIDA-Tools] Center for Applied Internet Data Analysis Caida tools - overview

[Cablesmap] Telegeography Submarine cable map

[Carlucci2015] Gaetano Carlucci Luca De Cicco and Saverio Mascolo Http over udp An experimental investigation of quic In Proceedings of the 30th Annual ACMSymposium on Applied Computing SAC rsquo15 pages 609ndash614 New York NYUSA 2015 ACM

[Chappell2010] Laura Chappell and G Combs Wireshark network analysis the officialWireshark certified network analyst study guide Protocol Analysis InstituteChappell University 2010

[Chavula2017] Josiah Chavula Amreesh Phokeer Agustin Formoso and Nick FeamsterInsight into africarsquos country-level latencies In AFRICON 2017 IEEE pages938ndash944 IEEE 2017

[Chiu1989] Dah-Ming Chiu and Raj Jain Analysis of the increase and decrease algo-rithms for congestion avoidance in computer networks Computer Networksand ISDN systems 17(1) 1ndash14 1989

[Chun2003] Brent Chun David Culler Timothy Roscoe Andy Bavier Larry PetersonMike Wawrzoniak and Mic Bowman PlanetLab An overlay testbed forbroad-coverage services SIGCOMM Comput Commun Rev 33(3) 3ndash12July 2003

[Ciullo2009] D Ciullo M Mellia and M Meo Two schemes to reduce latency in shortlived TCP flows IEEE Communications Letters 13(10) October 2009

[Claise2004] Benoit Claise Cisco systems netflow services export 2004

[Comores2002] Mwezinet Lrsquoarriveacutee drsquointernet aux comores Last Seen 09062017

[Coonjah2015] Irfaan Coonjah Pierre Clarel Catherine and KMS Soyjaudah Perfor-mance evaluation and analysis of layer 3 tunneling between openssh andopenvpn in a wide area network environment In Computing Communica-tion and Security (ICCCS) 2015 International Conference on pages 1ndash4 IEEE2015

104

[Crovella2006] Mark Crovella and Balachander Krishnamurthy Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc New YorkNY USA 2006

[Crowcroft1998] Jon Crowcroft and Philippe Oechslin Differentiated end-to-end in-ternet services using a weighted proportional fair sharing tcp ACM SIG-COMM Computer Communication Review 28(3) 53ndash69 1998

[DICT2017] Government of Seychelles Office of the president Department of informa-tion communication technology 2016

[Donnet2012] Benoit Donnet Matthew Luckie Pascal Meacuterindol and Jean-Jacques Pan-siot Revealing mpls tunnels obscured from traceroute ACM SIGCOMMComputer Communication Review 42(2) 87ndash93 2012

[Downey1999] Allen B Downey Using pathchar to estimate internet link characteristicsIn ACM SIGCOMM Computer Communication Review volume 29 pages 241ndash250 ACM 1999

[EQUINIX] CAIDA Chicago passive network monitor Last visit 12012018

[Estan2001] Cristian Estan and George Varghese New directions in traffic measurementand accounting volume 32 ACM 2002

[Fanou2015] Rodeacuterick Fanou Pierre Francois and Emile Aben On the diversity of in-terdomain routing in africa In Passive and Active Measurement pages 41ndash54Springer 2015

[Fanou2016] Rodeacuterick Fanou Gareth Tyson Pierre Francois and Arjuna SathiaseelanPushing the frontier Exploring the african web ecosystem In Proceedingsof the 25th International Conference on World Wide Web pages 435ndash445 Inter-national World Wide Web Conferences Steering Committee 2016

[Feige1992] Uriel Feige and Prabhakar Raghavan Exact analysis of hot-potato routingIn Foundations of Computer Science 1992 Proceedings 33rd Annual Symposiumon pages 553ndash562 IEEE 1992

[Fraleigh2001] Chuck Fraleigh Christophe Diot Bryan Lyles Sue Moon Philippe Owe-zarski Dina Papagiannaki and Fouad Tobagi Design and deployment ofa passive monitoring infrastructure In Thyrrhenian Internatinal Workshop onDigital Communications pages 556ndash575 Springer 2001

[Fraleigh2003] Chuck Fraleigh Sue Moon Bryan Lyles Chase Cotton Mujahid KhanDeb Moll Rob Rockell Ted Seely and SC Diot Packet-level traffic measu-rements from the sprint IP backbone Network IEEE 17(6) 6ndash16 2003

[France2017] Mission Tregraves Haut Deacutebit Plan france tregraves haut deacutebit Last seen 09062017

[GOTICOM2011] Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de laCommunication Goticom Last Seen 09062017

[GSCounter] StatCounter Statcounter global stats - browser os search engine includingmobile usage share Last visit 13102017

[Gettys2011] Jim Gettys and Kathleen Nichols Bufferbloat Dark buffers in the InternetQueue 9(11) 40 2011

[Gevros2001] Panos Gevros Jon Crowcroft Peter Kirstein and Saleem Bhatti Conges-tion control mechanisms and the best effort service model IEEE network15(3) 16ndash26 2001

[Graham1997] Ian Graham Murray Pearson Jed Martens and Stephen Donnelly DAG- a cell capture board for ATMmeasurement systems 1997

105

[Gupta2014] Arpit Gupta Matt Calder Nick Feamster Marshini Chetty Enrico Calan-dro and Ethan Katz-Bassett Peering at the internetrsquos frontier A first lookat isp interconnectivity in africa In Passive and Active Measurement pages204ndash213 Springer 2014

[Ha2008] Sangtae Ha Injong Rhee and Lisong Xu Cubic A new tcp-friendly high-speed tcp variant SIGOPS Oper Syst Rev 42(5) 64ndash74 July 2008

[Herman2001] Paul Herman The tcpstat tool Publicly available at http wwwfrenchfriesnetpaultcpstat 2001

[Huston2000] Geoff Hutson Tcp performance The Internet Protocol Journal 3 2000

[Huston2006] Geoff Huston Gigabit tcp Internet Protocol Journal 9 2006

[IANA-port] IANA Service Name and Transport Protocol Port Number Registry Lastvisit 06202018

[ICTA2017] Information and Communication Technologies Authority of Mauritius IctaLast Seen 09062017

[IOX] Government Information Service Iox submarine cable to drive the newdigital economy of mauritius 2018

[IPMon] ATL Sprint Ipmon project

[Jacobson1988-1] V Jacobson Congestion avoidance and control ACM Computer Com-munications Review 18(4) 314ndash329 August 1988

[Jacobson1989-1] Van Jacobson Craig Leres and S McCanne The tcpdump manualpage Lawrence Berkeley Laboratory Berkeley CA 1989

[Jacobson1989-2] Van Jacobson Craig Leres and Steven McCanne pcap-packet capturelibrary UNIX man page 2001

[Jacobson1997] Van Jacobson Pathchar A tool to infer characteristics of internet paths1997

[Jain1990] Raj Jain Congestion Control in Computer Networks Issues and TrendsIEEE Network Magazine May 1990

[John2010] Wolfgang John Sven Tafvelin and Tomas Olovsson Passive internet mea-surement Overview and guidelines based on experiences Computer Com-munications 33(5) 533ndash550 2010

[Johnson2011] David L Johnson Veljko Pejovic Elizabeth M Belding and Gertjan vanStam Traffic characterization and internet usage in rural Africa In Pro-ceedings of the 20th International Conference Companion on World Wide WebWWW rsquo11 pages 493ndash502 New York NY USA 2011 ACM

[Johnson2016] David L Johnson and Gertjan van Stam The shortcomings of globalisedinternet technology in southern africa 2016

[Katabi2002] Dina Katabi Mark Handley and Charlie Rohrs Congestion control for highbandwidth-delay product networks In Proceedings of the 2002 Conference onApplications Technologies Architectures and Protocols for Computer Communi-cations SIGCOMM rsquo02 pages 89ndash102 New York NY USA 2002 ACM

[Katz2010] Ethan Katz-Bassett Harsha V Madhyastha Vijay Kumar Adhikari ColinScott Justine Sherry Peter Van Wesep Thomas E Anderson and ArvindKrishnamurthy Reverse traceroute In NSDI volume 10 pages 219ndash2342010

[Krajsa2011] Ondrej Krajsa and Lucie Fojtova RTT measurement and its dependence onthe real geographical distance In Telecommunications and Signal Processing(TSP) 2011 34th International Conference on pages 231ndash234 IEEE 2011

106

[LIL1978] Loi numeacutero 78-17 du 6 janvier 1978 relative agrave lrsquoinformatique aux fichiers etaux liberteacutes Last modification on 19 March 2014

[Lan2006] Kun-chan Lan and John Heidemann A measurement study of correlationsof internet flow characteristics Computer Networks 50(1) 46ndash62 2006

[LanYanFock2015] Jean-Christophe Lan-Yan-Fock Geacuteolocalisation drsquoadresses IP 2015

[Larrieu2010] Nicolas Larrieu and Philippe Owezarski Metrology of internet networksDigital Cognitive Technologies Epistemology and the Knowledge Economy pages101ndash117 2010

[Leguay2004] Jeremie Leguay Matthieu Latapy Timur Friedman and Kaveacute SalamatianDescribing and simulating internet routes CoRR csNI0411051 2004

[Leiner1997] Barry M Leiner Vinton G Cerf David D Clark Robert E Kahn LeonardKleinrock Daniel C Lynch Jon Postel Lawrence G Roberts and Stephen SWolff The past and future history of the Internet Communications of theACM 40(2) 102ndash108 1997

[Lemauricien] Le Mauricien Projet cacircble metiss le contrat deacutecrocheacute par alcatel subma-rine networks et electra tlc spa 2018

[Liu2007] Dan Liu Mark Allman Shudong Jin and Limin Wang Congestion controlwithout a startup phase In Workshop on Protocols for Fast Long-Distance Net-works (PFLDnet) 2007

[Lopez2006] Dino Martin Loacutepez-Pacheco Congduc Pham and Laurent Lefevre Nxg03-4 Xcp-i explicit control protocol for heterogeneous inter-networking ofhigh-speed networks In Global Telecommunications Conference 2006 GLO-BECOMrsquo06 IEEE pages 1ndash6 IEEE 2006

[METROPOLIS] Philippe Owezarski Metropolis meacutetrologie pour lrsquointernet et les ser-vices

[MGIX2017] Madagascar Internet Exchange Point Mgix Mauritius internet exchangepoint 2017

[MIXP2017] Mauritius Internet Exchange Point Mixp Mauritius internet exchangepoint 2017

[Maksimovic2014] Mirjana Maksimovic Vladimir Vujovic Nikola Davidovic VladimirMiloševic and Branko Perišic Raspberry pi as internet of things hardware performances and constraints design issues 3 8 2014

[Mediametrie2018-1] Benoit David Lrsquoanneacutee Internet 2017 Internet meacuteta-meacutedia Lastvisit 20042018

[Mediametrie2018-2] Benoit David Lrsquoobservatoire des Usages Digitaux Antilles-Guyane et Reacuteunion - Panorama 2017 Last visit 20042018

[Medina2005] Alberto Medina Mark Allman and Sally Floyd Measuring the evolutionof transport protocols in the internet ACM SIGCOMM Computer Communi-cation Review 35(2) 37ndash52 2005

[Mellia2003-1] Marco Mellia Andrea Carpani and Renato Lo Cigno Tstat Tcp statisticand analysis tool In International Workshop on Quality of Service in Multiser-vice IP Networks pages 145ndash157 Springer 2003

[Mellia2003-2] M Mellia I Stoica and H Zhang TCP-aware packet marking in net-works with diffserv support Elsevier Computer Networks 42(1) 81ndash100 2003

[Mellia2005] Marco Mellia R Lo Cigno and Fabio Neri Measuring ip and tcp behavioron edge nodes with tstat Computer Networks 47(1) 1ndash21 2005

107

[Moore2001] David Moore Ken Keys Ryan Koga Edouard Lagache and K C ClaffyThe coralreef software suite as a tool for system and network administra-tors In Proceedings of the 15th USENIX Conference on System AdministrationLISA rsquo01 pages 133ndash144 Berkeley CA USA 2001 USENIX Association

[NCSUNRL] North Caroline State University - Networking Research Lab Last seen 27022018

[Nagle1984] John Nagle Congestion control in iptcp internetworks 1984

[Nicolay2017-2] Xavier Nicolay Reacutehan Noordally Pascal Anelli Nour Mohammad Mu-rad and Tahiry Razafindralambo Where is my next hop the case of indianocean islands In 2017 Global Information Infrastructure and Networking Sym-posium (GIIS) (GIISrsquo17) St Denis Reunion October 2017

[Nomikos2016] George Nomikos and Xenofontas Dimitropoulos traixroute Detectingixps in traceroute paths In International Conference on Passive and ActiveNetwork Measurement pages 346ndash358 Springer 2016

[Noordally2016] Reacutehan Noordally Xavier Nicolay Pascal Anelli Richard Lorion andPierre Ugo Tournoux Analysis of internet latency The reunion island caseIn Proceedings of the 12th Asian Internet Engineering Conference AINTEC rsquo16pages 49ndash56 New York NY USA 2016 ACM

[Noordally2017] Reacutehan Noordally Yassine Gangat Arnaud Ravoavahy Pascal Anelliand Xavier Nicolay How long delays impact tcp performance for a connec-tivity from reunion island In Next Generation Computing Applications (Next-Comp) 2017 1st International Conference on page 103ndash108 IEEE 07 2017

[ONU2013] ONU The millennium development goals report 2013 Technical reportOrganisation Nations United 2013

[Obar2012] Jonathan A Obar and Andrew Clement Internet surveillance and boome-rang routing A call for Canadian network sovereignty In TEM 2013 Pro-ceedings of the Technology amp Emerging Media Track-Annual Conference of theCanadian Communication Association (Victoria) 2012

[OpenVPN] OpenVPN Openvpn - open source vpn Last visit 09102017

[OpenWrt] OpenWrt Openwrt project Welcome to the openwrt project Last visit 12062018

[Orebaugh2006] Angela Orebaugh Gilbert Ramirez and Jay Beale Wireshark amp Etherealnetwork protocol analyzer toolkit Syngress 2006

[Ostermann2000] Shawn Ostermann Tcptrace A TCP connection analysis tool URL http www tcptrace org 2000

[Owezarski2003-1] Philippe Owezarski Meacutetrologie de la qualiteacute de service Ecole drsquoeacuteteacutetemps reacuteel (ETR2003)-Systemes Reacuteseauxet Applications 2003

[Owezarski2004] Philippe Owezarski and Nicolas Larrieu Internet trafficcharacterizationndashan analysis of traffic oscillations High Speed Networks andMultimedia Communications pages 96ndash107 2004

[PCH] Packet Clearing House Internet exchange directory 2014

[PSAMP] The Internet Engineering Task Force Packet sampling (psamp) 2017

[Paris-traceroute] Paris Traceroute Team Paris traceroute Last visit 09292017

[Paxson1995] Vern Paxson and Sally Floyd Wide area traffic the failure of poissonmodeling IEEEACM Transactions on Networking (ToN) 3(3) 226ndash244 1995

[Paxson1999] Vern Paxson Bro a system for detecting network intruders in real-timeComputer networks 31(23) 2435ndash2463 1999

108

[Paxson2001] Vern Paxson Some not-so-pretty admissions about dealing with internetmeasurements In Workshop on Network-Related Data Management (NRDM2001) 2001

[PeeringDB] Peering DB Peeringdb facilitates the exchange of information related topeering

[Periakaruppan1999] Ram Periakaruppan Evi Nemeth et al GTrace A graphical trace-route tool In LISA volume 99 pages 69ndash78 1999

[Peterson2007] Larry L Peterson and Bruce S Davie Computer networks a systems ap-proach Elsevier 2007

[Phidgets] Phidgets Phidgets products for usb sensing and control

[PlanetLab] PlanetLab an open platform for developing deploying and accessingplanetary-scale services

[PlanetLabEurope] PlanetLab PlanetLab europe an open platform for developing de-ploying and accessing planetary-scale services last visit 09102017

[Pretet2000] Thierry Prete and Olivier Mas Avancement du projet SAFE Technicalreport 16 Janvier 2000

[REUNIX2017] RENATER RENATER Connecteur de savoirs - reunix Last visit 09102017

[RFC1072] V Jacobson and R Braden TCP extensions for long-delay paths RFC 1072October 1988

[RFC1105] K Lougheed and Y Rekhter Border Gateway Protocol (BGP) RFC 1105June 1989

[RFC1700] J Reynolds and J Postel Assigned numbers RFC 1700 October 1994

[RFC1918] Y Rekhter B Moskowitz D Karrenberg G J de Groot and E Lear Ad-dress Allocation for Private Internets RFC 1918 February 1996

[RFC1983] G Malkin (Ed) Internet Usersrsquo Glossary RFC 1983 (Informational) August1996

[RFC2001] W Richard Stevens TCP Slow Start Congestion Avoidance Fast Retrans-mit and Fast Recovery Algorithms RFC 2001 January 1997

[RFC2330] Dr Guy T Almes Jamshid Mahdavi Matt Mathis and Dr Vern PaxsonFramework for IP Performance Metrics RFC 2330 May 1998

[RFC2582] Tom Henderson and Sally Floyd The NewReno Modification to TCPrsquos FastRecovery Algorithm RFC 2582 April 1999

[RFC2678] J Mahdavi and V Paxson IPPM Metrics for Measuring Connectivity RFC2678 (Proposed Standard) September 1999

[RFC2679] G Almes S Kalidindi and M Zekauskas A One-way Delay Metric forIPPM RFC 2679 (Proposed Standard) September 1999 Obsoleted by RFC7679

[RFC2680] G Almes S Kalidindi and M Zekauskas A One-way Packet Loss Metricfor IPPM RFC 2680 (Proposed Standard) September 1999 Obsoleted byRFC 7680

[RFC2681] G Almes S Kalidindi and M Zekauskas A Round-trip Delay Metric forIPPM RFC 2681 (Proposed Standard) September 1999

[RFC2756] P Vixie and D Wessels Hyper Text Caching Protocol (HTCP00) RFC2756 (Experimental) January 2000

109

[RFC2914] Sally Floyd Congestion Control Principles RFC 2914 September 2000

[RFC3031] E Rosen Viswanathan A and R Callon Multiprotocol Label SwitchingArchitecture RFC 3031 January 2001

[RFC3069] D McPherson and B Dykes VLAN Aggregation for Efficient IP AddressAllocation RFC 3069 (Informational) February 2001

[RFC3168] Sally Floyd Dr K K Ramakrishnan and David L Black The Addition ofExplicit Congestion Notification (ECN) to IP RFC 3168 September 2001

[RFC3232] J Reynolds Assigned Numbers RFC 1700 is Replaced by an On-line Da-tabase RFC 3232 January 2002

[RFC3376] B Cain S Deering I Kouvelas B Fenner and A Thyagarajan InternetGroup Management Protocol Version 3 RFC 3376 (Proposed Standard)October 2002 Updated by RFC 4604

[RFC3649] Sally Floyd HighSpeed TCP for Large Congestion Windows RFC 3649December 2003

[RFC3742] S Floyd Limited Slow-Start for TCP with Large Congestion Windows RFC3742 (Experimental) March 2004

[RFC4250] Chris M Lonvick and Sami Lehtinen The Secure Shell (SSH) Protocol As-signed Numbers RFC 4250 January 2006

[RFC4782] Pasi Sarolahti Amit Jain Sally Floyd and Mark Allman Quick-Start forTCP and IP RFC 4782 January 2007

[RFC4950] R Bonica D Gan D Tappan and C Pignataro ICMP extensions for mul-tiprotocol label switching RFC 4950 August 2007

[RFC5166] S Floyd (Ed) Metrics for the Evaluation of Congestion Control Mecha-nisms RFC 5166 (Informational) March 2008

[RFC5475] T Zseby M Molina N Duffield S Niccolini and F Raspall Sampling andFiltering Techniques for IP Packet Selection RFC 5475 (Proposed Standard)March 2009

[RFC5681] Ethan Blanton Dr Vern Paxson and Mark Allman TCP CongestionControl RFC 5681 September 2009

[RFC5735] Michelle S Cotton and Leo Vegoda Special Use IPv4 Addresses RFC 5735January 2010

[RFC5936] E Lewis and A Hoenes (Ed) DNS Zone Transfer Protocol (AXFR) RFC5936 (Proposed Standard) June 2010

[RFC6077] Ed D Papadimitriou M Welzl M Scharf and Bob J Briscoe Open Re-search Issues in Internet Congestion Control RFC 6077 February 2011

[RFC6201] R Asati C Pignataro F Calabria and C Olvera Device Reset Characteri-zation RFC 6201 (Informational) March 2011

[RFC6248] A Morton RFC 4148 and the IP Performance Metrics (IPPM) Registry ofMetrics Are Obsolete RFC 6248 (Informational) April 2011

[RFC6298] Vern Paxson Mark Allman Jerry Chu and Matt Sargent Computing TCPrsquosretransmission timer RFC 6298 June 2011

[RFC6528] F Gont and S Bellovin Defending against Sequence Number Attacks RFC6528 February 2012

[RFC6691] D Borman TCP Options and Maximum Segment Size (MSS) RFC 6691(Informational) July 2012

110

[RFC6761] Marc Krochmal and Stuart Cheshire Special-Use Domain Names RFC6761 February 2013

[RFC6928] J Chu N Dukkipati Y Cheng and M Mathis Increasing TCPrsquos InitialWindow RFC 6928 (Experimental) April 2013

[RFC7414] M Duke R Braden W Eddy and E Blanton and TCP Extensions for HighPerformance RFC 7414 February 2015

[RFC760] DoD standard Internet Protocol RFC 760 January 1980

[RFC776] J Postel Assigned numbers RFC 776 (Historic) January 1981 Obsoletedby RFC 790

[RFC7766] J Dickinson S Dickinson R Bellis A Mankin and D Wessels DNS Trans-port over TCP - Implementation Requirements RFC 7766 (Proposed Stan-dard) March 2016

[RFC793] Information Sciences Institute Transmission Control Protocol RFC 793September 1981

[RFC8311] D Black Relaxing Restrictions on Explicit Congestion Notification (ECN)Experimentation RFC 8311 (Proposed Standard) January 2018

[RFC8312] I Rhee L Xu S Ha A Zimmermann and L Eggert CUBIC for Fast Long-Distance Networks RFC 8312 February 2018

[RITE2014-1] Bob Briscoe Anna Brunstrom Andreas Petlund David Hayes David RosIng-Jyh Tsang Stein Gjessing Gorry Fairhurst Carsten Griwodz and Mi-chael Welz Reducing internet latency A survey of techniques and theirmerits In IEEE Communications Surveys amp Tutorials IEEE 2014 (To appear)

[RITE2014-2] RITE | Reducing Internet Transport Latency Slow internet -more band-with is not the answer 2014

[RaspberryPi] RASPBERRY PI FOUNDATION Raspberry Pi official website Last visit 09102017

[Ravoavahy2017] Arnaud Ravoavahy Meacutetrologie Reacuteseaux 2017

[Ripe2010] RIPE NCC RIPE atlas 2010

[Ros2005] David Ros Protocole de Transport TCP Ed Techniques Ingeacutenieur 2005

[SDTAN2013] Reacutegion Reunion Sphegravere Public and TACTIS Schema directeur drsquoamena-gement numerique du territoire de la reunion Technical report 2013

[Sallantin2014] Renaud Sallantin Optimisation de bout-en-bout du deacutemarrage des connexionsTCP PhD thesis 2014

[SamKnows] SamKnows Ltd Samknowscom 2017

[Sanchez2013] Mario A Saacutenchez John S Otto Zachary S Bischof David R ChoffnesFabiaacuten E Bustamante Balachander Krishnamurthy and Walter WillingerDasu Pushing experiments to the internetrsquos edge In NSDI pages 487ndash4992013

[Scharf2008-1] Michael Scharf Simon Hauger and Jochen Koumlgel Quick-start tcp Fromtheory to practice In Proc 6th Intern Workshop on Protocols for FAST Long-Distance Networks (PFLDnet) Manchester 2008

[Speechecker] Speedchecker Ltd Internet Performance Monitoring | Speedchecker LtdLast visit 29032018

[Steenbergen2009] Richard A Steenbergen A practical guide to (correctly) troubleshoo-ting with traceroute North American Network Operators Group pages 1ndash492009

111

[Sundaresan2011] Srikanth Sundaresan Walter De Donato Nick Feamster RenataTeixeira Sam Crawford and Antonio Pescapegrave Broadband internet perfor-mance a view from the gateway In ACM SIGCOMM computer communica-tion review volume 41 pages 134ndash145 ACM 2011

[Tan2006] Kun Tan Jingmin Song Qian Zhang and Murad Sridharan A compoundtcp approach for high-speed and long distance networks In Proceedings-IEEE INFOCOM 2006

[Tirumala2005] Ajay Tirumala Feng Qin Jon Dugan Jim Ferguson and Kevin GibbsIperf The tcpudp bandwidth measurement tool htt p dast nlanr net-Projects 2005

[Trammell2015] Brian Trammell Mirja Kuumlhlewind Damiano Boppart Iain LearmonthGorry Fairhurst and Richard Scheffenegger Enabling internet-wide de-ployment of explicit congestion notification In International Conference onPassive and Active Network Measurement pages 193ndash205 Springer 2015

[Udoo] UDOO All you need mini pc android + linux + arduino | udoo

[Vergoz2013] Michael Vergoz Classement des opeacuterateurs Internet reacuteunionnais Techni-cal report BinarySec 2013

[WAND] WAND Wand network research group Last visit 09252017

[Wang2004] Ren Wang Giovanni Pau Kenshin Yamada MY Sanadidi and Mario GerlaTcp startup performance in large bandwidth networks In INFOCOM 2004Twenty-third AnnualJoint Conference of the IEEE Computer and CommunicationsSocieties volume 2 pages 796ndash805 IEEE 2004

[Wang2018] Jessie Hui Wang and Changqing An A study on geographic properties ofinternet routing Computer Networks 133 183ndash194 2018

[Wenwei2006] Li Wenwei Zhang Dafang Yang Jinmin and Xie Gaogang On evalua-ting the differences of TCP and ICMP in network measurement ComputerCommunications 30(2) 428ndash439 2007

[WikiPing] Wikipedia ping (logiciel) Last visit 06102017

[Xu2002] Jun Xu Jinliang Fan Mostafa H Ammar and Sue B Moon Prefix-preservingIP address anonymization Measurement-based security evaluation and anew cryptography-based scheme In Network Protocols 2002 Proceedings10th IEEE International Conferenceon pages 280ndash289 IEEE 2002

[Xu2004] Lisong Xu Khaled Harfoush and Injong Rhee Binary increase congestioncontrol (bic) for fast long-distance networks In INFOCOM 2004 Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Socie-ties volume 4 pages 2514ndash2524 IEEE 2004

[Yang2016] Chantal Yang Hussein Suleman and Josiah Chavula A topology visuali-sation tool for national research and education networks in Africa In IST-Africa Week Conference 2016 pages 1ndash11 IIMC 2016

[Zhang2007] Jian Zhang and Andrew Moore Traffic trace artifacts due to monitoringvia port mirroring In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

[Zheleva2015] Mariya Zheleva Paul Schmitt Morgan Vigil and Elizabeth Belding In-ternet bandwidth upgrade implications on performance and usage in ru-ral zambia Information Technologies amp International Development 11(2) ppndash12015

[nPerf2017] nperf awards broadband reunion 2017

112

[rtraceroute] Reacutehan Noordally Arnaud Ravohavay and Xavier Nicolay rtraceroute Lastvisit 18102017

113

Pocircle Recherche Ecoles doctorales

LETTRE DrsquoENGAGEMENT DE NON-PLAGIAT

Je soussigneacute(e) NOORDALLY Reacutehan

en ma qualiteacute de doctorant(e) de

lrsquoUniversiteacute de La Reacuteunion deacuteclare ecirctre conscient(e) que le plagiat est un acte deacutelictueux

passible de sanctions disciplinaires Aussi dans le respect de la proprieacuteteacute intellectuelle et du

droit drsquoauteur je mrsquoengage agrave systeacutematiquement citer mes sources quelle qursquoen soit la forme

(textes images audiovisuel internet) dans le cadre de la reacutedaction de ma thegravese et de toute

autre production scientifique sachant que lrsquoeacutetablissement est susceptible de soumettre le texte

de ma thegravese agrave un logiciel anti-plagiat

Fait agrave Saint-Denis le 06072018

Signature

Extrait du Regraveglement inteacuterieur de lUniversiteacute de La Reacuteunion (valideacute par le Conseil drsquoAdministration en date du 11 deacutecembre 2014)

Article 9 Protection de la proprieacuteteacute intellectuelle ndash Faux et usage de faux contrefaccedilon plagiat

Lrsquoutilisation des ressources informatiques de lrsquoUniversiteacute implique le respect de ses droits de proprieacuteteacute intellectuelle ainsi que ceux de ses partenaires et plus geacuteneacuteralement de tous tiers titulaires de tes droits En conseacutequence chaque utilisateur doit - utiliser les logiciels dans les conditions de licences souscrites - ne pas reproduire copier diffuser modifier ou utiliser des logiciels bases de donneacutees pages Web textes images photographies ou autres creacuteations proteacutegeacutees par le droit drsquoauteur ou un droit privatif sans avoir obtenu preacutealablement lrsquoautorisation des titulaires de ces droits

La contrefaccedilon et le faux Conformeacutement aux dispositions du code de la proprieacuteteacute intellectuelle toute repreacutesentation ou reproduction inteacutegrale ou partielle drsquoune œuvre de lrsquoesprit faite ans le consentement de son auteur est illicite et constitue un deacutelit peacutenal Lrsquoarticle 444-1 du code peacutenal dispose laquo Constitue un faux toute alteacuteration frauduleuse de la veacuteriteacute de nature agrave cause un preacutejudice et accomplie par quelque moyen que ce soit dans un eacutecrit ou tout autre support drsquoexpression de la penseacutee qui a pour objet ou qui peut avoir pour effet drsquoeacutetablir la preuve drsquoun droit ou drsquoun fait ayant des conseacutequences juridiques raquo Lrsquoarticle L335_3 du code de la proprieacuteteacute intellectuelle preacutecise que laquo Est eacutegalement un deacutelit de contrefaccedilon toute reproduction repreacutesentation ou diffusion par quelque moyen que ce soit drsquoune œuvre de lrsquoesprit en violation des droits de lrsquoauteur tels qursquoils sont deacutefinis et reacuteglementeacutes par la loi Est eacutegalement un deacutelit de contrefaccedilon la violation de lrsquoun des droits de lrsquoauteur drsquoun logiciel (hellip) raquo

Le plagiat est constitueacute par la copie totale ou partielle drsquoun travail reacutealiseacute par autrui lorsque la source emprunteacutee nrsquoest pas citeacutee quel que soit le moyen utiliseacute Le plagiat constitue une violation du droit drsquoauteur (au sens des articles L 335-2 et L 335- 3 du code de la proprieacuteteacute intellectuelle) Il peut ecirctre assimileacute agrave un deacutelit de contrefaccedilon Crsquoest aussi une faute disciplinaire susceptible drsquoentraicircner une sanction Les sources et les reacutefeacuterences utiliseacutees dans le cadre des travaux (preacuteparations devoirs meacutemoires thegraveses rapports de stagehellip) doivent ecirctre clairement citeacutees Des citations inteacutegrales peuvent figurer dans les documents rendus si elles sont assorties de leur reacutefeacuterence (nom drsquoauteur publication date eacutediteurhellip) et identifieacutees comme telles par des guillemets ou des italiques

Les deacutelits de contrefaccedilon de plagiat et drsquousage de faux peuvent donner lieu agrave une sanction disciplinaire indeacutependante de la mise en œuvre de poursuites peacutenales

  • Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion
  • Remerciements
  • Reacutesumeacute
  • Abstract
  • Table des matiegraveres
  • Liste des acronymes
  • Introduction
    • Contexte geacuteneacuteral
    • Contexte reacutegional
      • LInternet agrave La Reacuteunion
      • LInternet dans la Zone de lOceacutean Indien
        • Probleacutematique
        • Organisation de la thegravese
          • Eacutetat de lart
            • Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage
              • Controcircle de congestion de TCP
              • La probleacutematique de lutilisation dun reacuteseau agrave grande capaciteacute de stockage
              • Un controcircle de congestion de TCP adapteacute aux LFN
              • Controcircle de congestion avec implication des routeurs
              • Caracteacuterisation de La Reacuteunion
                • Meacutetrologie du trafic Internet
                  • Deacutefinition
                  • Meacutetrologie active
                  • Meacutetrologie passive
                  • Comparatif entre mesures actives et mesures passives
                    • Synthegravese
                      • Caracteacuterisation de la connectiviteacute de La Reacuteunion
                        • Objectifs
                        • Cahier des charges
                          • Evolution
                          • Connectiviteacute
                            • Protocole de mesure
                              • Eacutechantillon de mesure
                              • Eacutevolution
                              • Connectiviteacute
                                • Reacutesultats
                                  • Eacutevolution
                                  • Connectiviteacute de La Reacuteunion
                                  • Connectiviteacute des icircles de la Zone Oceacutean Indien
                                  • Synthegravese des reacutesultats
                                    • Conclusion
                                      • Meacutetrologie sur le service de transport agrave La Reacuteunion
                                        • Objectifs
                                          • Les objectifs de leacutetude
                                          • Les meacutetriques de leacutetude
                                            • Mise en oeuvre dune plate-forme de meacutetrologie
                                              • Pour la capture du trafic
                                              • Pour analyser les traces
                                                • Protocole de mesure
                                                • Reacutesultats
                                                  • Supervision du trafic
                                                  • Performance de TCP
                                                  • Synthegravese des reacutesultats
                                                    • Conclusion
                                                      • Conclusion amp perspectives
                                                        • Synthegravese des travaux
                                                          • Perspectives
                                                            • Table des figures
                                                            • Liste des tableaux
                                                              • Bibliographie
                                                                  • Table des figures
                                                                  • Liste des tableaux
                                                                  • Bibliographie
Page 2: Étude de la connectivité Internet de l'île de la Réunion

Thegravesede lrsquoUniversiteacute de la Reacuteunion

Speacutecialiteacute

RESEAUX INFORMATIQUES

preacutesenteacutee par

M Reacutehan NOORDALLY

Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion

Soutenance le 30 Aoucirct 2018 devant le jury composeacute de

Pr Laure PETRUCCI RapporteurPr Emmanuel LOCHIN RapporteurDr HDR Promeacutetheacutee SPATHIS ExaminateurPr Reacutemy COURDIER ExaminateurDr HDR Pascal ANELLI Directeur de ThegraveseDr Richard LORION Encadrant

CETTE THEgraveSE A RECcedilU LE SOUTIEN FINANCIER DE LA REacuteGION REacuteUNION ET DE LrsquoUNION

EUROPEacuteENNE (FONDS EUROPEacuteEN DE DEacuteVELOPPEMENT REacuteGIONAL - FEDER)

Je deacutedie cette thegravese agrave lrsquoensemble des membres de ma famille

I

II

Remerciements

Mes premiers remerciements vont agrave lrsquoendroit de Monsieur Pascal Anelli Maicirctre deconfeacuterences HDR agrave lrsquoUniversiteacute de La Reacuteunion qui a accepteacute drsquoencadrer cette thegravese Jele remercie drsquoavoir mis toute son eacutenergie pour que je puisse mener ces travaux dans lesmeilleures conditions Je le remercie eacutegalement pour la confiance et la patience sans failleqursquoil mrsquoa teacutemoigneacutees durant ces anneacutees

Je remercie Monsieur Richard Lorion Maicirctre de Confeacuterences agrave lrsquoUniversiteacute de LaReacuteunion Malgreacute un emploi du temps surchargeacute il a su me consacrer du temps pouraiguiller mes travaux

Je tiens agrave remercier tout particuliegraverement Madame Laure Petrucci Professeur agrave lrsquoUni-versiteacute Paris 13 et Monsieur Emmanuel Lochin Professeur agrave lrsquoISAE SUPAERO qui mrsquoontfait lrsquohonneur drsquoaccepter de juger ces travaux et drsquoen ecirctre rapporteurs

Je remercie le Professeur Reacutemy Courdier qui a accepteacute de preacutesider mon jury de thegraveseDe par cette acceptation je boucle mon cursus universitaire agrave lrsquoUniversiteacute de La ReacuteunionMes remerciements vont agrave lrsquoattention de Monsieur Promeacutetheacutee Spathis qui consacre deson temps agrave la participation de mon jury de thegravese en tant qursquoexaminateur

Je tiens agrave remercier Messieurs Pierre-Ugo Tournoux et Xavier Nicolay pour les dis-cussions que lrsquoon a eues Cela mrsquoa permis de me remettre dans le droit chemin quand jemrsquoeacutegarais

Je remercie eacutegalement Monsieur Bruno Baynat Maicirctre de confeacuterences agrave lrsquoUniversiteacutede Paris 6 qui a su donner un nouveau souffle agrave ces travaux agrave travers ses conseils lors deson passage

Je remercie eacutegalement Monsieur Denis Fabregravegue Responsable du pocircle TIC agrave La ReacuteunionMonsieur Thierry Pretet travaillant agrave la cellule Investissements publics de la ReacutegionReacuteunion Monsieur Thomas Silverston Chercheur au NICT drsquoavoir accepteacute de faire par-tie de mon comiteacute de suivi de thegravese

Je remercie eacutegalement le Laboratoire drsquoInformatique et de Matheacutematiques dirigeacute parMonsieur Jean Diatta Professeur agrave lrsquoUniversiteacute de La Reacuteunion ainsi que lrsquoensemble desmembres pour lrsquoaccueil et les moyens qui mrsquoont eacuteteacute mis agrave disposition pour le bon deacuterou-lement de cette thegravese

Je remercie eacutegalement la Reacutegion Reacuteunion qui a soutenu financiegraverement ces travaux dethegravese

Je remercie eacutegalement Messieurs Jean-Christophe Lan-Yan-Fock et Arnaud Ravoa-vahy pour les travaux reacutealiseacutes durant leurs stages

Je remercie eacutegalement mes collegravegues mes amis et mes proches pour leurs contribu-tions et leurs encouragements

Je remercie particuliegraverement Aureacutelie Miora Florence et Anne-Claire qui ont eacuteteacute dansla mecircme galegravere que moi

Je tiens agrave remercier du fond du coeur lrsquoensemble des membres de ma famille qui mrsquoonttoujours apporteacute leur soutien et leur encouragement Merci agrave vous

Enfin je tiens agrave remercier toutes les personnes qui ont contribueacute de pregraves ou de loin agravela reacutealisation de ces travaux

III

IV

Reacutesumeacute

Lrsquoaccegraves agrave Internet des icircles de la Zone Oceacutean Indien a la particulariteacute drsquoutiliser deuxlongs cacircbles sous-marins Les routes ont en commun de passer par un de ces liens etdrsquointroduire une composante de deacutelai qui peut ecirctre significative La performance de TCPest lieacutee agrave lrsquoeacutetat des routes et au deacutelai Dans la situation de lrsquoicircle de la Reacuteunion comment secomporte un protocole ayant une deacutependance au deacutelai tel que TCP

Dans cette thegravese nous proposons une eacutetude de lrsquoInternet agrave la Reacuteunion Les travauxvisent agrave pouvoir dresser un bilan de la connectiviteacute Internet Ils srsquoorientent drsquoune partagrave caracteacuteriser la connectiviteacute au niveau du reacuteseau et drsquoautre part agrave traduire ses caracteacute-ristiques au niveau de la couche de transport Ainsi les travaux preacutesenteacutes reposent surdeux eacutetudes de meacutetrologie sur le reacuteseau reacuteunionnais

Le premier examen a pour objectif la caracteacuterisation des deacutelais et des routes emprun-teacutees depuis et en direction de lrsquoicircle Ces travaux reposent sur une plate-forme de mesuresmise en place agrave cet effet Un outil drsquoidentification des routes a eacuteteacute deacuteveloppeacute afin drsquoana-lyser les chemins depuis et vers la Reacuteunion Cet outil utilise une base de donneacutees degeacuteolocalisation construite agrave partir des adresses IP rencontreacutees des deacutelais associeacutes et drsquoin-formations provenant des Registres Internet Reacutegionaux Lrsquoanalyse des reacutesultats montredes caracteacuteristiques propres agrave la reacutegion Reacuteunion

La seconde eacutetude de meacutetrologie vise lrsquoanalyse des flux TCP Des meacutetriques associeacuteesagrave lrsquoobservation des captures de trafic sont identifieacutees afin drsquoeacutetablir les performances deTCP mais eacutegalement les types de trafic entrant et sortant de lrsquoicircle Le volume des eacutecouteseacutetant important un outil drsquoanalyse pour des traitements efficaces et rapides a eacutegalementeacuteteacute deacuteveloppeacute

Les contributions de cette thegravese sont drsquoabord rattacheacutees au contexte reacuteunionnais etsont extrapoleacutees vers lrsquointernet de la Zone Oceacutean Indien Cette thegravese se veut ecirctre un eacuteleacute-ment pour une reacuteflexion avec lrsquoensemble des acteurs de lrsquoInternet agrave la Reacuteunion

Mots cleacutes

Meacutetrologie active Deacutelais Routage Meacutetrologie passive Performance TCP Zone OceacuteanIndien Reacuteunion

V

Abstract

The access to the Internet of the Islands of the Indian Ocean Area has the particularityof using two long submarines cables The routes have in common to go through one ofthese links and introduce a delay component that can be significant The performance ofTCP is linked to the state of the route and the delay In the situation of Reunion Islandhow does a protocol having a dependence on delay such as TCP behaves

In this thesis we propose a study of the Internet in Reunion Island The work aimsto be able to take stock of Internet connectivity They are oriented on the one hand tocharacterize the connectivity at the level of the network and on the other hand to translatethese characteristics at the level of the transport layer Thus the works presented arebased on two metrology studies on the Reunion network

The first review aims to characterize the delays and the routes taken from and to theisland This work is based on a platform of measures put in place for this purpose A roadidentification tool has been developed to analyze roads to and from Reunion Island Thistool uses a geolocation database built from IP addresses encountered associated delaysand information from the Regional Internet Registries The analysis of the results showscharacteristics specific to the Reacuteunion region

The second metrology study aims to analyze TCP flows Metrics associated with theobservation of the catches of traffic are identified in order to establish the performancesof TCP but also the types of traffic entering and leaving the island Since the volume ofthe intercepts is important an analysis tool for efficient and rapid treatments has beendeveloped

The contributions of this thesis are first of all related to the Reunionese context andare extrapolated to the Internet of the Indian Ocean Zone This thesis is meant to be anelement for a reflection with all the actors of the Internet in Reunion Island

Keywords

Active Metrology Delay Routage Passive metrology Performance TCP Indian OceanArea Reunion Island

VI

Table des matiegraveres

Remerciements III

Reacutesumeacute V

Abstract VI

Liste des acronymes IX

Introduction 11 Contexte geacuteneacuteral 12 Contexte reacutegional 1

21 LrsquoInternet agrave La Reacuteunion 122 LrsquoInternet dans la Zone de lrsquoOceacutean Indien 5

3 Probleacutematique 84 Organisation de la thegravese 8

1 Eacutetat de lrsquoart 911 Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage 10

111 Controcircle de congestion de TCP 10112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de

stockage 14113 Un controcircle de congestion de TCP adapteacute aux LFN 17114 Controcircle de congestion avec implication des routeurs 22115 Caracteacuterisation de La Reacuteunion 23

12 Meacutetrologie du trafic Internet 25121 Deacutefinition 25122 Meacutetrologie active 26123 Meacutetrologie passive 32124 Comparatif entre mesures actives et mesures passives 35

13 Synthegravese 36

2 Caracteacuterisation de la connectiviteacute de La Reacuteunion 3921 Objectifs 4022 Cahier des charges 40

221 Evolution 40222 Connectiviteacute 40

23 Protocole de mesure 46231 Eacutechantillon de mesure 46232 Eacutevolution 47233 Connectiviteacute 48

24 Reacutesultats 53241 Eacutevolution 53

VII

242 Connectiviteacute de La Reacuteunion 54243 Connectiviteacute des icircles de la Zone Oceacutean Indien 65244 Synthegravese des reacutesultats 71

25 Conclusion 72

3 Meacutetrologie sur le service de transport agrave La Reacuteunion 7531 Objectifs 75

311 Les objectifs de lrsquoeacutetude 76312 Les meacutetriques de lrsquoeacutetude 76

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie 79321 Pour la capture du trafic 79322 Pour analyser les traces 80

33 Protocole de mesure 8234 Reacutesultats 85

341 Supervision du trafic 86342 Performance de TCP 88343 Synthegravese des reacutesultats 91

35 Conclusion 92

Conclusion amp perspectives 951 Synthegravese des travaux 952 Perspectives 96

Table des figures 100

Liste des tableaux 101

Bibliographie 103

VIII

Liste des acronymes

ACK Acknowledgement

ADSL Asymmetric Digital Subscriber Line

AIMD Additive Increase and Multiplicative Decrease

API Application Programming Interface

ARCEP Autoriteacute de Reacutegulation des Communications Electroniques et des Postes

AS Autonomous System

BDP Bandwidth Delay Product

CAIDA Center for Applied Internet Data Analysis

CDCS Comoros Domestic Cable Sytem

CDF Cumulative Density Function

CIL Correspondant Informatique et Liberteacutes

CWND Congestion Window

CWR Congestion Window Reduce

DNS Domain Name System

DSI Direction des Services Informatiques

DupAck Duplicate Acknowledgement

EASSY Eastern Arfrica Submarine SYstem

ECE ECN Echo

ECN Explicit Congestion Notification

FAI Fournisseurs drsquoAccegraves Internet

FTTH Fiber To The Home

GIX Global Internet eXchange

GNU GNUrsquos Not Unix

GPL General Public Licence

HTTP HyperText Transfer Protocol

HTTPS HyperText Transfer Protocol Secured

IANA Internet Assigned Numbers Authority

ICMP Internet Control Message Protocol

IETF Internet Engineering Task Force

IX

IGMP Internet Group Management Protocol

IMAP Internet Message Access Protocol

IP Internet Protocol

IPPM IP Performance Metrics

IW Initial Window

IXP Internet eXchange Point

LAN Local Area Network

LER Label Edge Router

LFN Long Fat Network

LIM Laboratoire drsquoInformatique et de Matheacutematiques

LION Lower Indian Ocean Network

LSP Label Switched Path

LSR Label Switch Router

MAN Metropolitan Area Network

MPLS MultiProtocol Label Switch

MSS Maximun Segment Size

NRA Noeud de Raccordement drsquoAbonneacutes

NS Nonce Sum

OS Operating System

PDF Probability Density Function

POP Post Office Protocol

PSAMP Packet Sampling

RENATER REseau NAtional de communication eacutelectroniques pour la Technologie lrsquoEnseigne-ment et la Recherche

RIR Regional Internet Registry

RITE Reducing Internet Transport Latency

RSSI Responsable Seacutecuriteacute et Systegravemes drsquoInformation

RTO Retransmission TimeOut

RTT Round-Trip delay Time

SAFE South-Africa Far East

SAT-3 South Africa Transit-3

SCP Ssh CoPy

SEAS Seychelles to East Africa System

SMTP Simple Mail Transfert Protocol

SSH Secure SHell

ssthresh slow-start threshold

TAI Technologies drsquoAccegraves agrave Internet

X

TCP Transmission Control Protocol

TTL Time-To-Live

UDP User Datagram Protocol

VDSL Very-high-bit-rate Digital Subscriber Line

VLAN Virtual Local Area Network

VOD Video on demand

VPN Virtal Private Network

WAN Wide Area Network

WASC West Africa Submarine Cable

ZOI Zone Oceacutean Indien

XI

XII

Introduction

1 Contexte geacuteneacuteral

Depuis sa premiegravere deacutemonstration publique en 1972 Internet a fortement eacutevolueacute[Leiner1997] Dans une premiegravere phase nous avons les changements de services Les uti-lisateurs ont basculeacute des services historiques que sont lrsquoeacutechange drsquoe-mail et la navigationweb vers une utilisation interactive de lrsquoInternet Ces nouveaux services tels que la Voixsur IP les Jeux en ligne le Streaming etc sont maintenant possibles peu importe lrsquoendroitougrave lrsquoon se situe Cela gracircce agrave la seconde phase des innovations de lrsquoInternet lrsquoeacutevolu-tion des technologies logicielles et mateacuterielles Les technologies sont devenues de plusen plus mobiles et proposent des deacutebits drsquoaccegraves agrave lrsquoInternet de plus en plus importantsAinsi nous sommes passeacutes drsquoun accegraves physique de chez soi connecteacutes agrave un ordinateurfixe et une liaison 56 kbits (kilo-bitsseconde) agrave des smartphones et des connexions mo-biles avec un deacutebit theacuteorique minimal descendant de 20 Gbits (Giga-bitsseconde) dansun futur proche pour la technologie 5G En parallegravele lrsquoaccegraves agrave Internet srsquoest deacutemocra-tiseacute Drsquoapregraves une eacutetude de lrsquoOrganisation des Nations Unies le nombre de teacuteleacutephonesmobiles est devenu supeacuterieur au nombre drsquohabitants sur la planegravete [ONU2013] Ces eacutevo-lutions parallegraveles ont bouleverseacute lrsquousage de lrsquoInternet Est-ce que ces eacutevolutions ont eu unimpact sur lrsquoInternet reacuteunionnais

2 Contexte reacutegional

21 LrsquoInternet agrave La Reacuteunion

Pour comprendre la situation de lrsquoInternet agrave La Reacuteunion il est neacutecessaire de relaterlrsquohistoire de la connectiviteacute Internet et de dresser un bilan de lrsquoeacutetat actuel Cet historiqueest effectueacute agrave partir du document [Pretet2000] qui preacutesente lrsquoavancement du projet deconnexion de lrsquoicircle de La Reacuteunion au cacircble sous-marin South-Africa Far East (SAFE)

La premiegravere connexion de La Reacuteunion agrave lrsquoInternet date de 1992 avec la mise en servicedu projet Telecom-2 Agrave cette eacutepoque la seule liaison connectant La Reacuteunion agrave Interneteacutetait une connexion satellitaire Jusqursquoen 2001 et lrsquoarriveacutee du cacircble SAT-3WASCSAFEles deacutebits drsquoaccegraves reacutesidentiels ne deacutepassaient pas les 56 kbits La bande passante totalede lrsquoaccegraves Internet de lrsquoicircle par ce canal satellite eacutetait de 400 Mbits (Meacutega-bitsseconde)tous opeacuterateurs confondus Le coucirct drsquoutilisation de la liaison satellite avoisinait les17 000DMbmois et par opeacuterateur La technologie drsquoaccegraves et le tarif eacuteleveacute limitaient lesusages de lrsquoInternet priveacute agrave des services basiques comme lrsquoeacutechange drsquoe-mail Lrsquoarriveacuteedes cacircbles South Africa Transit-3 (SAT-3)West Africa Submarine Cable (WASC)SAFE en2001 visaient agrave deacutesenclaver numeacuteriquement lrsquoicircle

Ce cacircble drsquoune longueur totale de 28 000 Km (Kilo-megravetres) connecte lrsquoEurope (Es-pagne et Portugal) agrave lrsquoAsie (Inde et Malaisie) en longeant la cocircte Ouest africaine telqursquoillustreacutee par la carte figure 1 Le lien est composeacute de deux paires de fibres optiquesavec une capaciteacute globale de 135 Gbits La reacutepartition des capaciteacutes fut faite en fonction

1

du montant investi par les opeacuterateurs France Teacuteleacutecom fut seacutelectionneacutee pour la Franceavec un deacutebit total de 13 6 Gbits dont 155 Mbits furent alloueacutes agrave la connexion de LaReacuteunion Ce deacutebit eacutetait eacutequivalent agrave la capaciteacute maximale theacuteorique du lien satellite deFrance Teacuteleacutecom Outre la seacutecuriteacute apporteacutee par la fibre optique crsquoest la qualiteacute de la trans-mission qui a eacuteteacute ameacutelioreacutee avec ce support Ce cacircble a eacuteteacute une premiegravere eacutetape dans lamise en place drsquoune autoroute de lrsquoinformation entre lrsquoEurope lrsquoAsie et lrsquoAfrique PourLa Reacuteunion cette autoroute a eacuteteacute un facteur pour la baisse des coucircts de communication eten parallegravele le deacuteploiement de la technologie Asymmetric Digital Subscriber Line (ADSL)Les tarifs de consommation de la bande passante du lien ont connu une baisse impor-tante suite agrave une deacutecision de lrsquoAutoriteacute de Reacutegulation des Communications Electroniques etdes Postes (ARCEP) en 2004 [ARCEP2004] Les tarifs sont passeacutes de 17 000 DMbmois agrave1 550 DMbmois

FIGURE 1 ndash Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000])

Malgreacute la baisse des tarifs lrsquoADSL nrsquoeacutetait preacutesent que dans 6 villes agrave forte densiteacutede population Afin drsquoaugmenter la couverture de lrsquoaccegraves Internet de lrsquoicircle une dorsalefaisant le tour de lrsquoicircle est installeacutee Crsquoest le reacuteseau nommeacute Gazelle dont le deacutebut du deacute-ploiement fut effectueacute dans le courant de lrsquoanneacutee 2003 [SDTAN2013] Cette fibre est ins-talleacutee en hauteur en suivant le reacuteseau Haute Tension drsquoEDF selon le plan de la figure 2(en trait bleu ou fonceacute) Le but de ce reacuteseau est de raccorder lrsquoensemble des Noeud de Rac-cordement drsquoAbonneacutes (NRA) Un NRA est un local heacutebergeant un central teacuteleacutephonique delrsquoopeacuterateur historique France Teacuteleacutecom dans lequel aboutissent les lignes teacuteleacutephoniquesdes abonneacutes communeacutement appeleacutees boucles locales Au delagrave de ces locaux les boucleslocales forment le reacuteseau capillaire Lrsquointerconnexion entre le reacuteseau Gazelle et les NRAest repreacutesenteacutee en vert sur la figure 2

En 2004 La Reacuteunion srsquoest doteacutee drsquoun point drsquoeacutechange (Global Internet eXchange (GIX)ou Internet eXchange Point (IXP)) nommeacute Reunix Il fut pendant pregraves de 10 ans le seul IXPpreacutesent dans la Zone Oceacutean Indien (ZOI) Geacutereacute par le REseau NAtional de communicationeacutelectroniques pour la Technologie lrsquoEnseignement et la Recherche (RENATER) il vise agrave inter-connecter les fournisseurs drsquoaccegraves Internet de La Reacuteunion afin drsquoeacuteviter que le trafic localne sorte de lrsquoicircle et consomme des capaciteacutes sur le cacircble sous-marin En plus de cet eacutequi-pement des technologies de cache ont eacuteteacute deacuteployeacutees sur le territoire LrsquoUniversiteacute de LaReacuteunion a eacuteteacute un des acteurs de ce deacuteploiement

2

FIGURE 2 ndash Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000])

Depuis la deacutecision de lrsquoARCEP en 2004 chaque anneacutee une baisse de 20 agrave 40 duprix du Meacutegabit sur le cacircble sous-marin est enregistreacutee En 2006 pour 50D un abonneacutenrsquoavait droit qursquoagrave la connexion ADSL de 1 Mbits sans aucun service additionnel Lrsquoan-neacutee suivante pour le mecircme tarif la teacuteleacutephonie illimiteacutee vers certains pays a eacuteteacute ajouteacuteeau forfait Dans le courant de lrsquoanneacutee 2010 le forfait est resteacute le mecircme mais le deacutebit alloueacuteest augmenteacute pour atteindre 8 Mbits La Reacuteunion nrsquoa vu lrsquoarriveacutee du triple play (Teacuteleacutevi-sion Teacuteleacutephone Internet) qursquoagrave partir des anneacutees 20112012 avec lrsquoarriveacutee drsquoun nouveaucacircble Lower Indian Ocean Network (LION) Le LION est un cacircble sous-marin reliant LaReacuteunion Maurice et Madagascar depuis 2009 En 2012 une extension est rajouteacutee sousle nom de LION-2 connectant le LION agrave Mayotte et au Kenya Ce nouveau cacircble proposedegraves sa mise en service une capaciteacute deacutepassant le 1 Tbs (Teacuterabitseconde)

Lrsquoaugmentation continue des deacutebits et de la capaciteacute disponible sur le cacircble SAT-3WASCSAFE actuellement agrave 900 Gbits a acceacuteleacutereacute le deacuteploiement de nouveaux ser-vices et de nouvelles technologies drsquoaccegraves agrave Internet pour les abonneacutes Lrsquoicircle de La Reacuteuniondispose actuellement en dehors des connexions mobiles de trois Technologies drsquoAccegraves agrave In-ternet (TAI) La premiegravere est la technologie ADSL preacutesente depuis 2001 Elle propose desdeacutebits asymeacutetriques allant jusqursquoagrave 20 Mbitss en descente Crsquoest le deacutebit qursquoaura lrsquoutilisa-teur en teacuteleacutechargement Depuis 2014 lrsquoopeacuterateur historique Orange (ex-France Teacuteleacutecom)propose la technologie Very-high-bit-rate Digital Subscriber Line (VDSL) 2 avec des deacutebitsallant jusqursquoagrave 100 Mbits descendant La limite physique de cette TAI impose une dis-tance entre lrsquoabonneacute et le distributeur infeacuterieure agrave 1 Km La derniegravere technologie preacutesentesur lrsquoicircle est la fibre optique Deacuteployeacutee depuis 2007 par lrsquoopeacuterateur priveacute ZEOP elle eacutetaitjusqursquoagrave peu principalement deacuteployeacutee dans les villes du Port Sainte Marie et Saint Pierre

Chaque opeacuterateur dispose drsquoune ou plusieurs technologies drsquoaccegraves Chaque technolo-

3

gie est associeacutee agrave un deacutebit maximal theacuteorique La carte 3 1 preacutesente les deacutebits theacuteoriquesqui sont preacutesents sur lrsquoicircle [France2017]

Cette carte montre une dispariteacute des deacutebits selon les zones geacuteographiques de lrsquoicircleLe Plan France Tregraves Haut Deacutebit a pour objectif drsquouniformiser sur lrsquoensemble du territoirefranccedilais les deacutebits avec le deacuteploiement de la technologie drsquoaccegraves fibre optique

FIGURE 3 ndash Carte des deacutebits agrave La Reacuteunion

Reacutecapitulatif

La connexion agrave Internet donne agrave La Reacuteunion des capaciteacutes importantes La preacutesencedrsquoun GIX sur le territoire a limiteacute le trafic reacuteunionnais sur les cacircbles sous-marins La figure4 montre lrsquoensemble des eacuteveacutenements qui ont marqueacute le deacuteveloppement de lrsquoInternet agrave LaReacuteunion jusqursquoagrave nos jours

Depuis la deacutecision de lrsquoARCEP en 2004 [ARCEP2004] et lrsquoarriveacutee du cacircble LION lesopeacuterateurs ont fait le choix drsquoaugmenter les services proposeacutes avec un prix reacutesidentielstable Les derniers services ajouteacutes sont ceux de la Video on demand (VOD) et de la rediffu-sion (Replay) En 2014 le prix moyen du MeacutegabitMois sur le cacircble SAT-3WASCSAFEavoisinait les 25 D En pregraves de 15 ans on note la baisse du coucirct moyen du Meacutegabitmoisde 17 000 D agrave 25 D

Lrsquoeacutevolution de la connectiviteacute Internet agrave La Reacuteunion est lieacutee au deacuteveloppement de laconnectiviteacute des diffeacuterents pays preacutesents dans la Zone Oceacutean Indien

1 Source Observatoire France Tregraves Haut Deacutebit

4

FIGURE 4 ndash Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion

22 LrsquoInternet dans la Zone de lrsquoOceacutean Indien

Les acteurs du deacuteveloppement du numeacuterique dans la Zone Oceacutean Indien

Dans le cadre de nos eacutetudes nous restreignons la ZOI agrave 6 icircles ou archipels suivants(rangeacutes par ordre alphabeacutetique) les Comores Madagascar Maurice Mayotte La Reacuteunionet les Seychelles Agrave lrsquoexception de Mayotte et de La Reacuteunion qui sont des reacutegions fran-ccedilaises les autres icircles et archipels citeacutes sont des pays indeacutependants Nous allons dansun premier temps faire une preacutesentation des principaux acteurs du deacuteveloppement nu-meacuterique dans chaque territoire Le deacuteveloppement de lrsquoInternet dans la ZOI se fait encollaboration avec lrsquoensemble des pays Nous poursuivrons avec les futures installationsdes cacircbles sous-marins dans la ZOI

LrsquoUnion des Comores est une reacutepublique feacutedeacuterale drsquoAfrique Lrsquoarchipel est connecteacuteagrave Internet depuis le 19 Janvier 1998 via une connexion satellite En 2010 le gouverne-ment deacuteploie le Comoros Domestic Cable Sytem (CDCS) qui relie lrsquoensemble des icircles delrsquoarchipel entre elles avec en parallegravele le raccordement au cacircble Eastern Arfrica SubmarineSYstem (EASSY) [Comores2002] Ce cacircble relie lrsquoAfrique du Sud au Soudan en longeantla cocircte Est du continent En 2009 lrsquoAutoriteacute Nationale de Reacutegulation des TIC (ANRTIC) voitle jour De nombreuses missions sont donneacutees agrave cette autoriteacute comme appliquer et fairerespecter la loi des Technologies de lrsquoInformation et de la Communication (TIC) reacuteguler lesecteur des TIC favoriser la coopeacuteration entre les acteurs et geacuterer les diffeacuterends garan-tir une concurrence saine et loyale entre les opeacuterateurs et de deacutevelopper la recherche laformation et les innovations technologiques [ANRTIC2016] En deacutecembre 2016 un troi-siegraveme cacircble connecte lrsquoarchipel agrave Mayotte Actuellement un Vice-Preacutesident chargeacute desTIC travaille en collaboration avec un Conseiller du preacutesident en matiegravere de transports etteacuteleacutecommunications

La Reacutepublique de Madagascar est relieacutee agrave Internet par deux cacircbles sous-marins Lepremier est lrsquoEASSY Le second cacircble est le LION Au niveau des prises de deacutecisions 3 or-ganismes principaux existent Le plus important est le ministegravere des Teacuteleacutecommunicationset des Nouvelles Technologies Il a mis en place le Projet drsquoInfrastructure de Communicationpour Madagascar (PICOM) Lrsquoobjectif est la reacuteduction des coucircts drsquoaccegraves aux services deteacuteleacutecommunications Le second est lrsquoAutoriteacute de Reacutegulation des TEchnologies de Communica-tion (ARTEC) Cet administration octroie les licences aux proprieacutetaires des reacuteseaux arbitreles diffeacuterends entre opeacuterateurs et assure la gestion des spectres [ARTEC2016] Le dernierorganisme est le Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de la Commu-nication (GOTICOM) Il a pour objectif drsquoaccompagner et drsquoameacuteliorer les infrastructuresde teacuteleacutecommunication et de favoriser lrsquointeacutegration des TIC [GOTICOM2011] Depuis2016 un GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Africaine [MGIX2017]

5

La Reacutepublique de Maurice regroupe les icircles Rodrigues et Maurice Sous lrsquoimpulsiondu gouvernement anglais la premiegravere ligne teacuteleacutephonique fut installeacutee en 1883 Actuel-lement en plus drsquoune connexion satellitaire reliant les deux icircles le SAFE et le LIONconnectent Maurice agrave Internet Un ministegravere des Technologies de lrsquoInnovation et desCommunications existe au sein du gouvernement Crsquoest ce mecircme gouvernement quinomme le directeur de lrsquoInformation and Communication Technologies Authority (ICTA) Crsquoestlrsquoautoriteacute de reacutegulation des Teacuteleacutecoms et des Postes Il existe 2 principaux opeacuterateurs quesont Mauritius Telecom et Emtel Une dizaine drsquoopeacuterateurs cohabitent sur lrsquoicircle [ICTA2017]Depuis 2016 un nouveau GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Afri-caine [MIXP2017]

Mayotte est un deacutepartement franccedilais depuis Mars 2011 Le raccordement au cacircbleLION-2 extension du cacircble LION en avril 2012 rend possible lrsquoarriveacutee du haut deacutebit surce territoire En 2013 un GIX geacutereacute par RENATER est installeacute au sein du Rectorat Il senomme Mayotix

Les Seychelles ont vu leur premiegravere connexion Internet introduite dans lrsquoarchipel parAtlas Seychelles Ltd en septembre 1996 En 2012 les Seychelles sont connecteacutes agrave une fibreen provenance de Tanzanie Crsquoest le cacircble Seychelles to East Africa System (SEAS) Crsquoestlrsquounique cacircble sous-marin connectant lrsquoarchipel Le Ministegravere des Technologie de lrsquoInforma-tion et des Communications (MITC) fait office drsquoautoriteacute de Reacutegulation des Teacuteleacutecommuni-cations dans le pays [DICT2017]

Chaque autoriteacute de reacutegulation agrave un impact sur le deacuteveloppement de lrsquoInternet dansson pays Ce deacuteveloppement se reacutepercute sur lrsquoameacutelioration de lrsquoaccegraves Internet dans laZOI

Deacuteveloppement de lrsquointerconnexion de la Zone Oceacutean Indien

Cette reacutegion a connu un premier bouleversement de sa connectiviteacute agrave Internet avecle deacuteploiement du cacircble sous-marin SAT-3WASCSAFE en 2001 pour La Reacuteunion etMaurice Lrsquoarriveacutee du LION en 2009 a connecteacute Madagascar aux deux icircles En 2010 lesComores et Madagascar se sont ouverts une voie vers lrsquoAfrique avec le cacircble EASSY Lrsquoin-terconnexion du LION 2 a deacuteveloppeacute lrsquoInternet agrave Mayotte tandis que le deacuteploiement ducacircble SEAS a ouvert les Seychelles agrave lrsquoInternet haut deacutebit La carte 5 indique les diffeacuterentscacircbles sous-marins preacutesents dans la ZOI

La ZOI srsquoengage dans le deacuteploiement de nouveaux liensLe cacircble MElting poT Indianoceanic Submarine System (METISS) drsquoune longueur de

3 500 kilomegravetres reliera Madagascar Maurice et La Reacuteunion agrave lrsquoAfrique du Sud La bandepassante du cacircble sera de 24 Tbs Sa mise en service est preacutevue pour le courant de lrsquoan-neacutee 2019 [Lemauricien]

Africa-1 est un cacircble reliant lrsquoAfrique du Sud le Moyen Orient et lrsquoAsie centrale Cecacircble de plus de 12 0000 kilomegravetres passera le long de la cocircte Est africaine avant de relierlrsquoArabie Saoudite lrsquoEacutegypte et le Pakistan La mise en service du cacircble est preacutevue pour lecourant de lrsquoanneacutee 2020 [Africa1]

En 2019 sera mis en service le cacircble IOX IOX est un cacircble sous-marin deacutedieacute agrave lrsquoicircleMaurice Il a pour but drsquooffrir une nouvelle liaison agrave Maurice en reliant lrsquoicircle agrave lrsquoAfrique etau reste du monde Il sera doteacute drsquoune capaciteacute de 54 Tbs [IOX]

La carte 6 repreacutesente lrsquoensemble des IXP preacutesents dans la Zone Oceacutean Indien En vertce sont les points drsquoeacutechanges deacutejagrave en service La France a degraves lrsquoanneacutee 2004 mis en placele point drsquoeacutechange agrave La Reacuteunion et en 2012 celui de Mayotte Ceux de Maurice et de

6

FIGURE 5 ndash Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source [Cablesmap])

Madagascar ont eacuteteacute mis en service en 2016 avec lrsquoaide de lrsquoUnion Africaine de lrsquoInter-net Society et du projet AXIS [AXIS] Les points bleus repreacutesentent les points drsquoeacutechangequi sont preacutevus drsquoecirctre deacuteployeacutes dans la zone oceacutean indien par le projet AXIS dans le fu-tur Drsquoici quelques anneacutees lrsquoensemble des territoires de la zone sera eacutequipeacute drsquoun pointdrsquoeacutechange Cet eacutequipement vise a maintenir le trafic de type Metropolitan Area Network(MAN) du pays ougrave il est installeacute Il facilite les eacutechanges entre les opeacuterateurs locaux enreacuteduisant la latence et en augmentant la qualiteacute de service

FIGURE 6 ndash Carte des points drsquoeacutechange preacutesents actuellement et dans un futur prochedans la ZOI

7

3 Probleacutematique

LrsquoInternet et ses applications ont eacuteteacute deacuteveloppeacutes dans des territoires ougrave les routes sontnombreuses Lrsquoicircle de La Reacuteunion comme beaucoup de territoires insulaires ne beacuteneacuteficiepas drsquoun nombre de liaisons physiques directes important Lrsquoeacutevolution de lrsquoInternet al-lant des applications toleacuterantes aux deacutelais vers des applications temps-reacuteel neacutecessite unerobustesse et une qualiteacute de service deacutependantes drsquoun maillage fort et de deacutelais courts

Lrsquoeacutetude drsquo[Anelli2012] a deacutemontreacute que les deacutelais agrave destination drsquoadresses aleacuteatoiressont sensiblement plus longs depuis La Reacuteunion que depuis Paris avec un eacutecart drsquoenvi-ron 180 ms Suite agrave ce constat lrsquoauteur a reacutealiseacute des simulations estimant les deacutebits asso-cieacutes avec un taux de pertes de 10 Ces simulations ont mis en avant des deacutebits eacutecouleacutesplus faibles pour un usager situeacute agrave La Reacuteunion qursquoun usager baseacute agrave Paris Une augmen-tation de la bande passante nrsquoentraicircnerait pas une diminution des deacutelais Le groupe detravail europeacuteen Reducing Internet Transport Latency (RITE) a reacutealiseacute une videacuteo explicativede ce pheacutenomegravene [RITE2014-2]

Cette thegravese vise agrave mettre en lumiegravere les principaux freins des deacutebits eacutecouleacutes

Dans une premiegravere eacutetape nous eacutetudierons lrsquoeacutevolution des deacutelais depuis La Reacuteunionen prenant comme base lrsquoeacutetude reacutealiseacutee par [Anelli2012]

Dans un second temps nous eacutetudierons les routes logiques de lrsquoInternet reacuteunionnais

Dans un dernier temps nous reacutealiserons une proposition drsquoeacutetude de meacutetrologie Cetteeacutetude vise agrave identifier la correacutelation des eacuteveacutenements de congestion entre les flots lrsquoimpor-tance des anomalies affectant Transmission Control Protocol (TCP) (pertes initiales fauxeacuteveacutenements de congestion) la reacutepartition des flots (en taille en protocole en application)et les paramegravetres de performances (taux de pertesRTT deacutebit eacutecouleacute)

4 Organisation de la thegravese

Suite agrave lrsquoexposition de notre probleacutematique le chapitre 1 preacutesente le contexte scienti-fique de nos travaux Dans un premier temps nous allons preacutesenter les caracteacuteristiquesde TCP et sa probleacutematique lieacutee aux reacuteseaux agrave forte capaciteacute de stockage Nous continue-rons avec une preacutesentation de quelques solutions Nous deacuteterminerons si lrsquoaccegraves Internetde La Reacuteunion doit ecirctre consideacutereacute comme un reacuteseau agrave forte capaciteacute de meacutemorisation Lasuite du chapitre inclura la deacutefinition de la meacutetrologie dans les reacuteseaux et une preacutesenta-tion des techniques de mesures active et passive

La premiegravere eacutetude est deacutecrite dans le chapitre 2 et deacutebute par la preacutesentation des ob-jectifs Un cahier des charges permettant de reacutepondre aux objectifs a eacuteteacute reacutedigeacute Ce cahierdes charges a deacuteboucheacute sur le deacuteploiement de la plate-forme de meacutetrologie active RunPLet du deacuteveloppement de deux outils drsquoaide agrave lrsquoanalyse rgeoloc et rtraceroute La preacutesen-tation du protocole de mesure a eacuteteacute reacutealiseacutee dans la partie preacuteceacutedant celle des reacutesultatsLe chapitre se conclut par une synthegravese des reacutesultats qui ont servi agrave nos contributions

La seconde eacutetude est preacutesenteacutee dans le chapitre 3 Les objectifs du chapitre sont preacute-senteacutes dans un premier temps et diviseacutes en deux Ce chapitre preacutesente la mise en oeuvredrsquoune plate-forme de meacutetrologie et du protocole de mesure associeacute Une section reacutesultatassocieacutee agrave une conclusion termine le chapitre Ce chapitre a fait lrsquoobjet drsquoune contributionscientifique

Nous concluons notre thegravese par un reacutesumeacute des diffeacuterentes contributions Un apportsur les perspectives qursquoautorisent nos travaux est proposeacute dans le chapitre 35

8

Chapitre 1

Eacutetat de lrsquoart

Transmission Control Protocol (TCP) est le protocole de transport le plus utiliseacute sur lrsquoIn-ternet Lrsquoeacutetude reacutealiseacutee par Center for Applied Internet Data Analysis (CAIDA) sur une du-reacutee de 2 ans du trafic passant par le point drsquoeacutechange (IXP) EQUNIX de Chicago a montreacuteque 90 97 des paquets Internet Protocol (IP) acheminent des segments TCP [EQUINIX]TCP est un protocole de transport qui rend un service de transfert fiable de donneacuteesLorsque la somme du deacutebit des eacutemetteurs TCP partageant une mecircme ressource du reacute-seau excegravede la capaciteacute de cette ressource il se produit de la congestion La congestionest un pheacutenomegravene indeacutesirable qui met le reacuteseau dans un eacutetat ougrave le service rendu est deacute-gradeacute Cette deacutegradation peut ecirctre seacutevegravere en fonction de lrsquointensiteacute du pheacutenomegravene Poureacuteviter que lrsquoeffet de la congestion empire quand elle apparaicirct TCP integravegre une fonctionde reacutesolution connue sous le nom de controcircle de congestion Le principe est que chaqueeacutemetteur deacutetecte la congestion et diminue son deacutebit drsquoeacutemission Pour se faire le controcirclede congestion srsquoappuie sur la boucle de controcircle constitueacutee entre lrsquoeacutemission drsquoun segmentde donneacutees et la reacuteception de lrsquoacquittement correspondant Le controcircle de congestionagit sur le deacutebit drsquoeacutemission de lrsquoeacutemetteur avec une latence lieacutee au Round-Trip delay Time(RTT) Lorsque le produit du RTT avec la capaciteacute drsquoeacutecoulement offerte par le reacuteseau estrelativement important le controcircle de congestion de TCP peine agrave utiliser les ressourcesdu reacuteseau efficacement Ce produit du deacutelai et du deacutebit repreacutesente la quantiteacute de donneacuteesnon acquitteacutees qui peut circuler On peut assimiler ce produit agrave la capaciteacute de stockage dedonneacutees dans le reacuteseau

Ces derniegraveres anneacutees lrsquoaugmentation de la bande passante a fait croicirctre significative-ment cette capaciteacute de stockage En effet comme les deacutelais nrsquoont pas diminueacute dans lesmecircmes proportions la capaciteacute de stockage nrsquoa fait que croicirctre Cette eacutevolution pose undeacutefi au controcircle de congestion de TCP pour maintenir ses performances Cette eacutevolutiona entraicircneacute une activiteacute intense de recherche pour traiter ce problegraveme de produit deacutelai-bande passante pour TCP Ainsi de nouvelles versions du controcircle de congestion de TCPont eacuteteacute eacutetudieacutees pour lrsquoadapter aux speacutecificiteacutes des reacuteseaux agrave forte capaciteacute de stockageLong Fat Network (LFN)

Si le stockage important de donneacutees dans le reacuteseau pose un problegraveme pour le controcirclede congestion de TCP qursquoen est-il en pratique dans le cas de lrsquoInternet agrave La Reacuteunion Pourreacutepondre agrave cette question il faut pouvoir mesurer lrsquoexistant Depuis quelques anneacutees ily a un inteacuterecirct croissant pour la mesure Une science de la mesure sur lrsquoInternet se deacute-veloppe Il faut chercher dans la croissance continue et soutenue de lrsquoInternet ainsi quedans lrsquoabsence drsquoune exploitation coordonneacutee les motivations agrave deacutevelopper la meacutetrologiesur Internet Cette meacutetrologie vise agrave mieux comprendre le fonctionnement de lrsquoInternet

Ce chapitre se compose de deux sections theacutematiques La premiegravere section 11 traitede la probleacutematique du controcircle de congestion de TCP utiliseacute sur les reacuteseaux agrave grande

9

capaciteacute de stockage La sous-section 111 rappelle le principe du controcircle de conges-tion et sa mise en œuvre dans TCP Dans la partie 112 les problegravemes speacutecifiques ducontrocircle de congestion de TCP appliqueacute dans le contexte des reacuteseaux agrave forte capaciteacute demeacutemorisation sont indiqueacutes Face agrave ces problegravemes des propositions ont eacuteteacute eacutetudieacutees quenous preacutesenterons dans les parties 113 et 114 Pour conclure cette section nous pose-rons dans la sous-section 115 les arguments qui permettent drsquoavancer que lrsquoicircle de LaReacuteunion a une connectiviteacute qui srsquoapparente agrave celle des reacuteseaux agrave forte capaciteacute de sto-ckageLa seconde section 12 est consacreacutee agrave la meacutetrologie du trafic Internet La deacutefinition et lesmeacutethodologies de la meacutetrologie sont indiqueacutees dans la partie 121 La preacutesentation de lameacutetrologie active sera reacutealiseacutee dans la section 122 suivie par celle de la meacutetrologie pas-sive dans la section 123 La comparaison entre la meacutetrologie active et passive termineracette preacutesentation et sera faite dans la partie 124 Pour conclure ce chapitre une synthegraveseest reacutealiseacutee par la section 13 dans laquelle nous tirons les enseignements pour mener deseacutetudes depuis et vers La Reacuteunion

11 Le controcircle de congestion TCP et les reacuteseaux agrave grande capa-citeacute de stockage

TCP est un protocole de transport creacuteeacute en 1980 et deacutecrit pour la premiegravere fois dans le[RFC793] il a subi depuis de nombreuses eacutevolutions comme lrsquoindique le [RFC7414] Lesuccegraves de TCP repose sur son service de transmission fiable et ordonneacutee drsquoun flux de don-neacutees asynchrones Crsquoest un protocole fonctionnant de point agrave point et de bout en bout au-trement dit entre lrsquoeacutemetteur et le reacutecepteur des donneacutees sans concerner les eacutequipementsintermeacutediaires TCP offre un service de communication eacutequivalent agrave un canal virtuel bi-directionnel entre 2 entiteacutes applicatives Le canal de communication se caracteacuterise par satransparence seacutemantique crsquoest-agrave-dire par lrsquoabsence drsquoalteacuteration des donneacutees transfeacutereacuteesPour reacutealiser cette fiabiliteacute de lrsquoeacutechange TCP supervise les eacutechanges de donneacutees par desacquittements (Acknowledgement (ACK)) Cette supervision forme une boucle de controcirclecorrespondant agrave lrsquoeacutemission de donneacutees et agrave la reacuteception de lrsquoacquittement correspondantElle se caracteacuterise par le deacutelai pris nommeacute RTT La correction des donneacutees perdues oualteacutereacutees en cours de transit srsquoeffectue par retransmission de ces donneacutees Si le principe defonctionnement de TCP srsquoeacutenonce facilement sa mise en œuvre est complexe du fait de lanon fiabiliteacute du protocole IP sous-jacent et de la diversiteacute des contextes drsquoutilisation deTCP Lrsquoarticle [Ros2005] deacutetaille les diffeacuterentes caracteacuteristiques du protocole lieacutees agrave lrsquoeacuteta-blissement de connexion la numeacuterotation des donneacutees et agrave la fiabilisation des eacutechanges

Outre lrsquoobjectif de fiabiliteacute TCP a aussi un objectif de performance pour le servicerendu en termes de deacutebit eacutecouleacute et drsquoutilisation des capaciteacutes de transmission du reacuteseauPour atteindre cet objectif pour le service TCP integravegre une fonction de controcircle de flux quirepose sur une fenecirctre glissante geacutereacutee par le reacutecepteur Ainsi le deacutebit drsquoeacutemission peut srsquoali-gner sur le deacutebit de reacuteception de sorte qursquoun reacutecepteur lent ne puisse ecirctre satureacute par unexpeacutediteur rapide La speacutecification initiale de TCP a eacuteteacute conccedilue sans prendre en compteles ressources du reacuteseau Cet oubli a eacuteteacute agrave la source de dysfonctionnements seacutevegraveres du reacute-seau comme lrsquoeffondrement ducirc agrave la congestion (congestion collapse) [Afanasyev2010] Lafonction de controcircle de congestion vise agrave une prise en compte des ressources disponiblesdu reacuteseau et agrave leurs utilisations efficaces Le controcircle de congestion a susciteacute un travail derecherche intensif et ce sujet reste encore drsquoactualiteacute comme lrsquoindique le [RFC6077]

111 Controcircle de congestion de TCP

Drsquoapregraves [Jain1990] la congestion srsquoexprime par lrsquoeacutequation matheacutematique 11

10

sumDemande gt Ressources (11)

Du point de vue drsquoun reacuteseau par commutation de paquets les ressources sont princi-palement les meacutemoires tampon des nœuds de commutation et la capaciteacute de transmissiondes artegraveres de communication La congestion apparaicirct au niveau des nœuds de commu-tation et plus particuliegraverement sur leurs interfaces de sortie La condition pour voir ap-paraicirctre une congestion est laquo si la somme des deacutebits des flux arrivant sur lrsquointerface desortie est supeacuterieure agrave la capaciteacute de transmission du lien en sortie raquo Dans cette situationune file drsquoattente se constitue et quand elle deacuteborde les effets neacutefastes de la congestionse concreacutetisent A savoir que le taux de pertes des paquets augmente dans le reacuteseau cequi se traduit au niveau du service par un deacutebit eacutecouleacute qui chute et un deacutelai de trans-fert qui augmente Dans [Chiu1989] les auteurs montrent que la performance du reacuteseauest lieacutee agrave la charge appliqueacutee au reacuteseau Formellement la charge srsquoexprime comme tauxdrsquoarriveacutee sur le taux de service Informellement la charge repreacutesente la proportion de lademande autrement dit du trafic eacutemis par rapport agrave la capaciteacute de transfert La figure11 illustre lrsquoeacutevolution du deacutebit eacutecouleacute (throughput) et du RTT en fonction de la chargeappliqueacutee au reacuteseau (load) Au deacutebut le deacutebit eacutecouleacute srsquoaccroicirct avec la charge alors queles deacutelais nrsquoaugmentent presque pas On est dans une phase de remplissage des liensLorsque la charge srsquoapproche du taux de remplissage maximum des liens du reacuteseau Ledeacutebit eacutecouleacute nrsquoaugmente presque plus alors que les deacutelais augmentent fortement Crsquoestla phase de remplissage des files drsquoattente Ces deux phases sont seacutepareacutees par un pointcaracteacuteristique qui srsquoappelle le point drsquoinflexion (knee) Lorsque les files drsquoattente sontpleines et que la charge du reacuteseau continue de srsquoaccroicirctre les files drsquoattente vont deacutebor-der Agrave partir de ce point appeleacute le point de retournement (cliff ) le reacuteseau rentre dans lrsquoeacutetatdit drsquoeffondrement ducirc agrave la congestion (congestion collapse)

FIGURE 11 ndash Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989])

Lrsquoeffondrement ducirc agrave la congestion est rapporteacute par [Nagle1984] Dans cet eacutetat le reacute-seau enregistre des retransmissions abusives effectue des transferts avec des deacutelais ten-dant vers lrsquoinfini et rend un service avec un deacutebit eacutecouleacute proche de zeacutero Lrsquoeffondrementducirc agrave la congestion srsquoexplique par le gaspillage des ressources utiliseacutees en amont du point

11

de perte du paquet La solution agrave lrsquoeffondrement ducirc agrave la congestion reacuteside en lrsquoalignementdu deacutebit de lrsquoeacutemetteur agrave la capaciteacute drsquoeacutecoulement du canal de communication offert parle reacuteseau afin de ne produire aucune perte Ainsi les objectifs assigneacutes au controcircle decongestion de TCP sont drsquoeacuteviter lrsquoeacutetat drsquoeffondrement ducirc agrave la congestion drsquoallouer eacutequi-tablement les ressources du reacuteseau entres les flux concurrents et drsquooptimiser les perfor-mances obtenues par chaque flux [RFC2914]

Le controcircle de congestion de TCP fonctionne sur le principe de la boucle fermeacutee avecle reacuteseau vu comme une boicircte noire ainsi preacutesenteacute par la figure 12 Apregraves une stimu-lation sous la forme de lrsquoenvoi de paquets lrsquoobservation du comportement de la boicirctenoire agrave ce stimulus sera analyseacute par le controcircleur situeacute dans lrsquoeacutemetteur Le controcircleur rap-proche lrsquoobservation faite en retour du stimulus (feedback) par rapport agrave lrsquoobjectif affecteacuteau controcircleur Celui-ci par reacutetro-action ajustera le nombre des paquets suivants envoyeacutesCet ajustement est le reacutesultat drsquoune fonction de controcircle qui se base sur une perceptionbinaire des retours agrave savoir absence ou preacutesence de congestion

FIGURE 12 ndash Boucle fermeacutee du CC de TCP

Dans [Gevros2001] lrsquoauteur liste les moyens pour effectuer les observations que lrsquoonnomme en fait des notifications dans le contexte des reacuteseaux Les notifications de lacongestion dans le reacuteseau peuvent ecirctre implicites ou explicites Dans le premier caselles sont deacuteduites par lrsquoabsence drsquoACK Lrsquoaugmentation des deacutelais et les pertes des don-neacutees sont des causes possibles pour la non-reacuteception de lrsquoACK A lrsquoinverse lrsquoabsence decongestion est deacuteduite par la reacuteception drsquoun ACK Cette reacuteception autorise lrsquoenvoi drsquounnouveau paquet comme le montre [Jacobson1988-1] Les notifications peuvent ecirctre ex-plicites si les paquets veacutehiculent une marque mise par lrsquoeacuteleacutement congestionneacute commecrsquoest le cas avec la proposition Explicit Congestion Notification (ECN) [RFC3168] Nous re-viendrons sur cette proposition dans la sous-section 113 Lorsque le controcircleur deacuteduitla preacutesence de congestion il reacuteduit le deacutebit drsquoeacutemission de la source Le deacutebit est controcircleacuteagrave lrsquoaide drsquoune fenecirctre appeleacutee la fenecirctre de congestion (Congestion Window (CWND) ω)Elle indique la quantiteacute de donneacutees qui peut ecirctre eacutemise sur un RTT Autrement dit elleindique combien de donneacutees non acquitteacutees peut recevoir le canal de communicationSa taille eacutevolue dans le temps en fonction de lrsquoeacutetat du reacuteseau et selon une fonction decontrocircle Additive Increase and Multiplicative Decrease (AIMD) La fenecirctre drsquoeacutemission uti-liseacutee par un eacutemetteur TCP est le minimum entre la fenecirctre de congestion et la fenecirctreglissante du controcircle de flux Le controcircle de congestion comporte deux phases distinctes[Gevros2001]

mdash La premiegravere phase se nomme eacutevitement de la congestion (congestion avoidance) et sesitue autour du point drsquoinflexion de la figure 11

mdash La seconde phase se nomme reacutesolution de la congestion (congestion recovery) Ellese deacuteclenche quand lrsquoeacutetat du reacuteseau se situe au delagrave du point drsquoinflexion

Dans la phase de congestion avoidance le controcircle de congestion de TCP utilise deux al-gorithmes le deacutemarrage en douceur (slow-start (SS)) et lrsquoeacutevitement de congestion (conges-tion avoidance (CA)) Au deacutebut de la connexion TCP nrsquoa aucune connaissance de lrsquoeacutetat dureacuteseau autrement dit de lrsquoeacutetat du canal de communication entre lrsquoeacutemetteur et le reacutecep-teur TCP utilise lrsquoalgorithme du deacutemarrage en douceur pour sonder le canal Lrsquoobjectif

12

est drsquoatteindre le point drsquoinflexion rapidement et sans risquer de congestionner le canalpar des rafales Pour cela lrsquoalgorithme du deacutemarrage en douceur va eacutetaler sur plusieursRTT la croissance de la taille fenecirctre de congestion jusqursquoagrave atteindre une estimation dupoint drsquoinflexion Ainsi lrsquoeacutemetteur commence avec une fenecirctre de congestion assez pe-tite et lrsquoouvre au fur et agrave mesure et de plus en plus vite avec lrsquoarriveacutee des acquittementsPlus preacuteciseacutement le rythme de croissance de la taille de la fenecirctre de congestion est surle doublement tous les RTT Quant la fenecirctre de congestion atteint un certain seuil noteacuteslow-start threshold (ssthresh) le deacutemarrage en douceur srsquoarrecircte et lrsquoalgorithme drsquoeacutevite-ment de congestion est maintenant utiliseacute Cet algorithme augmente lineacuteairement et pluslentement que le deacutemarrage en douceur la taille de la fenecirctre de congestion En lrsquoabsencedrsquoindication explicite par le reacuteseau du deacutebit disponible sur le canal de communicationlrsquoeacutemetteur TCP continue de faire le sondage du canal et veacuterifie si le deacutebit eacutecouleacute peut ecirctreencore augmenteacute Pour lrsquoauteur de [Sallantin2014] lorsque la connexion TCP utilise lrsquoal-gorithme drsquoeacutevitement de congestion elle entre alors dans un eacutetat stable Dans cet eacutetat laconnexion doit se deacuterouler avec un deacutebit eacutecouleacute eacuteleveacute Crsquoest une indication que le pointdrsquoinflexion est atteint

La figure 13 donne une repreacutesentation simplifieacutee des eacutetats du controcircle de congestionde TCP Elle indique que lrsquoeacutetat stable peut ecirctre quitteacute si la connexion est libeacutereacutee ou si ily a un eacuteveacutenement de congestion TCP assimile les pertes implicitement agrave un eacuteveacutenementde congestion Lrsquoeacuteveacutenement de congestion fait basculer le controcircle de congestion de TCPdans la phase de reacutesolution de la congestion Dans cette phase la reprise de la perte oudes pertes est effectueacutee et la taille de la fenecirctre de congestion est diminueacutee et ceci afin dediminuer le deacutebit drsquoeacutemission

On distingue deux faccedilons de deacutetecter un eacuteveacutenement de congestion Une meacutethodesrsquoappuie sur la reprise de perte de TCP par retransmission des donneacutees perdues sur ex-piration drsquoun temporisateur (Retransmission TimeOut (RTO)) Une autre meacutethode utilisela caracteacuteristique de TCP qui consiste agrave ce que le reacutecepteur envoie un acquittement agravechaque segment de donneacutees reccedilu en seacutequence Ce segment porte le numeacutero des derniegraveresdonneacutees reccedilues seacutequentiellement Ainsi la reacuteception de donneacutees entraicircnant une rupturede la numeacuterotation en seacutequence geacutenegravere lrsquoeacutemission drsquoun acquittement dupliqueacute (Dupli-cate Acknowledgement (DupAck)) par le reacutecepteur Agrave la reacuteception de trois DupAck parlrsquoeacutemetteur les donneacutees indiqueacutees par la rupture de seacutequencement sont consideacutereacutees per-dues et retransmises sans attendre lrsquoexpiration du RTO Ce principe de retransmissionrapide porte le nom de fast retransmit (FR) Lrsquoalgorithme de reacutecupeacuteration rapide (fast reco-very (FR)) va maintenir la quantiteacute de donneacutees en transit dans le canal de communicationpour eacuteviter lrsquoeacutemission drsquoune rafale lorsqursquoun nouvel acquittement sera reccedilu En lrsquoabsencedu fast recovery agrave la reacuteception drsquoun nouvel acquittement la fenecirctre pourrait se vider parune rafale correspondant agrave des eacutemissions de paquets de donneacutees dos agrave dos sur un deacute-bit supeacuterieur agrave celui du deacutebit drsquoeacutecoulement du canal Ceci aurait pour effet de saturer lecanal et de renvoyer la connexion TCP dans une phase de reacutesolution de la congestion

Lorsque les eacutemissions de lrsquoeacutemetteur sont bloqueacutees par des donneacutees eacutemises et jamaisacquitteacutees le blocage est rompu par le RTO et ceci quel que soit lrsquoeacutetat Les deacutetails dela mise en œuvre des algorithmes du controcircle de congestion TCP sont deacutecrits par le[RFC5681]

Historiquement la version deacutenommeacutee TCP Tahoe incorporait la fonction de controcirclede congestion deacuteveloppeacutee en 1888 Elle comportait les algorithmes de slow-start conges-tion avoidance et de fast retransmit [Jacobson1988-1] La reprise de perte par fast retransmitsouffrait drsquoinefficaciteacute elle a eacuteteacute corrigeacutee avec lrsquoalgorithme du fast recovery Cette versionagrave quatre algorithmes est la version connue sous le nom de Reno et publieacutee la premiegraverefois en 1997 par le [RFC2001] Le couplage fast retransmit - fast recovery souffrait de deacutefauts

13

Deacutebut13

de13

connexion

Deacutemarrage13

en13

douceur

Etat13

stable

FRFR

Fin13

de13

connexion

3 Dupack

nouvel 13

ack

RTO

RTO

cwnd gt ss

tresh

SYN13

SYNACK

FIN-FINACK

FIGURE 13 ndash Etats du controcircle de congestion de TCP

lorsqursquoun eacuteveacutenement de congestion comportait plusieurs pertes Le [RFC2582] apportaitun correctif en 1999 On parla alors de version NewReno du controcircle de congestion En2005 une eacutetude montra que crsquoeacutetait la version du controcircle de congestion de TCP la plusutiliseacutee sur lrsquoInternet [Medina2005] Depuis de nouvelles versions ont eacuteteacute deacuteployeacutees dansles systegravemes drsquoexploitation tels que Windows et Linux appeleacutes respectivement C-TCP[Tan2006] et CUBIC [Ha2008] Dans la section 112 ces versions seront deacutetailleacutees

Le fonctionnement caracteacuteristique du controcircle de congestion de TCP est illustreacute parla figure 14 extraite de [Huston2000] Elle montre lrsquoeacutevolution de la fenecirctre de conges-tion dans le temps (exprimeacutee en terme de RTT) sur un canal de communication virtuelentre 2 stations Il srsquoagit ici drsquoun sceacutenario ideacutealiseacute dans lequel la connexion TCP nrsquoest pasen concurrence avec drsquoautres connexions La congestion se produit toujours agrave la mecircmevaleur de fenecirctre et pour laquelle la file drsquoattente deacuteborde Cette figure montre les deuxcaracteacuteristiques du controcircle de congestion de TCP qui deacutecoulent de la phase drsquoeacutevitementde congestion et de reacutesolution de la congestion et qui sont

mdash Lrsquoagressiviteacute elle provient du sondage du canal de communication LrsquoeacutemetteurTCP va chercher agrave accroicirctre le deacutebit eacutecouleacute en augmentant graduellement son deacutebitdrsquoeacutemission par lrsquoagrandissement de la taille de la fenecirctre de congestion

mdash La reacuteactiviteacute lorsque le canal de communication est plein et qursquoil deacuteborde quandcette perte est deacutetecteacutee lrsquoeacutemetteur TCP reacuteagit et diminue la taille de sa fenecirctre afinde diminuer son deacutebit drsquoeacutemission

Ces deux caracteacuteristiques donnent cette figure en dents de scie de la fenecirctre de conges-tion

112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de sto-ckage

Un reacuteseau agrave forte capaciteacute de stockage est un reacuteseau avec un produit deacutelai-bandepassante (Bandwidth Delay Product (BDP)) eacuteleveacute Dans lrsquoouvrage [Peterson2007] lrsquoauteureffectue une analogie du produit deacutelai-bande passante avec un tuyau Le deacutelai corres-pond agrave la longueur du tuyau et la bande passante au diamegravetre du tube Ainsi le BDPest le volume du tube Dans le cas drsquoun reacuteseau informatique le volume du tuyau srsquoex-prime en bits Ainsi lorsqursquoun canal de communication entre un eacutemetteur et un reacutecepteurpreacutesente un produit deacutelai-bande passante important un volume important de bits (autre-ment dit de donneacutees) peut ecirctre eacutemis avant de recevoir une notification Du point de vue

14

FIGURE 14 ndash Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP

de lrsquoeacutemetteur TCP ce volume de donneacutees injecteacute dans le reacuteseau sont des donneacutees nonencore acquitteacutees Les reacuteseaux qui offrent des canaux de communication avec un pro-duit deacutelai-bande passante important sont nommeacutes en anglais Long Fat Network (LFN) Le[RFC1072] preacutecise qursquoun LFN agrave un produit deacutelai-bande passante supeacuterieur agrave 12 5 Ko

Sachant que le controcircle de congestion de TCP srsquoappuie sur une reacutetro-action selon unepeacuteriode de RTT et que le deacutebit eacutecouleacute maximal est atteint lorsque la fenecirctre drsquoeacutemissionest au moins supeacuterieure au produit deacutelai(RTT)-bande passante du canal de communica-tion lrsquoutilisation de TCP sur un reacuteseau LFN a des conseacutequences neacutegatives sur la perfor-mance Les causes sont agrave chercher du cocircteacute du RTT et du produit deacutelai-bande passante quiprennent tous les deux des valeurs importantesDans le cas du RTT crsquoest le deacutelai de reacuteactiviteacute de TCP qui est impacteacute En effet quandle RTT est eacuteleveacute la dynamique de TCP est ralentie car lrsquoeacutemetteur TCP doit attendre pluslongtemps pour recevoir un ACK et savoir quoi faire par la suite

Pour ce qui concerne le produit deacutelai-bande passante crsquoest le deacutebit eacutecouleacute qui peutecirctre faible par rapport au deacutebit du canal de communication (sa bande passante) La fe-necirctre drsquoeacutemission de TCP nrsquoatteint pas la valeur du produit deacutelai-bande passante lrsquoeacutemet-teur se trouve alors bloqueacute en attente de lrsquoACK pour eacutemettre de nouvelles donneacutees Cespeacuteriodes de blocage concourent agrave faire chuter le taux drsquoutilisation du canal de communi-cation

Par la suite nous allons deacutetailler les conseacutequences de la faible reacuteactiviteacute et drsquoune fe-necirctre drsquoeacutemission importante agrave atteindre sur lrsquoefficaciteacute de TCP La probleacutematique se poseen terme de deacutemarrage de connexion et son implication pour le transfert des flots courtsde taille maximale possible de la fenecirctre de congestion et de reacutesolution de la congestion

Le deacutemarrage de connexion

Le deacutebut des connexions de TCP se fait agrave lrsquoaide de lrsquoalgorithme du deacutemarrage en dou-ceur Nous avons vu preacuteceacutedemment que ce meacutecanisme double la fenecirctre de congestionen un RTT Lorsque la fenecirctre de congestion atteint la valeur seuil ssthresh lrsquoalgorithmedrsquoeacutevitement de congestion est utiliseacute La valeur initiale du seuil est fixeacutee arbitrairementce qui soumet TCP agrave deux problegravemes Le doublement de la fenecirctre de congestion quandelle atteint des valeurs importantes constitue des increacutements avec une granulariteacute de plusen plus grosse Si la valeur de ssthresh est trop grande par rapport au BDP avec un grosincreacutement le deacutepassement du BDP peut conduire agrave eacutemettre trop de paquets causantdes pertes multiples induisant une augmentation de la latence et une reacuteduction du deacute-bit eacutecouleacute Dans le cas ougrave la valeur du ssthresh est trop basse par rapport au BDP la

15

connexion TCP va utiliser preacutematureacutement lrsquoalgorithme drsquoeacutevitement de congestion avecune increacutementation lineacuteaire Ce changement preacutematureacute aura pour conseacutequence une sous-utilisation de lrsquoalgorithme de deacutemarrage en douceur speacutecialement dans le cas ougrave le BDPest tregraves eacuteleveacute [Wang2004]

Le deacutemarrage de connexion est particuliegraverement important pour les flots courts TCP(short lived TCP flow) Un flot court TCP se deacutefinit comme un flot dont la taille est in-feacuterieure ou eacutegale agrave 10 segments TCP [Sallantin2014] La probleacutematique des flots courtsprovient du fait qursquoils nrsquoont pas assez de donneacutees pour quitter lrsquoeacutetape du deacutemarrage endouceur En effet la taille de la fenecirctre de congestion nrsquoa pas le temps drsquoatteindre la va-leur du produit deacutelai-bande passante que la totaliteacute des donneacutees ont eacuteteacute transmises Laconseacutequence est qursquoils ont fonctionneacute avec une fenecirctre de congestion qui est resteacutee rela-tivement petite Dans le cas drsquoun LFN le rapport de la taille de la fenecirctre de congestionsur le produit deacutelai-bande passante tend vers zeacutero et neacutecessite plusieurs RTT Il srsquoensuitque le deacutebit eacutecouleacute est extrecircmement faible De plus si le flot court souffre drsquoun eacuteveacutene-ment de congestion il sera particuliegraverement peacutenaliseacute Il a de fortes chances que la reprisesrsquoeffectue avec un RTO avec un deacutelai maximum de 1 agrave 3 secondes [RFC6298] Ce genrede flots nrsquoa pas toujours assez de donneacutees eacutemises apregraves la perte pour geacuteneacuterer trois Du-pAck et proceacuteder agrave une reprise par fast retransnmit Comme ces flots repreacutesentent drsquoapregraves[Ciullo2009] 90 des flux preacutesents dans lrsquoInternet leur sous-performance sur les LFN estprobleacutematique

La reacutesolution de la congestion

TCP deacutetecte une perte par lrsquoexpiration du RTO ou par la reacuteception de trois DupAckTCP va reacuteagir en deux temps en renvoyant le paquet perdu et en divisant par deux lafenecirctre de congestion Si la taille de la fenecirctre est importante la division par deux vaentraicircner une chute significative de la capaciteacute drsquoenvoi Par rapport au produit deacutelai-bande passante cette division par deux peut entraicircner une sur-reacuteaction de lrsquoeacutemetteur Ledeacutebit eacutecouleacute apregraves un eacuteveacutenement de congestion peut devenir faible et se pose le problegravemede la dynamique de sondage

Dynamique du sondage

TCP a un objectif de performance en terme de deacutebit eacutecouleacute et drsquoutilisation des capa-citeacutes de transmission du reacuteseau TCP possegravede un comportement conservateur Avec lafonction de controcircle AIMD TCP aura besoin drsquoun cycle eacutegal agrave ω2 RTT pour reacutecupeacutererune taille de fenecirctre eacutegale agrave celle avant reacuteduction Dans les reacuteseaux agrave forte capaciteacute destockage TCP tend agrave ecirctre trop prudent agrave ouvrir sa fenecirctre de congestion trop lentementLa capaciteacute de stockage importante demande un nombre de cycles important pour quela fenecirctre de congestion puisse couvrir le BDP Durant ce temps il est important de nepas avoir de pertes Lrsquoexemple donneacute par le [RFC3649] preacutesente un reacuteseau agrave une capa-citeacute de 10 Gbits un deacutelai de 100 ms et une taille de paquets drsquoun maximum de 1500octets Cela demanderait un eacutechange drsquoune dureacutee de deux heures environ De plus la to-taliteacute des paquets devront ecirctre transmis dans la dureacutee indiqueacutee preacuteceacutedemment Le tauxde perte maximal permettant lrsquousage de la totaliteacute de la bande passante est de lrsquoordrede 10minus10 Crsquoest un taux de perte irreacutealiste Il faut donc appliquer une autre fonction decontrocircle pour utiliser efficacement la capaciteacute des liens et pour reacutepondre rapidement auxchangements drsquoeacutetats du reacuteseau

16

113 Un controcircle de congestion de TCP adapteacute aux LFN

Pour rappel dans la partie 111 nous avons vu que le controcircle de congestion de TCPse deacutecoupait en deux phases La premiegravere phase de congestion avoidance comporte les al-gorithmes de sondage alors que la seconde phase dite de congestion recovery comporte lesalgorithmes de reacutesolution de la congestion Nous preacutesentons les propositions qui visentagrave changer le controcircle de congestion de TCP sur ces deux phases pour les adapter auxcontraintes des LFN et donc traiter les problegravemes que nous avons mis en eacutevidence dansla sous-section 112 Lrsquoutilisation de TCP sur des reacuteseaux agrave forte capaciteacute de stockage asusciteacute des propositions qui sont classeacutees dans le tableau 11 Ces propositions vont ecirctredeacutetailleacutees dans la suite de ce manuscrit

TABLE 11 ndash Tableau de synthegravese des propositions

Phase Problegraveme SolutionsCongestion avoidance Deacutemarrage de

connexionInitial Spreading Reacuteduc-tion du RTO Quick-startJump Start

Congestion recoveryReacutesolution decongestion

MulTCP

Dynamique dusondage

HighSpeed TCP C-TCPBIC CUBIC

Le deacutemarrage de connexion

Lrsquoideacutee de la premiegravere solution est de reacuteduire le nombre de cycles au deacutemarrage drsquounflot Le doublement de la taille lorsque la fenecirctre de congestion vaut 2 segments parexemple conduit agrave un increacutement qui reste faible sur un RTT Le principe de la premiegraveresolution est drsquoaugmenter la taille initiale de la fenecirctre de congestion (Initial Window (IW))[RFC6928] Avec une taille initiale de fenecirctre de congestion eacutequivalent agrave 10 Maximun Seg-ment Size (MSS) lrsquoeacutemetteur peut transmettre degraves le deacutebut de connexion une rafale de 10segments Parmi les avantages de cette solution on peut citer la reacuteduction de la latencedu transfert de donneacutees en consideacuterant que le canal ne sera pas congestionneacute Un des in-conveacutenients de cette solution est la possibiliteacute de congestionner la file drsquoattente du goulotdrsquoeacutetranglement Afin de reacutesoudre ce problegraveme [Sallantin2014] propose lrsquoInitial SpreadingCette proposition combine lrsquoaugmentation de la fenecirctre drsquoeacutemission et le meacutecanisme drsquoes-pacement meacutecanisme limitant la preacutesence de rafales Ces travaux ont fait lrsquoobjet drsquouneproposition aupregraves de lrsquoInternet Engineering Task Force (IETF) [Arnal2014]

La deacutetection drsquoune perte au deacutepart du deacutemarrage en douceur se fait agrave travers lrsquoex-piration du RTO soit trois secondes Pour ameacuteliorer la reprise sur erreur le [RFC6298]propose de reacuteduire la dureacutee du RTO agrave une seconde Cette reacuteduction du RTO autorise uneretransmission plus rapide des paquets perdus et apporte un gain relativement importantpour des flots qui ont une latence tregraves faible comme celle des flots courts

Une autre solution eacutevalueacutee par [Scharf2008-1] et deacutecrite par le [RFC4782] se nommeQuick-start Lrsquoeacutemetteur eacutemet une requecircte contenant le deacutebit drsquoeacutemission qursquoil souhaite uti-liser Chaque nœud traverseacute peut alors accepter rejeter ignorer ou modifier la requecircteen fonction de son deacutebit disponible Pour bien fonctionner ce meacutecanisme de neacutegociationneacutecessite que lrsquoensemble des routeurs traverseacutes aient reacutepondu agrave la requecircte La figure 15compare les performances du deacutemarrage en douceur (en rouge) et de Quick-start sur unteacuteleacutechargement vu depuis le serveur Le serveur a eacutemis deux requecirctes la premiegravere agrave undeacutebit de 8192 Mbits (en vert) et lrsquoautre pour un deacutebit drsquoune valeur de 512 Mbits (en

17

bleu) Lrsquoaxe des abscisses repreacutesente la latence (dureacutee de la connexion) depuis lrsquoeacutemissionde la demande drsquoeacutetablissement de connexion et en ordonneacutee le deacutebit drsquoeacutemission Les deacute-bits ont eacuteteacute calculeacutes agrave partir de la quantiteacute de donneacutees moyenne eacutemises en un RTT Les reacute-sultats montrent des performances supeacuterieures de Quick-start par rapport au deacutemarrageen douceur En effet une requecircte de Quick-start avec un deacutebit suffisamment eacuteleveacute per-met drsquoatteindre rapidement lrsquoutilisation maximale de la bande passante disponible Ledeacutemarrage en douceur limite la croissance du deacutebit drsquoeacutemission On remarque eacutegalementque si la valeur seuil du deacutemarrage est trop basse le deacutebit drsquoeacutemission croicirct beaucoupmoins rapidement (lien en pointilleacute sur la figure 15) Quick-start reste performant sur lesflots courts en appliquant un deacutebit drsquoeacutemission qui sera eacutequivalent agrave un flot long

FIGURE 15 ndash Principe de Quick-Start (Source [Scharf2008-1])

Dans lrsquoarticle [Liu2007] lrsquoauteur preacutesente Jump Start Cette proposition reacutealise uneestimation des donneacutees precirctes agrave ecirctre envoyeacutees ainsi que du RTT Lrsquoobjectif est drsquoeacutemettreles segments de faccedilon reacuteguliegravere en un RTT Ce meacutecanisme srsquoavegravere trop agressif dans lesenvironnements congestionneacutes Le nombre de segments envoyeacutes en un RTT peut ecirctreimportant et ainsi causer de seacutevegraveres deacutegradations de performance

La reacutesolution de la congestion

Quand TCP a atteint lrsquoeacutetat stable et qursquoune perte est deacutetecteacutee la fenecirctre de conges-tion va ecirctre diviseacutee par deux Cette reacuteduction diminuera le deacutebit eacutecouleacute Il est importantpour TCP drsquoecirctre reacuteactif vis agrave vis des pertes Pour cela de nouveaux algorithmes doiventecirctre mis en place dans la phase drsquoeacutevitement de congestion Ces algorithmes devront ecirctrereacuteactifs aux pertes mais sans sur-reacuteagir Ces nouveauteacutes doivent permettre de retrouverrapidement un deacutebit eacutecouleacute important

Lorsque plusieurs flux TCP empruntent une route congestionneacutee ils sont soumis aumecircme taux de pertes Le but eacutetant de reacutepartir eacutequitablement la bande passante dispo-nible Une approche de diminution moins agressive de la fenecirctre de congestion consistea reacutealiser des connexions TCP parallegraveles Lrsquoobjectif est drsquoavoir un flux TCP se comportantcomme lrsquoagreacutegation de plusieurs flux

Dans lrsquoarticle [Crowcroft1998] les auteurs proposent une version du controcircle de conges-tion de TCP qui se comporte drsquoune maniegravere eacutequivalente agrave N sessions TCP parallegraveles Ilsrsquoagit de MulTCP MulTCP geacutenegravere un flux TCP unique ougrave les sessions virtuelles sont reacute-parties uniformeacutement afin drsquoobtenir le reacutesultat maximal en terme de deacutebit Le controcircle decongestion de TCP change lorsqursquoil utilise lrsquoalgorithme drsquoeacutevitement de congestion et qursquoil

18

deacutetecte un eacuteveacutenement de congestion (par deacutetection drsquoau moins une perte drsquoun segmentdans une fenecirctre de congestion) Les eacutequations suivantes sont utiliseacutees dans chacun descas MulTCP

ACK ω larr ω +N

ω

DROP ω larr ω times (1minus 1

2N)

(12)

En eacutevitement de congestion lorsqursquoun ACK est reccedilu MulTCP augmente sa fenecirctre decongestion (ω) de N segments par RTT Lors de la perte de segments (DROP) MulTCPreacuteduit sa fenecirctre de ω(2N) plutocirct que la valeur par deacutefaut de ω2 La figure 16 montrelrsquoeacutevolution de la fenecirctre de congestion de MulTCP par rapport agrave TCP On voit sur la fi-gure 16 que MulTCP a de meilleures performances qursquoun flux TCP normal Lorsque lesperformances sont combineacutees le reacutesultat est supeacuterieur agrave un flux unique

FIGURE 16 ndash Simulation de MulTCP avec N=5 (Source [Huston2006])

Dynamique du sondage

Lrsquoobjectif de lrsquoeacutemetteur de TCP est drsquoenvoyer le plus de donneacutees le plus vite possibleMais agrave condition qursquoelles arrivent sans produire de la congestion sinon les donneacutees se-ront perdues et il faudra les reacute-eacutemettre Il faut eacutegalement tenir compte des autres flotsen partageant eacutequitablement les ressources du reacuteseau Une approche pour traiter le pro-blegraveme de la dynamique du sondage consiste agrave changer la fonction de controcircle de TCP

Lrsquoobjectif de HighSpeed-TCP (HS-TCP) est drsquoatteindre les hauts deacutebits en ayant desperformances comparables agrave TCP classique dans les environnements agrave faible BDP [RFC3649]La version du controcircle de congestion HighSpeed-TCP utilise le meacutecanisme drsquoAdditive In-crease and Multiplicative Decrease combineacute agrave un facteur calculeacute en fonction de la taille dela fenecirctre de congestion tel qursquoindiqueacute par les eacutequations 13 En deccedila drsquoun certain seuilde ω la reacuteponse de HighSpeed-TCP est eacutequivalente agrave TCP Reno HS-TCP est limiteacute durantla phase de deacutemarrage en douceur Durant cette phase HS-TCP peut normalement en-voyer un grand nombre de paquets Lrsquoenvoi drsquoun trop grand nombre de donneacutees risquedrsquooccasionner de la congestion Le [RFC3742] propose de limiter agrave 100 paquets la capaciteacutedrsquoenvoi drsquoHS-TCP durant la phase de deacutemarrage en douceur

ACK ω larr ω +α(ω)

ωDROP ω larr (1minus β(ω))times ω

(13)

19

La figure 17 illustre le comportement de la fenecirctre de congestion de HighSpeed-TCPLorsqursquoune perte est deacutetecteacutee la diminution de la fenecirctre est moins importante gracircceau facteur β Le retour a la valeur preacuteceacutedente se fait beaucoup plus rapidement qursquoavecReno ou NewReno (en gris clair sur la figure) gracircce au facteur α Ainsi HS-TCP offre unemeilleure utilisation de la capaciteacute disponible sur le lien

FIGURE 17 ndash Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source [Afanasyev2010])

Dans [Tan2006] lrsquoauteur propose une version de TCP alliant lrsquoapproche pro-activeet reacuteactive Une approche pro-active utilise les variations du RTT pour estimer lrsquoeacutetat dureacuteseau Alors qursquoune approche reacuteactive agit quand lrsquoeacuteveacutenement de congestion srsquoest pro-duit Lrsquoobjectif est de maintenir de bonnes performances sur reacuteseaux avec un haut deacutebitet un grand RTT Compound-TCP (C-TCP) maintient deux fenecirctres de congestion Lrsquounecroicirct de faccedilon lineacuteaire mais deacutecroicirct via un certain coefficient en cas de perte La secondefenecirctre est lieacutee agrave lrsquoapproche pro-active de TCP-Vegas [Brakmo1994] La taille de la fenecirctrede congestion reacuteellement utiliseacutee est la somme des deux fenecirctres Lrsquoeacutequation 14 illustrecette addition

ACK ω larr ωreno + ωfast (14)

Si le RTT est bas alors la fenecirctre ωfast va croicirctre rapidement Si C-TCP rencontre uneperte alors ωreno diminuera rapidement pour compenser lrsquoaugmentation preacuteceacutedente deωfast Ce systegraveme cherche agrave garder une valeur constante de la fenecirctre drsquoeacutemission C-TCPutilise efficacement des liens sur les reacuteseaux agrave forte capaciteacute de stockage C-TCP est sujetau mecircme deacutefaut que TCP-Vegas sur lrsquoexactitude des mesures RTT Si les flux en concur-rence les uns avec les autres dans le reacuteseau observent des valeurs RTT minimales diffeacute-rentes le flux se voyant un RTT plus eacuteleveacute sera beaucoup plus agressif et injuste pourlrsquoautre flux La figure 18 illustre le fonctionnement de la fenecirctre de congestion de C-TCPLa partie convexe de la courbe repreacutesente un fonctionnement plus proche de TCP RenoCela indique donc une valeur de ωfast faible Nous remarquons qursquoapregraves une perte TCPessaye de reacutecupeacuterer rapidement la valeur preacuteceacutedente Lors de pertes multiples la fenecirctrede congestion suit une forme proche agrave ce moment de la courbe de HighSpeed-TCP (voirfigure 17) Ce comportement est la conseacutequence drsquoune valeur eacuteleveacutee de ωfast C-TCP per-met ainsi drsquoatteindre le deacutebit maximum disponible sur le lien tout en lissant sa capaciteacutedrsquoenvoi en se basant sur le RTT C-TCP est la version de TCP installeacutee nativement sur lesystegraveme drsquoexploitation Windows de Microsoft

Lrsquoalgorithme de controcircle de congestion de TCP connu sous le nom Binary IncreaseCongestion control (BIC) vise agrave une convergence rapide [Xu2004] La fenecirctre doit atteindrela taille maximale possible sans qursquoil y ait de pertes Pour cela il met en œuvre une nou-velle fonction du controcircle de la taille de la fenecirctre de congestion La fonction de controcircle

20

FIGURE 18 ndash Comportement de la fenecirctre de congestion de Compound-TCP (Source [Afanasyev2010])

de BIC est structureacutee en trois phases (Additive Increase Binary Search Max Probing) tellesqursquoillustreacutees par la figure 19a Au deacutemarrage de la connexion BIC va increacutementer lineacuteai-rement la fenecirctre de congestion Crsquoest la phase drsquoAdditive Increase

Durant la phase Binary Search BIC va essayer de deacutecouvrir la taille optimale de lafenecirctre de congestion La taille optimale est la taille permettant drsquoeacutemettre le maximum dedonneacutees sans essuyer de pertes Elle se base sur lrsquoeacutetude entre la valeur minimale (ωmin)et la valeur maximale (ωmax) de la fenecirctre de congestion Ces variables vont permettredrsquoaffiner la valeur de la fenecirctre de congestion Au deacutebut de la connexion ωmin est mise agrave1 et ωmax est mis arbitrairement agrave une valeur eacuteleveacutee

Lorsqursquoune perte est deacutetecteacutee la fenecirctre de congestion va ecirctre reacuteduite et prendre pourvaleur la moyenne entre ωmin et ωmax ωmin prend alors pour valeur la taille de la fenecirctrede congestion apregraves reacuteduction et ωmax la valeur de la fenecirctre de congestion avant la perteSi lrsquoeacutecart entre la valeur de la fenecirctre de congestion avant et apregraves la perte est supeacuterieuragrave une constante Smax alors la fonction de controcircle de BIC entre en phase dite AdditiveIncrease Durant cette phase Smax va servir de valeur drsquoincreacutementation pour la fenecirctrede congestion agrave chaque RTT Par la suite et si aucune perte nrsquoest de nouveau deacutetecteacuteela fonction de controcircle de BIC retourne en phase de Binary Search Lrsquoobjectif est de stabi-liser la taille de la fenecirctre aux alentours de la valeur de ωmax rencontreacutee avant la pertepreacuteceacutedente

Lorsque cette valeur est deacutepasseacutee BIC entre dans la phase dite Max Probing Lrsquoaug-mentation de la fenecirctre de congestion est alors lineacuteaire Lrsquoobjectif eacutetant la recherche drsquounnouvel ωmax La figure 19b illustre le fonctionnement de la fenecirctre de congestion dansle temps Lors du deacutebut de connexion BIC se comporte comme Reno avec le meacutecanismedu deacutemarrage en douceur Degraves qursquoune perte est deacutetecteacutee la diminution de la fenecirctre estalors moins agressive qursquoavec Reno Au centre de la courbe nous remarquons la fonctiondrsquoaccroissement avec les trois phases

BIC est un controcircle de congestion performant dans les reacuteseaux agrave forte capaciteacute destockage Neacuteanmoins BIC peut ecirctre trop agressif pour les flux qui ont des courts deacutelaisCela a pour conseacutequence un partage ineacutequitable de la bande passante disponible avec lesflux qui ont des longs deacutelais

Afin de reacutesoudre le problegraveme drsquoiniquiteacute lieacute au RTT lrsquoalgorithme CUBIC propose dechanger la fonction de controcircle de la taille de la fenecirctre de congestion pour la rendreplus agressive La fonction retenue est cubique et son eacutevolution est repreacutesenteacutee par la fi-gure 110a Contrairement agrave la figure drsquoaccroissement de BIC (fig 19a) qui comporte troisphases la fonction drsquoaccroissement de CUBIC nrsquoen compte que deux (fig 110a) Sur lafigure 110b on constate que ces deux phases sont preacutesentes tout au long de lrsquoeacutevolutionde la fenecirctre de congestion de CUBIC Ces deux phases ne sont pas forceacutement conseacute-cutives lrsquoune de lrsquoautre Apregraves la deacutetection drsquoune perte CUBIC va essayer de croicirctre le

21

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez BIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deBIC-TCP (Source [Afanasyev2010])

FIGURE 19 ndash Fonctionnement de BIC TCP

plus rapidement possible jusqursquoagrave ωMax Lorsque ωMax est atteint la taille de la fenecirctre vasrsquoincreacutementer lentement Mais plus la valeur drsquoω est eacuteloigneacutee en taille de ωMax plus lacroissance va srsquoacceacuteleacuterer Lrsquoavantage de CUBIC sur BIC est le remplacement la fonction decontrocircle lineacuteaire par une fonction cubique pour plus drsquoagressiviteacute Lrsquoalgorithme CUBICest deacutecrit par le [RFC8312]

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez CUBIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deCUBIC-TCP (Source [Afanasyev2010])

FIGURE 110 ndash Fonctionnement de CUBIC

114 Controcircle de congestion avec implication des routeurs

Drsquoautres approches ont eacuteteacute eacutetudieacutees pour aider le controcircle de congestion de TCP Cesapproches impliquent les routeurs et ne reposent plus que sur le principe de bout-en-boutpropre agrave TCP

Explicit Congestion Notification (ECN) vise agrave renforcer lrsquoindication drsquoun eacuteveacutenement decongestion [RFC3168] Avec ECN la congestion est signaleacutee avant que la perte drsquoun pa-quet ne se produise Lors de la reacuteception drsquoun paquet indiquant une congestion lrsquoeacutemet-teur va alors reacuteduire sa fenecirctre de congestion et sa fenecirctre drsquoeacutemission La reacuteduction dela capaciteacute drsquoeacutemission de lrsquoeacutemetteur eacutevitera pertes et retransmissions et une reacuteductiondes deacutelais de reprise Lrsquousage de cette option neacutecessite que lrsquoeacutemetteur le reacutecepteur et lesrouteurs du chemin soient capables de geacuterer les notifications explicites Avec ECN lrsquoin-formation de congestion est transmise agrave lrsquoeacutemetteur Aucune indication sur le lieu preacutecisde la congestion est indiqueacutee

eXplicit Control Protocol (XCP) est un protocole de controcircle de congestion utilisantles notifications explicites de deacutebit [Katabi2002] En cela il reprend lrsquoideacutee de Quick-startCependant il se diffeacuterencie par le deacutecouplage opeacutereacute entre la probleacutematique du partageeacutequitable entre les flots et celle de lrsquoefficaciteacute du transfert Dans lrsquoarchitecture de proto-coles XCP se situe entre TCP et IP XCP repose sur un en-tecircte qui va servir aux routeurs

22

traverseacutes pour indiquer le deacutebit drsquoeacutemission pour le flot La valeur drsquoadaptation de la fe-necirctre de congestion est calculeacutee agrave partir des informations contenues dans lrsquoen-tecircte XCPXCP propose un controcircle de congestion qui fonctionne sur un reacuteseau 100 XCP Uneseconde limite est lrsquoiniquiteacute avec les autres protocoles de transport Les performancessont fortement deacutegradeacutees si diffeacuterents protocoles de bout en bout sont exeacutecuteacutes dans lemecircme reacuteseau tels que TCP XCP possegravede de mauvaises performances si des routeurs IPclassiques (non-XCP) se trouvent au niveau du goulot drsquoeacutetranglement

Afin de reacutesoudre le problegraveme drsquointeropeacuterabiliteacute Dans [Lopez2006] lrsquoauteur proposeXCP-interoperable (XCP-i) une version XCP qui garde les meacutecanismes de controcircle XCPsans ajouter drsquoeacutetat de flux Lrsquoobjectif drsquoXCP-i est de deacuteployer XCP sur un reacuteseau com-prenant des routeurs XCP et non-XCP Pour cela XCP-i va fonctionner en deux phasesDans une premiegravere phase il va deacutecouvrir les nuages non-XCP Un nuage non-XCP est unensemble de routeurs non capables de traiter XCP En comparant les champs Time-To-Live(TTL) drsquoIP et drsquoXCP le nombre de routeurs non-XCP preacutesents dans le reacuteseau peut ecirctredeacuteduit La seconde phase consiste agrave deacuteterminer les ressources du nuage non-XCP En ra-joutant un champ last_xcp_routeur XCP-i garde en meacutemoire lrsquoadresse du dernier routeurXCP traverseacute Agrave partir drsquoalgorithmes drsquoestimation de bande passante la bande passantedu nuage non-XCP sera estimeacutee entre les deux nœuds XCP La derniegravere phase pour reacutea-liser une inter-opeacuterabiliteacute complegravete entre routeurs classiques et routeurs XCP consiste agraveprendre en consideacuteration la bande passante estimeacutee dans les calculs du feedback de XCPLe protocole XCP-i va creacuteer un routeur XCP virtuel agrave la place du nuage non-XCP Gracirccea ces meacutecanismes un reacuteseau heacuteteacuterogegravene devient virtuellement homogegravene pour XCP Lesperformances de XCP-i sont comparables agrave celle de XCP [Lopez2006] XCP-i reacutesout leproblegraveme drsquointer-opeacuterabiliteacute de XCP sur des reacuteseaux non 100 XCP

Ces solutions preacutesentent le deacutesavantage de devoir ecirctre deacuteployeacutees eacutegalement au seindes routeurs Le principal avantage de ces solutions est une indeacutependance au deacutelai Lesprobleacutematiques lieacutees au deacutelai que lrsquoon a preacutesenteacutees preacuteceacutedemment sont alors inopeacute-rantes Dans le cadre de La Reacuteunion les deacutelais peuvent ecirctre importants

115 Caracteacuterisation de La Reacuteunion

Lrsquoaugmentation des deacutebits drsquoaccegraves srsquoaccompagne de lrsquoaugmentation de la capaciteacute desliens drsquointerconnexion comme celles des cacircbles sous-marins Malgreacute cette augmentationdes deacutebits le temps de propagation reste inchangeacute Dans cette partie nous deacuteterminonsagrave partir de quel deacutebit un accegraves Internet agrave La Reacuteunion peut ecirctre sujet aux problegravemes ren-contreacutes sur les LFN

Dans la section 21 nous avons vu que La Reacuteunion est raccordeacutee agrave Internet par deuxaccegraves reposant sur des cacircbles sous-marins le SAFE et le LION Le cacircble SAFE est prolongeacutepar le cacircble SAT-3WASC Le temps de propagation (tp) sur un cacircble peut ecirctre estimeacutepar la formule matheacutematique 15 dans laquelle d repreacutesente la distance et c la vitesse depropagation du signal sur le support

tp =d

c(15)

Si nous retenons la route directe entre La Reacuteunion et la France hexagonale qui passepar le plus long des accegraves constitueacute par les cacircbles SAFE et SAT-3WASC Sachant que lecacircble SAFE a une longueur totale de 13 500 km pour aller de lrsquoAfrique du Sud agrave lrsquoAsie Sion fait lrsquohypothegravese que lrsquoicircle de La Reacuteunion se situe agrave une distance eacutequivalente agrave la moitieacutedu cacircble SAFE La longueur du cacircble pour La Reacuteunion est de 6 750 Km La vitesse de

23

propagation du signal pour une fibre optique est eacutegale agrave la vitesse de la lumiegravere (299 792Kms) Lrsquoapplication de la formule 15 donne tp1 avec

tp1 = 12times dSAFEc = 22 52ms (16)

tp1 approxime le temps de propagation entre La Reacuteunion et le point de sortie du cacircbleSAFE en Afrique du Sud ou en Asie Pour obtenir le RTT ce temps est agrave doubler Onobtient alors la valeur RTT1 = 45 04 ms

La seconde partie du trajet de lrsquoAfrique du Sud jusqursquoen Europe emprunte le cacircbleSAT-3WASC Drsquoapregraves [Cablesmap] la longueur du cacircble est de 14 350 Km Le temps depropagation entre lrsquoAfrique du Sud et lrsquoEurope noteacute tp2 srsquoexprime comme

tp2 = (dSATminus3WASC)c = 47 87ms (17)

Le RTT sur ce cacircble est de RTT2 = 95 74 msAu total le RTT incompressible pour joindre lrsquoEurope en passant par les cacircbles SAFESAT-3WASC consiste agrave additionner le RTT de chaque cacircble agrave savoir RTT1 et RTT2 Le RTTincompressible est donc minimal de 140 78ms Ce deacutelai comme nous venons de le calcu-ler ne prend en compte que la propagation Il neacuteglige le temps de transmission du paquetainsi que les temps drsquoattente avant la transmission

Lrsquoeacutetude preacutesenteacutee dans[Anelli2012] a mesureacute un RTT minimal pour les paquets quit-tant lrsquoicircle de La Reacuteunion de 185 ms Ce reacutesultat a eacuteteacute obtenu par une eacutetude de mesuresdepuis les locaux de lrsquoUniversiteacute de La Reacuteunion La figure 111 repreacutesente la Probabi-lity Density Function (PDF) des RTT mesureacutes Cette fonction est compareacutee agrave celle qui estobtenue depuis la France hexagonale et de Paris en particulier On constate une forte si-militude sur la forme des courbes La courbe de La Reacuteunion enregistre un deacutecalage dansle temps de 185 ms par rapport agrave celle de Paris Ce deacutecalage repreacutesente le RTT minimummesureacute pour rejoindre la meacutetropole et acceacuteder agrave lrsquoInternet

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

FIGURE 111 ndash Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

Si lrsquoon considegravere la valeur de BDP de 12 5 Ko indiqueacutee par le [RFC1072] comme lalimite basse drsquoun LFN et si nous reprenons les diffeacuterentes TAI preacutesenteacutees dans la section21 nous pouvons calculer le produit deacutelai-bande passante drsquoun canal de communica-tion entre La Reacuteunion et la meacutetropole Il est fait lrsquohypothegravese pour ce calcul que le goulotdrsquoeacutetranglement est donneacute par lrsquoaccegraves agrave Internet Le tableau 12 preacutesente les reacutesultats ob-tenus

24

TABLE 12 ndash Approximation du produit deacutelai bande passante de la connectiviteacute de LaReacuteunion agrave lrsquoInternet

NomhhhhhhhhhhhhhhhhhhhBande passante

RTT (en secondes)Estimeacute 0141

Mesureacute 0185

Modem56 Kbits 987 o 130 Ko128 Kbits 226 Ko 296 Ko512 Kbits 902 Ko 118 Ko

ADSL1 Mbits 176 Ko 231 Ko8 Mbits 141 Ko 185 Ko20 Mbits 353 Ko 463 Ko

VDSL 50 Mbits 881 Ko 116 Mo

Fibre

35 Mbits 617 Ko 809 Ko100 Mbits 176 Mo 231 Mo200 Mbits 353 Mo 463 Mo

1 Gbits 176 Mo 231 Mo

Le tableau preacutesente en gras les produits deacutelai-bande passante deacutepassant la limite des12 5 Ko Ainsi les reacutesultats sont assez eacuteloquents Degraves que lrsquoon arrive sur un accegraves ADSLavec un deacutebit minimal drsquo1 Mbits nous avons un BDP supeacuterieur agrave la limite fixeacutee par le[RFC1072] Ainsi rapidement lrsquoeacutevolution des deacutebits proposeacutes sur lrsquoicircle et les capaciteacutes descacircbles sous-marins associeacutes agrave un deacutelai eacuteleveacute ont fait de lrsquoInternet reacuteunionnais un reacuteseauqui a les caracteacuteristiques drsquoun LFN

Nous avons vu que TCP est un protocole de transport dont la performance est deacutepen-dante du RTT et du BDP Les deacutelais sont une des caracteacuteristiques des LFN La Reacuteunionest un reacuteseau agrave forte capaciteacute de stockage due agrave des deacutelais importants Il est important demesurer pour comprendre lrsquoimpact de cette caracteacuterisation sur les performances de TCP

12 Meacutetrologie du trafic Internet

Avec lrsquoInternet qui devient de plus en plus gros et de plus en plus complexe la meacutetro-logie est une activiteacute qui vise agrave mieux comprendre le fonctionnement de lrsquoInternet Nousallons dans cette partie du manuscrit preacutesenter les techniques de meacutetrologie appliqueacuteesagrave lrsquoInternet

121 Deacutefinition

Meacutetrologie est un mot composeacute de deux termes grecs Le premier metron signifie lamesure tandis que logos fait reacutefeacuterence agrave la science Par deacutefinition la meacutetrologie deacutesignela science de la mesure Par la suite le terme meacutetrologie fera uniquement reacutefeacuterence agrave la meacute-trologie appliqueacutee aux reacuteseaux informatiquesLa meacutetrologie signifie donc la mesure des caracteacuteristiques drsquoun reacuteseau sous de nombreuxaspects Cette science est devenue un outil indispensable pour avoir une compreacutehensionde divers aspects de lrsquoInternet On peut citer la complexiteacute la qualiteacute de service et laqualiteacute utilisateur la performance du reacuteseau la performance des protocoles le fonction-nement ou encore la validation des modegravelesLa meacutetrologie Internet englobe deux types drsquoactiviteacutes La premiegravere est lrsquoeacutetude des para-megravetres physiques de la qualiteacute de service La seconde consiste a mettre en eacutevidence lesproblegravemes lieacutes agrave lrsquoInternet [Larrieu2010]

25

Dans [Paxson2001] lrsquoauteur preacutesente lrsquoapproche research driven et lrsquoapproche measure-ment driven pour deacutefinir les objectifs drsquoune eacutetude de meacutetrologie Le choix drsquoune approcheva aider une personne souhaitant faire de la meacutetrologie sur la bonne faccedilon drsquoaborderlrsquoeacutetude qursquoelle veut mettre en place

Lrsquoexpression research driven peut ecirctre traduite par axeacutee sur la recherche Elle consisteagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires de lancer les campagnes de mesures et drsquointerpreacuteter les reacute-sultats Une meacutetrique se deacutefinit comme une grandeur mesurable et speacutecifieacutee de maniegravererigoureuse Une bonne meacutetrique doit pouvoir se mesurer de faccedilon reproductible ecirctreutile en pratique pour les utilisateurs et les administrateurs du reacuteseau [RFC2330] Cetteapproche est celle geacuteneacuteralement utiliseacutee par les opeacuterateurs et les groupes de recherchesElle est deacuteveloppeacutee par le groupe de travail IP Performance Metrics (IPPM) de lrsquoIETF Cegroupe de travail a produit de nombreux documents pour deacutefinir les mesures de per-formances Lrsquoapproche research driven comporte un deacutefaut principal En laissant de cocircteacutecertaines meacutetriques des aspects du comportement du reacuteseau ne sont pas eacutetudieacutes Parexemple une eacutetude restreinte aux deacutelais ne peut indiquer les raisons de la variation desdeacutelais dans le temps

Lrsquoapproche measurement driven peut se traduire en la mesure pour la mesure Cettemeacutethode consiste agrave mettre en place une infrastructure de mesures afin de reacutecupeacuterer lemaximum drsquoinformations puis effectuer toutes les analyses possibles sur les traces col-lecteacutees et interpreacuteter les reacutesultats obtenus Une telle meacutethode peut srsquoutiliser lorsque lrsquoonsouhaite mettre en avant le comportement geacuteneacuteral drsquoun lien Cette approche permet agrave ladiffeacuterence de la preacuteceacutedente drsquoanalyser agrave plusieurs reprises une mecircme source de donneacuteesen fonction des reacutesultats obtenus

Le tableau 13 reacutesume les deux approches de conduite de projet en meacutetrologie

TABLE 13 ndash Comparatif entre les approches de meacutetrologie

Research Driven Measurement Driven1 - Meacutetriques deacutefinies preacutealablement2 - Utilisation drsquoun outil adapteacute

1 - Collecte des donneacutees2 - Analyse exhaustive

Ces deux approches sont compleacutementaires lrsquoune de lrsquoautre et srsquoappliquent dans lesdeux classes de techniques de mesures les techniques de mesures actives et les tech-niques de mesures passives

122 Meacutetrologie active

La meacutetrologie active consiste agrave injecter un trafic speacutecifique et agrave mesurer en reacuteceptionlrsquoeffet sur le reacuteseau agrave eacutetudier Lrsquohypothegravese faite par la meacutetrologie active est que la mesurefaite de bout en bout est reacuteveacutelatrice de la performance du service du reacuteseau telle qursquoellepeut ecirctre perccedilue par une application Les paquets eacutemis sont des sondes qui en emprun-tant la route entre la source et la destination expeacuterimentent la performance du canal decommunication Il convient de limiter le trafic des sondes afin qursquoil ne vienne pas pertur-ber le trafic et donc fausser la mesure Les meacutetriques mesureacutees par les mesures activessont geacuteneacuteralement des meacutetriques associeacutees agrave la topologie du reacuteseau ou au trafic commeles routes ou les deacutelais Dans le cas de la meacutetrologie active il se peut que lrsquoeacutemetteur soiteacutegalement le collecteur La figure 112 illustre ce principe

La meacutetrologie active est opeacutereacutee agrave lrsquoaide drsquooutils speacutecifiques de geacuteneacuteration et de collectede sondes Le tableau 14 indique les meacutetriques obtenues avec les outils de meacutetrologiepreacutesenteacutes par la suite

26

FIGURE 112 ndash Principe de la meacutetrologie active

TABLE 14 ndash Classement des outils

XXXXXXXXXXXOutilMeacutetriques

RTT Routes Deacutebits

Ping XTraceroute X XParis Traceroute X XReverse-traceroute X XTraceIXroute X XPathchar XClink XIperf X

La mesure du RTT est geacuteneacuteralement obtenue par lrsquooutil ping (Packet Internet Groper)Cet outil se preacutesente sous la forme drsquoune commande dans un systegraveme de type Unix Ellesert en premier lieu agrave veacuterifier la connectiviteacute agrave Internet et lrsquoaccessibiliteacute drsquoun nœud Ensecond lieu avec cette veacuterification le RTT et la longueur de la route exprimeacutee en nombrede sauts sont deacutetermineacutes Elle utilise le protocole Internet Control Message Protocol (ICMP)pour effectuer la mesure Un message ICMP Echo request est eacutemis Le destinataire renvoieagrave lrsquoeacutemetteur un message ICMP Echo reply La peacuteriode qui seacutepare lrsquoeacutemission de la reacuteceptiondu coteacute eacutemetteur est mesureacutee

Pour en savoir plus sur la connectiviteacute drsquoun nœud et notamment sur la route emprun-teacutee pour atteindre une destination donneacutee lrsquooutil traceroute offre le moyen de cette deacute-couverte [Jacobson1989-1] Cet outil se preacutesente comme pour ping sous la forme drsquounecommande de type Unix Son principe de fonctionnement est baseacute sur un envoi successifde messages avec un champ TTL du paquet IP qui va croissant Le routeur qui reccediloit unmessage dont le TTL du paquet a atteint la valeur zeacutero envoie un message ICMP TimeExceeded pour reporter lrsquoerreur agrave lrsquoeacutemetteur Par ce message il indique en adresse sourcelrsquoadresse IP de son interface qui a rejeteacute le paquet Ainsi si un paquet ayant un TTL posi-tionneacute agrave n est envoyeacute vers une destination donneacutee le routeur situeacute agrave n sauts de la sourceva faire connaicirctre son adresse IP et ceci tant que le chemin vers la destination est supeacute-rieur agrave n sauts [Crovella2006] Le reacutesultat est lrsquoensemble des nœuds traverseacutes reacutepondantau protocole ICMP De nouveaux outils utilisant le principe de traceroute furent deacutevelop-peacutes pour reacutepondre agrave drsquoautres probleacutematiques comme la preacutesence des points drsquoeacutechangeou encore lrsquoasymeacutetrie des liens

La reacuteponse afficheacutee par la commande traceroute nrsquoest pas la seule route existanteEn exeacutecutant agrave plusieurs reprises la mecircme commande traceroute les reacuteponses obtenuespeuvent ecirctre diffeacuterentes A cause de lrsquoeacutequilibrage de charge (load-balancing) la sortie drsquounrouteur ne sera pas toujours la mecircme Lrsquoeacutequilibrage des charges sert agrave reacutepartir le traficsur diffeacuterents liens Ainsi il est possible que deux paquets provenant de la mecircme sourcevers la mecircme destination nrsquoempruntent pas la mecircme route Sur la figure 113 les liensphysiques entre les diffeacuterents nœuds sont indiqueacutes en rouge Les traits en pointilleacute repreacute-sentent le chemin emprunteacute par les messages ICMP envoyeacutes par la source La figure 113amontre le reacutesultat trouveacute par traceroute La route emprunteacutee est SRC A D DST

27

Traceroute va envoyer 3 paquets avec un champ TTL eacutegal agrave 2 Dans le cas de cet exemplelrsquoensemble des paquets est dirigeacute vers B Ainsi malgreacute lrsquoabsence de liaison physique di-recte entre les nœuds A et D traceroute nous indique la preacutesence drsquoune route entre ceuxdeux eacutequipements Lrsquooutil Paris-traceroute vise agrave traiter ce problegraveme [Augustin2006]La figure 113b montre la route deacutecouverte par Paris-traceroute La route afficheacutee estSRC A C DST On remarque que la route obtenue existe physiquement Pour obte-nir ce reacutesultat Paris-traceroute change le numeacutero drsquoidentification du flux agrave lrsquoeacutemission despaquets ICMP Cette modification oblige les routeurs agrave suivre une seule et unique routeParis-traceroute autorise eacutegalement lrsquoaffichage des numeacuteros de voies logiques MPLS

(a) Traceroute

(b) Paris-traceroute

FIGURE 113 ndash Illustration du pheacutenomegravene drsquoeacutequilibrage des charges

MultiProtocol Label Switch (MPLS) est un meacutecanisme de commutation rapide de pa-quets fondeacute sur des adresses de format fixe et sans structure hieacuterarchique [RFC3031]Ces adresses sont des numeacuteros de voies logiques appeleacutees des eacutetiquettes ou labels (paranglicisme) Dans le cas de lrsquoutilisation de traceroute avec MPLS il faut que le routeurMPLS puisse envoyer un message ICMP Le [RFC4950] documente une simple extensionagrave ICMP pour retourner de lrsquoinformation speacutecifique agrave MPLS autrement dit pour qursquounrouteur MPLS puisse indiquer des informations speacutecifiques agrave MPLS dans le paquet ICMPeacutemis en cas de problegraveme [Donnet2012] a eacutetudieacute les possibiliteacutes offertes par des routeursMPLS

Dans les explicit tunnels la structure interne du tunnel est entiegraverement visible et chaquenœud dans le Label Switched Path (LSP) est marqueacute comme nœud MPLS Dans ce type detunnel le champ ttl-propagate qui est dans lrsquoen-tecircte MPLS des paquets et le [RFC4950] sontappliqueacutes Cela signifie que le champ TTL du datagramme IP est deacutecreacutementeacute agrave chaquerouteur rencontreacuteDans les implicit tunnels le LER drsquoentreacutee active lrsquooption ttl-propagate mais les LSR nrsquoim-pleacutementent pas le [RFC4950] La deacutecreacutementation du TTL est effective mais aucune infor-mation de routeur MPLS nrsquoest visibleDans les opaque tunnels crsquoest lrsquoinverse de lrsquoimplicit tunnels Les routeurs impleacutementent le[RFC4950] Le nœud drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Le TTL est alors deacutecreacute-menteacute agrave la sortie du tunnel MPLS Le paquet ICMP-reply indique quand mecircme lrsquoexistencedrsquoun tunnel MPLSPour les invisible tunnels le LER drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Dans ce casle TTL est deacutecreacutementeacute uniquement lors du dernier routeur du tunnel Le [RFC4950] nrsquoestpas impleacutementeacute par le dernier routeur du LSP Cela implique lrsquoabsence drsquoinformation

28

sur le meacutecanisme MPLS au sein des paquets ICMP On nrsquoa alors pas drsquoinformations surlrsquoexistence drsquoun tunnel ICMP sur la route emprunteacutee

Avec lrsquoacheminement avec MPLS des mauvaises valeurs de TTL peuvent ecirctre obte-nues agrave cause du type de tunnel mis en œuvre Il est donc important que le [RFC4950] soitimpleacutementeacute dans les routeurs

FIGURE 114 ndash Taxonomie des configurations de tunnels MPLS et des comportements detraceroute correspondants (Source [Donnet2012] )

Paris-traceroute propose lrsquoaffichage des informations MPLS lorsque celles-ci sont dis-ponibles [Augustin2007] La texte ci-dessous illustre les reacutesultats obtenus par Paris-traceroutesur un Explicit tunnel On y voit lrsquoaffichage des marques MPLS avec le TTL associeacute agravechaque nœud

traceroute [(412131413533456) -gt (818216615733457)]protocol icmp algo hopbyhop duration 3 s1 4121314133 23266 ms 2542 ms 3696 ms2 4121313397 6811 ms 5613 ms 4635 ms3 10322161 5779 ms 6841 ms 4073 msMPLS Label 16445 TTL=1 | 2129964 1032237 2223 ms 2249 ms 2264 msMPLS Label 16386 TTL=2 | 2129965 4121312850 2185 ms 2245 ms 2097 msMPLS Label 16442 TTL=3 | 2129966 10322193 3551 ms 9330 ms 7775 ms7 41213133158 2337 ms 3088 ms 2250 ms8 4121312854 195439 ms 195555 ms 195512 ms9 213242121233 211737 ms 211724 ms 212013 ms10 469148181 234190 ms 234271 ms 234323 ms11 4687222 236854 ms 236798 ms 237063 ms12 213224250110 237108 ms T0 236580 ms T0 236570 msT013 2132242502 237213 ms 236631 ms 236694 ms14 213224201252 239100 ms 239461 ms 238680 ms15 8182166157 250874 ms 249608 ms 248057 ms

Avec traIXroute lrsquoobjectif est de deacutecouvrir les diffeacuterents points de peering (IXP) sur unchemin vers une destination [Nomikos2016] Pour lrsquoidentification des nœuds drsquoeacutechangecette version de traceroute combine deux bases de donneacutees compleacutementaires qui sontPeeringDB [PeeringDB] et Packet Clearing House [PCH] Avec une geacuteolocalisation desadresses retourneacutees la liste des pays traverseacutes peut ecirctre eacutetablie

29

Drsquoapregraves [Steenbergen2009] laquo lrsquooutil de deacutepannage numeacutero 1 pour veacuterifier la connec-tiviteacute drsquoun nœud reste traceroute raquo pour les administrateurs reacuteseaux mais laquo les liens asy-meacutetriques sont les fleacuteaux numeacutero un de lrsquooutil raquo car laquo le chemin de retour est entiegraverementmasqueacute raquo Afin de corriger cela lrsquooutil reverse-traceroute propose drsquoobtenir une routenon pas entre la source et la destination mais entre la destination et la source [Katz2010]pour cela lrsquooutil va utiliser lrsquoenregistrement des adresses IP des routeurs sur le chemindu retour agrave lrsquoaide des options drsquoen-tecircte Record-Route et Timestamp drsquoIP

Pour deacuteterminer le deacutebit pathchar [Jacobson1997] vise agrave donner le deacutebit saut par sautvers une destination Aussi il reprend le principe de traceroute en eacutemettant des sondesavec le champ TTL avec une valeur croissante Lorsqursquoil injecte le trafic de sondes vers unnœud du chemin il le fait avec des paquets de taille variable Ainsi pathchar deacuteterminela bande passante disponible entre chaque nœud rencontreacute

Lrsquooutil Clink [Downey1999] est similaire agrave pathchar La diffeacuterence se fait au niveausur le nombre de paquets envoyeacutes Clink envoie un nombre de paquets plus importantque Pathchar Ainsi les mesures reacutealiseacutees par Clink auront une meilleure preacutecision

Iperf [Tirumala2005] est un outil pour mesurer la bande passante et la qualiteacute drsquounlien reacuteseau Ce dernier est deacutelimiteacute par deux machines sur lesquelles est installeacute IperfUne machine tient le rocircle de serveur tandis que la seconde machine sera parameacutetreacuteecomme client

Pour des mesures plus repreacutesentatives il est neacutecessaire drsquoaugmenter les points decollectes Des outils de meacutetrologie active ont eacuteteacute conccedilus pour ecirctre reacutepartis sur plusieursnœuds Ces outils se preacutesentent sous la forme de plates-formes de meacutetrologie active deacute-ployeacutees agrave travers le monde De nos jours on compte de nombreuses plates-formes demeacutetrologie active Comme chaque plate-forme a un objectif preacutecis et pour identifier laplate-forme approprieacutee pour reacutealiser une eacutetude preacutecise lrsquoauteur de [Bajpai2015-1] effec-tue une comparaison des diffeacuterentes plates-formes selon 5 critegraveres qui sont

1 lrsquoeacutechelle la couverture et la dureacutee de vie de la plate-forme

2 le mateacuteriel physique utiliseacute pour la sonde

3 les meacutetriques disponibles

4 lrsquoarchitecture de mesure de la plate-forme

5 lrsquoimpact de son utilisation pour la recherche

De cette comparaison nous avons gardeacute 4 plates-formes que sont Atlas RIPE NCC BIS-Mark DASU SamKnows Ces plates-formes ont eacuteteacute gardeacutees car elles autorisent lrsquoeacutetudedes performances des reacuteseaux drsquoaccegraves Nous y avons ajouteacute les plates-formes Archipe-lago et Planet-Lab Ces deux plates-formes ne font pas partie du document drsquoorigine maisfont lrsquoobjet drsquoune utilisation par de nombreux participants tel que lrsquoindique le nombrede sondes actives de ces deux plates-formes

En 2007 le CAIDA a deacuteployeacute sa propre plate-forme de mesures [Archipelago] Atravers le deployement de nœuds (des sondes dans le vocabulaire de Archipelago) surlrsquoensemble de la planegravete lrsquoobjectif est drsquooffrir des accegraves pour effectuer des mesures avecdes outils tels que ping et traceroute Archipelago est composeacutee agrave la date du 1er Mars2017 de 170 sondes reacuteparties dans 59 pays et sur tous les continents

Dans le courant de lrsquoanneacutee 2010 le Regional Internet Registry (RIR) europeacuteen RIPENCC a deacutemarreacute la distribution de sondes pour la creacuteation de la plate-forme Atlas [Ripe2010]Cette plate-forme vise agrave creacuteer un reacuteseau de sondes pour lrsquoeacutetude de la connectiviteacute de lrsquoIn-ternet Composeacutee actuellement de pregraves de 10 000 sondes reacuteparties agrave travers le monde elleest capable drsquoeffectuer des tests de meacutetrologie active autour des commandes ping DNSHTTP NTP traceroute et Paris-traceroute

30

Agrave lrsquoinitiative de Georgia Tech la plate-forme Broadband Internet Service Benchmark (BIS-Mark) a vu le jour en 2010 Lrsquoobjectif est la reacutealisation drsquoun eacutetat des lieux des performancesdes accegraves Internet [Sundaresan2011] La plate-forme est composeacutee de 405 routeurs instru-menteacutes avec OpenWrt laquo Le projet OpenWrt est un systegraveme drsquoexploitation Linux ciblantles appareils embarqueacutes OpenWrt fournit un systegraveme de fichiers entiegraverement inscriptibleavec gestion des modules drsquoinstallation de logiciels Cela libegravere la seacutelection et la configu-ration des applications fournies par le fournisseur et permet de personnaliser lrsquoappareilgracircce agrave lrsquoutilisation de progiciels adapteacutes agrave nrsquoimporte quelle application raquo [OpenWrt] Lessondes sont distribueacutees dans 34 pays agrave travers le monde

DASU est un utilitaire deacuteveloppeacute en 2010 agrave lrsquoUniversiteacute de Northwestern Le logicielcouple meacutetrologie active et passive avec pour objectif de caracteacuteriser les performancesdes utilisateurs Lrsquooutil fut deacuteveloppeacute comme une extension drsquoun logiciel peer-to-peer Bit-Torrent [Sanchez2013] Depuis Juillet 2010 plus de 90 000 personnes reacuteparties agrave travers147 pays utilisent DASU

En 2003 des chercheurs ameacutericains ont deacuteployeacute une plate-forme de test Planet-Lab[Chun2003] En 2008 une extension europeacuteenne [PlanetLabEurope] a vu le jour Planet-Lab deacutepasse le seul objectif de meacutetrologie elle vise aussi de tester des nouveaux servicesde communication en situation reacuteelle Les nœuds Planet-Lab ont pour Operating System(OS) Fedora Il est possible drsquoinstaller nrsquoimporte quel logiciel du moment qursquoil est com-patible avec cet OS Avec une certaine liberteacute il est possible drsquoeffectuer des tests et desmesures depuis 425 sites reacutepartis sur tous les continents

La plate-forme SamKnows a vu le jour en 2008 [SamKnows] SamKnows sert agrave lrsquoeacutetudedes performances des connexions des particuliers et des entreprises Elle est composeacuteede pregraves de 440 000 sondes Cette infrastructure est partenaire de 36 Fournisseurs drsquoAccegravesInternet (FAI) de tous les continents

Le tableau 15 reacutesume les possibiliteacutes offertes par les plates-formes La colonne Impactsur la recherche est deacutetermineacutee agrave partir du nombre de citations par des articles scientifiquessuivis par le site Google Scholar

La plate-forme de mesures Atlas RIPE NCC [Ripe2010] a eacuteteacute utiliseacutee dans le contexteinsulaire de Cuba Dans lrsquoarticle [Bischof2015] lrsquoauteur cherche agrave caracteacuteriser lrsquoaccegraves In-ternet cubain Dans ses reacutesultats lrsquoauteur a montreacute une forte asymeacutetrie des routes in-ternationales pour le trafic cubain Drsquoun point de vue de la topologie physique cette icirclepossegravede une connectiviteacute qui peut par certains aspects ressembler agrave de celle de lrsquoicircle de LaReacuteunion

Lrsquoicircle de La Reacuteunion bien que Franccedilaise est rattacheacutee administrativement au RIR dela zone Afrique (AfriNIC) LrsquoAfriNIC est le dernier RIR creacuteeacute et les eacutetudes de meacutetrolo-gie concernant cette zone sont peu nombreuses Nous pouvons citer [Gupta2014] qui sepenche sur lrsquointerconnexion des FAI sur le continent africain Cette eacutetude montre que leseacutechanges de paquets ne se font pas au sein du continent africain mais en Europe La rai-son avanceacutee par lrsquoauteur est un coucirct drsquointer-connexion infeacuterieur en Europe Ces regravegles deroutage on des conseacutequences sur les deacutelais et donc sur les performances sur le servicede transport rendu par TCP Ces reacutesultats ont eacuteteacute confirmeacutes par [Fanou2015] Cette eacutetudesrsquointeacuteresse en plus agrave la stabiliteacute des routes Les reacutesultats ont montreacute que les chemins afri-cains restent stables sur une longue dureacutee Pour les auteurs lrsquoeacutemergence de nouveauxpoints drsquoeacutechanges sur le continent doit aider agrave la reacuteduction des deacutelais agrave conditions queles coucircts drsquointerconnexion soient proches de ceux pratiqueacutes en Europe

Enfin lrsquoarticle [Chavula2017] publieacute en 2017 preacutesente la latence pour les transferts defichiers agrave partir de 53 pays africains diffeacuterents Ces mesures srsquoappuient sur la plate-formeRIPE Atlas [Ripe2010] et Speedchecker [Speechecker] Agrave partir des mesures reacutealiseacutees les

31

TABLE 15 ndash Tableau des plates-formes de mesures de meacutetrologie active

Nom Nombre desondes deacuteployeacutees

Meacutetriques dispo-nibles

Impact sur la re-cherche

Archipelago ~200 Longueur duchemin RTTDNS Autono-mous System(AS)

109

Atlas RIPE NCC ~12 000 RTT RouteHTTP GET etrequecirctes SSL

38

BISMark ~420 RTT taux depertes deacutebiteacutecouleacute tempsde chargementdrsquoune page web

304

DASU ~100 000 Informations surles flux TCP RTTroutes emprun-teacutees reacutesolutionDNS HTTP GETdeacutebit eacutecouleacute

84

PlanetLab ~400 1218SamKnows ~70 000 RTT deacutebit

eacutecouleacute deacutebitutile giguetaux de perteperformance decertains services

154

auteurs avancent que lrsquoAfrique est un continent ineacutegalitaire en terme de latence intra etinter pays Ils ont conclu que lrsquoexistence drsquoune faible latence entre deux FAI drsquoun mecircmepays provient drsquoaccord de peering au sein drsquoun IXP heacutebergeacute soit par le pays concerneacutesoit par un pays voisin

123 Meacutetrologie passive

La meacutetrologie passive a pour objectif la mesure des flots de paquets agrave partir drsquounpoint particulier du reacuteseau appeleacute le point de collecte Elle consiste agrave eacutecouter captureret analyser les paquets IP La figure 115 illustre le principe de la meacutetrologie passiveElle montre que le point de collecte nrsquoest pas forceacutement localiseacute du coteacute eacutemetteur oureacutecepteur Les paquets IP transitant par le point de collecte sont captureacutes et sauvegardeacutesOn appelle alors les fichiers contenant les paquets IP collecteacutes des traces Les mesurespassives peuvent ecirctre effectueacutees agrave diffeacuterents niveaux de granulariteacute

Au niveau microscopique les mesures passives tendent agrave eacutetudier les flots au niveaude la connexion de transport On peut par exemple eacutetudier le nombre de paquets per-dus durant une connexion TCP Au niveau macroscopique les mesures passives sonteffectueacutees sur des meacutetriques agreacutegeacutees comme le deacutebit eacutecouleacute total ou le nombre total deconnexions

32

FIGURE 115 ndash Principe de la meacutetrologie passive

La meilleure faccedilon de reacutealiser des mesures passives au niveau microscopique est decapturer tous les paquets traversant le point de collecte Mais comme il est difficile decapturer tous les paquets lorsque le deacutebit du lien est eacuteleveacute il faut avoir recours agrave lrsquoeacutechan-tillonnage du trafic Dans ce cas les mesures ne sont pas faites sur la totaliteacute des pa-quets traversant le point de collecte mais sur un sous-ensemble bien speacutecifique de cespaquets Le groupe de travail Packet Sampling (PSAMP) de lrsquoIETF travaille sur un algo-rithme drsquoeacutechantillonnage adapteacute au trafic Internet [PSAMP]

Une combinaison entre lrsquoanalyse des deux granulariteacutes est capable de donner uneeacutevaluation reacuteelle du trafic Les informations que lrsquoon peut obtenir par la meacutetrologie pas-sive sont nombreuses Elles reposent sur lrsquoeacutetude des informations contenues dans le da-tagramme IP que ccedila soit dans lrsquoen-tecircte du datagramme IP ou dans celle du message duprotocole de transport Les meacutetriques sont eacutegalement deacutependantes des outils utiliseacutes Onpeut classer les meacutetriques en deux cateacutegories que sont la supervision et la performance

La supervision donne des informations sur le fonctionnement du reacuteseau et la carac-teacuterisation du trafic On peut ainsi eacutetudier les diffeacuterents services et protocole de transportutiliseacutesLa performance se rapporte agrave celle du protocole de transport crsquoest-agrave-dire son fonction-nement ou sur lrsquoanalyse des flots par rapport soit agrave la composante temporelle ou soit agravela composante seacutemantique On peut alors comparer le deacutebit drsquoaccegraves theacuteorique et le deacutebitmesureacute Pour cela on va eacutetudier le taux de perte le RTT et la MSS

La meacutethode de capture peut reposer sur des eacutequipements mateacuteriels deacutedieacutes ou par unsystegraveme logiciel fonctionnant sur un eacutequipement standard Le logiciel srsquoappuie majori-tairement sur la bibliothegraveque Libpcap [Jacobson1989-2] Cette bibliothegraveque capture lespaquets reccedilus mais elle srsquoutilise eacutegalement en lisant des traces de paquets preacutealablementcaptureacutes Le problegraveme principal des solutions logicielles viennent de la vitesse des liensPlus le lien a un deacutebit eacuteleveacute plus la capture au niveau logiciel devient difficile Il fautalors se tourner vers des solutions de mateacuteriels deacutedieacutes La carte DAG [Graham1997] deacute-veloppeacutee par lrsquoeacutequipe [WAND] de lrsquoUniversiteacute de Waikato en Nouvelle Zeacutelande en est unparfait exemple Cette carte de capture est capable de capter les paquets sur des liens detregraves haut deacutebit Ce mateacuteriel se charge drsquoextraire les entecirctes des paquets de les estampillersuivant une horloge synchroniseacutee et de les stocker sur un disque dur

Lrsquoanalyse des donneacutees est reacutealiseacutee selon deux techniques temps reacuteels ou Batch Leprincipe du temps reacuteel est de pouvoir reacutecupeacuterer extraire et restituer de lrsquoinformation entemps reacuteel sur des flux continus de donneacutees Le mode Batch va englober tous les traite-ments de donneacutees neacutecessitant un temps de calcul plus conseacutequent Le premier proceacutedeacutese propose drsquoanalyser agrave la voleacutee ce qui se passe dans le reacuteseau par le branchement drsquouneacutequipement drsquoeacutecoute sur le reacuteseau On se concentre alors sur la performance du lien Desoutils comme Tstat [Mellia2005] ou Netflow [Claise2004] reacutealisent ce genre drsquoanalyse La

33

seconde technique se deacutecompose en deux phases distinctes que sont la capture et lrsquoana-lyse La premiegravere eacutetape est de reacutealiser la capture du trafic appeleacutee des traces Des outilscomme TCPDump [Jacobson1989-1] ou Wireshark [Chappell2010] peuvent enregistrerdes traces sous format DUMP ou PCAP La seconde phase consiste agrave analyser les tracescollecteacutees Les formats de sortie des donneacutees analyseacutees sont deacutependants des outils Lesinformations peuvent ecirctre retranscrites au format texte ou graphique Des outils commeTCPTrace [Ostermann2000] ou TCPStat [Herman2001] peuvent effectuer ce genre drsquoana-lyse de donneacutees Crsquoest avec cette technique qursquoil est possible drsquoeacutetudier les performancesdrsquoun protocole

Il nrsquoexiste pas de plate-forme drsquoaccegraves publique reacutealisant des captures de trafic au ni-veau international Malgreacute cela des traces collecteacutees sont disponibles sur Internet agrave desfins de recherche Dans [Allman2007] les auteurs preacutesentent les regravegles agrave respecter avantde publier des traces Un point est agrave souligner et concerne les adresses IP des paquets Lanon-anonymisation des adresses IP constitue une violation de la vie priveacutee de plus ellepreacutesente un risque drsquoinseacutecuriteacute pour les machines impliqueacutees par les paquets captureacutesCAIDA gegravere un deacutepocirct de partage et propose drsquoacceacuteder agrave des traces collecteacutees agrave traversplusieurs points drsquoeacutechange ameacutericains Pour y acceacuteder il faut indiquer la finaliteacute de lrsquouti-lisation des traces demandeacutees Drsquoautres plates-formes deacutedieacutees agrave des projets ont eacuteteacute misesen place agrave travers le monde

Le projet IPMon de lrsquoopeacuterateur ameacutericain SPRINT consiste agrave identifier les problegravemesdrsquoun reacuteseau deacutejagrave deacuteployeacute afin de pouvoir anticiper son eacutevolution future[IPMon] Danslrsquoarticle [Fraleigh2001] lrsquoauteur preacutesente lrsquoinfrastructure de mesure qui est deacuteployeacutee endivers points du reacuteseau de lrsquoopeacuterateur Les premiers reacutesultats publieacutes dans [Fraleigh2003]ont montreacute une utilisation de plus en plus importante par du trafic multimeacutedia sur le pro-tocole TCP De plus les flots TCP preacutesentent des performances eacuteleveacutees avec des taux dedeacute-seacutequencement faibles et un deacutelai minimal proche du temps de propagation

Le projet METROPOLIS srsquoest inspireacute du projet IPMon Il srsquoagit drsquoun projet franccedilaisavec des points de mesures sur deux types de reacuteseaux Internet diffeacuterents RENATER etle reacuteseau ADSL de France Teacuteleacutecom laquo Lrsquoobjectif de METROPOLIS eacutetait de concevoir denouvelles meacutethodologies pour la meacutetrologie des reacuteseaux IP raquo [METROPOLIS] Dans lecadre de ce projet un outil de caracteacuterisation et drsquoanalyse des traces fut deacuteveloppeacute Cenouvel outil srsquointitule ZOO Une preacutesentation de lrsquooutil sera reacutealiseacutee dans la sous-section322 Les reacutesultats ont mis une eacutevidence lrsquousage preacutedominant du protocole de transportTCP Les applications de type peer-to-peer repreacutesentaient plus de 80 du trafic eacutetudieacute

La position geacuteographique de La Reacuteunion et son rattachement au RIR AfriNIC attirentnotre attention sur les travaux de meacutetrologie passive africains La carte [AfterFibre] preacute-sente les reacuteseaux fibres terrestres et maritimes lieacutes au continent africain On voit ainsi queles reacuteseaux sont ineacutegalement reacutepartis sur le territoire La grandeur du continent et les in-terconnections preacutesentes font du territoire un espace drsquoeacutetude inteacuteressant Crsquoest pourquoide nombreux chercheurs privileacutegient lrsquoeacutetude de la connectiviteacute et des performances delrsquoInternet africain

Dans lrsquoarticle [Johnson2011] une eacutetude sur une zone rurale connecteacutee par satelliteest reacutealiseacutee Les reacutesultats ont montreacute que le trafic est principalement composeacute de fluxweb dont une forte proportion pourrait ecirctre mise en cache Au niveau des deacutelais le RTTmoyen sur la peacuteriode de mesure varie entre 3 et 10 secondes Ce deacutelai rend lrsquoutilisationdes applications temps-reacuteel difficile Le dernier reacutesultat notable de cette analyse est lapreacutesence de trafic geacuteneacutereacute par des logiciels malveillants (malware) Des attaques pour listerles ports UDP et TCP ouverts ont eacuteteacute remarqueacutees

En 2015 les auteurs de [Zheleva2015] ont eacutetudieacute les performances du reacuteseau et le com-portement des usagers apregraves une augmentation de la bande passante en Zambie Lrsquoun des

34

premiers reacutesultats indique une augmentation de plus de 58 de la quantiteacute des donneacuteeseacutechangeacutees Au niveau des performances ils ont pu eacutegalement remarquer une tregraves leacutegegraveredeacutegradation du canal de communication avec un taux de retransmission en hausse Cepourcentage est passeacute de 1 12 agrave 1 16 Le dernier reacutesultat noteacute porte sur lrsquoaugmenta-tion du RTT moyen de plus de 100 passant de 0 1436 s agrave 0 3190 s Lrsquoaugmentation dela bande passante a permis lrsquoaccegraves agrave de nouveaux services entraicircnant des changementspour les usagers

Dans [Fanou2016] lrsquoauteur srsquointeacuteresse aux services proposeacutes et compare la localisa-tion des serveurs Le premier reacutesultat montre lrsquoexternalisation continentale de nombreuxserveurs Ceci a pour conseacutequence drsquoaugmenter les deacutelais et de deacutegrader la performancedu service de communication Il faut pour lrsquoauteur arrecircter de raisonner en terme drsquoin-frastructure mais plus en terme de service et mettre lrsquoutilisateur au centre du systegravemePour cela il propose de rapatrier les services sur le territoire et drsquoaugmenter les accordsdrsquoeacutechanges entre les opeacuterateurs continentaux

Enfin dans [Johnson2016] les auteurs srsquointerrogent sur les faibles performances deTCP en Afrique La preacutesence de zone reculeacutees avec des accegraves satellitaires poussent lesdeacutelais vers des valeurs allant au delagrave des 400 ms Ces longs deacutelais sont agrave rapprocher desdeacutebits faibles De plus une expeacuterimentation sur les performances de TCP en fonction dusystegraveme drsquoexploitation a eacuteteacute meneacutee Les reacutesultats ont mis en eacutevidence que le systegraveme Li-nux avec la version TCP CUBIC est moins sensible au long deacutelais La solution proposeacutee auproblegraveme de la diffeacuterence de connectiviteacute agrave travers le continent est la creacuteation drsquoune ingeacute-nierie reacuteseau (liaison physique protocole de transport nouveau service) tenant comptedu contexte Africain

124 Comparatif entre mesures actives et mesures passives

La meacutetrologie active et la meacutetrologie passive preacutesentent des points communs et despoints de divergences Une fois des objectifs fixeacutes et au moment du choix de la meacutethodeil est important de connaicirctre les avantages et les inconveacutenients lieacutes agrave chaque type demesure Le tableau 16 reacutecapitule syntheacutetiquement ce qui vient drsquoecirctre preacutesenteacute

TABLE 16 ndash Comparatif entre mesures actives et mesures passives

Meacutetrologie Active Meacutetrologie Passive

Avantages

1 - Pour la mesure directe des pa-ramegravetres de QoS principalementle deacutelai le taux de pertes et lagigue

1 - Non intrusives2 - Permettent une mesure directedes paramegravetres utiliseacutes dans lrsquoin-geacutenierie des reacuteseaux

Inconveacutenients

1 - Intrusives le trafic de mesurepeut dans certains cas fausser lesmesures elles-mecircmes2 - Le fait que certains adminis-trateurs et entreprises bloquentou limitent le trafic ICMP peutfausser les reacutesultats obtenus parles techniques actives car ces der-niegraveres font souvent usage de ceprotocole

1 - Elles sont locales (relatives agraveun lien) et il est difficile de leseacutetendre agrave la globaliteacute du reacuteseau2 - Elles ne permettent pas la me-sure directe des paramegravetres deQoS3 - Elles neacutecessitent des ressourcesdisque et meacutemoire vive impor-tantes

35

13 Synthegravese

Ce chapitre a rappeleacute le fonctionnement du controcircle de congestion de TCP Le controcirclede congestion de TCP vise agrave maximiser lrsquoutilisation des ressources et agrave maximiser le deacute-bit utile eacutecouleacute de la connexion Ce controcircle est reacutegi par une boucle fermeacutee caracteacuteriseacuteepar un RTT Plus le deacutelai est eacuteleveacute moins TCP est susceptible de reacuteagir dynamiquementaux eacuteveacutenements de congestion Lorsque le produit du RTT et de la capaciteacute du canalde communication est trop important TCP peine agrave atteindre les objectifs preacuteceacutedemmentpreacutesenteacutes Lrsquoaugmentation progressive de la bande passante sans diminution des deacutelais apour effet lrsquoaugmentation de la capaciteacute de stockage des liens Cet accroissement a uneffet neacutegatif sur les performances de TCP Cet effet neacutegatif impacte le deacutemarrage deconnexion les flots courts la reacutesolution de la congestion et la dynamique du sondagePour diminuer lrsquoeffet de la capaciteacute de stockage des liens sur les performances de TCPde nouveaux controcircles de congestion furent deacuteveloppeacutes Chaque nouvelle version ducontrocircle de congestion ambitionne de reacutesoudre une agrave plusieurs probleacutematiques des reacute-seaux agrave forte capaciteacute de stockage Le deacutemarrage de connexion et les flots courts ont dessolutions communes comme une augmentation de la capaciteacute drsquoeacutemission de TCP agrave lrsquoini-tialisation de la connexion ou la reacuteduction du RTO Les probleacutematiques de reacutesolution decongestion et de dynamique de sondage ont permis la creacuteation de nouvelles versions ducontrocircle de congestion de TCP Ces versions de TCP sont des solutions de bout-en-boutDrsquoautres solutions neacutecessitent un changement de paradigme et lrsquointeraction avec les rou-teurs Ces solutions ont lrsquoavantage drsquoecirctre reacuteactives mais neacutecessitent la mise agrave jour deseacutequipements intermeacutediaires du reacuteseau

Le localisation geacuteographique de La Reacuteunion au milieu de lrsquooceacutean indien place lrsquoicircledans une situation ougrave la capaciteacute de stockage du reacuteseau peut ecirctre importante Nous avonsainsi estimeacute cette capaciteacute agrave lrsquoaide des deacutebits theacuteoriques des accegraves et les deacutelais de propa-gation estimeacutes et mesureacutes Les reacutesultats obtenus ont mis en eacutevidence une capaciteacute destockage autorisant la caracteacuterisation de lrsquoInternet reacuteunionnais comme un reacuteseau agrave fortecapaciteacute de stockage Lrsquoimpact de cette capaciteacute de meacutemorisation nrsquoa pas encore eacuteteacute me-sureacute Crsquoest pourquoi nous nous sommes concentreacutes sur la meacutetrologie Internet

La meacutetrologie active est une science invasive en injectant des paquets dans le reacuteseauLa meacutetrologie active mesure directement des paramegravetres de qualiteacute de service comme lesdeacutelais les routes le taux perte et la gigue Nous avons vu que des outils sont en capa-citeacute de mesurer deux meacutetriques simultaneacutement Certains outils peuvent ecirctre distribueacuteset ainsi former des plates-formes de mesure Ces plates-formes offrent la possibiliteacute auxpersonnes inteacuteresseacutees du monde entier de geacuteneacuterer des donneacutees de mesure agrave travers lemonde Les performances de TCP sont deacutependantes du deacutelai Les deacutelais sont eux-mecircmedeacutependants des routes physiques et logiques emprunteacutees Il est donc important drsquoeacutetudierces deux paramegravetres Connaissant nos besoins nous utiliserons lrsquoapproche research drivenpour lrsquoeacutetude de meacutetrologie active Lrsquoapproche research driven est une approche consistantagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires agrave lrsquoeacutetude Notre eacutetude de meacutetrologie active est preacutesenteacutee dansle chapitre 2

La meacutetrologie passive permet une mesure directe des paramegravetres utiliseacutes Cette classede meacutetrologie est centreacutee sur un lien de mesure Elle utilise lrsquoeacutecoute et la capture desdatagrammes IP La meacutetrologie passive eacutetudie la caracteacuterisation du trafic et la perfor-mance des protocoles Nous avons vu que des outils sont en capaciteacute de reacutealiser les deuxeacutetudes en parallegravele Ne pouvant reacutealiser des eacutetudes de meacutetrologie passive agrave distance denombreux chercheurs ont mis agrave disposition de la communauteacute scientifique des donneacuteespubliques La litteacuterature scientifique propose un grand nombre de meacutetriques pour lrsquoeacutetudedes performances du protocole de transport TCP et de la supervision du trafic Afin de

36

ne pas nous concentrer sur une meacutetrique en particulier nous faisons le choix de ne pasdresser une liste de meacutetriques Notre eacutetude de meacutetrologie passive que nous preacutesente-rons dans le chapitre 3 utilisera lrsquoapproche measurement driven Cette approche consiste agravemettre en place une infrastructure de mesures afin de reacutecupeacuterer le maximum drsquoinforma-tions puis drsquoeffectuer toutes les analyses possibles sur les donneacutees collecteacutees Neacuteanmoinsla meacutetrologie passive souffre de deux faiblesses essentielles (1) elle reste locale et il estdifficile drsquoeacutetendre les reacutesultats agrave la globaliteacute du reacuteseau (2) au niveau microscopique lescaptures aboutissent tregraves rapidement agrave des volumes de traces colossaux

37

38

Chapitre 2

Caracteacuterisation de la connectiviteacute deLa Reacuteunion

Le rapport [Mediametrie2018-2] sur lrsquoaccegraves Internet agrave La Reacuteunion a montreacute que 856de la population reacuteunionnaise de plus de 13 ans srsquoest deacutejagrave connecteacutee agrave Internet 747 deces personnes sont des usagers reacuteguliers En comparaison le rapport [Mediametrie2018-1]montre qursquoaux alentours de 68 de la population franccedilaise meacutetropolitaine se connectequotidiennement Ces sondages montrent lrsquointeacuterecirct pris par lrsquoInternet pour la populationreacuteunionnaise

En 2013 une eacutetude de meacutetrologie reacutealiseacutee par BinarySec vise a effectuer un classementdes fournisseurs drsquoaccegraves Internet de La Reacuteunion Dans le rapport associeacute [Vergoz2013] 9meacutetriques sont preacutesenteacutees Parmi elles le deacutebit descendant moyen est mesureacute agrave 9 36MbsEn comparaison le deacutebit descendant moyen en France meacutetropolitaine mesureacute par[Akamai2015] srsquoeacutelegraveve agrave 8 2 Mbits Akamai utilise la plate-forme Intelligent PlatformTM

pour reacutecolter des donneacutees dont le deacutebit reacuteel La Reacuteunion posseacutedait ainsi un meilleurdeacutebit descendant que la France meacutetropolitaine Le deacutebit moyen franccedilais preacutesenteacute par[Akamai2017] est de 10 75 Mbits Le deacutebit descendant minimum reacuteunionnais mesureacutepar [nPerf2017] est de 18 63 Mbits Ainsi lrsquoeacutecart entre les deacutebits franccedilais et reacuteunionnaissrsquoest accentueacute Malgreacute un deacutebit plus eacuteleveacute La Reacuteunion preacutesente des deacutelais plus eacuteleveacutesque la France

Lrsquoeacutevolution des deacutebits pose la question sur lrsquoeacutevolution des deacutelais depuis la derniegraverecampagne de mesure La figure 111 montre des deacutelais plus importants agrave La Reacuteunion qursquoagraveParis Lrsquoobjectif de ce chapitre est drsquoeacutetudier lrsquoeacutevolution des deacutelais depuis 2012 On srsquointeacute-resse eacutegalement agrave la connectiviteacute de La Reacuteunion en terme de deacutelai et de routes Lrsquoasymeacute-trie des liens est une chose courante dans lrsquoInternet Les questions que lrsquoon se pose de-puis La Reacuteunion doivent eacutegalement ecirctre poseacutees lorsque lrsquoon essaye de joindre lrsquoicircle Dansce chapitre nous allons explorer la connectiviteacute de La Reacuteunion Pour cela nous avonsmis en place un protocole de mesures se basant sur notre propre plate-forme de mesuresrespectant la reacutepartition des destinations Notre plate-forme a pour objectif lrsquoeacutetude desroutes et des deacutelais speacutecifiques de lrsquoicircle par rapport agrave son accegraves Internet via les cacircblessous-marins

Une seconde question est alors apparue Est-ce que ces speacutecificiteacutes sont uniquementcelles de La Reacuteunion ou alors communes aux icircles de la Zone Oceacutean Indien

Dans la section 21 nous preacutesentons les objectifs de notre eacutetude de meacutetrologie et lescontraintes associeacutees Afin de reacutepondre agrave ces contraintes un cahier des charges est preacute-senteacute dans la section 22 Le protocole drsquoeacutetude est deacutecrit dans la section 23 Les reacutesultatsobtenus pour La Reacuteunion suivis de ceux des icircles de lrsquoOceacutean Indien sont preacutesenteacutes dansla section 24

39

21 Objectifs

En 2012 [Anelli2012] a reacutealiseacute une campagne de mesure des deacutelais depuis La Reacuteunionet Paris Cette campagne de meacutetrologie active baseacutee sur la commande ping a pour ob-jectif de deacutemontrer la diffeacuterence de deacutelai et de deacutebit entre La Reacuteunion et Paris Le premierobjectif de nos travaux consiste agrave la mise jour des donneacutees par une nouvelle eacutetude desdeacutelais Nous ferons par la suite reacutefeacuterence agrave cet objectif par le titre Evolution

Le second objectif est lrsquoanalyse de la connectiviteacute Internet de La Reacuteunion Pour arri-ver agrave obtenir une analyse preacutecise de la connectiviteacute Internet reacuteunionnaise une eacutetude surles routes emprunteacutees par les paquets IP en provenance et agrave destination de La Reacuteunionsera reacutealiseacutee Pour cela on utilisera un outil de type traceroute On utilisera les donneacuteesreacutecolteacutees pour lrsquoidentification des portes de lrsquoInternet reacuteunionnais La reacutefeacuterence utiliseacuteepour cet objectif dans le suite du manuscrit est Connectiviteacute

Ayant cibleacute les meacutetriques nous avons fait le choix de la meacutethode research-driven Cettemeacutethode preacutesenteacutee dans la section 121 a lrsquoavantage de se concentrer uniquement surdes meacutetriques deacutecideacutees preacutealablement Dans le cas de notre eacutetude ce sont les deacutelais et lesroutes

22 Cahier des charges

Deux paramegravetres doivent ecirctre pris en consideacuteration lors de la reacutedaction du cahier descharges lrsquooutil de mesure et lrsquooutil drsquoanalyse

221 Evolution

Pour reacutepondre agrave lrsquoobjectif nous allons effectuer une reprise de lrsquoexistant Lrsquooutil demesure sera la commande ping associeacutee agrave la plate-forme Planet-Lab [PlanetLabEurope]Lrsquooutil drsquoanalyse sera identique agrave celui utiliseacute par [Anelli2012]

222 Connectiviteacute

Identification des besoins

Dans le tableau 14 nous avons vu que diffeacuterents outils sont capables de mesurer lesroutes et les deacutelais Lrsquooutil retenu devra limiter les erreurs lieacutees aux meacutecanismes de lrsquoeacutequi-librage de charge et de MPLS Cet outil devra reacutealiser des mesures depuis des nœudsreacutepartis sur lrsquoensemble de lrsquoicircle Pour cela il est neacutecessaire drsquoeffectuer un choix de plate-forme de meacutetrologie active Ce choix se fera sur 2 points la distribution geacuteographiquedes nœuds de mesure et la couverture des diffeacuterents fournisseurs drsquoaccegraves internet

Lrsquooutil drsquoanalyse devra ecirctre en capaciteacute drsquoidentifier les portes de lrsquoInternet reacuteunion-nais agrave travers la geacuteolocalisation des adresses IP drsquoidentifier les marques MPLS preacutesentesdans les donneacutees pour une meilleure compreacutehension des regravegles de routage geacuteneacuterer unecarte des relations entre pays agrave travers les eacutechanges de paquets envoyeacutes et reacutealiser desstatistiques sur les diffeacuterents nœuds emprunteacutes

Mise en œuvre drsquoune infrastructure de meacutetrologie active

Dans la section preacuteceacutedente nous avons vu que notre cahier des charges devra respec-ter 3 principaux critegraveres outil de mesure plate-forme de mesure et outil drsquoanalyse

40

Paris-traceroute

Nous avons vu dans la partie 122 que lrsquoeacutetude des routes et des deacutelais peut se faire agravelrsquoaide drsquoun seul outil traceroute Or cet outil est sujet agrave des impreacutecisions lieacutees agrave lrsquoeacutequili-brage des charges par exemple Souhaitant limiter lrsquoimpact de ces aleacuteas dans nos donneacuteesnous faisons le choix de Paris-traceroute Pour rappel une preacutesentation de lrsquooutil et deses meacutecanismes est faite agrave la section 122

La plate-forme RunPL

Les plates-formes disponibles Similairement dans la section 122 nous avons preacute-senteacute des plates-formes de meacutetrologie active La plate-forme seacutelectionneacutee devra respecterles critegraveres preacutesenteacutes preacuteceacutedemment

Parmi les plates-formes seules Atlas et Planet-Lab ont des sondes preacutesentes sur lrsquoicirclerespectivement 21 et 2 Ces sondes sont reacuteparties de maniegravere ineacutequitable sur lrsquoicircle Lareacutegion Est de lrsquoicircle ne compte qursquoune sonde quand le minimum est de 6 dans les autresreacutegions De plus certains des Fournisseurs drsquoAccegraves Internet (FAI) nrsquoheacutebergent pas de sondede mesure Le reacutesumeacute de notre comparaison est indiqueacute dans le tableau 21

TABLE 21 ndash Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet

Archipelago Atlas BISMark DASU Planet-Lab SamKnowsParis-traceroute

Oui Oui Oui Non Oui Non

Disponibiliteacutesur lrsquoicircle

Non Oui Non Non Oui Non

Couverturede lrsquoicircle

Non Oui Non Non Non Non

Reacutepartitionfournis-seurs

Non Non Non Non Non Non

On constate ainsi qursquoaucune des plates-formes preacutesenteacutees ne remplit la totaliteacute descritegraveres de seacutelection Nous avons souhaiteacute deacuteployer notre propre infrastructure Cettenouvelle plate-forme reacutepondra agrave nos critegraveres en offrant une meilleure couverture de lrsquoicirclesur les aspects geacuteographiques FAI et Technologies drsquoAccegraves agrave Internet (TAI) Lrsquoeacutechantillon depopulation est repreacutesenteacute par un ensemble drsquoeacutetudiants Notre plate-forme nous autoriseeacutegalement agrave ecirctre maicirctre de lrsquoinfrastructure de mesures que lrsquoon souhaite mettre en placeAfin de seacutelectionner les outils (physiques et logiciels) les plus adapteacutes agrave nos objectifsnous avons deacutecideacute des speacutecificiteacutes de notre plate-forme

Creacuteation et deacuteploiement de la plate-forme RunPL La plate-forme que lrsquoon souhaitedeacuteployer devra respecter un scheacutema de connectiviteacute bien preacutecis repreacutesenteacute par la figure21 La Sonde de mesure est le cœur de la plate-forme La Destination correspond agrave uneadresse IP ou un nom de domaine agrave joindre pour obtenir des informations sur les routesemprunteacutees et les deacutelais associeacutes Le Serveur de stockage est preacutesent pour deacutelester la sondede mesure LrsquoOrdinateur distant repreacutesente lrsquoadministrateur de la plate-forme Ne pouvantse deacuteplacer pour configurer la sonde un accegraves distant doit ecirctre reacutealiseacute Il est illustreacute parle train en pointilleacute sur la figure Le trait plein entre la sonde et la destination correspondagrave lrsquointeraction entre la sonde et la destination Cette interaction repreacutesente les mesuresque lrsquoon obtiendra sur les performances des liens Les sondes de mesure devront pou-voir effectuer les mesures sans limitation de destinations Elles devront afin de limiter

41

le stockage effectuer un deacutelestage des mesures collecteacutees sur un serveur de stockage Ceserveur de stockage tout comme la sonde de mesure devra pouvoir ecirctre joint par lrsquoordi-nateur distant Cette communication a un double objectif Le premier est la reacutecupeacuterationdes donneacutees pour les analyses Le second est la mise agrave jour du protocole de mesure sineacutecessaire Une interaction seacutecuriseacutee est eacutetablie entre lrsquoordinateur distant la sonde et leserveur de stockage Cette liaison est caracteacuteriseacutee par les pointilleacutes sur la figure 21

FIGURE 21 ndash Scheacutema drsquointerconnexion de la plate-forme

Les speacutecificiteacutes de notre plate-forme se deacutecomposent en deux grandes parties quesont la partie mateacuterielle et la partie systegraveme

Mateacuterielle Un cahier des charges speacutecifique agrave notre plate-forme de mesure doit ecirctrereacutealiseacute La premiegravere partie concerne le choix du mateacuteriel physique

La partie mateacuterielle de la plate-forme de mesure est formeacutee de deux composants lasonde de mesure et le serveur de stockage des donneacutees Le serveur de stockage serafourni par le Laboratoire drsquoInformatique et de Matheacutematiques (LIM) Seule la sonde de me-sure sera indiqueacutee dans le cahier des charges Le mateacuteriel seacutelectionneacute devra respecter lescritegraveres preacutecis Ces critegraveres ont eacuteteacute deacutecideacutes en eacutetudiant les solutions proposeacutees par lesplates-formes preacuteceacutedemment eacutetudieacutees

mdash Peu encombrant de nombreuses sondes proposeacutees par les diffeacuterentes plates-formessont tregraves discregravetes Notre sonde devra eacutegalement ecirctre peu visible Nous souhaitonsque la sonde soit directement connecteacutee sur le routeur de lrsquousager

mdash Peu coucircteux le coucirct unitaire de chaque kit ne devait pas deacutepasser 50D afin que lrsquoonpuisse avoir un nombre de nœuds conseacutequent Un kit sera composeacute de la sonde deson cacircble alimentation drsquoune carte meacutemoire et drsquoun cacircble reacuteseau

mdash Peu eacutenergivore la facture drsquoeacutelectriciteacute eacutetant agrave la charge de lrsquousager nous souhai-tions une solution agrave faible consommation drsquoeacutenergie

mdash Diversiteacute du systegraveme drsquoexploitation (OS) Le systegraveme drsquoexploitation choisi devrasupporter lrsquoinstallation de Paris-traceroute

La seconde partie du cahier des charges de notre plate-forme se concentre sur le choixdu systegraveme drsquoexploitation

Pour rappel sur la figure 21 nous avons repreacutesenteacute en pointilleacute des interactions seacute-curiseacutees Ces eacutechanges concernent lrsquoaccegraves distant agrave la sonde au serveur de stockage et agravela sauvegarde des donneacutees de mesures sur le serveur Le systegraveme drsquoexploitation devracorrespondre aux critegraveres de seacutelection suivants

42

mdash Paris-traceroute Le systegraveme drsquoexploitation devra inteacutegrer Paris-traceroute dans seslibrairies drsquoinstallations ou supporter lrsquoinstallation du code source

mdash Licence GNU-GPL Des modifications du systegraveme seront potentiellement neacuteces-saires

mdash Accegraves distant Le mateacuteriel devant ecirctre geacutereacute agrave distance Un accegraves Secure SHell (SSH)devra donc ecirctre configureacute Le protocole SSH [RFC4250] fut deacuteveloppeacute pour per-mettre lrsquoaccegraves agrave distance de terminaux

mdash Transmission seacutecuriseacutee Lrsquoaccegraves au diffeacuterents composants de la plate-forme devrase faire drsquoune faccedilon seacutecuriseacutee La restriction se fera agrave travers un systegraveme drsquoidentifi-cation

Seacutelection du mateacuteriel [Maksimovic2014] reacutealise une comparaison de diffeacuterents micro-ordinateurs tels que Arduino [Arduino] BeagleBone [Beaglebone] Phidgets [Phidgets]Udoo [Udoo] et RaspberryPi [RaspberryPi] Dans ce comparatif les critegraveres utiliseacutes sontproches de ceux que lrsquoon a seacutelectionneacutes Le tableau 22 reacutesume lrsquoensemble des critegraveres deseacutelection du mateacuteriel Il provient directement de lrsquoarticle [Maksimovic2014]

TABLE 22 ndash Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

Critegraveres Arduino BeagleBone Phidegts Raspberry Pi UdooEncombrement(en mm)

7553 863533 813533 8565398 11085

Coucirct (en $ parnœud

30 45 50-200 25-35 99-135

Eacutenergie (en V) 7-12 5 6-15 5 6-15

Systegraveme

drsquoexploitation

Linux ang-strom

Linux

RaspbianUbuntuAndroidArchLinuxFreeBSDFedoraRISC OS

UbuntuAn-droidLinuxArchLi-nux

Nous avons mis en eacutevidence les valeurs respectant les critegraveres Nous faisons le choixdu Raspberry Pi car il possegravede le plus de critegraveres respecteacutes

Seacutelection du systegraveme drsquoexploitation Le premier critegravere de seacutelection est lrsquoinstalla-tion de Paris-traceroute Drsquoapregraves [Paris-traceroute] lrsquooutil est disponible sur les systegravemesRaspbian Ubuntu ArchLinux et FreeBSDConcernant les licences lrsquoensemble des OS ne sont pas eacutequivalents Ainsi seul RaspbianUbuntu et ArchLinux proposent une licence General Public Licence (GPL) RISC OS est as-socieacute agrave une licence proprieacutetaire Android FreeBSD et Fedora sont sous licence de logiciellibre et open source Les licences de distribution open source vont nous autoriser agrave ajou-ter modifier voire supprimer des parties du code pour qursquoil corresponde plus facilementagrave nos besoinsDe nombreux OS proposent nativement la version cliente du protocole SSH La versionserveur peut ecirctre activeacutee lors de lrsquoinstallation du systegraveme drsquoexploitation Lrsquoaccegraves distantnous permettra eacutegalement la mise agrave jour des outils et des OS pour des raisons de seacutecu-riteacuteLa seacutecurisation des eacutechanges se fera au travers drsquoun Virtal Private Network (VPN) Un

43

VPN est un systegraveme permettant de creacuteer un lien direct entre des ordinateurs distants[Coonjah2015] reacutealise une comparaison entre deux outils permettant la creacuteation de VPNOpenSSH et OpenVPN OpenSSH propose de meilleures performances qursquoOpenVPN auniveau de lrsquoutilisation de la bande passante et des temps de transferts de fichiers Malgreacutecela nous avons pris le parti drsquoutiliser OpenVPN car crsquoest un outil majoritairement uti-liseacute par les entreprises [Coonjah2015] Cet utilitaire nous propose la mise en place drsquouneconnexion seacutecuriseacutee baseacutee sur lrsquoidentification agrave travers un certificat drsquoauthentificationLe VPN permet de joindre agrave travers un adressage priveacute les diffeacuterentes sondes qui se-ront distribueacutees sur lrsquoicircle de La Reacuteunion Drsquoapregraves le site officiel drsquo[OpenVPN] lrsquooutil peutsrsquoinstaller facilement sur les distributions Rapsbian Ubuntu et Fedora

Le choix du systegraveme drsquoexploitation va deacutependre des critegraveres de seacutelection Nous reacuteca-pitulons les critegraveres preacutesenteacutes preacuteceacutedemment dans le tableau 23

TABLE 23 ndash Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur RaspberryPi

Critegraveres Raspbian Ubuntu Android ArchLinux FreeBSD Fedora RISC OSParis-traceroute

Oui Oui Non Oui Oui Non Non

Licence GPL GPL ASL GNULinux

BSD CreativeCom-mons

CastleTechno-logiesLtdLicence

Accegraves dis-tant (SSH)

Oui Oui Oui Oui Oui Oui Oui

OpenVPN Oui Oui Non Non Non Oui Non

Deux systegravemes disponibles pour Raspberry Pi reacutepondent agrave nos critegraveres Raspbian etUbuntu Nous faisons le choix du systegraveme Raspbian Cet OS est une distribution Linuxentiegraverement revue pour des performances optimales sur la carte Raspberry Pi Fortementinspireacutee par la distribution Linux Debian elle propose les mecircmes caracteacuteristiques que ladistribution dite de Bureau Les sondes nrsquoeacutetant pas eacutequipeacutees drsquoun systegraveme drsquoaffichagenous optons pour lrsquoinstallation la plus leacutegegravere possible avec uniquement les paquets neacute-cessaires agrave notre eacutetude

Lrsquooutil drsquoanalyse rTraceroute

Dans la section 21 nous avons preacutesenteacute les contraintes lieacutees agrave la seacutelection drsquoun outildrsquoanalyse des donneacutees de type traceroute Pour rappel ces contraintes sont les suivantes la geacuteolocalisation des adresses IP lrsquoidentification des liens MPLS la geacuteneacuteration drsquounecarte des liens logiques et la geacuteneacuteration drsquoun fichier comportant des statistiques sur lesdiffeacuterents nœuds rencontreacutes

Les outils disponibles Il existe diffeacuterents outils drsquoanalyse des routes que lrsquoon peut ran-ger en trois cateacutegories les geacuteneacuterateurs de donneacutees brutes les plates-formes de mesures etles outils drsquoanalyse graphiques Lrsquooutil que lrsquoon souhaite utiliser entre dans la troisiegravemecateacutegorie La litteacuterature autour drsquooutils graphiques pour lrsquoanalyse des routes nrsquoest pasaussi complegravete que lrsquoon pourrait croire

Gtrace est un outil creacuteeacute par [Periakaruppan1999] Cet outil reproduit graphiquementles reacutesultats obtenus par Traceroute Le logiciel geacutenegravere ses propres donneacutees avant de les

44

repreacutesenter sous forme graphique La geacuteolocalisation ne se fait pas sur les adresses IPmais sur le nom Domain Name System (DNS) des nœuds rencontreacutes La localisation drsquounnœud nrsquoest valideacutee qursquoapregraves croisement des informations entre les abreacuteviations des villeset aeacuteroports drsquoinformations contenues dans deux bases de donneacutees Une derniegravere veacuteri-fication est reacutealiseacutee agrave lrsquoaide de la commande nslookup Actuellement cet outil nrsquoest plusmaintenu Il nrsquoimpleacutemente pas le [RFC4950] permettant lrsquoidentification des nœuds MPLSdans les routes

[Aben2015] preacutesente un outil drsquoanalyse des routes inteacutegreacute agrave Atlas RIPE NCC Cet outildrsquoanalyse se nomme OpenIPMap Il utilise la base de donneacutees de RIPE pour effectuer lageacuteolocalisation des donneacutees Les routes sont ensuite traceacutees sur une carte interactive Lesmesures geacuteneacutereacutees par Atlas sont directement visibles et peuvent srsquointeacutegrer dans OpenIP-Map Lrsquoidentification des nœuds MPLS ainsi que la partie statistique ne sont pas inclusesdans les sorties proposeacutees par OpenIPMap

Dans [Yang2016] lrsquoauteur preacutesente un outil drsquoanalyse des routes centreacute sur le conti-nent africain African Visual Route Le design de lrsquooutil srsquoinspire largement du projetOpenIPMap [Aben2015] Lrsquooutil possegravede un deacutefaut important Il lit uniquement les fi-chiers provenant de la plate-forme Atlas

Le tableau 24 preacutesente les possibiliteacutes offertes par chaque outil preacutesenteacute preacuteceacutedem-ment

TABLE 24 ndash Fonctions disponibles dans les outils graphiques drsquoanalyse des routes

African Visual Route Gtrace OpenIPMapGeacuteolocalisation Oui Oui OuiIdentificationdes liens MPLS

Non Non Non

Cartographie Oui Oui OuiStatistiques Non Non Non

On peut constater que par rapport agrave nos besoins les outils listeacutes preacutesentent des la-cunes Les critegraveres drsquoaffichage des liens MPLS et la partie statistique sur les nœuds inter-meacutediaires nrsquoont pu ecirctre remplis Pour ces raisons nous avons deacuteveloppeacute un outil drsquoana-lyse rTraceroute

Deacuteveloppement de rTraceroute

Geacuteolocalisation Dans le cadre de nos travaux la geacuteolocalisation drsquoadresse IP consi-degravere la position geacuteographique de lrsquoadresse les informations sur le deacutetenteur de lrsquoadresseet lrsquoAutonomous System (AS) associeacutes Un AS est un ensemble drsquoeacutequipements et de reacuteseauxsous une mecircme autoriteacute rTraceroute geacuteolocalise les adresses IP rencontreacutees agrave travers unebase de donneacutees impleacutementeacutee au sein du LIM Cette base de donneacutees est remplie au furet agrave mesure que de nouvelles adresses IP sont remonteacutees par les mesures Lrsquoidentificationdes nouvelles adresses se fait par un script deacuteveloppeacute en python sous ma direction parun eacutetudiant de Licence 3eme anneacutee [LanYanFock2015] Cet outil nommeacute rgeoloc utiliseles commandes de lrsquoApplication Programming Interface (API) de RIPE NCC En interro-geant une base de donneacutees drsquoun RIR nous espeacuterons limiter les erreurs lieacutees agrave la geacuteoloca-lisation Pour nos besoins nous limitons les informations lieacutees agrave la localisation et au FAICes informations sont Pays Latitude Longitude Nom du FAI Numeacutero de lrsquoASLes informations (pays longitude latitude) seront utiliseacutees par la suite pour effectuer

45

des calculs de distance entre deux adresses IP Le nom du FAI autorise le suivi des ac-cords drsquoeacutechanges de paquets sur les routes Le numeacutero de lrsquoAS nous offre la possibiliteacutede suivre les diffeacuterents chemins emprunteacutes en termes drsquoAS diffeacuterents

rgeoloc est capable drsquoextraire les informations de deacutelais et de longueurs de routesdrsquoun fichier traceroute Il peut eacutegalement deacutecouper un fichier contenant plusieurs don-neacutees traceroute en fichier unitaire

La geacuteolocalisation des adresses associeacutees agrave lrsquoidentification des liens MPLS va aider agravela compreacutehension des routes de lrsquoInternet dans le monde

Identification des liens MPLS Paris-traceroute indique dans ses sorties les liensMPLS rencontreacutes [Augustin2007] indique que lrsquoidentification des liens se fait par la lec-ture des informations contenues dans les paquets reccedilus par lrsquooutil rTraceroute va identi-fier les marques MPLS et les repreacutesenter en un coloris diffeacuterent sur les cartes

Cartographie Lors de la geacuteolocalisation des adresses IP lrsquoinformation neacutecessaire agravela cartographie est le pays Lors de cette identification deux nouvelles informations sontassocieacutees agrave lrsquoIP Ce sont les coordonneacutees du pays pour la carte passeacutee en paramegravetre Agravepartir de ces nouvelles coordonneacutees rTraceroute va geacuteneacuterer une nouvelle carte affichantlrsquoensemble des liens logiques (entre pays) preacutesents dans les traces analyseacutees

Statistique rTraceroute geacutenegravere des statistiques sur chaque nœud rencontreacute La cleacutedrsquoidentification drsquoun nœud est son adresse IP et sa position sur la route analyseacutee Les sta-tistiques geacuteneacutereacutees sont lrsquooccurrence de la paire drsquoidentification le deacutelai minimal obtenupour joindre ce nœud agrave cette position et le pays rattacheacute agrave lrsquoadresse IP

Notre outil est actuellement disponible sur le site du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrrtraceroute [rtraceroute] Cet outil est distribueacute sous licencelibre pour une large diffusion dans la communauteacute scientifique

23 Protocole de mesure

La connectiviteacute particuliegravere de lrsquoicircle par les deux cacircbles sous-marins provoque un in-teacuterecirct de lrsquoeacutetude des routes emprunteacutees Lrsquoun des objectifs de nos mesures est drsquoeacutetudierlrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012 et 2016 Le second objec-tif est lrsquoeacutetude de la connectiviteacute en terme de routes de deacutelais et des accegraves logiques delrsquoInternet reacuteunionnais

Notre protocole de mesure se divise en 3 parties La premiegravere partie preacutesente lespoints communs entre les deux objectifs La seconde consiste agrave effectuer une comparai-son de lrsquoeacutetat actuel avec le travail effectueacute preacuteceacutedemment par [Anelli2012] Le troisiegravemepoint concerne les mesures drsquoidentification des portes de lrsquoaccegraves Internet de La Reacuteunion

231 Eacutechantillon de mesure

Lrsquoeacutechantillon drsquoadresses IP que lrsquoon va utiliser dans nos eacutetudes se doit drsquoecirctre repreacute-sentatif et preacutecis La preacutecision srsquoobtient par la taille drsquoun eacutechantillon La repreacutesentativiteacutepar le respect de la distribution des adresses IP dans lrsquoInternet

Il existe 232 adresses IPv4 avec une reacutepartition bien speacutecifique Drsquoapregraves les [RFC3232RFC5735 RFC6761] 592 708 865 adresses sont reacuteserveacutees On peut citer en exemple lesadresses de type 1921680016 Ce bloc est reacuteserveacute aux reacuteseaux priveacutes Son utilisationpreacutevue est documenteacutee dans le [RFC1918] Telles que deacutecrites dans ce standard les adresses

46

de ce bloc nrsquoapparaissent pas leacutegitimement sur lrsquoInternet publicApregraves soustraction il ne reste que 3 702 258 431 adresses agrave reacutepartir dans les diffeacuterentspays et FAI Ces IP sont distribueacutees par preacutefixes par les RIR dont RIPE NCC pour lrsquoEu-rope et AfriNIC pour le continent africain Afin drsquoavoir un eacutechantillon preacutecis nous avonsgeacuteneacutereacute aleacuteatoirement 1 000 000 drsquoadresses non reacuteserveacutees Ces adresses ont eacuteteacute testeacutees parle protocole ICMP Ce test nous assure que les adresses IP sont des adresses que nouspourrons utiliser par la suite Nous avons ainsi valideacute 84 000 adresses Neacuteanmoins nousnrsquoavons aucune garantie sur la modification des attributions des adresses IP au fil dutemps

Pour que notre jeu de destinations soit repreacutesentatif nous avons geacuteolocaliseacute les adressesvalides Nous avons regroupeacute les reacutesultats par continent pour une meilleure lisibiliteacute Lereacutesultat obtenu est illustreacute par la figure 22a

Nous pouvons constater une forte dispariteacute entre les diffeacuterents continents LrsquoOceacuteanieet lrsquoAfrique ont moins de 1 de preacutesence dans notre jeu On constate eacutegalement une fortepreacutesence drsquoadresse de type BOGONS Ces adresses font parti de blocs encore non alloueacutespar les RIR ou alors reacuteserveacutees par lrsquoInternet Assigned Numbers Authority (IANA) maispreacutesentes au sein de lrsquoInternet On peut citer lrsquoadresse 10012016100 en exemple Cetteadresse est marqueacutee comme reacuteserveacutee par lrsquoIANA par RIPE NCC Ce nombre drsquoadressesest en diminution avec lrsquoattribution des blocs restant aux diffeacuterents FAI Pour validerce reacutesultat nous lrsquoavons compareacute agrave la distribution datant de Mai 2016 du site CountryIP-Blocks 1 Le regroupement est illustreacute par la figure 22b On remarque un certain eacutequilibreentre lrsquoEurope et lrsquoAsie et une domination de lrsquoAmeacuterique du Nord

Notre reacutepartition est diffeacuterente en de trop nombreux points agrave celle de CountryIP-Blocks Les donneacutees communiqueacutees par CountryIPBlocks proviennent des RIR Cettedistribution est donc plus proche de la reacutepartition reacuteelle Crsquoest pourquoi agrave partir de notreensemble drsquoadresses initales nous seacutelectionnerons un sous ensemble en respectant la dis-tribution preacutesenteacutee par la figure 22b

232 Eacutevolution

En 2012 [Anelli2012] a effectueacute une campagne de ping depuis Paris et La ReacuteunionCette campagne reacutealiseacutee sur le FAI RENATER avait pour objectif la mise en eacutevidence dela diffeacuterence des deacutelais entre Paris et La Reacuteunion Afin drsquoeacutetudier lrsquoeacutevolution des deacutelaiset de la longueur des routes depuis lrsquoeacutetude preacuteceacutedente nous avons reacutealiseacute une nouvellecampagne de ping depuis Paris et La Reacuteunion Cette campagne a mis a contribution lesnœuds [PlanetLabEurope] de lrsquoUniversiteacute de La Reacuteunion et de lrsquoUniversiteacute Pierre et Ma-rie Curie

Agrave partir du jeu drsquoadresses preacutepareacute preacutesenteacute preacuteceacutedemment nous avons tireacute le maxi-mum drsquoadresses IP possibles tout en respectant la reacutepartition geacuteographique de la figure22b Nous avons obtenu un jeu de 40 000 adresses Nous avons fait le choix drsquoutiliserun eacutechantillon drsquoadresses diffeacuterentes par rapport agrave la premiegravere eacutetude Cette deacutecision pro-vient de notre volonteacute drsquoobtenir des donneacutees repreacutesentatives de lrsquoeacutetat actuel de lrsquoInterneten terme de reacutepartition des adresses Chaque mesure sera indeacutependante lrsquoune de lrsquoautreEn effet pour qursquoune mesure se lance il faut que la preacuteceacutedente soit finie

Lrsquoanalyse se deacuteroulera agrave lrsquoidentique de ce qui srsquoest fait pour lrsquoeacutetude preacuteceacutedente agravelrsquoexception drsquoune modification Nous y ajouterons la comparaison de la longueur desroutes Les reacutesultats associeacutes agrave cette eacutetude seront preacutesenteacutes dans la section 241

1 Source httpswww countryipblocks net

47

(a) IP seacutelectionneacutee au hasard (b) CountryIPBlocks

FIGURE 22 ndash Distribution geacuteographique des adresses IPv4 publiques

233 Connectiviteacute

La seconde eacutetude de meacutetrologie active concerne lrsquoeacutetude de la connectiviteacute de La ReacuteunionPour reacutepondre agrave notre objectif nous mettons en place deux protocoles de mesure Unprotocole eacutetudiant la connectiviteacute Depuis La Reacuteunion et un protocole dans le sens Vers LaReacuteunion

Depuis La Reacuteunion

Notre eacutetude de meacutetrologie se compose de plusieurs phases

1 la preacuteparation du jeu de destinations

2 la reacutealisation des mesures par les sondes

3 la quantification des perturbations de nos mesures sur lrsquoaccegraves des usagers

4 la collecte des reacutesultats obtenus par les sondes

5 lrsquoanalyse des reacutesultats

Preacuteparation La reacutepartition geacuteographique preacutesenteacutee dans la figure 22b ne peut pas srsquoap-pliquer agrave lrsquointeacutegraliteacute de notre ensemble de deacutepart Afin de pouvoir garder cette reacutepar-tition nous avons reacuteduit notre jeu de destinations agrave 10 000 adresses Cette reacuteduction estneacutecessaire afin que lrsquoensemble de nos mesures puissent ecirctre reacutealiseacutees en un deacutelai de 24heures Bien que le nombre drsquoadresses seacutelectionneacutees repreacutesente moins de 1 des adressesIP publiques de lrsquoInternet il est neacuteanmoins suffisant pour que notre jeu reste preacutecis

48

Reacutealisation Chaque sonde eacutetant indeacutependante lrsquoautomatisation du lancement des me-sures degraves le deacutemarrage est neacutecessaire De fait une proceacutedure a eacuteteacute implanteacutee au seinde lrsquoOS Cette proceacutedure va autoriser le deacutemarrage des mesures degraves la fin de la phasedrsquoinitialisation de lrsquoensemble des services de Raspbian La mise en place des mesures estdiviseacutee en 2 eacutetapes

La premiegravere consiste pour chaque sonde agrave creacuteer ses propres sceacutenarios de mesuresUn sceacutenario est un fichier contenant deux colonnes destination et intervalle de temps Lapremiegravere colonne contient les 10 000 adresses IP de destination La seconde colonne re-groupe des valeurs qui serviront drsquoeacutecart entre deux mesures Ces valeurs ont eacuteteacute geacuteneacutereacuteessuivant une loi exponentielle de taux 864 Ce taux provient de lrsquoeacutequation 21 ci-dessous

taux = nombre de secondes par journombre dprimeadresses IP = 8640010000 = 8 64(21)

Les valeurs obtenues seront identiques sur lrsquoensemble des sondes de mesures Chaquesceacutenario sera creacuteeacute en tirant aleacuteatoirement une adresse IP et un eacutecart Une fois que lrsquoen-semble des sceacutenarios est eacutecrit et numeacuteroteacute de 1 agrave 28 la sonde va programmeacute dans le tempslrsquoexeacutecution de la seconde eacutetape gracircce agrave la commande at

La seconde eacutetape consiste agrave lire le sceacutenario du jour et agrave joindre la destination par lrsquooutilde mesure La commande exacte exeacutecuteacutee par chaque test est

Paris-traceroute -m 255 -n -p icmp ip

Dans laquelle les options indiquent

mdash -m 255 la valeur du champ TTL du paquet est mise agrave sa valeur maximale (255)Nous faisons le choix drsquoautoriser lrsquooutil agrave essayer de joindre la destination jusqursquoagraveeacutepuisement de la valeur maximale autoriseacutee par le protocole pour identifier certainsproblegravemes de routage

mdash -n pas de reacutesolution de DNS Afin drsquooptimiser les mesures nous avons eacutelimineacute lareacutesolution des noms des routeurs Seules les adresses IP seront afficheacutees

mdash -p icmp le protocole utiliseacute pour la mesure [Wenwei2006] effectue une eacutetude com-parative entre les protocoles ICMP et TCP pour les mesures de deacutelai Ils ont montreacuteque dans certaines conditions les reacutesultats sont similaires Quand le ratio α calculeacuteentre le RTT moyen et le RTT minimal tend agrave ecirctre important (supeacuterieur agrave 20) TCPest moins stable que son concurrent Crsquoest pour cette raison que nous avons fait lechoix de lrsquoICMP

mdash ip adresse IP de destination que la commande va essayer de joindre

Veacuterification La sonde va consommer de la bande passante de chaque connexion Inter-net Lrsquoestimation du deacutebit de la mesure deacutepend du nombre moyen de paquets eacutemis parmesure et de la dureacutee moyenne drsquoune mesure Agrave lrsquoaide drsquoune peacuteriode de test nous avonspu calculer divers paramegravetres drsquoune mesure reacutealiseacutee avec Paris-traceroute Les informa-tions obtenues concernent la dureacutee drsquoune mesure et le nombre de paquets eacutechangeacutes Lesreacutesultats obtenus montrent qursquoune mesure dure en moyenne 28 secondes et se composede 54 paquets de 64 octets Une mesure geacutenegravere donc un deacutebit drsquoeacutemission de 987 bitss agravelrsquoentreacutee de lrsquointerface reacuteseau Le deacutebit geacuteneacutereacute effectif (au niveau du support) est de 1265bitss Le deacutebit geacuteneacutereacute par rapport au deacutebit drsquoaccegraves drsquoun accegraves ADSL est alors neacutegli-geable

49

Drsquoapregraves le rapport [Vergoz2013] le deacutebit montant le plus faible mesureacute est de 128 33KbsLa charge calculeacutee repreacutesente pregraves de 1 de la capaciteacute du lien drsquoaccegraves Comme il yaura en moyenne 4 mesures simultaneacutees la capaciteacute consommeacutee correspond donc agrave 4Cette situation correspond au pire cas Dans la situation courante drsquoun accegraves theacuteorique enMbits nous pouvons avancer que la sonde nrsquoaura aucun impact sensible sur la connec-tiviteacute du participant

Collecte Une phase de collecte des donneacutees de mesures est reacutealiseacutee Le but de cetteeacutetape est de libeacuterer de lrsquoespace disque sur la sonde Chaque jour agrave minuit un nouveausceacutenario est lanceacute Une fois que 7 sceacutenarios ont eacuteteacute lus la sonde va creacuteer une archive Lenom de lrsquoarchive sera composeacute de la date de creacuteation de lrsquoarchive du nom de la sonde etde la TAI Le nom propose un classement rapide des donneacutees que ccedila soit par TAI ou pardate Lrsquoarchive contiendra les mesures des 7 jours preacuteceacutedents Lrsquoarchive est envoyeacutee sur leserveur de stockage localiseacute au sein du laboratoire Une comparaison de lrsquoempreinte MD5de lrsquoarchive preacutesente sur le serveur et sur la sonde de mesure sera reacutealiseacutee Si les deuxempreintes sont identiques alors la suppression de lrsquoarchive heacutebergeacutee sur le RaspberryPi est reacutealiseacutee Le jour drsquoenvoi des donneacutees sur le serveur aucune mesure nrsquoest effectueacuteeafin de ne pas geacuteneacuterer de bruit suppleacutementaire sur le lien Le lendemain de la copiedes donneacutees la sonde va amorcer 7 nouveaux jours de mesures Un cycle de mesuresest composeacute de 7 jours de mesures conseacutecutifs et drsquoun jour drsquoenvoi des donneacutees versle serveur de stockage Ce cycle est reacutepeacuteteacute 4 fois par mois La figure 23 scheacutematise lefonctionnement drsquoune sonde de mesure sur une dureacutee de 32 jours soit 4 cycles de mesureet de collecte

La plate-forme reacutealise des mesures en continue jusqursquoagrave lrsquoarrecirct complet de lrsquoappareil demesures Nous nrsquoavons pour lrsquoinstant pas programmeacute drsquoarrecirct des mesures Dans le cadrede lrsquoanalyse reacutealiseacutee dans ce manuscrit nous avons pris un cycle complet de mesure soit32 jours Nous nrsquoeffectuons pas drsquoanalyse comparative temporelle de nos mesures

Analyse La plate-forme reacutealise les mesures par cycle de 7 jours Lrsquoanalyse des tracesreacutecolteacutees se fait en plusieurs eacutetapes Le processus drsquoanalyse commence par la deacutecoupedu fichier de donneacutees en fichiers atomiques Chaque fichier atomique contiendra uni-quement le reacutesultat drsquoune mesure Chaque fichier de donneacutees reacutecolteacutees par jour va doncecirctre deacutecouper en 10 000 fichiers atomiques Cette deacutecoupe est reacutealiseacutee par lrsquooutil rgeolocLrsquoanalyse des fichiers atomiques diffegravere selon lrsquoobjectif

Lrsquoextraction des deacutelais srsquoeffectue agrave lrsquoaide de rgeoloc Lors de lrsquoextraction les informa-tions sur les deacutelais sont accompagneacutees de la longueur du chemin et des adresses IP sourceet destination

Nous souhaitons deacuteterminer si les routes Internet provenant de La Reacuteunion sont sy-meacutetriques ou non Pour cela une eacutetude des deacutelais et des routes vers La Reacuteunion est effec-tueacutee

Vers La Reacuteunion

Les routes asymeacutetriques sont freacutequentes et principalement dues agrave des politiques deroutage et agrave lrsquoingeacutenierie de trafic Des meacutecanismes comme lrsquoeacutequilibrage de charge (load-balancing) Hot Potato Routing ou encore BGP (Border Gate Protocol) peuvent eacutegalementgeacuteneacuterer un pheacutenomegravene drsquoasymeacutetrie des liensHot Potato Routing est un pheacutenomegravene lieacute au routage sans regraveglement Le routeur transfegraverele paquet aussi vite que possible vers un routeur situeacute en aval sur la route [Feige1992Wang2018]

50

FIGURE 23 ndash Fonctionnement de la sonde

BGP est protocole de routage inter-AS deacutefini dans le [RFC1105] En fonction des informa-tions eacutechangeacutees deux paquets peuvent ne pas suivre la mecircme chemin IP mais suivre unchemin AS identique

Afin de veacuterifier la preacutesence des liens asymeacutetriques nous avons mis en place le proto-cole suivant en utilisant la plate-forme Atlas RIPE NCC [Ripe2010]

Preacuteparation Pour notre eacutetude et en accord avec les Conditions Geacuteneacuterales drsquoUtilisation(CGU) drsquoAtlas nous avons seacutelectionneacute le nombre maximal de sondes autoriseacutees soit1 000 Ces sondes serviront de sources pour nos mesures La seacutelection des sondes srsquoestfaite selon deux critegraveresLe premier est le fait que la sonde soit active En effet mecircme si la sonde nrsquoest pas joi-gnable Atlas continue drsquoindiquer la sonde dans ses donneacuteesLa seconde indication neacutecessaire agrave la seacutelection drsquoune sonde est son pays drsquoheacutebergementIl est neacutecessaire de garder la mecircme reacutepartition geacuteographique que les destinations seacutelec-tionneacutees pour lrsquoeacutetude preacuteceacutedente (voir Figure 22b)

La seacutelection des destinations srsquoest effectueacutee sur les critegraveres drsquoidentification des FAI etdes TAI disponibles sur lrsquoicircle Tout comme notre plate-forme de mesure de la section 233

51

il est pour nous important que nos destinations respectent une pariteacute sur ces critegraveres deseacutelection Afin de nous assurer que nos destinations soient physiquement heacutebergeacutees surlrsquoicircle nous avons pris la deacutecision de seacutelectionner des sondes de mesure de lrsquoeacutetude preacuteceacute-dente Lrsquoutilisation drsquoAtlas eacutetant reacutegi par un systegraveme drsquoutilisation et de creacuteation de creacuteditnous avons ducirc limiter le nombre de nos destinations agrave 10 IP publiques de la plate-formeRunPL Nous avons pleinement conscience que ce nombre nrsquoest pas forceacutement repreacute-sentatif du nombre drsquoadresse IP disponibles sur lrsquoIcircle de La Reacuteunion mais nous sommesrestreint par les CGU drsquoAtlas

Reacutealisation Atlas propose deux possibiliteacutes de programmation des sondes La premiegraveresrsquoeffectue agrave travers son interface graphique Le second choix est drsquoutiliser une API Commeil est fastidieux de programmer un nombre important de mesures agrave travers lrsquointerfacegraphique nous faisons le choix drsquoutiliser lrsquoAPI Pour effectuer 10 000 mesures par journous avons fait le choix de garder le taux de la loi exponentielle de lrsquoeacutetude preacuteceacutedentesoit 8 64 secondes Afin de limiter les pheacutenomegravenes de synchronisation le calendrier demesures a eacuteteacute geacuteneacutereacute aleacuteatoirement Nous nous sommes assureacutes que chaque sonde demesures allait effectivement joindre lrsquoensemble des destinations par jour

Veacuterification La veacuterification des perturbations se fait sur la bande passante descendanteEn effet ce sont les sondes de la plate-forme RunPL qui geacutenegraverent du trafic en continu Ilne faut pas que les mesures de la section 233 soient impacteacutees par lrsquoarriveacutee des paquetsentrants Le nombre maximal de paquets arrivant jusqursquoau routeur de lrsquoheacutebergeur estde 3 Un paquet possegravede un poids maximal de 64 octets Un poids total de 1536 bitsest envoyeacute agrave la destination Une mesure eacutetant programmeacutee toutes les 8 secondes nousutilisons cette valeur comme variable pour calculer le deacutebit Nous avons donc un deacutebitde 192 bits

Drsquoapregraves le rapport [Vergoz2013] le deacutebit descendant le plus faible mesureacute est de 1 58Mbits Notre mesure impact repreacutesente donc approximativement 0 12 de la capaciteacutedu lien Cet impact est neacutegligeable agrave un instant donneacute

Collecte La plate-forme Atlas stocke automatiquement les reacutesultats lieacutes agrave ses expeacuteri-mentations sur son propre serveur Une fois lrsquoensemble des mesures reacutealiseacutees nous avonsreacutecupeacutereacute les reacutesultats Un total de 300 000 fichiers correspondant aux 300 000 mesuresont eacuteteacute teacuteleacutechargeacutes du serveur drsquoAtlas

Analyse Cette partie de lrsquoeacutetude est fortement similaire agrave lrsquoanalyse effectueacutee pour lrsquoeacutetudedes routes et deacutelais depuis La Reacuteunion Une seule partie diffegravere En effet comme indiqueacutedans la section preacuteceacutedente chaque fichier collecteacute repreacutesente une mesure Nous nrsquoavonsdonc pas la neacutecessiteacute drsquoeffectuer une phase de deacutecoupage de nos donneacutees en fichiersatomiques

Reacutecapitulatif

Afin de pouvoir effectuer une comparaison entre les deux protocoles de mesures surlrsquoeacutetude des routes et des deacutelais associeacutes le tableau 25 reacutesume les deux protocoles sur lemois de mesure analyseacute

Nous constatons une diffeacuterence notable en terme de sources et de destinations Cettediffeacuterence impacte le nombre de fichiers atomiques que lrsquoon a obtenus Le nombre defichiers atomiques provient de la multiplication entre le nombre de sources le nombre dedestinations et le nombre de jours de mesures Cela correspond au nombre maximal de

52

TABLE 25 ndash Reacutesumeacute des caracteacuteristiques du jeu de donneacutees

Depuis VersSondes de mesures Raspberry Pi Atlas RIPE NCC

Nombres de Destinations 10 000 IP 10 raspberry-piNombres de sources 27 1 000

Nombres de jours de mesures 28 30Outil de mesure Paris-traceroute

Nombres de fichiers atomiques 7 560 000 300 000

Nombres de fichiers analyseacutes 1 015 180 38 714

fichiers que lrsquoon peut obtenir La derniegravere ligne du tableau indique le nombre de fichiersque lrsquoon a pu analyser apregraves veacuterification des mesures et nettoyage des fichiers erroneacutesCe nettoyage se fait par lrsquooutil drsquoanalyse rTraceroute Dans la section 233 nous avons puanalyser 13 43 des donneacutees De la section 233 12 91 des donneacutees ont eacuteteacute exploiteacutesNous avons dans les deux cas un taux de pertes de donneacutees important

24 Reacutesultats

Dans la suite de notre manuscrit et pour des raisons pratiques nous avons reacuteduit lenom des continents agrave deux lettres La correspondance entre lrsquoacronyme et le nom completest indiqueacutee dans le tableau 26

TABLE 26 ndash Correspondance entre acronymes et noms des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

Cette correspondance provient de lrsquoutilisation des deux premiegraveres lettres de chaquecontinent en version anglophone

241 Eacutevolution

La comparaison avec lrsquoexistant fut diviseacutee en deux Dans un premier temps nousavons compareacute les deacutelais Par la suite nous avons utiliseacute une partie des donneacutees nonencore exploiteacutees pour reacutealiser une comparaison de la longueur des routes

Distribution du RTT

Les mesures obtenues ont permis drsquoeffectuer une comparaison avec les donneacutees reacute-colteacutees en 2012 par [Anelli2012] Nous avons effectueacute une campagne de ping en 2016 afindrsquoeacutetudier lrsquoeacutevolution des deacutelais depuis Paris et La Reacuteunion La figure 24 illustre lrsquoeacutevolu-tion de la distribution du RTT en 4 ans

Entre 2012 et 2016 le jeu drsquoadresses IP de destination fut diffeacuterent En 2012 aucunereacutepartition geacuteographique ne fut eacutetablie En 2016 la distribution des adresses est cellepreacutesenteacutee dans la partie 231 Malgreacute ces diffeacuterences nous remarquons que les courbesont les mecircmes tendances en 2012 et en 2016 Des pics sont preacutesents aux environs desvaleurs 005 01 et 03 secondes pour Paris en 2012 Des pics sont identifieacutes aux valeurs02 035 et 05 secondes pour La Reacuteunion en 2012 Les pics sont preacutesents aux alentours desmecircmes valeurs sur les deux campagnes de mesure Nous eacutemettons lrsquohypothegravese que ces

53

pics correspondent aux 3 continents les plus repreacutesenteacutes dans nos eacutechantillons agrave savoirlrsquoAmeacuterique du Nord lrsquoAsie et lrsquoEurope Nous veacuterifierons cela par la suite

Malgreacute un eacutecart de 4 ans entre les deux campagnes de mesures on constate une sta-biliteacute du deacutelai minimal aux alentours de 02 secondes La stabiliteacute du deacutelai srsquoest elle ac-compagneacutee drsquoune stabiliteacute de la longueur des routes

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(a) 2012

0

0002

0004

0006

0008

001

0012

0014

0016

01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(b) 2016

FIGURE 24 ndash Comparaison des deacutelais entre Paris et La Reacuteunion

Longueur du chemin

Dans le section preacuteceacutedente nous avons constateacute que le deacutelai minimal pour quitter lrsquoicircleest resteacute stable en 4 ans Nous allons essayer de corroborer cette stabiliteacute du deacutelai par unestabiliteacute de la longueur des routes sur la mecircme peacuteriode

La longueur des routes fut obtenue par lrsquoanalyse inverse du TTL Le [RFC1700] preacute-conise une valeur de deacutepart de 64 Or le site Wikipeacutedia [WikiPing] indique que le TTLinitial peut varier Les valeurs les plus communes sont 64 128 voire 255 dans certains casNous avons donc en fonction de la valeur du TTL soustrait une valeur de deacutepart agrave la va-leur indiqueacutee pour obtenir la longueur de la route Dans les donneacutees datant de 2012 leslongueurs de certaines routes sont eacutegales agrave 127 Ne pouvant deacutecider de la valeur de TTLde deacutepart nous avons fait le choix de ne garder que les reacutesultats dont le TTL afficheacute parping est supeacuterieur ou eacutegal agrave 128 Pour les donneacutees de 2016 nous nrsquoavons pas reacutepertorieacutede valeurs comprises dans lrsquointervalle [ 120 208] De fait nous avons gardeacute lrsquoensembledes valeurs obtenues

La figure 25 illustre lrsquoeacutevolution des routes entre les deux jeux de reacutesultats En 2012la longueur des routes eacutevolue entre 10 et 40 nœuds avec un pic agrave 24 nœuds En 2016les routes ont une longueur qui varie entre 5 et 30 sauts avec un pic agrave 17 Un eacutecart de 7nœuds repreacutesenteacute sur notre figure

Les deacutelais entre La Reacuteunion et Paris sont resteacutes stables entre 2012 et 2016 Sur la mecircmepeacuteriode la longueur des routes depuis La Reacuteunion a diminueacute

242 Connectiviteacute de La Reacuteunion

La section 241 a montreacute lrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012et 2016 Malgreacute ces eacutetudes aucune caracteacuterisation de la connectiviteacute de La Reacuteunion nrsquoaeacuteteacute reacutealiseacutee Dans cette section nous allons effectuer cette caracteacuterisation en termes dedeacutelais et des routes emprunteacutees

54

FIGURE 25 ndash Eacutevolution de la longueur des routes entre 2012 et 2016

Geacuteneacuteraliteacutes

Nous avons en plus des informations sur les deacutelais et la longueur des routes desinformations sur les adresses IP rencontreacutees tout au long des mesures Ainsi nous avonsdeacutecideacute de reacutepartir notre analyse sur 4 principales meacutetriques que sont

mdash La longueur du chemin est deacutetermineacutee par le nombre de nœuds rencontreacute par Paris-traceroute

mdash Le deacutelai analyseacute est le RTT Il est associeacute agrave la destination jointe

mdash La localisation des adresses IP avant (resp apregraves) le passage par les cacircbles sous-marins quand nos donneacutees arrivent (resp quittent) agrave La Reacuteunion

mdash La distance geacuteographique correspond agrave la distance reacuteelle (en Km) entre la source etla destination Pour cela on utilise lrsquoeacutequation (22) Ils srsquoagit de lrsquoeacutequation de calculde distance entre deux points sur une sphegravere

d = arccos[cos(x)times cos(y)times cos(m)times cos(n) ++ cos(x)times sin(y)times cos(m)times sin(n) ++ sin(x)times sin(m)]times 6371 1 [km]

(22)

ougrave

mdash (xy) (mn) sont respectivement la latitude et la longitude de la source et de la des-tination (en radians)

mdash 63711 km est la reacutefeacuterence en radius de la Terre

Les coordonneacutees geacuteographiques des adresses IP ont eacuteteacute obtenues par notre outil degeacuteolocalisation Nous avons ainsi pu calculer la distance geacuteographique entre deux adressesIP Si nous prenons lrsquoexemple de la reacutepartition geacuteographique des adresses IP des sondesatlas et des destinations seacutelectionneacutees nous obtenons la figure 26 Les deux courbes sontsimilaires en terme de reacutepartition des distances La diffeacuterence des valeurs de lrsquoaxe des

55

ordonneacutees provient du nombre plus important drsquoeacutechantillons pour la figure 26a Surcette figure il est difficile de visualiser la distance des adresses relatives au continentoceacuteanique La faible eacutepaisseur de la probabiliteacute des adresses oceacuteaniques est eacutegalementpreacutesente sur la figure 26b On constate sur cette figure une preacutesence plus importantedrsquoadresses IP africaines et asiatiques

(a) Depuis (b) Vers

FIGURE 26 ndash Distribution de la distance geacuteographique par continent

La reacutepartition des adresses IP dans le monde et leur distance geacuteographique ont-ellesun impact sur la distribution des deacutelais Crsquoest agrave cette question que nous allons essayerde reacutepondre dans la section suivante

Distribution du RTT par continent

La figure 27 repreacutesente la distribution des deacutelais obtenus par nos mesures incluantla reacutepartition par continent Nous avons utiliseacute un regroupement des deacutelais par eacutecart de10 ms On constate rapidement que les deux figures nrsquoont pas la mecircme tendance Dans lasection 241 nous avions eacutemis lrsquohypothegravese que les pics preacutesents sur les courbes des deacutelaiseacutetaient associeacutes aux continents les plus preacutesents dans la geacuteolocalisation des adresses IP

La comparaison que lrsquoon peut effectuer avec les donneacutees de lrsquoexistant est celle delrsquoeacutetude Depuis Ainsi on remarque que la figure garde la mecircme forme avec la preacutesencedes 3 pics Sur la figure 27a nous pouvons identifier ces pics Ces pics repreacutesentent lrsquoEu-rope lrsquoAmeacuterique du Nord et lrsquoAsie On constate que le deacutelai minimal est stable avec unevaleur proche des 200 ms

Dans lrsquoexpeacuterimentation Vers La Reacuteunion nous constatons la preacutesence de non pas 3mais de 2 pics Le pic relatif au continent asiatique a disparu De plus les deacutelais associeacutesagrave ce continent sont moins concentreacutes Pour les autres continents la distribution des deacute-lais est relativement identique agrave lrsquoexpeacuterimentation preacuteceacutedente Nous pouvons remarquerla preacutesence de deacutelais africains vers La Reacuteunion aux alentours des 100 ms Les deacutelais de-puis lrsquoEurope sont sensiblement eacutequivalents agrave ceux de lrsquoeacutetude Depuis avec des deacutelaiscompris entre 180 et 190ms

Agrave la lecture des reacutesultats nous pouvons confirmer que lrsquohypothegravese avanceacutee preacuteceacute-demment est juste

Nous avons connaissance drsquoune relation entre la distance et le temps mis pour parcou-rir cette distance Ayant constateacute lrsquoeacutevolution des deacutelais nous allons maintenant eacutetudierlrsquoeacutevolution de la distance parcourue

56

(a) Depuis (b) Vers

FIGURE 27 ndash Distribution du RTT par continent

Longueur du chemin par continent

Nous avons pu dans la section 241 constater une diminution des routes entre 2012et 2016 Les figures 28 indiquent la reacutepartition de la longueur des routes obtenues enfonction des continents La premiegravere constatation est la forte similitude entre les deuxcourbes

Sur la figure 28a on remarque la preacutesence drsquoun pic pour une longueur de 18 nœudsCela indique que peu importe le continent de destination la probabiliteacute drsquoavoir une routedrsquoune longueur de 18 sauts est importante

Dans le sens Vers le pic est quasiment identique selon le continent de deacutepart Lavaleur geacuteneacuterale se situe agrave une valeur de 15 nœuds pour lrsquoAmeacuterique du Nord lrsquoOceacuteanieet lrsquoAmeacuterique du Sud et agrave une valeur de 16 sauts pour les autres continents

Avec un eacutecart de 2 agrave 3 sauts selon le sens on peut donc consideacuterer que la longueur duchemin reste identique pour lrsquoInternet reacuteunionnais

(a) Depuis (b) Vers

FIGURE 28 ndash Distribution de la longueur des routes par continent

Longueur du chemin et distance geacuteographique

Le premier reacutesultat analyseacute concerne la distance logique par rapport agrave la distancephysique Dans lrsquoarticle [Leguay2004] lrsquoauteur a calculeacute la moyenne des chemins dans

57

lrsquoInternet agrave partir drsquoun jeu incluant plus de 7 000 000 de donneacutees La valeur obtenue estde 15 57 sauts

Dans nos reacutesultats la valeur moyenne calculeacutee est de 17 11 eacutequipements traverseacutesavant de joindre la destination Cette valeur regroupe lrsquoensemble de nos donneacutees sansaucune distinction de la localisation de la source drsquoeacutemission En eacutetudiant uniquementles donneacutees Depuis les routes ont une longueur moyenne de 17 37 sauts Si on analysela longueur des routes des donneacutees entrant sur lrsquoicircle on obtient une moyenne de 16 85eacutequipements On observe deacutejagrave une premiegravere asymeacutetrie des routes selon que lrsquoon quitteou que lrsquoon joint lrsquoicircle de La Reacuteunion

Les figures 29a et 29b illustrent les reacutesultats obtenus Chaque figure est diviseacutee endeux On a inseacutereacute en bas de chaque figure la PDF de la longueur du chemin en fonctionde la distance entre sources et destinations Tandis qursquoen haut les aires dessineacutees parles ellipses contiennent 95 des eacutechantillons rattacheacutes agrave chaque continent Les barresdrsquoerreurs repreacutesentent quant agrave elles la moyenne et lrsquoeacutecart-type de la longueur du cheminassocieacutes agrave chaque continent

Nous remarquons que depuis La Reacuteunion la majoriteacute des distance sont situeacutees danstrois grandes reacutegions Le premier regroupement se situe entre 8 000 et 12 000 km Cebloc inclus lrsquoAsie lrsquoOceacuteanie lrsquoEurope et lrsquoAmeacuterique du sud Le second bloc comporteque lrsquoAmeacuterique du Nord et se situe au delagrave des 14 000 km Reste le cas africain Ce conti-nent est tregraves proche de La Reacuteunion Les destinations et sources africaines sont toutesinfeacuterieures agrave 10 000 km

Lrsquoanalyse geacuteneacuterale des reacutesultats obtenus montre que le nombre de sauts nrsquoest pas deacute-pendant de la distance geacuteographique Sur la figure 29a on constate des chemins aussilongs sur la boucle locale que pour joindre certaines destinations lointaines On a eacutegale-ment repreacutesenteacute sur les figures PL(d) = α times d + β qui est la fonction lineacuteaire de la lon-gueur du chemin comme fonction de la distance geacuteographique Le tableau 27 regroupeles eacutequations obtenues selon lrsquoexpeacuterimentation

TABLE 27 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

Expeacuterimentation Eacutequation PL(d)Depuis La Reacuteunion 1 58 lowast 10minus5 timesD + 16 65

Vers La Reacuteunion 7 50 lowast 10minus5 timesD + 18 32

La valeur obtenue pour α qui est le coefficient directeur de la droite possegravede unmultiplicateur eacutegal agrave 10minus5 Cette valeur indique le nombre de sauts suppleacutementaires pourchaque kilomegravetre Les valeurs de α proches de zeacutero indiquent clairement que la distancegeacuteographique nrsquoimpacte pas la longueur du chemin quelle que soit lrsquoexpeacuterimentation

Impact de la longueur du chemin sur le RTT

Les figures 210a et 210b repreacutesentent la distribution du RTT comme fonction dunombre de sauts ainsi que la meacutediane et les PDF Est eacutegalement preacutesente en bas dechacune des figures la probabiliteacute de densiteacute de la longueur du chemin

Les figures montrent une croissance du deacutelai avec lrsquoaugmentation du nombre denœuds jusqursquoagrave une certaine limite Sur la figure 210a repreacutesentant lrsquoeacutetude Depuis nousremarquons des deacutelais importants deacutepassant les 3 secondes Cette valeur des 3 secondespeut ecirctre atteinte degraves que lrsquoon deacutepasse le 9eme saut Agrave lrsquoinverse sur lrsquoeacutetude Vers illustreacuteepar la figure 210b nous constatons une certaine stabiliteacute du deacutelai Les valeurs restent

58

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 29 ndash Relation entre la longueur de la route et la distance geacuteographique

majoritairement infeacuterieures agrave 2 secondes Lrsquoeacutetude de la meacutediane nous indique des routesplus courtes lorsque lrsquoon essaye de joindre La Reacuteunion Il y a une forte variation de lameacutediane agrave la fin de la figure due au nombre drsquoeacutechantillons pour chaque valeur de lalongueur des routes Afin drsquoidentifier le deacutelai associeacute agrave chaque nouveau nœud la fonc-tion lineacuteaire D(d) = α times d + β du deacutelai comme fonction de la longueur du chemin esteacutegalement repreacutesenteacutee

Le tableau 28 indique les eacutequations obtenues lors de lrsquoanalyse des donneacuteesLa variable drsquoajustement β ne sera pas analyseacutee bien qursquoelle repreacutesente un deacutelai mi-

nimal Nous avons vu dans la partie preacuteceacutedente que ce deacutelai eacutetait eacutequivalent peu importe

59

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 210 ndash Relation entre la longueur de la route et les deacutelais

TABLE 28 ndash Formule de correacutelation du deacutelai en fonction de la longueur du chemin

Expeacuterimentation Eacutequation D(PL)Depuis La Reacuteunion 11 11times PL+ 204 92

Vers La Reacuteunion 6 22times PL+ 249 66

lrsquoexpeacuterimentation La pente de la droite repreacutesenteacutee par le coefficient α indique la valeurassocieacutee agrave chaque nouvel eacutequipement Cette valeur diffegravere fortement selon lrsquoexpeacuterimen-tation mise en place Ainsi le temps accordeacute agrave chaque eacutequipement est beaucoup pluslong lorsque nos donneacutees quittent La Reacuteunion que dans le sens inverse avec un coef-ficient proche du double Cela signifie que pour chaque saut suppleacutementaire un deacutelaiadditionnel de 6 22ms (resp 11 11ms) doit ecirctre pris en compte lorsque lrsquoon joint (resp

60

quitte) La Reacuteunion On passe quasiment du simple au double

Nous avons preacuteceacutedemment analyseacute les Cumulative Density Function (CDF) des lon-gueurs des routes logiques par continent Nous avions constateacute pour certains continentsune forte similitude entre les diffeacuterentes courbes Cette observation est de nouveau preacute-sente ici Les deux PDF sur la longueur des chemins emprunteacutes sont similaires Neacutean-moins le fait drsquoavoir un plus grand nombre drsquoeacutechantillons sur lrsquoexpeacuterimentation Depuisa permis un lissage de la courbe

Correacutelation entre deacutelai et distance geacuteographique

Dans [Krajsa2011] les auteurs se sont inteacuteresseacutes agrave lrsquoimpact de la distance sur le RTTLes reacutesultats ont eacuteteacute obtenus a partir drsquoune eacutetude de meacutetrologie active reacutealiseacutee dans despays agrave forte connectiviteacute en terme de liaisons sous-marines Les auteurs ont deacutetermineacuteune fonction lineacuteaire repreacutesenteacutee par lrsquoeacutequation suivante

y = 0 0128times x (23)

Cette eacutequation preacutedit le deacutelai en fonction drsquoune distance geacuteographique donneacutee Nousallons eacutetudier la pertinence de ce modegravele dans le cas de lrsquoicircle de La Reacuteunion On se reacutefegravereagrave ce modegravele par la notation Expected Internet RTT for a given geographical Distance (EIRD)

La figure 211 est composeacuteee de trois parties En haut nous avons repreacutesenteacute les dis-tances couvertes par chaque continent La figure 211a (resp fig 211b) graphe la fonctionExpected RTT (ER) pour le cas Depuis (resp Vers) et le modegravele EIRD Le modegravele ER(d) vientde la repreacutesentation sous forme lineacuteaire de lrsquoimpact de la distance geacuteographique sur lesdeacutelais obtenus Nous avons eacutegalement repreacutesenteacute les 5eme 10eme 25eme 75eme 90eme et95eme percentiles Les points preacutesents agrave lrsquointeacuterieur des barres drsquoerreurs indiquent le 50eme

percentile Au bas de chaque figure la PDF de la distance geacuteographique est repreacutesenteacutee

Lrsquoeacutetude de la reacutepartition de nos destinations (resp sources) pour notre eacutetude montreque les distances vont drsquoune valeur infeacuterieure agrave 10 km jusqursquoagrave pregraves de 20 000 km Nousconstatons un regroupement des continents entre 5 000 et 10 000 km pour lrsquoeacutetude DepuisLe regroupement se fait agrave une distance plus grande (comprise en 7 500 et 14 000 km)pour Vers Ces valeurs sont remarqueacutees dans la PDF de chaque eacutetude Malgreacute la preacutesenceseule du continent Nord Ameacutericain apregraves 15 000 km la densiteacute de probabiliteacute drsquoavoir unedestination prise dans cet ensemble est importante

Les figures montrent une complegravete opposition entre le modegravele EIRD et nos reacutesul-tats Afin drsquoeffectuer une meilleure comparaison nous avons traduit nos reacutesultats sousla forme ER(d) = αtimes d+ β fonction lineacuteaire du deacutelai en fonction de la distance geacuteogra-phique Une repreacutesentation graphique de ER(d) est indiqueacutee sur les figures Les eacutequa-tions obtenues sont indiqueacutees dans le tableau 29

TABLE 29 ndash Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique

Expeacuterimentation Eacutequation d(t) R2

EIRD y = 0 0128times t 0 9794

ER(d) (Depuis La Reacuteunion) y = minus62 92 lowast 10minus4 times t+ 477 6 16 80 lowast 10minus3ER(d) (Vers La Reacuteunion) y = minus29 4 lowast 10minus5 times t+ 358 1 14 81 lowast 10minus5

Les coefficients de deacutetermination (R2) entre les fonctions lineacuteaires et nos donneacutees in-diquent que nous nrsquoavons pas pu trouver de modegravele de preacutediction suffisamment preacuteciscontrairement au modegravele EIRD Nous constatons eacutegalement que les pentes de nos mo-degraveles ER(d) sont toutes deux neacutegatives Cela signifie que le deacutelai sera plus court pour

61

(a) Depuis La Reacuteunion

(b) Vers La Reacuteunion

FIGURE 211 ndash Relation entre les deacutelais et la distance geacuteographique

joindre une distance eacuteloigneacutee physiquement degraves que lrsquoon emprunte les cacircbles sous-marins La preacutesence du GIX Reunix sur lrsquoicircle permet drsquoavoir des deacutelais courts du mo-ment que lrsquoon reste sur la boucle locale Gazelle (cf section 21) Par exemple le deacutelai pourjoindre un pays europeacuteen est plus court que le deacutelai pour joindre les pays de la ZOI Cereacutesultat est contraire agrave lrsquoanalyse EIRD Il peut srsquoexpliquer en partie par le fait lrsquoeacutetude preacute-senteacute dans [Krajsa2011] est reacutealiseacutee dans des lieux ougrave la connectiviteacute (en terme de liaisonssous-marines) est importante

La partie drsquoanalyse des routes emprunteacutees va nous aider agrave valider ou infirmer lrsquohy-pothegravese suivante Les coefficients α obtenus sur nos eacutequations ER(d) proviennent du routage

Analyse des routes

Dans la section 22 nous avons montreacute lrsquoexistence de liens physiques reliant lrsquoen-semble des icircles de la ZOI Nous cherchons agrave caracteacuteriser lrsquoefficaciteacute des routes emprunteacutees

62

drsquoun point de vue geacuteographique La figure 212 repreacutesente les diffeacuterents points drsquoentreacuteeset de sorties logiques de lrsquoInternet reacuteunionnais que nous avons extraits de nos donneacutees

Des donneacutees obtenues de lrsquoeacutetude Depuis nous avons extrait le pays du premier nœudbaseacute agrave lrsquoexteacuterieur de lrsquoicircle Cette information nous permet drsquoeacutetudier les sorties logiques delrsquoInternet reacuteunionnais Le reacutesultat obtenu est indiqueacute par la figure 212a La taille du lienest proportionnelle au nombre drsquoeacutechantillons passant par ce pays Nous deacutenombrons4 sorties dont 3 en Europe Malgreacute lrsquoabsence de lien direct avec lrsquoAmeacuterique du Norddepuis La Reacuteunion nous avons identifieacute une sortie dans la moitieacute ouest des Eacutetats-UnisLes sorties physiques directes de La Reacuteunion qui sont baseacutees en Afrique Asie et sur lesicircles de la ZOI ne sont pas utiliseacutees La majoriteacute du routage de nos donneacutees avec pregraves de97 srsquoeffectue en France

Dans la figure 212b nous indiquons le dernier eacutequipement localiseacute en dehors deLa Reacuteunion pour une destination finale localiseacutee sur lrsquoicircle Ce sont les entreacutees logiquesde lrsquoInternet reacuteunionnais que nous avons pu obtenir des donneacutees provenant de lrsquoeacutetudeVers Le nombre drsquoentreacutees est double par rapport au nombre de sorties et plus reacuteparti enterme de continent Quatre continents sont directement relieacutes agrave notre icircle lrsquoAfrique lrsquoAsielrsquoEurope et lrsquoAmeacuterique du Sud Le continent europeacuteen est largement repreacutesenteacute dans nosdonneacutees avec 99 51 transitant sur ce territoire La France hexagonale capte 99 33 desdonneacutees soit la quasi-totaliteacute de nos donneacutees Nous avons tout de mecircme pu identifier desliaisons minimales avec lrsquoAfrique du Sud lrsquoInde le Sri Lanka et le Paraguay Ce dernierest le seul agrave ne pas ecirctre directement relieacute agrave lrsquoicircle par un cacircble sous-marin

Le tableau 210 reacutesume les informations contenues dans les figures 212a et 212b Leslignes sont rangeacutees par taux drsquoutilisation deacutecroissant

TABLE 210 ndash Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunionnais

Depuis La Reacuteunion Vers La Reacuteunion

France (9699) 18101 msAllemagne (1 03) 299 26 msEacutetat-Unis (1 03) 293 15 msItalie (1 03) 289 46 ms

France (9933) 18330 msAfrique du Sud (0 45) 66 42 msBelgique (0 1) 197 48 msItalie (0 04) 202 59 msSloveacutenie (0 04) 205 50msInde (0 01) 161 45 msParaguay (0 01) 454 36 msSri Lanka (0 01) 207 88 ms

La preacutesence de liens directs entre La Reacuteunion et des pays beaucoup plus eacuteloigneacutestels que les Eacutetats-Unis ou le Paraguay sans cacircbles physiques directs est symptomatiquede lrsquoabsence drsquoinformations ou drsquoerreurs de geacuteolocalisation Nous pouvons preacutesenter etexpliquer quelques points preacutesents dans nos reacutesultats

1 Les erreurs de geacuteolocalisation Les erreurs de geacuteolocalisation sont principalementdues agrave une mauvaise utilisation des blocs drsquoadresses IP par les opeacuterateurs Ils preacute-fegraverent utiliser des adresses qui leur ont deacutejagrave eacuteteacute attribueacutees que drsquoeffectuer une de-mande drsquoadresse IP aupregraves drsquoun RIR Un exemple est lrsquoadresse IP rsquo19416714221rsquoCette adresse est attribueacutee agrave lrsquoopeacuterateur franccedilais RENATER Comme RENATERpossegravede la nationaliteacute franccedilaise le pays de localisation de lrsquoadresse est rsquoFRANCErsquoOr il srsquoavegravere que cette adresse est utiliseacutee comme adresse publique de lrsquoUniversiteacutede La Reacuteunion Elle est donc localiseacutee sur lrsquoicircle Un raisonnement similaire peut srsquoef-fectuer sur les autres reacutegions drsquooutre-mer posseacutedant des relations avec lrsquoopeacuterateurRENATER Les filiales drsquoopeacuterateur meacutetropolitain comme Orange peuvent eacutegale-ment utiliser ce systegraveme sur lrsquoensemble de leur reacuteseau Pour reacutesoudre ce problegraveme

63

(a) Sorties

(b) Entreacutees

FIGURE 212 ndash Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais

nous avons effectueacute une analyse du deacutelai Si le deacutelai associeacute agrave certaines adresses IPcorrespond au deacutelai theacuteorique associeacute au continent nous avons consideacutereacute que lageacuteolocalisation est correcte Dans les cas contraires nous nrsquoavons pas la possibiliteacutedrsquoecirctre sucircrs agrave 100 de la bonne localisation

2 Les accords de peering se font dans un pays avant que le paquet nrsquoemprunte le cacircblesous-marin Lrsquoexemple illustreacute par la figure 213 montre que les eacutechanges entre deuxadresses IP srsquoeffectuent au sein drsquoun IXP Ces eacutechanges peuvent se faire entre deuxpays distants au sein drsquoun troisiegraveme pays Dans notre exemple lrsquoeacutechange entre LaReacuteunion et les USA se fait en France

3 Lrsquoencapsulation des donneacutees au sein du systegraveme MPLS geacutenegravere eacutegalement des in-coheacuterences au sein de nos analyses Lrsquoexemple que lrsquoon peut indiquer est lrsquoanalysede la mesure numeacuteroteacutee 4178740 2 chez Atlas RIPE NCC Cette trace est composeacuteede 5 sauts entre le Paraguay et La Reacuteunion avec un lien direct Or il nrsquoexiste aucuncacircble physique entre ces deux points du monde Une encapsulation au niveau In-

2 httpsatlasripenetmeasurements4178740

64

Internet InternetUtilisateur DestinationIXP (FR)

RE US

FIGURE 213 ndash Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dansun pays tiers

visible des donneacutees nrsquoindique pas le parcours preacutecis des donneacutees tel que lrsquoindiquelrsquoauteur de lrsquoarticle [Donnet2012]

Ces explications ne sont pas les seules mais potentiellement les plus freacutequemmentrencontreacutees Dans notre cas les points 2 et 3 semblent ecirctre les raisons preacutedominantesLes marques du systegraveme MPLS sont dues agrave la division de la capaciteacute des cacircbles pour lesdiffeacuterents opeacuterateurs et agrave la connexion en diffeacuterents points pour reacutegeacuteneacuterer le signal

Des reacutesultats de nos eacutetudes nous deacuteplorons lrsquoabsence de peering reacutegional Cette ano-malie est la principale cause de la tendance des courbes obtenues dans le tableau 29 Eneacutetudiant les diffeacuterents IXP nous constatons lrsquoabsence drsquoopeacuterateurs communs entre les 3icircles comme lrsquoillustre la figure 214 Ces informations proviennent directement des sitesinternet officiels des IXP [MIXP2017 MGIX2017 REUNIX2017] On peut neacuteanmoins no-ter la preacutesence des filiales de lrsquoopeacuterateur Orange agrave Madagascar et agrave La Reacuteunion Il srsquoagitdans le cas drsquoOrange Madagascar de lrsquoexploitation du nom sans ecirctre dirigeacutee par lrsquoen-treprise Orange De cette figure on peut deacuteduire que les eacutechanges drsquoinformations et dedonneacutees se font dans une reacutegion eacuteloigneacutee de la ZOI et agrave un niveau plus eacuteleveacute On peutsupposer que ce sont des Tiers-1 qui se chargent du peering de cette zone Afin de vali-der cette hypothegravese nous avons deacuteployeacute des sondes de mesures de RunPL sur les icirclesvoisines

FIGURE 214 ndash FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien

243 Connectiviteacute des icircles de la Zone Oceacutean Indien

Nous avons vu dans la section 22 que les icircles de la ZOI partagent des routes phy-siques en commun Nous avons constateacute dans la section 242 que La Reacuteunion possegravede

65

une connectiviteacute Internet particuliegravere Nous sommes donc en droit de nous demander sicette connectiviteacute est commune agrave lrsquoensemble des icircles de la ZOI ou non Nous avons pu deacute-ployer un minimum de deux sondes par pays eacutetudieacute Le protocole de mesure et drsquoanalysemis en place est en tout point identique agrave celui utiliseacute pour lrsquoeacutetude de la connectiviteacute deLa Reacuteunion Ainsi nous avons utiliseacute les mecircmes meacutetriques pour valider la comparaison

Distribution du RTT par pays eacutetudieacute

La figure 215 illustre la reacutepartition des deacutelais des icircles de la ZOI selon le pays drsquooriginedes mesures (215a) et du continent de destination (215b) Comme pour La Reacuteunion nousremarquons la preacutesence des trois pics

Drsquoapregraves la figure 215b ces pics ont la mecircme signification que dans la situation preacute-ceacutedente crsquoest-agrave-dire la preacutesence des deacutelais pour joindre lrsquoEurope lrsquoAmeacuterique du Nord etlrsquoAsie

Sur la figure 215a on remarque eacutegalement des valeurs minimales et maximales dif-feacuterentes selon le pays Ainsi les Seychelles ont les deacutelais les plus courts de la ZOI Agravelrsquoinverse crsquoest La Reacuteunion qui possegravede le plus de deacutelais au delagrave des 800 ms

Le comportement des deacutelais eacutetant communs agrave lrsquoensemble de la ZOI nous allons main-tenant eacutetudier la longueur des routes pour chaque icircle eacutetudieacutee

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 215 ndash Distribution des deacutelais des icircles de la ZOI

Longueur des routes par pays eacutetudieacute

La figure 216 repreacutesente la densiteacute de probabiliteacute de la longueur des routes En confon-dant les destinations nous pouvons eacutetudier la reacutepartition de la distance en fonction delrsquoicircle source (216a) Nous avons appliqueacute le mecircme raisonnement en meacutelangeant les icirclessources pour se concentrer sur la destination (216b) Les figures eacutetudieacutees nrsquoont pas lamecircme forme que celles uniquement deacutedieacutees agrave La Reacuteunion En effet la courbe 216 pos-segravede 2 pics

Sur la figure 216a on remarque que cette diffeacuterence est fortement accentueacutee par lapreacutesence des donneacutees reacuteunionnaises

Sur la figure 216b on voit une diffeacuterence de comportement en fonction du contientjoint Ainsi lrsquoAfrique lrsquoAsie et lrsquoEurope ont la preacutesence drsquoun seul pic Cela signifie queces continents seront majoritairement joints par des routes comprises entre 10 en 20 sautsPour les Ameacuteriques et lrsquoOceacuteanie il y a deux pics Cela sous-entend la preacutesence de deuxgrandes routes avec lrsquoune plus courte que lrsquoautre La plus petite est composeacutee de 13sauts La seconde route est quant agrave elle drsquoune longueur de 16 sauts

66

Cette diffeacuterence peut srsquoexpliquer par la preacutesence de routes emprunteacutees diffeacuterentes enfonction des pays de destinations Pour corroborer cela nous allons poursuivre lrsquoeacutetudeen fonction des meacutetriques preacutesenteacutees dans la section 242

0

003

006

009

012

0 5 10 15 20 25 30 35 40

P [

X=

x]

Longueur du chemin (en noeuds)

Mayotte

Seychelles

Reunion

Maurice

Madagascar

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 216 ndash Longueur des routes emprunteacutees

Longueur du chemin et distance geacuteographique

Dans cette section on va eacutetudier la relation entre la longueur du chemin et la distancegeacuteographique On a vu agrave travers le reacutesultat preacuteceacutedent que le choix du continent avaitun impact sur la longueur du chemin Pour plus de lisibiliteacute nous avons repreacutesenteacute lesreacutesultats sous la forme drsquoeacutequations lineacuteaires repreacutesenteacutes par lrsquoeacutequation 24

PL(d) = αtimes d+ β (24)

Les eacutequations obtenues sont indiqueacutees dans le tableau 211 et repreacutesenteacutees graphique-ment par la figure 217

TABLE 211 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation PL(d)Madagascar y = minus0 000303631times d+ 26 1771

Maurice y = minus0 000183807times d+ 18 4231

Reacuteunion y = minus9 18819 lowast 10minus5 times d+ 17 1201

Seychelles y = minus0 000183362times d+ 18 9892

Mayotte y = minus7 15288 lowast 10minus5 times d+ 18 4781

Nous pouvons seacuteparer nos reacutesultats en 3 groupes Drsquoun cocircteacute les deacutepartements fran-ccedilais avec La Reacuteunion et Mayotte Dans un second groupe lrsquoicircle Maurice et les SeychellesEt dans un troisiegraveme groupe Madagascar Les reacutesultats de La Reacuteunion et de Mayotte sontsimilaires La pente α est quasi-nulle et lrsquoeacutecart sur le coefficient β est de 1 saut Ce reacutesul-tat est similaire agrave celui obtenu preacuteceacutedemment Maurice et les Seychelles ont eacutegalementdes coefficients proches Les pentes sont leacutegegraverement neacutegatives Cela implique une petitedeacutependance du nombre de sauts en fonction de la distance geacuteographique Le cas le plusinteacuteressant est Madagascar Nous allons nous inteacuteresser plus en deacutetail agrave son comporte-ment

Madagascar possegravede les coefficients α et β les plus eacuteleveacutes Cela signifie que le payspossegravede une route minimale plus longue que les autres icircles Son coefficient α neacutegatif

67

10

20

30

0 5000 10000 15000 20000

Pat

h L

ength

PL

(N

um

ber

of

hops)

Distance d (Km)

MGMURESCYT

FIGURE 217 ndash Relation entre la longueur de la route et la distance geacuteographique

est presque deux fois plus eacuteleveacute que pour Maurice et les Seychelles Lrsquoimpact de la dis-tance sur le nombre de sauts est donc plus fort La figure 218 a eacuteteacute reacutealiseacutee selon le mecircmescheacutema que les figures 28 La repreacutesentation de la PDF de la distance des destinations parrapport aux sondes deacuteployeacutees agrave Madagascar montre deux grands groupes Le premiersitueacute entre 5 000 et 10 000 kilomegravetres Ce groupe regroupe Asie Europe Oceacuteanie et Ameacute-rique du Sud Le second groupe eacutevoluant aux alentours des 15 000 kilomegravetres englobe latotaliteacute des adresses IP geacuteolocaliseacutees en Ameacuterique du Nord Le nombre drsquoadresses prove-nant du continent africain est compris entre 0 et 10 000 La pente neacutegative suggegravere doncque les routes vers les continents eacuteloigneacutes sont plus courtes que les routes vers des desti-nations proches geacuteographiquement Neacuteanmoins la lecture des cercles montre des routesglobalement aussi longues quel que soit le continent

Impact de la longueur du chemin sur le RTT

Tout comme la section preacuteceacutedente nous avons repreacutesenteacute les reacutesultats sous formedrsquoeacutequations lineacuteaires Le tableau 212 regroupe les eacutequations obtenues tandis que la fi-gure 219 les repreacutesente graphiquement

TABLE 212 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation D(PL)Madagascar y = 13 5709times t+ 119 717

Maurice y = 14 296times t+ 171 69

Reacuteunion y = 14 2259times t+ 166 84

Seychelles y = 17 3953times t+ 35 3596

Mayotte y = 16 3138times t+ 90 9087

Comme on pouvait srsquoy attendre le deacutelai srsquoaccroicirct avec le nombre de sauts Les coef-ficients α obtenus sont proches les uns des autres La diffeacuterence se fait plus sur la valeurdrsquoajustement β Cette valeur correspond au deacutelai minimal Les Seychelles ont la pente

68

FIGURE 218 ndash Relation entre la longueur de la route et la distance geacuteographique pourMadagascar

la plus eacuteleveacutee et la valeur drsquoajustement la plus basse Cela signifie que malgreacute un deacute-lai minimal faible le temps mis par un paquet dans chaque routeur est plus importantque pour les autres icircles Mayotte est sensiblement dans le mecircme cas Pour Maurice et LaReacuteunion les pentes sont proches et la valeur de β eacutegalement Ces deux icircles auraient doncun comportement similaire

0

50

100

150

200

250

300

350

400

10 20 30

RT

T D

elay

(m

s)

Path Length PL (Number of hops)

MGMURESCYT

FIGURE 219 ndash Relation entre la longueur de la route et les deacutelais

69

Correacutelation entre deacutelai et distance geacuteographique

Nous avions vu que pour La Reacuteunion il y avait une incoheacuterence sur la relation entrele deacutelai et la distance geacuteographique En effet nous avions comme reacutesultat le fait que ledeacutelai deacutecroissait avec la distance Ce scheacutema se reproduit eacutegalement pour les autres icirclesde la ZOI tel qursquoillustreacute par la figure 220 Les eacutequations associeacutees agrave chaque pays sontpreacutesenteacutees dans le tableau 213

TABLE 213 ndash Formule de correacutelation de la distance geacuteographique et du RTT

icircle de deacutepart Eacutequation PL(t)Madagascar y = minus0 0053913times t+ 476 626

Maurice y = minus0 00418997times t+ 438 177

Reacuteunion y = minus0 00370839times t+ 440 249

Seychelles y = minus0 00344991times t+ 368 501

Mayotte y = minus0 0015904times t+ 397 1

On constate des pentes fortement diffeacuterentes en fonction des pays Ainsi Mayotte aune pente beaucoup plus douce que les autres icircles Malgreacute un β proche on voit que lrsquoeacutecartdes deacutelais entre La Reacuteunion et Maurice srsquoaccroicirct avec la distance La pente de Madagascarest tregraves importante Ccedila indique une forte deacutecroissance du deacutelai avec la distance Ainsi ledeacutelai pour joindre lrsquoicircle Maurice sera beaucoup plus important que pour joindre les paysdrsquoAmeacuterique du Nord

Lrsquoune des conseacutequences de ces reacutesultats est la preacutesence drsquoun deacutelai plus eacuteleveacute pourjoindre les icircles de la ZOI que pour joindre des destinations plus lointaines Et cela malgreacutedes routes toutes aussi longues Cela montre une contradiction agrave travers nos reacutesultatsPour comprendre cela il est neacutecessaire drsquoeacutetudier les portes de sorties de lrsquoInternet desicircles de la ZOI

300

350

400

450

500

0 5000 10000 15000 20000

RT

T D

elay

(m

s)

Distance d (Km)

MGMURESCYT

FIGURE 220 ndash Relation entre les deacutelais et la distance geacuteographique

Analyse des portes de sortie

Chaque icircle de la ZOI possegravede ses propres routes avec ses propres regravegles et ses propressorties Agrave la fin de la section 242 nous avons eacutemis lrsquohypothegravese suivante les eacutechanges de

70

paquets entre les FAI des icircles de la ZOI ne se font pas au sein de la ZOILa figure 221 indique le nombre de sorties que lrsquoon a pu relever durant nos mesures

(221a) et le pourcentage de leur reacutepartition geacuteographique (221b)

En analysant la figure 221b on constate que la majoriteacute des pays de sortie est situeacuteeen Europe avec 9463 On remarque lrsquoabsence de sortie au niveau Africain et drsquointer-connexion directe entre les icircles de la ZOI

Sur la figure 221a on remarque qursquoagrave lrsquoexception de Mayotte chaque pays a plus de20 sorties diffeacuterentes Pour La Reacuteunion crsquoest un reacutesultat fortement diffeacuterent de celui ob-tenu dans la section 242 Cela peut srsquoexpliquer par les mecircmes raisons que lors de lrsquoeacutetudepreacuteceacutedente pour rappel les raisons invoqueacutees sont potentiellement des erreurs de geacuteolo-calisation des accords de peering direct dans un pays tiers ou encore de lrsquoencapsulationMPLS

0

5

10

15

20

25

30

35

40

45

50

MG

MU

RE

SC YT

Num

ber

of

links

(a) Nombre de points de sorties pour chaqueicircle de la ZOI

0

20

40

60

80

100

AS

EU NA

Use

d l

inks

()

(b) En fonction du continent

FIGURE 221 ndash Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI

La figure 222 montre la reacutepartition des sorties en pourcentage selon les pays (fig222a) et les continents (222b) pour La Reacuteunion En comparaison avec les reacutesultats ob-tenus preacuteceacutedemment on constate une forte diminution du pourcentage de sorties geacuteo-localiseacutees en France hexagonale (FR) Nous sommes passeacutes de 9699 agrave une valeur de55408 Neacuteanmoins le pourcentage par continent reste extrecircmement eacuteleveacute avec 951636de sorties localiseacutees en Europe

Agrave travers lrsquoanalyse des points de sorties de lrsquoInternet des icircles de la ZOI nous validonslrsquohypothegravese preacutesenteacutee selon laquelle les accords drsquoeacutechanges entre opeacuterateurs des icircles dela ZOI se font agrave travers un Tiers-1

244 Synthegravese des reacutesultats

Lrsquoeacutetude des routes et des deacutelais meneacutee durant nos travaux de thegravese a eacuteteacute diviseacutee entrois grandes parties La premiegravere consistait agrave comparer lrsquoeacutetat actuel avec une eacutetude reacutea-liseacutee quatre ans auparavant La seconde phase de meacutetrologie active a mis en avant uneanalyse plus fine de la connectiviteacute Internet de La Reacuteunion avec lrsquoeacutetude des routes Laderniegravere partie avait pour objectif de comparer la connectiviteacute Internet de La Reacuteunionavec les autres icircles de la ZOI

La campagne de ping meneacutee agrave lrsquoUniversiteacute de La Reacuteunion au sein du LIM a montreacuteune reacuteduction de la longueur des routes depuis La Reacuteunion En deacutepit de la reacuteduction desroutes nous avons constateacute une stabiliteacute des deacutelais aux alentours des 200 ms

71

0

20

40

60

80

100

US-C

O

US

GB

FR

Use

d l

inks

()

(a) par pays

0

20

40

60

80

100

EU NA

Use

d l

inks

()

(b) par continent

FIGURE 222 ndash Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion

Notre seconde eacutetude faite agrave partir de donneacutees de type traceroute meneacutee depuis dif-feacuterents points de mesures reacutepartis sur lrsquoicircle a montreacute des reacutesultats inteacuteressants Le pre-mier reacutesultat est la correacutelation des deacutelais et de la localisation des destinations jointesdepuis lrsquoicircle de La reacuteunion Nous avions constateacute des pics sur la PDF des deacutelais Cespics correspondaient bien agrave la reacutepartition des continents dans notre jeu de destinationsLa longueur des routes est quant agrave elle moins impacteacutee par cette reacutepartition des des-tinations Nous avons tout de mecircme trouveacute une forte symeacutetrie aux courbes peu im-porte le sens de lrsquoeacutetude Agrave partir de ces donneacutees nous avons eacutetudieacute les relations sui-vantes Longueur du chemin Distance geographique Longueur du chemin RTTet RTT Distance geographique La premiegravere concordance a montreacute que la longueurdu chemin nrsquoest pas deacutependante de la distance geacuteographique La seconde correacutelation amontreacute une premiegravere asymeacutetrie des liens En effet le temps associeacute agrave chaque nœud dutrajet est tregraves diffeacuterent selon que lrsquoon quitte ou que lrsquoon essaye de joindre La Reacuteunion Ledernier rapport a mis en eacutevidence une particulariteacute de lrsquoaccegraves Internet de La Reacuteunion Agravelrsquoinverse de tout sens commun les deacutelais provenant et agrave destination de La Reacuteunion vonten deacutecroissant en fonction de la distance geacuteographique Lrsquoanalyse des routes et plus par-ticuliegraverement les points drsquoentreacutees et de sorties logiques de lrsquoInternet reacuteunionnais a permisdrsquoexpliquer ce comportement

Notre derniegravere eacutetude utilise le mecircme protocole et la mecircme plate-forme que lrsquoeacutetudepreacuteceacutedente Nous avons reacuteussi agrave distribuer des sondes sur les icircles de la ZOI Agrave traverscette eacutetude nous avons pu constater un comportement proche pour lrsquoensemble des icircleseacutetudieacutees Ainsi nous avons pu trouver des speacutecificiteacutes de lrsquoInternet de la ZOI La dis-tance geacuteographique a un impact sur la longueur de la route le deacutelai associeacute agrave chaquenœud de la route est similaire Mais surtout le deacutelai pour toute destination baseacutee agrave lrsquoex-teacuterieur drsquoune icircle est plus long pour les distances geacuteographiques courtes Ce comporte-ment srsquoexplique par une inter-connexion des FAI reacutegionaux agrave travers des Tiers-1 situeacutesmajoritairement en Europe

25 Conclusion

Dans ce chapitre nous avons eacutetudieacute la connectiviteacute de La Reacuteunion en terme de deacutelaiset de routes emprunteacutees

Lors de la premiegravere section nous avons vu que La Reacuteunion ne propose pas drsquoinfra-structure permettant la mise en place de notre eacutetude La premiegravere eacutetape fut le deacuteploie-ment de raspberry-pi sur lrsquoensemble de lrsquoicircle Ces sondes connecteacutees agrave lrsquoensemble des FAI

72

et TAI utilisent lrsquooutil Paris-traceroute pour reacutealiser des mesures de deacutelais et de routesCet outil est moins sensible au pheacutenomegravene drsquoeacutequilibrage de charges que le traceroutetraditionnel

Une fois notre plate-forme deacuteployeacutee nous avons reacutealiseacute des mesures durant plusieursmois Ces mesures actives eacutetudient la connectiviteacute depuis et vers La Reacuteunion Cette vo-lonteacute drsquoeffectuer les mesures dans les deux sens provient de la forte preacutesence de routesasymeacutetriques dans lrsquoInternet

Nos donneacutees ont montreacute que La Reacuteunion est confronteacutee agrave ce pheacutenomegravene Nous avonseffectueacute une analyse selon 4 paramegravetres le deacutelai la distance geacuteographique la longueurdu chemin et les routes emprunteacutees La litteacuterature ne proposant pas drsquooutil respectantnos critegraveres de seacutelection nous avons deacuteveloppeacute notre propre outil drsquoanalyse rTrace-route Nous avons souhaiteacute partager notre outil drsquoanalyse agrave travers une publicationDans lrsquoattente drsquoune publication scientifique un site internet deacutedieacute agrave lrsquooutil est dispo-nible [rtraceroute]

Le premier reacutesultat concerne la longueur des routes Les routes reacuteunionnaises sontplus longues que la moyenne mondiale On constate eacutegalement une diffeacuterence selon lesens de communication En eacutetudiant lrsquoimpact de la distance kilomeacutetrique sur la longueuron voit qursquoaucune correacutelation nrsquoexiste entre les deux paramegravetres Les routes Internet dela boucle locale sont aussi longues que les routes reliant des points situeacutes agrave plus de 15 000kmLorsqursquoun paquet traverse un nœud un deacutelai associeacute au traitement agrave lrsquoeacutemission et agrave lapropagation des donneacutees vers le saut suivant peut ecirctre calculeacute Cette valeur diffegravere eacutenor-meacutement selon que lrsquoon quitte ou que lrsquoon joint La Reacuteunion On a un coefficient de 1 79entre les deux valeurs Cela corrobore lrsquoasymeacutetrie des liens mais aucunement un com-portement speacutecifique agrave la connectiviteacute reacuteunionnaiseLrsquoun des reacutesultats les plus inteacuteressants concerne la relation entre la distance geacuteogra-phique et les deacutelais associeacutes Contrairement agrave ce que lrsquoon pouvait attendre la connectiviteacutereacuteunionnaise deacutecroicirct les deacutelais avec lrsquoincreacutementation de la distance lorsque le trafic em-prunte les cacircbles sous-marinsDans lrsquoanalyse des routes nous avons constateacute que lrsquointer-connexion reacutegionale se faitnon pas au sein de la ZOI mais dans une zone eacuteloigneacutee La Reacuteunion possegravede 3 sortiesphysiques que sont lrsquoAsie lrsquoAfrique et lrsquoEurope Pour autant seule la France hexagonalesemble ecirctre inteacuteressante pour les FAI locaux Plus de 97 de nos donneacutees sortent agrave traversce pays localiseacute agrave plus de 10 000 km

Nous avons confirmeacute le fait que lrsquointer-connexion se fait dans une zone eacuteloigneacutee agravetravers lrsquoeacutetude de la connectiviteacute de la ZOI Cette eacutetude a deacutemontreacute un comportementsimilaire entre La Reacuteunion et les icircles de la zone La seule diffeacuterence notable provient dunombre de portes de sorties pour les icircles Neacuteanmoins elles sont agrave une tregraves forte majoriteacutegeacuteolocaliseacutees en Europe

Le deacutelai minimal mesureacute pour La Reacuteunion et la configuration actuelle de la connec-tiviteacute Internet reacuteunionnaise peuvent avoir des conseacutequences sur les performances desprotocoles de transport comme TCP Pour veacuterifier cela une eacutetude de meacutetrologie passivea eacuteteacute reacutealiseacutee Cette eacutetude est preacutesenteacutee dans le chapitre 3

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors dela confeacuterence Asian INTernet Engineering Conference (AINTEC) en 2016 [Noordally2016]Cette publication a eacuteteacute axeacutee sur les reacutesultats reacuteunionnais Une seconde contribution deacute-dieacutee agrave la connectiviteacute des icircles de la ZOI a eacuteteacute publieacutee lors de la confeacuterence Global Informa-tion Infrastructure and Networking Symposium (GIIS) en 2017 [Nicolay2017-2]

73

74

Chapitre 3

Meacutetrologie sur le service de transportagrave La Reacuteunion

TCP est un protocole de transport dont la performance est deacutependante du RTT etdu taux de perte des segments Plus exactement ces deux paramegravetres entrent en comptepour deacuteterminer le deacutelai pris par la fenecirctre de congestion pour qursquoelle atteigne une taillequi couvre le produit deacutelai-bande passante du canal virtuel qui relie la source agrave la desti-nation Aussi TCP voit ses performances reacuteduites lorsque ce produit augmente et changede facteur drsquoeacutechelle Les reacutesultats obtenus par lrsquoeacutetude de la connectiviteacute de lrsquoicircle de LaReacuteunion ont montreacute un RTT minimal de 180 ms pour le trafic quittant lrsquoicircle de La Reacuteunion(cf tableau 210) Avec les technologies drsquoaccegraves agrave haut deacutebit il devient techniquementpossible que des connexions TCP depuis ou vers La Reacuteunion souffrent des symptocircmesque lrsquoon retrouve avec lrsquoutilisation drsquoun LFN

Dans ce chapitre nous allons eacutetudier quel peut ecirctre lrsquoimpact de la capaciteacute de stockagedes canaux de communication depuis et vers lrsquoicircle La Reacuteunion sur les performances deTCP Pour cela nous allons nous appuyer sur de la meacutetrologie passive afin de pouvoirfaire des observations sur la performance de TCP Dans ce chapitre nous preacutesentonsla meacutethode que nous avons appliqueacutee afin drsquoestimer par la meacutetrologie le service quenous obtenons agrave La Reacuteunion Lrsquoobjectif ici nrsquoest pas drsquoobtenir des reacutesultats repreacutesentatifsde lrsquoInternet applicables agrave La Reacuteunion dans sa globaliteacute mais de mener une premiegravereexpeacuterience pour valider la meacutethode et les outils que nous pourrions ensuite appliqueraupregraves des diffeacuterents opeacuterateurs locaux

Ce chapitre se compose de quatre sections La premiegravere section 31 fixe les objectifs delrsquoeacutetude de meacutetrologie Elle preacutesente les meacutetriques agrave deacuteterminer pour pouvoir atteindreces objectifs La partie 32 preacutesente la meacutethode de mise en œuvre de la plate-forme demeacutetrologie Le protocole de mesure mis en place pour la reacutealisation drsquoune eacutetude est preacute-senteacute dans la section 33 Enfin cette section est suivie par la partie 34 qui preacutesente lesreacutesultats que lrsquoon peut obtenir et lrsquointerpreacutetation qui peut en ecirctre faite

31 Objectifs

Lrsquoeacutetude des deacutelais aller-retour (RTT) et des routes Internet de lrsquoicircle de La Reacuteunion quenous avons preacutesenteacutee dans le chapitre preacuteceacutedent a mis en eacutevidence une connectiviteacute speacute-cifique Lrsquoaccegraves agrave lrsquoInternet passe principalement par la meacutetropole avec un RTT minimalde 180 ms Ce RTT multiplieacute par un deacutebit drsquoaccegraves de 1 Mbits deacutebit theacuteorique minimalproposeacute dans les diffeacuterentes offres par les FAI donne une quantiteacute de donneacutees eacutemisespar anticipation de 22 5 Ko Ce calcul prend comme hypothegravese que le goulot drsquoeacutetran-glement est le lien drsquoaccegraves de lrsquohocircte Ce produit deacutelai bande passante repreacutesente la taille

75

de la fenecirctre drsquoeacutemission agrave partir de laquelle une transmission continue de lrsquoeacutemetteur de-vient possible Avec une valeur de 22 5 Ko cela place le canal de communication de LaReacuteunion dans la cateacutegorie des reacuteseaux agrave forte capaciteacute de stockage (LFN) Dans la section21 nous avons vu que La Reacuteunion est pleinement inteacutegreacutee au plan tregraves haut deacutebit delrsquoeacutetat franccedilais Ce plan a pour objectif de deacuteployer une infrastructure de distribution enfibre optique (Fiber To The Home (FTTH)) sur lrsquoensemble du territoire franccedilais Cela aurapour conseacutequence si les deacutelais ne sont pas en diminution drsquoaugmenter la capaciteacute destockage du canal de communication

311 Les objectifs de lrsquoeacutetude

Le lien drsquoaccegraves de La Reacuteunion conduit agrave consideacuterer lrsquoInternet avec les caracteacuteristiquesdrsquoun reacuteseau agrave forte capaciteacute de stockage Ceci est ducirc agrave un deacutelai minimal eacuteleveacute Avec cedeacutelai des deacutegradations potentielles des performances de TCP sont envisageables La miseen place drsquoune eacutetude de meacutetrologie passive agrave lrsquoeacutechelle reacutegionale nrsquoa pas encore eacuteteacute reacuteali-seacutee Les opeacuterateurs ont une connaissance partielle de la situation de lrsquoicircle Afin drsquoobtenirune vision globale de lrsquousage de lrsquoInternet sur lrsquoicircle de La Reacuteunion il nous faut reacutepondreaux diffeacuterentes questions suivantes

mdash Quel est lrsquoimpact de lrsquoaugmentation de la capaciteacute de stockage sur les performancesdu protocole TCP

mdash Est-ce que lrsquoaugmentation des deacutebits theacuteoriques est reacutecupeacutereacutee dans les deacutebits me-sureacutes par TCP

Dans la section 123 nous avons preacutesenteacute lrsquoarticle [Zheleva2015] Pour rappel dans cettepublication les auteurs ont mis en avant un changement drsquoutilisation des services Internetapregraves une augmentation de la bande passante Nous allons eacutegalement reacutepondre agrave desquestions orienteacutees vers la supervision du trafic Ces questions sont les suivantes

mdash Quels sont les protocoles de transport utiliseacutes

mdash Quels sont les services les plus freacutequents

mdash Quelle est la distribution geacuteographique des services joints

Les reacuteponses agrave ces questions impliqueront lrsquoapparition drsquoautres questions

312 Les meacutetriques de lrsquoeacutetude

Le tableau 31 indique les meacutetriques que lrsquoon va eacutetudier Chaque meacutetrique eacutetudieacuteesera mise en relation avec une des questions poseacutees preacuteceacutedemment

Meacutetriques de supervision

La supervision du trafic consiste agrave analyser le flux geacuteneacuteral de paquets qui transite ausein drsquoun eacutequipement comme un routeur ou un commutateur On parle drsquoeacutetude macro-scopique telle qursquoindiqueacutee dans le rapport [Owezarski2003-1] Les informations analy-seacutees par la supervision sont geacuteneacuteralement les informations analyseacutees par un adminis-trateur Reacuteseau ou encore un FAI En reacuteponse aux questions sur la supervision nousavons seacutelectionneacute dans un premier temps lrsquoidentification des protocoles de transportLe champ protocole de lrsquoen-tecircte IP indique le protocole de niveau suivant utiliseacute dans lapartie des donneacutees du datagramme Internet [RFC760] Les valeurs des diffeacuterents proto-coles sont speacutecifieacutees en reacutefeacuterence [RFC3232 IANA-port]

76

TABLE 31 ndash Les meacutetriques de meacutetrologie passive

Meacutetriques En-tecircte Champs

Supervisiondu trafic

Caracteacuterisation des destinationsIP

Adressessources etdestinations

Protocole de transport employeacute ProtocoleService utiliseacute

TCP

Numeacutero deport

Performanceprotocolaire

Performance deTCP

Eacuteveacutenement de congestion ECNNS+ CWRNumeacutero deseacutequence

RTT TimestampPertes Numeacutero de

seacutequencedeacute-seacutequencementsRetransmissions

Deacutebits binaires

EacutecouleacuteTimestampNumeacutero deseacutequencefenecirctre

DescendantMontant

UtileCaracteacuterisationdes flots

DeacutebitDureacutee Timestamp

Longueur Nombrede paquetseacutechangeacutes

Nous avons vu preacuteceacutedemment que les services eacutevoluent dans le temps et selon lesdeacutebits [Zheleva2015] Lrsquoanalyse du champ numeacutero de port de lrsquoen-tecircte TCP aide agrave lrsquoidenti-fication du Service utiliseacute Chaque numeacutero de port est associeacute agrave un service preacutecis deacutefinidans le [RFC776]

En regravegle geacuteneacuterale le trafic Internet est diviseacute en trois cateacutegories en fonction de ladestination par rapport agrave la source Crsquoest le groupe de travail 802 de lrsquoIETF qui est encharge des caracteacuterisations

mdash Local Area Network (LAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir une zonede quelques kilomegravetres carreacutes ou moins Parce que le reacuteseau est connu pour necouvrir qursquoune petite zone des optimisations peuvent ecirctre faites dans les protocolesde signal de reacuteseau qui permettent des deacutebits de donneacutees jusqursquoagrave 100 Mbits raquo[RFC1983]

mdash Metropolitan Area Network (MAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir unezone proche de celle drsquoune grande ville Ces reacuteseaux sont mis en œuvre par destechniques innovantes comme le passage de cacircbles agrave fibres optiques dans les tun-nels du meacutetro raquo [RFC1983]

mdash Wide Area Network (WAN) laquo Un reacuteseau geacuteneacuteralement construit avec des lignesseacuteries qui couvrent une large zone geacuteographique raquo [RFC1983]

La reacutepartition des adresses IP de destination va permettre drsquoidentifier le pays ougrave se si-tue lrsquoinformation Cette information peut permettre de connaicirctre la pertinence du lieudrsquoheacutebergement de lrsquoinformation par rapport au service et agrave lrsquoapplication utiliseacutee Nousutilisons pour cela la base de donneacutees associeacutee agrave lrsquooutil rTraceroute outil drsquoanalyse gra-phique des traces preacutesenteacute dans la section 222 Dans le cas ougrave une adresse IP nrsquoest pas

77

reacutepertorieacutee dans notre base de donneacutees lrsquoinformation sera extraite de la base de donneacuteesde RIPE NCC avec lrsquooutil rgeoloc [LanYanFock2015]

Meacutetriques de performance

Le groupe de travail IPPM de lrsquoIETF a deacutefini dans diffeacuterents documents des meacutetriquesde bases comme la mesure de connectiviteacute [RFC2678] le deacutelai unidirectionnel [RFC2679]le taux de perte unidirectionnel [RFC2680] Ces deux derniegraveres meacutetriques sont eacutegalementdeacutefinies dans le sens aller-retour avec le [RFC2681]

Nous avons comme objectif la comparaison du deacutebit theacuteorique et le deacutebit mesureacute Lecalcul du deacutebit mesureacute par TCP se fait agrave travers 3 meacutetriques le RTT la taille de la fe-necirctre drsquoeacutemission et la probabiliteacute de perte de paquets Le RTT est le deacutelai entre la misedu premier bit de la question sur le cacircble et la reacuteception du dernier bit de la reacuteponse[RFC2681] Il est calculeacute par la diffeacuterence de temps entre lrsquoeacutemission du paquet et la reacute-ception de lrsquoACK correspondant Si le RTT est trop important TCP peut consideacuterer unpaquet comme perdu

Une perte est deacutefinie comme laquo lrsquoeacutemission drsquoun paquet par la source mais non reccedilupar la destination raquo [RFC2680] Si le paquet est perdu alors TCP va reacuteduire la fenecirctredrsquoeacutemission

La fenecirctre drsquoeacutemission est calculeacutee agrave partir du champ Fenecirctre des segments TCP Cechamp est deacutefini dans le [RFC6528] comme le nombre drsquooctets de donneacutees commenccedilantpar celui indiqueacute dans le champ drsquoaccuseacute de reacuteception que lrsquoexpeacutediteur de ce segment estprecirct agrave accepter

Agrave lrsquoaide de la formule indiqueacutee par lrsquoeacutequation 31 il est possible de calculer le deacutebitmesureacute par TCP

Debit =FenetreRTTradic

Probabilite perte(31)

Les deacutebits mesureacutes pourront ecirctre classeacutes selon qursquoils soient montants descendantsconfondus ou utiles Cette diffeacuterenciation srsquoexplique par le fait que la comparaison avecle deacutebit theacuteorique est montant et descendant Le deacutebit eacutecouleacute (throughput) correspond laquo aunombre de paquets ou de bits par seconde raquo [RFC6201] Le deacutebit utile (goodput) corres-pond laquo au nombre de paquets ou de bits utiles (non retransmis) par seconde raquo[RFC5166]

Lrsquoeacutetude des performances du protocole TCP passe dans un premier temps par lrsquoeacutetudedes pertes et des retransmissions

Une retransmission est deacutefinie par le [RFC6298] comme eacutetant le laquo segment le plusancien qui nrsquoa pas eacuteteacute acquitteacute par le reacutecepteur TCP raquo Pour obtenir le nombre de re-transmissions on regarde les numeacuteros de seacutequences des segments TCP Si dans un flotIP un numeacutero de seacutequence apparaicirct plusieurs fois alors cela implique la retransmissiondu paquet Les retransmissions seront seacutepareacutees selon la raison de la retransmission (fastretransmit) ou retransmissions abusives (spurious retransmit)Le [RFC5681] explique le pheacutenomegravene pouvant provoquer une retransmission par le meacute-canisme de fast retransmit La retransmission drsquoun paquet due au meacutecanisme de fast re-transmit est calculeacutee en fonction du nombre drsquoacquittements dupliqueacutes et de la diffeacuterencetemporelle entre le paquet de donneacutees observeacutees et le preacuteceacutedent acquittementLes paquets spurious retransmit sont des paquets subissant des fausses retransmissions Sile numeacutero de seacutequence du paquet attendu est infeacuterieur ou eacutegal au numeacutero drsquoacquittementdu preacuteceacutedent ACK alors le paquet observeacute est un paquet retransmis abusivement

78

Lorsque le paquet est reacute-eacutemis il va se produire du deacute-seacutequencement Le deacute-seacutequencementse deacutefinit dans le [RFC6248] laquo Lrsquoarriveacutee ordonneacutee est une proprieacuteteacute que lrsquoon trouve dansles paquets qui transitent par leur chemin ougrave le numeacutero de seacutequence des paquets aug-mente avec chaque nouvelle arriveacutee et il nrsquoy a pas de reacutegression La deacutetection du reacute-ordonnancement agrave destination est baseacutee sur lrsquoordre drsquoarriveacutee des paquets par rapport agraveune valeur de reacutefeacuterence non inverseacutee raquo

Les paquets retransmis peuvent eacutegalement servir agrave lrsquoidentification des eacuteveacutenementsde congestion Pour identifier ces eacuteveacutenements deux techniques peuvent ecirctre mises enplaceLa premiegravere consiste a eacutetudier la preacutesence des drapeaux ECN et Congestion Window Re-duce (CWR) dans les en-tecirctes des paquets TCP [RFC8311]La seconde technique se propose drsquoeacutetudier les variations de la fenecirctre drsquoeacutemission de TCPCette eacutetude doit ecirctre coupleacutee avec lrsquoanalyse des pheacutenomegravenes de pertes et de retransmis-sion autour de cet eacuteveacutenement

Dans la section 112 nous avons constateacute que la capaciteacute de stockage drsquoun lien estprobleacutematique pour les flots courts Afin de poursuivre lrsquoeacutetude de lrsquoimpact de la capa-citeacute de stockage des liens de lrsquoInternet reacuteunionnais nous allons caracteacuteriser les flux Lacaracteacuterisation drsquoun flot peut se faire selon la dureacutee (temps eacutecouleacute entre le premier etle dernier paquet) la taille (nombre de paquets eacutechangeacutes) et le ratio entre la dureacutee et lataille Drsquoapregraves les travaux reacutealiseacutes par [Lan2006] un flot se caracteacuterise par la deacutefinitionsuivante laquo a flow is an unidirectional series of IP packets with same source and destinationaddresses port numbers and protocol numbers raquo Ce qui peut se traduire par la deacutefinition sui-vante laquo un flot est une seacuterie de paquets IP avec le mecircme tuple suivant (adresse IP sourceport source adresse IP destination port destination protocole IP) raquo Dans ce cas preacutecisune connexion TCP de par son coteacute bi-directionnel est constitueacutee de deux flots

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie

La mise en place drsquoune eacutetude de meacutetrologie passive au sein du territoire reacuteunionnaissoulegraveve trois contraintes

La premiegravere est la mise en place drsquoun accord de partenariat avec un ou plusieurs FAILrsquoobjectif de ce partenariat est la mise en place drsquoun systegraveme drsquoeacutecoute et de capture dedonneacutees au sein de leur infrastructure tout en garantissant une confidentialiteacute maximaleagrave leur clients et agrave lrsquoentreprise

Une seconde contrainte est la seacutelection drsquoun outil de mesure Cet outil sera capablenon seulement drsquoeacutecouter les donneacutees circulant sur une interface mais eacutegalement de cap-turer les donneacutees sous diverses extensions

La derniegravere contrainte est lieacutee agrave la seacutelection drsquoun outil drsquoanalyse Cet outil sera ca-pable drsquoapporter un support de reacuteponses aux questions poseacutees preacuteceacutedemment Il devrareacutepondre agrave des critegraveres que lrsquoon deacutetaillera par la suite

Le trafic eacutetant variable drsquoun instant t agrave lrsquoinstant t+1 nous allons mettre en place un sys-tegraveme de capture de donneacutees Ce systegraveme permettra lrsquoanalyse a posteriori des meacutetriquesEn fonction des reacutesultats drsquoautres meacutetriques pourront ecirctre extraites des donneacutees Deplus la capture nous autorise apregraves quelques deacutemarches administratives de partagerles traces aupregraves de la communauteacute scientifique

321 Pour la capture du trafic

Nous avons vu dans le chapitre 1 que les outils neacutecessaires agrave la reacutealisation drsquoeacutetudes demeacutetrologie passive sont nombreux Notre analyse sera la plus large possible en terme de

79

meacutetriques Nous devrons en fonction des reacutesultats obtenus eacutetudier drsquoautres meacutetriquesque celles choisies en premier lieu Pour ces raisons nous faisons le choix de reacutealiser descaptures du trafic Dans la section 123 nous avons preacutesenteacute les outils disponibles pourla capture de trafic Nous allons dans un premier temps utiliser une solution logicielleDans le cas ougrave les deacutebits sur les liens seraient trop eacuteleveacutes nous basculerons alors vers unesolution mateacuterielle

322 Pour analyser les traces

De nombreux outils drsquoanalyse de traces existent dans la litteacuterature Afin drsquoen choi-sir un nous allons deacutetailler des critegraveres de seacutelection Nous preacutesenterons quelques outilsdrsquoanalyse existants en mettant en avant leurs reacuteponses aux critegraveres preacutesenteacutes Nous fini-rons par la preacutesentation drsquoun outil drsquoanalyse de traces deacuteveloppeacute au sein du LIM

Deacutefinition des critegraveres

Lrsquooutil drsquoanalyse pour la plate-forme de meacutetrologie passive devra reacutepondre aux cri-tegraveres de seacutelection suivants

1 Protection de la vie priveacutee des utilisateurs Pour respecter ce critegravere une fonctiondrsquoanonymisation des traces doit ecirctre appliqueacutee La loi Informatique et Liberteacute de1978 reacuteglemente le traitement des donneacutees personnelles [LIL1978] Une trace estune eacutecoute drsquoun trafic initieacute par un utilisateur Les donneacutees transporteacutees nrsquoont pasagrave ecirctre lues En plus des donneacutees ce sont aussi les adresses IP qui ne doivent pasapparaitre en clair

2 traiter une volumeacutetrie importante Le volume des traces eacutetant variable il est neacuteces-saire que lrsquooutil soit capable de traiter des traces de grande taille Potentiellementce sont des fichiers de traces de plusieurs dizaines de Go (Giga-octets) qui peuventecirctre ameneacutes agrave ecirctre traiteacutes

3 proposer des meacutetriques adapteacutees Pour reacutealiser une analyse approfondie il fautque la liste des meacutetriques proposeacutees par lrsquooutil drsquoanalyse soit la plus large possibleAgrave ce titre nous avons preacutesenteacute dans le tableau 31 une base de meacutetriques a analyser

Les outils drsquoanalyse disponibles

Il existe de nombreux outils drsquoanalyse de donneacutees de meacutetrologie passive Nous pro-posons une classification selon les possibiliteacutes offertes par chaque outil CAIDA pro-pose sur son site internet une partie deacutedieacutee aux diffeacuterents outils de meacutetrologie passive[CAIDA-Tools]

BRO est un outil pour la deacutetection drsquointrus sur le reacuteseau en temps-reacuteel agrave partir demeacutetrologie passive Il est preacutesenteacute pour la premiegravere fois dans lrsquoarticle [Paxson1999] Agravepartir drsquoun systegraveme de script il accepte en entreacutee des fichiers de taille importante Leprincipal deacutefaut de Bro par rapport agrave nos critegraveres de seacutelection est le non-respect de la viepriveacutee

CoralReef [Moore2001] est une suite logicielle deacuteveloppeacutee par CAIDA en 1999 Cetoutil reacutealise des analyses de donneacutees que ccedila soit en temps reacuteel ou sur des traces Le critegraverede respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pas respecteacuteLrsquooutil est plus adapteacute agrave lrsquoeacutetude des caracteacuteristique du trafic qursquoau performance de TCPAinsi les meacutetriques lieacutees agrave lrsquoeacutetude des performances ne sont pas incluses dans le code delrsquooutil

Netflow est un outil proprieacutetaire Il neacutecessite lrsquoutilisation drsquoun mateacuteriel de la marqueCISCO plus la licence du logiciel Lrsquooutil reacutealise principalement la supervision du trafic

80

transitant sur le mateacuteriel Le respect de la vie priveacutee est ici respecteacute mais les meacutetriques deperformance protocolaire ne sont pas inclues

TCPStat [Herman2001] rapporte certaines statistiques du trafic transitant agrave traversune interface reacuteseau Crsquoest un outil qui peut travailler sur un flot en temps reacuteel ou enanalysant un fichier de trace Cet outil ne permet pas lrsquoanonymisation des adresses IPPeu de meacutetriques sont ainsi renseigneacutees On pourrait obtenir les deacutebits et la volumeacutetriedes paquets IPv4 eacutechangeacutes

TCPTrace [Ostermann2000] est un logiciel qui permet le traitement de traces drsquoeacutecouteOutil tregraves complet il a deacutejagrave fait ses preuves sur drsquoautres projets de meacutetrologie passive Lecritegravere de respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pasrempli La meacutetrique de caracteacuterisation des destinations et la reacutepartition geacuteographique nesont pas incluses dans les meacutetriques proposeacutees par lrsquooutil

Tstat [Mellia2003-1] est un outil qui peut reacutealiser la collecte et lrsquoanalyse du trafic Cetteanalyse se fait sur diffeacuterents niveaux passant des paquets agrave la couche applicative Cetteanalyse reacutealise une anonymisation des adresses IP Les meacutetriques de caracteacuterisations desdestinations et de reacutepartitions geacuteographiques ne sont pas inteacutegreacutees dans lrsquooutil

Wireshark [Orebaugh2006] est un outil graphique drsquoanalyse reacuteseau tregraves reacutepandu Cetoutil permet de filtrer et drsquoanalyser des donneacutees entrantes et sortantes drsquoun point entemps reacuteel ou sur des traces collecteacutees Il autorise eacutegalement la capture et la lecture detraces Lrsquooutil preacutesente des lacunes sur les trois critegraveres preacutesenteacutes

ZOO est un outil deacuteveloppeacute dans le cadre du projet Metropolis Creacuteeacute par le Labora-toire drsquoAnalyse et drsquoArchitecture des Systegravemes (LAAS) le logiciel essaie de trouver un moyende mesurer la qualiteacute du service de trouver des paramegravetres pour deacutefinir le processus detrafic et drsquoaider agrave eacutemettre un modegravele adapteacute pour le trafic [Owezarski2004] Au niveaudes meacutetriques preacutesenteacutees ce sont principalement des statistiques et des informations desupervision qui sont disponibles Lrsquoanonymisation des adresses IP nrsquoest pas incluse dansles caracteacuteristiques de lrsquooutil

Le tableau 31 sert de base pour la reacuteponse aux critegraveres deacutedieacutes des meacutetriques Netflowpossegravede un catalogue de meacutetriques restreint agrave la supervision du trafic TCPTrace et Tstatsont des outils qui auraient pu correspondre agrave nos besoins mais les meacutetriques de caracteacute-risation des destinations et la reacutepartition geacuteographiques sont absentes Nrsquoayant pu faireun choix sur un outil pouvant reacutepondre agrave la totaliteacute des critegraveres nous nous orientons versle deacuteveloppement drsquoun analyseur de traces

Deacuteveloppement de Xanalyse

Lrsquoanalyse des traces de meacutetrologie passive peut srsquoeffectuer avec de nombreux outilsDans la section preacuteceacutedente nous avons preacutesenteacute les critegraveres de diffeacuterenciation de cesoutils Tstat et TCPTrace sont des outils tregraves complets Ces deux outils auraient pu nousconvenir Neacuteanmoins le temps de traitement des fichiers de volumeacutetrie importante estbeaucoup trop important Ducirc agrave cela nous avons pris le parti de deacutevelopper un nouveloutil drsquoanalyse de traces Xanalyse

Le premier critegravere concerne le respect de la vie priveacutee Une approche simple pouranonymiser une adresse IP est de la faire correspondre avec une adresse IP aleacuteatoireUne telle meacutethode rend la trace inutilisable dans des situations utilisant la logique desadressages IP Lrsquoanonymisation drsquoadresse est performante si elle preacuteserve le mecircme preacute-fixe Autrement dit si deux adresses IP partagent k-bits de preacutefixes leurs eacutequivalencesanonymiseacutees conserveront ces k-bits de preacutefixes en commun La meacutethode crypto-pan deacute-crite dans lrsquoarticle [Xu2002] sert de base agrave la fonction drsquoanonymisation mise en œuvreLrsquoanonymisation srsquoappliquera que lors de lrsquoaffichage des reacutesultats Nous avons besoin de

81

lrsquoadresse pour deux meacutetriques de supervision que sont la reacutepartition du trafic et la geacuteo-localisation Concernant le champ Donneacutees des paquets TCP il nrsquoest pas utiliseacute Lrsquoeacutetudene recommande que les en-tecirctes

Sur lrsquoaspect du traitement drsquoune volumeacutetrie importante Xanalyse fut deacuteveloppeacute avecla volonteacute de maximiser lrsquoutilisation des ressources de la machine hocircte Pour cela nousavons eu lrsquoideacutee drsquoutiliser la programmation parallegravele (thread) La paralleacutelisation permetlrsquoexeacutecution de plusieurs instructions simultaneacutement

Le calcul des meacutetriques fut directement reacutealiseacute en consideacuterant leurs deacutefinitions dansles diffeacuterents RFC tel que nous lrsquoavons deacutecrit dans la section 312 Une partie statistiquefut eacutegalement inteacutegreacutee agrave notre outil Des calculs de moyenne de variance et drsquoeacutecart-typefurent inteacutegreacutes Ces calculs se font agrave la toute fin du programme Durant le deacuteveloppe-ment nous avons corroboreacute lrsquoensemble de nos reacutesultats avec les reacutesultats de TCPTraceCette comparaison a eacuteteacute mise en place pour veacuterifier lrsquoexactitude de nos reacutesultats Le deacuteve-loppement de lrsquooutil fut reacutealiseacute sous ma direction dans le cadre drsquoun stage de fin drsquoeacutetudede Master 2 [Ravoavahy2017]

Pour finir nous avons reacutealiseacute une validation par comparaison entre Xanalyse et TCP-Trace Le tableau 32 montre le bilan de cette comparaison

TABLE 32 ndash Comparaison de performances

TCPTrace XanalyseTemps drsquoanalyse sur une trace de 20 Go 10 jours 7 joursTemps drsquoanalyse sur une trace de 1 Go 1 Heure 3 Min

Xanalyse se reacutevegravele ecirctre un outil beaucoup plus rapide que TCPTrace avec des reacutesul-tats identiques sur le calcul des meacutetriques Cet outil est actuellement disponible sur lesite du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrxanalyse

33 Protocole de mesure

Le protocole de mesure preacutesente les diffeacuterentes phases que lrsquoon souhaite mettre enplace durant lrsquoeacutetude Elles sont ainsi au nombre de cinq les contraintes reacuteglementairesla veacuterification des perturbations la capture du trafic la collecte et lrsquoanalyse Ce protocolefut reacutedigeacute en prenant en consideacuteration les conseils indiqueacutes dans [John2010] Dans cetarticle les auteurs deacutelivrent diffeacuterents conseils et indications baseacutes sur lrsquoexpeacuterience deplusieurs acteurs de meacutetrologie passive

Notre protocole a eacuteteacute mis en place dans le but de rassurer lrsquoensemble des acteurs Ceprotocole fut testeacute dans le cadre drsquoune eacutetude de meacutetrologie passive du LIM

Contraintes reacuteglementaires Avant toute eacutetude de meacutetrologie Internet passive au seinde lrsquoUniversiteacute de La Reacuteunion il faut obtenir lrsquoautorisation du preacutesident de lrsquoeacutetablisse-ment Le preacutesident consultera le Correspondant Informatique et Liberteacutes (CIL) et le Respon-sable Seacutecuriteacute et Systegravemes drsquoInformation (RSSI) de lrsquouniversiteacute Ces personnes deacutefiniront enfonction des objectifs de lrsquoeacutetude les limites de notre eacutetude en accord avec les lois fran-ccedilaises Les limites imposeacutees par la preacutesidence de lrsquoUniversiteacute indiqueacutees par le CIL et leRSSI furent celles autour de la vie priveacutee Agrave ce titre nous nrsquoavions pas le droit drsquoeacutetudierle trafic en temps reacuteel nrsquoy drsquoeacutetudier le champ Donneacutees des paquets TCP Nous avionseacutegalement lrsquoobligation drsquoanonymiser lrsquoensemble des adresses IP priveacutees rencontreacutees Laderniegravere obligation fut la restriction de nos eacutecoutes au LIM Ces obligations furent res-pecteacutees dans le deacuteveloppement de lrsquooutil drsquoanalyse

82

Afin de ne capturer que le trafic du Laboratoire nous avons travailleacute en collaborationavec la Direction des Services Informatiques (DSI) de lrsquoUniversiteacute Ce partenariat a pourobjectif drsquoisoler le trafic du LIM dans un Virtual Local Area Network (VLAN) speacutecifique UnVLAN est laquo un meacutecanisme par lequel les hocirctes qui reacutesident dans la mecircme infrastructurephysique commuteacutee mais des domaines de diffusion virtuelle seacutepareacutes sont adresseacutes agravepartir du mecircme sous-reacuteseau IPv4 et partagent une adresse IP de passerelle par deacutefautcommune supprimant ainsi lrsquoexigence drsquoun sous-reacuteseau IP deacutedieacute pour chaque reacuteseaulocal virtuel (Local Area Network (LAN) ou MAN) raquo [RFC3069] Les VLAN seacuteparent lesusagers selon leur autorisations et les types de connexion Par exemple un enseignant-chercheur a plus de droits qursquoun eacutetudiant Une personne connecteacutee par connexion filairea des droits diffeacuterents drsquoune personne connecteacutee par agrave un reacuteseau sans fil Le RSSI delrsquoUniversiteacute ne souhaitant pas obliger les membres du LIM agrave participer agrave cette eacutetudeune campagne de preacutevention fut organiseacutee Les personnes ayant explicitement eacutemis lesouhait de ne pas participer agrave notre eacutetude seraient de facto connecteacutees agrave un autre VLANpar la DSI Au sein du laboratoire tout le personnel a accepteacute de participer agrave notre eacutetude

Veacuterification des perturbations La figure 31 illustre lrsquointer-connectiviteacute mise en placepour lrsquoeacutecoute du LIMChaque ordinateur du laboratoire geacutenegravere un trafic Internet qui passe par le VLAN dulaboratoire Par le systegraveme de port-mirroring le routeur va creacuteer une copie des paquetstransitant par le port du VLAN laboratoire Le paquet copieacute sera alors redirigeacute vers lasonde de capture La sonde de capture aura deux interfaces reacuteseaux La premiegravere (Eth0)sera deacutedieacutee agrave la capture des paquets provenant de la technique de port-mirroring La se-conde carte reacuteseau (Eth1) servira pour lrsquoaccegraves distant agrave la sonde de captureLrsquoordinateur drsquoaccegraves possegravede une cleacute priveacutee permettant lrsquoaccegraves agrave distance agrave la sonde decapture Cette porte drsquoentreacutee seacutecuriseacutee permet une gestion agrave distance de la sonde Lestraces collecteacutees seront transfeacutereacutees sur un serveur de stockage deacutedieacute au sein du LIM Letransfert se fera agrave lrsquoaide de la commande SCP et lrsquoaccegraves seacutecuriseacute preacutesenteacute preacuteceacutedemmentLrsquoaccegraves distant et le transfert des traces font partie inteacutegrante du trafic geacuteneacutereacute par lesmembres du laboratoire Les perturbations peuvent survenir agrave deux niveaux au routeuret agrave la sonde Au niveau de la sonde drsquoeacutecoute le deacutebit affecteacute en entreacutee-sortie du VLANdu laboratoire est eacutegal agrave 1 000 Mbits Ce deacutebit est devenu freacutequent sur les cartes reacuteseauxvendues sur les ordinateurs grand public Les caracteacuteristiques de la carte reacuteseau deacutedieacuteeagrave la capture accepte un deacutebit maximum eacutegal au deacutebit du VLAN du LIM On considegraverealors que le taux de pertes occasionneacute par la carte de capture peut ecirctre neacutegligeableAu niveau du routeur la fonction port-mirroring copie lrsquointeacutegraliteacute des segments IP en-trant sur un port Le paquet original est redirigeacute vers lrsquoadresse de destination incluse dansle champ destination de lrsquoen-tecircte IP Le paquet forgeacute au sein du routeur est dirigeacute versun port deacuteclareacute lors de la programmation de lrsquoeacutequipement La fonction de port-mirroringfait partie des techniques deacuteveloppeacutees dans le but drsquoeacutetudier le comportement drsquoun reacute-seau [Zhang2007] a eacutetudieacute les deacuterives lieacutes agrave la fonction port-mirroring Cette fonctionneacutecessite la mise en meacutemoire tampon des paquets provenant du lien eacutetudieacute jusqursquoagrave ceqursquoils puissent ecirctre transmis sur le lien miroir Cette mise en meacutemoire tampon joue sur lasynchronisation des paquets entre le lien eacutetudieacute et le lien miroir Lors de la transmissiondes paquets sur le lien miroir est-ce que la transmission srsquoest faite dans lrsquoordre drsquoarriveacuteesur le port eacutetudieacute Il y a donc une question drsquoordonnancement des paquets agrave eacutetudier Lameacutemoire tampon du routeur nrsquoest pas infinie Il existe donc des cas ougrave la meacutemoire estremplie occasionnant agrave ce moment lagrave des pertes Les reacutesultats de [Zhang2007] ont misen avant une diffeacuterence de synchronisation entre les paquets du lien eacutetudieacute et les paquetsdu lien miroir La diffeacuterence de synchronisation implique eacutegalement des erreurs dans lereacute-ordonnancement des paquets Ces erreurs auront pour conseacutequences des erreurs dans

83

lrsquoanalyse des performances de TCP Pour reacutesoudre ces problegravemes les auteurs preacuteconisentlrsquousage drsquoune carte physique speacutecifique agrave lrsquoeacutetude passive comme les cartes DAG

FIGURE 31 ndash Scheacutema de distribution de la plate-forme de mesure

Capture du trafic La mise en place des mesures se fait degraves la mise sous tension de lasonde et la fin du chargement du systegraveme drsquoexploitation La capture des donneacutees auraune dureacutee comprise entre 1 et 23 heures Elle srsquoeffectue agrave lrsquoaide de la commande

tcpdump -i eth0 -w trace-$timestamptrace amp

Dans laquelle les options indiquent

mdash -i eth0 indique lrsquointerface de capture Nous avons preacutevu une seconde interfacereacuteseau pour lrsquoaccegraves distant seacutecuriseacute

mdash -w trace-$timestamptrace cette option deacutesigne le fichier drsquoeacutecriture Les fichiers sontnommeacutes par le timestamp de deacutebut

Une fois la capture finie la sonde va deacutecider du temps avant la prochaine eacutecouteCette dureacutee nrsquoexceacutedera pas 24 heures Lrsquoobjectif est drsquoavoir des mesures quotidiennesmais programmeacutees de maniegravere aleacuteatoire sur la dureacutee drsquoeacutecoute et sur lrsquoeacutecart entre deuxmesures

Le paragraphe de veacuterifications des perturbations a deacutemontreacute qursquoil est difficile demettre en place une capture de la totaliteacute des paquets Une solution de capture est lrsquoeacutechan-tillonnage Dans notre cas nous avons reacutealiseacute un eacutechantillonnage indeacutependant du contenu[RFC5475] Cet eacutechantillonnage est reacutealiseacute sans prendre en consideacuteration le contenu dupaquet Ayant une volonteacute drsquoobtenir un grand nombre de donneacutees nous avons mis enplace une dureacutee de capture maximale de 23 heures et un eacutecart entre deux captures de 24heures

Collecte Une phase de collecte des traces est reacuteguliegraverement reacutealiseacutee Lrsquoobjectif est delibeacuterer de lrsquoespace disque au niveau de la sonde de capture Lorsque la sonde a fini dereacutealiser sa capture elle va envoyer le fichier de capture vers un serveur de stockage ausein du LIM Nous avons vu que le fichier de capture est nommeacute selon une nomenclaturespeacutecifique Pour rappel cette nomenclature comporte la date (au format timestamp) dudeacutebut de lrsquoeacutecoute La deacutenomination du fichier autorise un classement des traces par datede capture Ce classement peut permettre une eacutetude temporelle du trafic

Lrsquoenvoi du fichier se fait agrave travers lrsquointerface eth1 La technique utiliseacutee pour le trans-fert est la commande SCP Lrsquoutilisation de lrsquoempreinte MD5 du fichier nous assure que letransfert des donneacutees srsquoest reacutealiseacute correctement En cas de diffeacuterence entre les empreintes

84

le transfert srsquoeffectue agrave nouveau Lrsquoobjectif est de veacuterifier lrsquointeacutegriteacute des donneacutees transfeacute-reacutes

Le scheacutema 32 scheacutematise le fonctionnement de notre sonde de mesure Nous consi-deacuterons que la fonction de port-mirroring est deacutejagrave programmeacutee sur le routeur DSI

Degraves que la sonde est alimenteacutee eacutelectriquement et que lrsquoOS est chargeacute la sonde vaveacuterifier qursquoune capture est programmeacutee Si aucune capture de trace nrsquoest programmeacuteela sonde va en planifier une dans les prochaines 24 heures Si la sonde a connaissancedrsquoune programmation elle va alors reacutealiser la capture La sonde va enregistrer le traficsur une dureacutee allant entre 1 et 23 heures Lorsque la capture est finie la sonde va alorsprogrammer le prochain enregistrement La sonde va eacutegalement envoyer la trace vers leserveur de stockage

Capture

Alimentation

eacutelectrique

Veacuterification

dune capture

Programmation

dune capture

Collecte

PreacutesenteAbsente

24 heures maximum

1 - 23 heures maximum

FIGURE 32 ndash Scheacutema de fonctionnement de la plateforme de mesure

Analyse Lrsquoanalyse des donneacutees obtenues se fait en deux eacutetapes La premiegravere consiste agraveutiliser lrsquooutil Xanalyse pour obtenir les reacutesultats bruts La seconde eacutetape est lrsquoextractiondes donneacutees pour les repreacutesenter sous forme graphique

34 Reacutesultats

Notre eacutetude se cantonne agrave mesurer les performances du trafic au sein du LIM Le LIMfait partie inteacutegrante de lrsquoUniversiteacute de La Reacuteunion et agrave ce titre les usages de lrsquoInternetau sein de lrsquoeacutetablissement sont reacuteglementeacutes Ainsi lrsquoeacutetude des meacutetriques de supervisionpourraient ne pas correspondre agrave un usage plus libeacuteral de lrsquoInternet Pour rappel lesmeacutetriques eacutetudieacutees sont indiqueacutees dans le tableau 31

Nous avons fait le choix de seacuteparer notre eacutetude en deux La partie supervision donneun aperccedilu de lrsquousage du reacuteseau Internet au sein du LIM Nous essaierons dans la mesuredu possible de faire des extrapolations avec lrsquousage de lrsquoInternet agrave La Reacuteunion La sectionperformance est celle qui est la plus inteacuteressante Crsquoest elle qui va nous indiquer les deacutegra-dations occasionneacutees par les longs deacutelais pour La Reacuteunion

85

341 Supervision du trafic

Le tableau 33 montre la distribution des 4 protocoles de transport rencontreacutes

TABLE 33 ndash Distribution des protocoles encapsuleacutes dans IP

Protocole ICMP IGMP TCP UDPPourcentage 572 001 9249 178

La preacutesence du protocole ICMP agrave plus de 5 srsquoexplique par la preacutesence des sondesde mesures de RunPL Pour rappel lrsquoobjectif de cette plate-forme est drsquoeacutetudier la connec-tiviteacute de La Reacuteunion et des icircles de la Zone Oceacutean Indien agrave travers de la meacutetrologie activeNous avons dans le chapitre 2 preacutesenteacute des reacutesultats lieacutes agrave ces eacutetudes Lrsquousage du pro-tocole ICMP est freacutequent au sein de lrsquoInternet Une eacutetude du trafic reacuteunionnais mettraiteacutegalement lrsquousage de ce protocole

Le protocole Internet Group Management Protocol (IGMP) deacutefini dans le [RFC3376] estun protocole utiliseacute par les systegravemes IPv4 (hocirctes et routeurs) pour signaler leur appar-tenance agrave un groupe de multidiffusion IP agrave tout routeur multicast voisin Son usage estrestreint au sein drsquoun reacuteseau priveacute

Le protocole User Datagram Protocol (UDP) a une preacutesence infeacuterieure agrave 2 Son rocircleest la transmission de donneacutees simples sans fiabiliteacute Son usage est geacuteneacuteralement li-miteacute au service DNS Reacutecemment lrsquoentreprise Google a deacuteveloppeacute lrsquooption QUIC QUICpermet au navigateur Google Chrome drsquoeffectuer des requecirctes HyperText Transfer Protocol(HTTP)HyperText Transfer Protocol Secured (HTTPS) sur le protocole UDP [Carlucci2015]a eacutetudieacute les performances de ce systegraveme Les reacutesultats obtenus ont montreacute un meilleurgoodput que TCP-CUBIC malgreacute un taux de perte plus important Lrsquousage de QUIC estlimiteacute au navigateur Google Chrome navigateur le plus reacutepandu agrave La Reacuteunion drsquoapregraves[GSCounter] Neacuteanmoins cette option est deacutesactiveacutee par deacutefaut

Les reacutesultats de TCP sont en accord avec lrsquoeacutetude reacutealiseacutee par [EQUINIX] Avec unpourcentage de 92 49 TCP est majoritaire Les services proposeacutes par TCP sont plusnombreux que ceux offerts par les autres protocoles de transport

Le tableau 34 indique les services utiliseacutes Les services ont eacuteteacute rangeacutes par pourcentagereleveacute

TABLE 34 ndash Reacutepartition des services utiliseacutes par TCP

Service SSH DNS Mail Non identi-fieacutes

Autres HTTPS HTTP

Percent 002 163 491 721 945 3297 4379

La preacutesence du service Secure SHell (SSH) srsquoexplique par les accegraves distants agrave diffeacuterentsoutils propres au laboratoire On peut citer les nœuds Planet-Lab [PlanetLab] agrave traversle monde les sondes de la plate-forme RunPL lrsquoaccegraves agrave la sonde de capture pour cetteeacutetude lrsquoaccegraves agrave des serveurs distants etc

163 des paquets eacutechangeacutes dans nos traces sont des requecirctes de DNS Ces paquetspermettent de convertir un nom de domaine en adresse IP Lrsquoutilisation du DNS avec leprotocole TCP a eacuteteacute restreint aux transferts de zone et aux reacuteponses dont la taille est tropimportante pour UDP [RFC5936 RFC6691 RFC7766]

Le service intituleacute Mail regroupe les services identifieacutes par les ports numeacuteroteacutes 25110 143 465 995 et 993 Ces ports correspondent respectivement agrave Simple Mail TransfertProtocol (SMTP) Post Office Protocol (POP) Internet Message Access Protocol (IMAP) et leursversions seacutecuriseacutees SMTPs POPs IMAPs Lrsquoutilisation de ces ports est faite par les agents

86

de messagerie comme Windows Live Mail Mozilla Thunderbird ou Mail Lrsquoeacutechange decourriel repreacutesente 4 91 des paquets eacutechangeacutes Ce pourcentage est fausseacute par lrsquoutilisa-tion des interfaces web des messageries Par exemple on peut utiliser la page web duservice de message Gmail de Google pour envoyer directement des mails Le service uti-liseacute est alors un service web HTTP ou HTTPS

Le service nommeacute Non identifieacutes est une connexion dont le numeacutero de port nrsquoest pasrattacheacute agrave un service en particulier Ce sont geacuteneacuteralement des numeacuteros supeacuterieurs agrave 1 000

La partie Autres regroupe plusieurs services Ces services sont assez divers On peutainsi y retrouver lrsquoutilisation du port numeacuteroteacute 139 correspondant agrave netbios-ssn Ce servicede NetBIOS autorise lrsquoeacutechange de message en mode connecteacute On peut eacutegalement citerlrsquousage du service Hyper Text Caching Protocol (HTCP) [RFC2756] Ce service est utiliseacutepour partager et deacutecouvrir les contenus des caches (anteacutemeacutemoires) HTTP entre serveursmandataires

Nous avons deacutecideacute de garder la seacuteparation entre les services HTTP et HTTPS HTTPSest lrsquousage de HTTP avec un chiffrement Ce chiffrement permet au visiteur de veacuterifierlrsquoidentiteacute du site web gracircce agrave un certificat Ces services sont preacute-dominants au sein duLIM

Lrsquousage de ces services peut ecirctre deacutegradeacute si lrsquoon quitte La Reacuteunion Le tableau 35 in-dique la reacutepartition du trafic selon le type drsquoadresse de destination

TABLE 35 ndash Distribution du trafic

Trafic LAN MAN WANPourcentage 2165 0 7835

La reacutepartition srsquoest faite selon la geacuteolocalisation des adresses IP Le trafic LAN cor-respond agrave des eacutechanges entre adresses priveacutees Le trafic identifieacute MAN correspond agrave deseacutechanges entre adresses geacuteolocaliseacutees agrave La Reacuteunion On constate ainsi qursquoaucune infor-mation chercheacutee par les utilisateurs nrsquoest geacuteolocaliseacutee agrave La Reacuteunion Le trafic Wide AreaNetwork (WAN) repreacutesente le trafic transitant par les cacircbles sous-marins Ce deacutecoupageest rendu possible par lrsquointer-connexion des opeacuterateurs au sein du GIX Reunix Ce deacutecou-page ne serait pas le mecircme si on eacutetudiait la totaliteacute du trafic de La Reacuteunion Ainsi onconstate qursquoil nrsquoy a aucun service dont la destination finale serait La Reacuteunion

Le tableau 37 indique la reacutepartition des destinations de type WAN Le tableau 36rappelle la correspondance entre lrsquoacronyme et le nom complet de chaque continent

TABLE 36 ndash Correspondance entre acronymes et nom des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

TABLE 37 ndash Distribution geacuteographique des destinations WAN

Continent AF AS EU NA OC SAPourcentage 019 168 4850 4867 064 032

On constate que la reacutepartition des continents est fortement ineacutegale LrsquoEurope et lrsquoAmeacute-rique du Nord concentrent plus de 97 des destinations reacuteunies Lrsquoeacutetude reacutealiseacutee par[Fanou2016] a montreacute une incoheacuterence dans lrsquoaccegraves aux contenus Les reacutesultats ont ainsiprouveacute que malgreacute la preacutesence drsquoune infrastructure web deacuteveloppeacutee sur le continent afri-cain la majoriteacute du contenu eacutetait stockeacute sur les continents europeacuteen et nord-ameacutericain

87

Dans le cadre de La Reacuteunion les regravegles de routage vues dans le chapitre preacuteceacutedent sonten coheacuterence avec la reacutepartition des continents

342 Performance de TCP

Un flot peut ecirctre caracteacuteriseacute selon sa longueur (nombre de paquets ou octets eacutechan-geacutes) sa dureacutee (dureacutee des eacutechanges entre le premier et le dernier paquet captureacute) et sonratio Chaque caracteacuterisation est associeacutee agrave deacutenomination selon que le flux est court oulong Il existe plusieurs deacutefinitions de limites de chaque caracteacuterisation Dans le tableau38 nous indiquons le nom associeacute agrave chaque flux selon sa caracteacuterisation ainsi que desexemples de limites

Pour rappel nous avons deacutefini un flot comme laquo une seacuterie de paquets IP avec le mecircmetuple suivant ldquoadresse IP source port source adresse IP destination port destinationprotocole IPrdquo raquo Dans notre eacutetude nous consideacutererons un flot TCP sans tenir compte desmeacutecanismes drsquoeacutetablissement et de fermeture de connexion Ainsi un flot pourra conteniruniquement des paquets de donneacutees et drsquoacquittement

TABLE 38 ndash Tableau de deacutenomination des flux selon [Lan2006]`````````````Meacutetrique

Taille des fluxCourts Longs limites

Longueur Souris Eacuteleacutephant 10 paquets [Sallantin2014]1 de lrsquoutilisation du lien[Estan2001] 100 Ko[Lan2006]

Dureacutee Libellule Tortue 2 secondes[Brownlee2002] 15 mi-nutes [Lan2006]

Deacutebit Gueacutepard Escargot 100 Kos [Lan2006]

Les limites varient selon les eacutetudes Pour notre eacutetude les limites seront choisies enfonction des reacutesultats Nous comparerons nos limites avec celles indiqueacutees dans le ta-bleau ci-dessus Dans notre preacutesentation la caracteacuterisation des flux confond flux montantet flux descendant Drsquoapregraves la loi de Pareto environ 80 des effets sont le produit de 20des causes Dans lrsquoInternet 80 du trafic est reacutealiseacute par seulement 20 de flux eacuteleacutephants[Paxson1995] Nous regarderons si cette loi est respecteacutee par les limites proposeacutees

Dans la figure 33 nous avons repreacutesenteacute les CDF de la longueur des flux selon lespaquets (33a) et le nombre drsquooctets (33b) Les traits verticaux repreacutesentent les limitesindiqueacutees dans le tableau 38 Sur la figure 33a le trait vertical repreacutesente la limite des10 paquets de [Sallantin2014] Sur la figure 33b le trait vertical drsquoune valeur de 10 000octets repreacutesente la limite indiqueacutee par [Lan2006] Le trait de droite repreacutesente les 1 dela capaciteacute du lien drsquoaccegraves soit 107 octets (100 Ko)

Sur la figure 33a plus de 50 des flux sont des flux mono-paquet Les flux infeacuterieursagrave la limite proposeacutee par [Sallantin2014] de 10 paquets ont une probabiliteacute de 0 67 Notretrafic est donc constitueacute drsquoune majoriteacute de flots courts sur les paquets La seacuteparation de80 du trafic se fait agrave partir de 18 paquets

Lrsquoaxe des abscisses de la figure 33b deacutemarre agrave 500 octets avec une probabiliteacute de 0 28La valeur de deacutepart de lrsquoaxe des abscisses repreacutesente le pas utiliseacute pour le calcul de laCDF Le premier axe vertical repreacutesenteacute agrave 10 000 octets seacutepare 79 27 des flux sont desflux courts La limite proposeacutee par [Estan2001] est repreacutesenteacutee agrave 107 octets Cette seacutepara-tion indique que 99 des flux sont des flux courts Aucune des deux limites proposeacutees

88

ne permet une eacutetude fine de la seacuteparation des flux La limite proposeacutee par [Lan2006]approche la reacutepartition de Pareto

(a) Paquets (b) Octets

FIGURE 33 ndash Longueur des flux

La dureacutee drsquoun flot TCP correspond au deacutelai qui seacutepare la capture du premier et dudernier paquets du flot La figure 34 repreacutesente la PDF pour la dureacutee des flots en se-condes Le pas utiliseacute pour effectuer le traceacute est de 1 seconde Ce pas srsquoexplique par lavaleur minimale que peut prendre le RTO comme deacutefini dans le [RFC6298] La ligne ver-ticale repreacutesente la limite de [Brownlee2002] eacutegale agrave 2 secondes

La dureacutee maximale enregistreacutee pour un flot est de 61 192 secondes soit plus de 10heures drsquoeacutechange Au delagrave des 60 secondes la probabiliteacute drsquoavoir un flot supeacuterieur agravecette dureacutee est eacutegale agrave 0 081 Nous consideacuterons cette probabiliteacute neacutegligeable Plus de 59de nos flux sont infeacuterieurs agrave la limite repreacutesenteacutee par lrsquoexpiration du RTO (1 seconde) Lalimite des deux secondes indique que 64 des flux eacutechangeacutes sont des flux courts Pouratteindre la reacutepartition indiqueacutee par la loi de Pareto la seacuteparation devrait atteindre les 10secondes

Les figures 35 repreacutesentent la reacutepartition du deacutebit utile moyen de chaque flux selonle nombre de paquets par seconde (35a) et le nombre drsquooctets par seconde (35b) Laligne verticale sur la figure 35a repreacutesente la limite seacuteparant les flux courts et les fluxlongs Drsquoune valeur de 10 paquetsseconde elle est deacuteduite de la limite de 10 paquetsde la longueur des flux preacutesenteacutes preacuteceacutedemment La limite de 100 Ko de [Lan2006] suitle mecircme raisonnement Ils sont partis de la limite de la longueur des flux pour choisir lalimite de caracteacuterisation des flux sur les deacutebits

La figure 35a deacutemarre avec des deacutebits peu eacuteleveacutes mais nombreux Ainsi les flux infeacute-rieurs agrave la limite des 10 paquetsseconde repreacutesentent plus de 90 des flux rencontreacutesOn peut donc en deacuteduire que le trafic analyseacute a tregraves forte majoriteacute de flux agrave tregraves bas deacutebit

La figure 35b est calculeacutee avec le mecircme pas que pour la longueur des flux soit 500 oc-tets En analysant la figure on remarque ainsi que les flux infeacuterieurs ou eacutegaux agrave 500 octetsont une probabiliteacute drsquoexister proche de 09 La limite preacutesenteacutee par [Lan2006] autorise unecaracteacuterisation de 99 de nos flux en tant que flux courts

Tout comme lrsquoindiquaient [Paxson1995 Ciullo2009] le trafic est constitueacute en majoriteacutede flots courts Dans les trois caracteacuterisations effectueacutees (longueur dureacutee deacutebit) le traficeacutetudieacute est constitueacute agrave plus 50 voire 90 comme pour les deacutebits de flots courts

TCP est un protocole srsquoappuyant sur les deacutelais et le systegraveme drsquoacquittement pouradapter ses eacutemissions On a vu dans le chapitre 2 que lrsquoicircle de La Reacuteunion possegravede un

89

FIGURE 34 ndash Flux TCP - Densiteacute de la dureacutee de communication

(a) Paquetsseconde (b) Octetsseconde

FIGURE 35 ndash Deacutebits des flux

comportement particulier vis-agrave-vis de ce paramegravetre Nous faisons lrsquohypothegravese qursquoune desconseacutequences de ce fonctionnement est que La Reacuteunion possegravede une forte sensibiliteacute auxeacuteveacutenements de congestions Nous avons deux outils permettant de confirmer ce postulat

1 Le premier est lrsquoidentification des diffeacuterentes options preacutesentes dans lrsquoen-tecircte TCPplus particuliegraverement les options ECN Echo (ECE) Explicit Congestion Notification(ECN)Nonce Sum (NS) et CWR Le passage du bit de ces options agrave 1 indique unegestion des eacuteveacutenements de congestion

2 La seconde possibiliteacute est de repeacuterer les reacuteductions de la fenecirctre de TCP et les typesde retransmissions qui ont lieu aux alentours de cette diminution

Avec la premiegravere meacutethode nous nrsquoavons trouveacute aucun paquet avec une option degestion de la congestion (ECN) agrave 1 Cela indique que les eacuteveacutenements de congestion nepeuvent ecirctre identifieacutes par la lecture des drapeaux Les auteurs de [Trammell2015] ontmontreacute que le nombre de serveurs reacutepondant agrave la neacutegociation de lrsquooption ECE agrave traversle monde a augmenteacute ces derniegraveres anneacutees Lrsquoabsence de paquets deacutebutant la neacutegociation

90

donc provenant des utilisateurs du reacuteseau du laboratoire peut srsquoexpliquer par 3 hypo-thegravesesLa premiegravere est lrsquoobsolescence des ordinateurs du Laboratoire drsquoInformatique et de Ma-theacutematiques En effet il faut un systegraveme drsquoexploitation reacutecent pour que la version de TCPpuisse marquer les paquets avec lrsquooption Cette hypothegravese est vite abandonneacutee sachantque plusieurs participants agrave notre eacutetude possegravedent des ordinateurs acheteacutes agrave partir delrsquoanneacutee 2014La seconde hypothegravese est la suppression de lrsquooption par un eacutequipement reacuteseau traverseacute agravelrsquoUniversiteacute de La Reacuteunion Cette piste fut abandonneacutee apregraves un test de mesures Ce testconsistait agrave envoyer des paquets avec lrsquooption ECN agrave 1 et agrave regarder leurs options agrave leurarriveacutee au point de capture Les reacutesultats obtenus ont montreacute que lrsquooption eacutetait inchan-geacuteeLa derniegravere possibiliteacute est que le systegraveme drsquoexploitation ne marque pas lrsquoensemble despaquets avec le drapeau de neacutegociation Certains routeurs ou pare-feux incompatiblespeuvent bloquer le trafic entre deux hocirctes impleacutementant ECN [Bauer2011] Crsquoest pourcette raison qursquoelle est deacutesactiveacutee implicitement sur la plupart des systegravemes drsquoexploita-tion contemporains Nous avons confirmeacute cette hypothegravese agrave travers une demande drsquouti-lisation de la commande sysctl et des options de TCP des systegravemes drsquoexploitation DebianUbuntu et Mac OS X Les reacutesultats ont ainsi montreacute que les systegravemes drsquoexploitation eacutetu-dieacutes nrsquoactivaient pas cette option de TCP

Dans tous les cas lrsquoabsence des options ECE ECNNS et CWR est neacutefaste pour lesperformances de TCP Les travaux reacutealiseacutes par [Mellia2003-2] ont montreacute que les per-formances de TCP sont accrues lorsque les paquets sont marqueacutes avec ces options Sanselles les eacuteveacutenements de congestion sont plus difficiles agrave identifier

La seconde faccedilon drsquoidentifier les eacuteveacutenements de congestion est plus compliqueacutee agravemettre en place Il srsquoagit drsquoidentifier les reacuteductions de fenecirctre et drsquoeacutetudier des pertes etoudes retransmissions de paquets Elle provoque des incertitudes Sur un total de 42 386 540paquets nous avons identifieacute 21 022 400 paquets indiquant une diminution de fenecirctreSoit pregraves drsquoun paquet sur deux

Le tableau 39 indique les pourcentages des paquets retransmis etou perdus

TABLE 39 ndash Reacutepartition des paquets

fast retrans-mit

spurious retrans-mit

Paquetsperdus

Non retransmiset non perdus

Pourcentage 5 2times 10minus3 7 8times 10minus3 14times10minus3 99 97

On constate que le pourcentage des paquets retransmis ou perdus sont ridicules avecmoins de 1 des paquets eacutechangeacutes Ces pourcentages sont en deccedilagrave des valeurs que TCPpeut produire dans certaines zones Aux Eacutetat-Unis [Gettys2011] a eacutetudieacute le taux de pertesur un lien montant agrave 2 Mbits lors drsquoun transfert de fichiers drsquoun poids de 20 Go Letaux de perte est tregraves eacuteleveacute avec 33 de moyenne En comparaison avec ces eacutetudes reacuteali-seacutees lrsquoicircle de La Reacuteunion possegravede des performances de TCP que lrsquoon pourrait qualifier denormales

343 Synthegravese des reacutesultats

Lrsquoanalyse mise en place a pour objectif de tester en conditions reacuteelles notre plate-forme de mesure et la chaicircne drsquoanalyse

Lrsquoeacutetude du trafic du LIM a eacuteteacute deacutecoupeacutee en deux parties La premiegravere concerne lasupervision du trafic et traite de la composition La seconde partie se concentre sur les

91

performances du protocole de transport TCP sur le trafic agrave destination de lrsquoexteacuterieur delrsquoicircle de La ReacuteunionLrsquoeacutetude des donneacutees collecteacutees a mis en avant la preacutedominance drsquoun trafic empruntantles cacircbles sous-marins agrave destination de lrsquoEurope et de lrsquoAmeacuterique du Nord Ces deuxdestinations heacutebergent de nombreux serveurs de donneacutees scientifiquesLrsquointerrogation de ces serveurs se fait agrave partir du protocole TCP en utilisant les servicesHTTP ou HTTPS Le protocole TCP est majoritaire dans les protocoles rencontreacutes toutcomme les services preacutesenteacutes

Sur lrsquoeacutetude des performance du protocole TCP nous avons effectueacute une caracteacuteri-sation des flots en terme de longueur (paquets eacutechangeacutes) de dureacutee et de vitesse Lamajoriteacute de nos flots sont des flots courts contenant peu de donneacutees

35 Conclusion

Dans ce chapitre nous avons preacutesenteacute la meacutethode mise en place pour la reacutealisationdrsquoune eacutetude de meacutetrologie passive sur lrsquoicircle de La Reacuteunion

La Reacuteunion est une icircle dont la connectiviteacute en terme de deacutelais et de routes est par-ticuliegravere telle que le chapitre 2 preacutesente Lrsquoaugmentation progressive des deacutebits drsquoaccegravesa pour conseacutequence lrsquoaugmentation de la capaciteacute de stockage des liens On considegravereqursquoun lien possegravede une forte capaciteacute de stockage quand le produit deacutelai bande passante(BDP) associeacute agrave ce lien deacutepasse la limite de 12 5 Ko Pour La Reacuteunion la capaciteacute destockage minimale calculeacutee est de 22 5 ko Cette capaciteacute de stockage entraicircne des deacutegra-dations sur les performances du protocole TCP Nous avons souhaiteacute eacutetudier lrsquoimpact dela capaciteacute de stockage des liens sur les performances du protocole TCP agrave La ReacuteunionLrsquoaugmentation de la capaciteacute des liens entraicircne eacutegalement un changement des usagesNous souhaitons eacutegalement eacutetudier les diffeacuterents services utiliseacutes dans lrsquoInternet agrave LaReacuteunion

Le cahier des charges fut preacutesenteacute dans la section 31 Le cahier mis en place preacutesenteles meacutetriques de lrsquoeacutetude Ces meacutetriques ont eacuteteacute seacutelectionneacutees afin de reacutepondre aux objec-tifs preacutesenteacutes ci-dessus Elles couvriront un aspect supervision du trafic pour lrsquoeacutetude desservices et la reacutepartition geacuteographique Lrsquoaspect des performances du protocole TCP seraanalyseacute agrave travers les deacutebits les deacutelais les pertes les retransmissions et la preacutesence deseacuteveacutenements de congestion

Pour obtenir ces meacutetriques il est neacutecessaire de mettre en place une infrastructure demesure et une chaicircne drsquoanalyse La section 32 preacutesente lrsquoinfrastructure mise en place Lavariabiliteacute du trafic dans le temps nous a encourageacutes agrave mettre en place une plate-formede capture de trafic Le choix de lrsquooutil de capture nrsquoest pas deacutefinitif Il est deacutependant dudeacutebit associeacute au lien de capture Diffeacuterents outils drsquoanalyses de donneacutees passives existentDans le paragraphe 322 nous avons reacutealiseacute une comparaison des diffeacuterents outils selondes critegraveres de seacutelection Ces critegraveres sont au nombre de 3 protection de la vie priveacutee trai-tement drsquoune volumeacutetrie de donneacutees importante et le calcul des meacutetriques seacutelectionneacuteesAucun des outils preacutesenteacutes ne reacutepondait agrave la totaliteacute des critegraveres A la suite de ce constatnous avons fait le choix de deacutevelopper un outil reacutepondant agrave ces 3 critegraveres Lrsquoavantage decet outil est qursquoil pourra eacutevoluer en parallegravele agrave lrsquoeacutevolution de lrsquoeacutetude

Ces outils furent mis en place au sein du Laboratoire drsquoInformatique et de Matheacutematiquesdans le cadre drsquoune phase de test Les reacutesultats obtenus ont eacuteteacute compareacutes avec les reacutesultatsobtenus par TCPTrace afin de nous assurer de lrsquoexactitude de nos reacutesultats Le protocolede mesure mis en place pour cette eacutetude est deacutecrit dans la section 33 Dans ce protocolenous avons preacutesenteacute les contraintes reacuteglementaires imposeacutees par lrsquoUniversiteacute Nous nous

92

sommes ensuite assureacutes que le systegraveme mis en place pour la capture du trafic nrsquoeacutetaitsoumis agrave aucune perturbation Le systegraveme choisi pour eacutecouter le lien fut celui de port-mirroring Cette fonction des routeurs permet de copier lrsquoensemble des paquets entrantsur un lien vers un second lien Cette recopie est soumise agrave la limitation de la capaciteacutede meacutemoire des eacutequipements Elle peut entraicircner des erreurs au niveau de la datationdes paquets et dans lrsquoordre de reacute-eacutemission des paquets vers le lien miroir Dans cetteeacutetude la capture du trafic srsquoest faite agrave lrsquoaide du logiciel TCPDump Reacuteguliegraverement unephase de deacutelestage de la meacutemoire de la sonde de capture vers un serveur de stockage dulaboratoire a eacuteteacute mise en place

Les reacutesultats preacutesenteacutes dans la section 34 nous donnent une vision biaiseacutee du com-portement de lrsquoInternet reacuteunionnais Ces reacutesultats ne peuvent correspondre au compor-tement de TCP pour lrsquoensemble de lrsquoInternet de La Reacuteunion Ces reacutesultats nous donnentdes indications sur le comportement de TCP dans le cadre drsquoune connexion agrave forte capa-citeacute de meacutemorisation

Dans la partie supervision on a vu la preacutedominance du protocole TCP des servicesHTTP et HTTPS Ces usages srsquoaccompagnent drsquoune reacutepartition geacuteographique tregraves in-eacutegale LrsquoEurope et lrsquoAmeacuterique du Nord sont les deux continents avec lesquels les interac-tions sont les plus nombreuses (plus de 48 du trafic pour chaque continent)

Au niveau des performances de TCP nous avons pu voir que la majoriteacute des flotseacutetudieacutes sont des flots courts que ccedila soit en longueurs en dureacutees et en deacutebits Aucun eacuteveacute-nement de congestion ne fut releveacute Cela indique que la capaciteacute drsquoenvoi des eacutemetteursnrsquoa pas couvert le BDP du lien Cela srsquoest ressenti au niveau de la reacutepartition des paquetsRetransmissions et pertes nrsquoont repreacutesenteacute pregraves de 0 03 des paquets eacutechangeacutes

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors de laconfeacuterence Next Generation Computing Applications (NextComp) en 2017 [Noordally2017]

93

94

Conclusion amp Perspectives

1 Synthegravese des travaux

Les travaux de cette thegravese sont placeacutes dans le cadre reacutegional de lrsquoaccegraves de lrsquoicircle de LaReacuteunion agrave lrsquoInternet Ils visent agrave identifier les caracteacuteristiques qui ont une influence sur lesperformances de lrsquoInternet agrave La Reacuteunion La Reacuteunion est un deacutepartement drsquooutre-mer si-tueacute dans lrsquoOceacutean Indien Lrsquoicircle est connecteacutee agrave Internet agrave travers deux cacircbles sous-marins le SAFE et le LION Le SAFE relie lrsquoAfrique agrave lrsquoAsie Le LION interconnecte Madagascarlrsquoicircle Maurice et La Reacuteunion Lrsquoarriveacutee de ces cacircbles sur lrsquoicircle a permis le deacuteveloppement duhaut deacutebit et du tregraves haut deacutebit sur lrsquoicircle avec lrsquoarriveacutee des technologies ADSL VDSL etFTTH Des extensions agrave ces cacircbles permettent de remonter jusqursquoen Europe La Reacuteunionpossegravede REUNIX un point drsquointer-connexion (IXP) pour les opeacuterateurs locaux Ce typedrsquoaccegraves agrave Internet est speacutecifique aux icircles de la zone oceacutean indien Dans un premier tempsnous avons eacutetudieacute la connectiviteacute de lrsquoicircle sous lrsquoangle des deacutelais et des routes Dans unsecond temps lrsquoeacutetude a porteacute sur les flots TCP

TCP est le protocole de transport majoritaire dans lrsquoInternet qui rend un service detransport fiable et efficace de donneacutees Lrsquoefficaciteacute srsquoappreacutecie en terme de deacutebit eacutecouleacutepour le service rendu et drsquoutilisation des capaciteacutes de transmission du reacuteseau Lrsquoobjectifdrsquoefficaciteacute est du ressort du controcircle de flux et du controcircle de congestion Ces fonctionsagissent selon une peacuteriode correspondant au RTT de la connexion On voit alors que laperformance de TCP est deacutependante du deacutelai que va expeacuterimenter la connexion TCP

Nous avons dans un premier temps eacutetudieacute lrsquoeacutevolution du deacutelai et de la longueur desroutes entre 2012 et 2016 Cette eacutetude a mis en eacutevidence une stabiliteacute des deacutelais malgreacuteune reacuteduction de la longueur des routes Cette eacutetude a eacuteteacute reacutealiseacutee depuis un seul pointde mesure Afin drsquoeacutetudier en deacutetail la connectiviteacute de La Reacuteunion nous avons deacuteployeacuteune plate-forme de meacutetrologie active speacutecifique agrave lrsquoeacutetude Durant plusieurs mois nousavons mesureacute les deacutelais et les routes depuis et vers La Reacuteunion agrave lrsquoaide de lrsquooutil Paris-traceroute Lrsquoanalyse des reacutesultats a eacuteteacute reacutealiseacutee agrave partir de deux outils deacuteveloppeacutes pourle besoin de lrsquoeacutetude rgeoloc et rtraceroute rgeoloc sert agrave la geacuteolocalisation des adressesIP et agrave lrsquoextraction des deacutelais et de la longueur des routes depuis un fichier de sortiede traceroute rtraceroute est un outil drsquoanalyse graphique des routes Il va utiliser lesdonneacutees obtenues depuis rgeoloc pour placer sur une carte les diffeacuterents pays traverseacutespar les donneacutees collecteacutees

Les reacutesultats ont eacuteteacute eacutetudieacutes selon quatre critegraveres les deacutelais la longueur des routesla distance geacuteographique entre la source et la destination et lrsquoidentification des portesde lrsquoInternet reacuteunionnais Nous avons ainsi pu mettre en eacutevidence lrsquoindeacutependance de lalongueur de la route en fonction de la distance geacuteographique Nous avons calculeacute le deacutelaineacutecessaire agrave chaque noeud traverseacute Cette valeur est fortement deacutependante du sens decirculation de lrsquoinformation La relation entre le deacutelai et la distance geacuteographique a misen eacutevidence une incoheacuterence Le deacutelai neacutecessaire pour joindre une destination ou ecirctrejoint depuis lrsquoexteacuterieur de lrsquoicircle est inversement proportionnel agrave la distance geacuteographiqueCela signifie donc que plus la distance est importante moins le deacutelai est eacuteleveacute Nous

95

avons eacutetudieacute ce comportement vis agrave vis des portes de lrsquoInternet reacuteunionnais et mis enavant le fait que plus de 97 du trafic reacuteunionnais passe par la France hexagonale sanstenir compte si crsquoest du trafic montant ou descendant Ce comportement a eacutegalement eacuteteacuteeacutetudieacute pour les icircles de la ZOI dans le sens montant Le deacutelai minimal mesureacute accompagneacutedu routage analyseacute peut avoir des conseacutequences sur les performances drsquoun protocole detransport deacutependant au deacutelai comme lrsquoest TCP

Lrsquoaugmentation de la bande passante sur le reacuteseau de distribution de lrsquoicircle et sur lesliens reliant lrsquoIle agrave lrsquoInternet nrsquoont pas permis la reacuteduction des deacutelais Cela a pour conseacute-quence lrsquoaugmentation de la capaciteacute de stockage des canaux de communication La ca-paciteacute de stockage est calculeacutee agrave partir de la bande passante et du RTT On parle de Pro-duit Deacutelai-Bande passante (BDP) Si le BDP deacutepasse la valeur seuil de 12 5 Ko alors lecanal est consideacutereacute comme un reacuteseau agrave forte capaciteacute de stockage (LFN) Si on considegravereque le deacutebit drsquoaccegraves theacuteorique fourni par les FAI est le goulot drsquoeacutetranglement alors uncanal de communication sur lrsquoInternet depuis La Reacuteunion possegravede un BDP minimal eacutegalagrave 22 5 Ko Lorsque le transport des donneacutees srsquoeffectue avec TCP en passant par un LFNceci agrave des implications sur les performances du service rendu par TCP Lrsquoobjectif a eacuteteacute deconcevoir un systegraveme meacutetrologique pour pouvoir eacutetudier le service et analyser le fonc-tionnement du protocole Nous avons mis en place et expeacuterimenteacute une infrastructure demeacutetrologie passive interne au laboratoire En parallegravele nous avons conccedilu un outil drsquoana-lyse de traces drsquoeacutecoute speacutecifiques agrave notre eacutetude Lrsquoensemble de la chaicircne de mesure etdrsquoanalyse a eacuteteacute testeacute durant un mois au sein du LIM Les reacutesultats obtenus ont eacuteteacute valideacutespar comparaison agrave ceux fournis par drsquoautres outils

2 Perspectives

icircle de La Reacuteunion

La mise en place drsquoune eacutetude de meacutetrologie passive en collaboration avec les diffeacute-rents FAI permettrait drsquoeacutetudier le reacuteel impact de lrsquoeacuteloignement de La Reacuteunion sur lesperformances du protocole de transport TCP De plus lrsquoanalyse de supervision permet-trait drsquoidentifier des leviers pour limiter le rapatriement de trafic commun par les cacircblessous-marins

Zone Oceacutean Indien

Cette thegravese a mis en eacutevidence une connectiviteacute particuliegravere en terme de deacutelais et deroutes depuis lrsquoicircle de La Reacuteunion et les icircles de la Zone Oceacutean Indien dans le sens De-puis Lrsquoasymeacutetrie des routes est freacutequente dans lrsquoInternet Crsquoest pourquoi une eacutetude desdeacutelais et des routes depuis le monde agrave destination des sondes de la plate-forme RunPLbaseacutees sur les icircles de la ZOI peut ecirctre pertinente

Par la suite une eacutetude de meacutetrologie passive similaire agrave celle que lrsquoon veut mettreen place sur le territoire reacuteunionnais pourrait ecirctre reacutealiseacutee Lrsquoobjectif est de mettre eneacutevidence un comportement speacutecifique en terme drsquousage et de performance protocolairepour lrsquoensemble des usagers de la zone Cette eacutetude aura eacutegalement comme but le calculde la volumeacutetrie eacutechangeacutee et des services utiliseacutes entre les diffeacuterents territoires Si lesreacutesultats montrent une preacutedominance des trafics de consultation (accegraves agrave un serveur)la technique drsquooffloading pourrait ecirctre envisageacutee Cette meacutethode inspireacutee des travaux de[Baron2016] impliquerait lrsquousage des transports aeacuteriens pour charger des caches locauxDrsquoautres solutions seront eacutegalement eacutetudieacutees comme lrsquoimpleacutementation de serveurs departage de contenus localiseacutes sur lrsquoicircle

96

Territoires ultra-marins franccedilais

La Reacuteunion et Mayotte sont deux territoires franccedilais localiseacutes dans la ZOI Mais drsquoautresreacutegions ultra-marines peuvent ecirctre soumises agrave des comportements similaires Pour veacuteri-fier cette hypothegravese des eacutetudes de meacutetrologie active et passive pourraient venir validerou non cette hypothegravese Pour reacutepondre agrave cela nous privileacutegierons lrsquoenvoi de sondes dela plate-forme RunPL

Zone Isoleacutee

La derniegravere perspective que lrsquoon souhaite mettre en avant est le concept de ZoneIsoleacutee Si plusieurs reacutesultats des perspectives preacuteceacutedentes sont en adeacutequation avec lesreacutesultats obtenus et preacutesenteacutes dans cette thegravese nous aimerions deacutefinir ce concept Unepremiegravere deacutefinition serait axeacutee sur les trois points suivants

mdash Un routage limiteacute Un maillage important est un standard dans les zones bienconnecteacutees Les routes et les possibiliteacutes de trouver le plus court chemin sont nom-breuses Une faible valeur signifie de faibles alternatives ce qui sous-entend que laroute prise nrsquoest pas forceacutement la plus courte mais celle par deacutefaut

mdash Peering reacutegional et trafic interne Lrsquoensemble du trafic drsquoune zone va vers un GIXdrsquoautres pays pour des raisons de coucirct Lrsquoabsence drsquoaccords de peering entre lesFAI drsquoun mecircme pays ou ceux drsquoune mecircme zone geacuteographique ne permet pas ladiversiteacute des routes et augmente ainsi le deacutelai [Obar2012]

mdash Forts deacutelais Le deacutelai est un paramegravetre important de lrsquoaccegraves Internet Les forteslatences peuvent impacter les autres paramegravetres des connexions TCP [RITE2014-1]

97

98

Table des figures

1 Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000]) 2

2 Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000]) 33 Carte des deacutebits agrave La Reacuteunion 44 Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion 55 Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source

[Cablesmap]) 76 Carte des points drsquoeacutechange preacutesents actuellement et dans un futur proche

dans la ZOI 7

11 Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989]) 11

12 Boucle fermeacutee du CC de TCP 1213 Etats du controcircle de congestion de TCP 1414 Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP 1515 Principe de Quick-Start (Source [Scharf2008-1]) 1816 Simulation de MulTCP avec N=5 (Source [Huston2006]) 1917 Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source

[Afanasyev2010]) 2018 Comportement de la fenecirctre de congestion de Compound-TCP (Source

[Afanasyev2010]) 2119 Fonctionnement de BIC TCP 22110 Fonctionnement de CUBIC 22111 Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

24112 Principe de la meacutetrologie active 27113 Illustration du pheacutenomegravene drsquoeacutequilibrage des charges 28114 Taxonomie des configurations de tunnels MPLS et des comportements de

traceroute correspondants (Source [Donnet2012] ) 29115 Principe de la meacutetrologie passive 33

21 Scheacutema drsquointerconnexion de la plate-forme 4222 Distribution geacuteographique des adresses IPv4 publiques 4823 Fonctionnement de la sonde 5124 Comparaison des deacutelais entre Paris et La Reacuteunion 5425 Eacutevolution de la longueur des routes entre 2012 et 2016 5526 Distribution de la distance geacuteographique par continent 5627 Distribution du RTT par continent 5728 Distribution de la longueur des routes par continent 5729 Relation entre la longueur de la route et la distance geacuteographique 59210 Relation entre la longueur de la route et les deacutelais 60211 Relation entre les deacutelais et la distance geacuteographique 62

99

212 Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais 64213 Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dans

un pays tiers 65214 FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien 65215 Distribution des deacutelais des icircles de la ZOI 66216 Longueur des routes emprunteacutees 67217 Relation entre la longueur de la route et la distance geacuteographique 68218 Relation entre la longueur de la route et la distance geacuteographique pour

Madagascar 69219 Relation entre la longueur de la route et les deacutelais 69220 Relation entre les deacutelais et la distance geacuteographique 70221 Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI 71222 Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion 72

31 Scheacutema de distribution de la plate-forme de mesure 8432 Scheacutema de fonctionnement de la plateforme de mesure 8533 Longueur des flux 8934 Flux TCP - Densiteacute de la dureacutee de communication 9035 Deacutebits des flux 90

100

Liste des tableaux

11 Tableau de synthegravese des propositions 1712 Approximation du produit deacutelai bande passante de la connectiviteacute de La

Reacuteunion agrave lrsquoInternet 2513 Comparatif entre les approches de meacutetrologie 2614 Classement des outils 2715 Tableau des plates-formes de mesures de meacutetrologie active 3216 Comparatif entre mesures actives et mesures passives 35

21 Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet 4122 Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

4323 Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur Raspberry

Pi 4424 Fonctions disponibles dans les outils graphiques drsquoanalyse des routes 4525 Reacutesumeacute des caracteacuteristiques du jeu de donneacutees 5326 Correspondance entre acronymes et noms des continents 5327 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 5828 Formule de correacutelation du deacutelai en fonction de la longueur du chemin 6029 Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique 61210 Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunion-

nais 63211 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 67212 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 68213 Formule de correacutelation de la distance geacuteographique et du RTT 70

31 Les meacutetriques de meacutetrologie passive 7732 Comparaison de performances 8233 Distribution des protocoles encapsuleacutes dans IP 8634 Reacutepartition des services utiliseacutes par TCP 8635 Distribution du trafic 8736 Correspondance entre acronymes et nom des continents 8737 Distribution geacuteographique des destinations WAN 8738 Tableau de deacutenomination des flux selon [Lan2006] 8839 Reacutepartition des paquets 91

101

102

Bibliographie

[ANRTIC2016] ANRTIC Autoriteacute Nationale de Reacutegulation des TIC 2016

[ARCEP2004] Autoriteacute de Reacutegulation des Teacuteleacutecommunications Deacutecision n04-375 delrsquoautoriteacute de reacutegulations des teacuteleacutecommunications en date du 4 mai 2004 seprononccedilant sur un diffeacuterent opposant mobius agrave france teacuteleacutecom 2004

[ARTEC2016] Autoriteacute de Reacutegulation des TEchnologies de Communication Artec 2016

[AXIS] African internet exchange system project 2016

[Aben2015] Emile Aben Infrastructure geolocation - plan of action 2015

[Afanasyev2010] A Afanasyev N Tilley P Reiher and L Kleinrock Host-to-hostcongestion control for tcp IEEE Communications Surveys amp Tutorials 12(3)Third quarter 2010

[Africa1] Telegeography Submarine Cable Submarine cable map 2018

[AfterFibre] Steve Song African undersea and terrestrial fibre optic cables Last visit 09262017

[Akamai2015] Akamai Akamairsquos [state of the internet] 2015

[Akamai2017] Akamai Akamairsquos [state of the internet] 2017

[Allman2007] Mark Alllman and Vern Paxson Issues and etiquette concerning use ofshared measurement data In Proceedings of the 7th ACM SIGCOMM confe-rence on Internet measurement pages 135ndash140 ACM 2007

[Anelli2012] Pascal Anelli Des aleacuteas de la communication de la transmission au trans-port Habilitation agrave diriger des recherches en informatique Universiteacute deLa Reacuteunion 2012

[Archipelago] Kimberly Claffy Young Hyun Ken Keys Marina Fomenkov and DmitriKrioukov Internet mapping from art to science In Conference For Home-land Security 2009 CATCHrsquo09 Cybersecurity Applications amp Technology pages205ndash211 IEEE 2009

[Arduino] Arduino AG Arduino home

[Arnal2014] F Arnal E Dubois E Chaput and A Beylot Internet-draft r sallantin in-tended status Proposed standard e bouttier expires April 30 2015 cnes-tastesa c baudoin 2014

[Augustin2006] Brice Augustin Xavier Cuvellier Benjamin Orgogozo Fabien Viger Ti-mur Friedman Matthieu Latapy Cleacutemence Magnien and Renata TeixeiraAvoiding traceroute anomalies with paris traceroute In Proceedings of the 6thACM SIGCOMM conference on Internet measurement pages 153ndash158 ACM2006

[Augustin2007] Brice Augustin Timur Friedman and Renata Teixeira Multipath tracingwith paris traceroute In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

103

[Bajpai2015-1] Vaibhav Bajpai and Juumlrgen Schoumlnwaumllder A survey on internet perfor-mance measurement platforms and related standardization efforts IEEECommunications Surveys amp Tutorials 17(3) 1313ndash1341 2015

[Baron2016] Benjamin Baron Transport intermodal de donneacutees massives pour le deacutelestage desreacuteseaux drsquoinfrastructure PhD thesis Paris 6 2016

[Bauer2011] Steven Bauer Robert Beverly and Arthur Berger Measuring the state of ecnreadiness in servers clients and routers In Proceedings of the 2011 ACM SIG-COMM conference on Internet measurement conference pages 171ndash180 ACM2011

[Beaglebone] BeagleBoardorg Foundation Beagleboardorg - community supportedopen hardware computers for making

[Bischof2015] Zachary S Bischof John P Rula and Fabiaacuten E Bustamante In and out ofCuba Characterizing Cubarsquos connectivity In Proceedings of the 2015 ACMConference on Internet Measurement Conference pages 487ndash493 ACM 2015

[Brakmo1994] Lawrence S Brakmo Sean W OrsquoMalley and Larry L Peterson TCP Vegas New techniques for congestion detection and avoidance volume 24 ACM 1994

[Brownlee2002] Nevil Brownlee and KC Claffy Understanding internet traffic streams dragonflies and tortoises Communications Magazine IEEE 40(10) 110ndash1172002

[CAIDA-Tools] Center for Applied Internet Data Analysis Caida tools - overview

[Cablesmap] Telegeography Submarine cable map

[Carlucci2015] Gaetano Carlucci Luca De Cicco and Saverio Mascolo Http over udp An experimental investigation of quic In Proceedings of the 30th Annual ACMSymposium on Applied Computing SAC rsquo15 pages 609ndash614 New York NYUSA 2015 ACM

[Chappell2010] Laura Chappell and G Combs Wireshark network analysis the officialWireshark certified network analyst study guide Protocol Analysis InstituteChappell University 2010

[Chavula2017] Josiah Chavula Amreesh Phokeer Agustin Formoso and Nick FeamsterInsight into africarsquos country-level latencies In AFRICON 2017 IEEE pages938ndash944 IEEE 2017

[Chiu1989] Dah-Ming Chiu and Raj Jain Analysis of the increase and decrease algo-rithms for congestion avoidance in computer networks Computer Networksand ISDN systems 17(1) 1ndash14 1989

[Chun2003] Brent Chun David Culler Timothy Roscoe Andy Bavier Larry PetersonMike Wawrzoniak and Mic Bowman PlanetLab An overlay testbed forbroad-coverage services SIGCOMM Comput Commun Rev 33(3) 3ndash12July 2003

[Ciullo2009] D Ciullo M Mellia and M Meo Two schemes to reduce latency in shortlived TCP flows IEEE Communications Letters 13(10) October 2009

[Claise2004] Benoit Claise Cisco systems netflow services export 2004

[Comores2002] Mwezinet Lrsquoarriveacutee drsquointernet aux comores Last Seen 09062017

[Coonjah2015] Irfaan Coonjah Pierre Clarel Catherine and KMS Soyjaudah Perfor-mance evaluation and analysis of layer 3 tunneling between openssh andopenvpn in a wide area network environment In Computing Communica-tion and Security (ICCCS) 2015 International Conference on pages 1ndash4 IEEE2015

104

[Crovella2006] Mark Crovella and Balachander Krishnamurthy Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc New YorkNY USA 2006

[Crowcroft1998] Jon Crowcroft and Philippe Oechslin Differentiated end-to-end in-ternet services using a weighted proportional fair sharing tcp ACM SIG-COMM Computer Communication Review 28(3) 53ndash69 1998

[DICT2017] Government of Seychelles Office of the president Department of informa-tion communication technology 2016

[Donnet2012] Benoit Donnet Matthew Luckie Pascal Meacuterindol and Jean-Jacques Pan-siot Revealing mpls tunnels obscured from traceroute ACM SIGCOMMComputer Communication Review 42(2) 87ndash93 2012

[Downey1999] Allen B Downey Using pathchar to estimate internet link characteristicsIn ACM SIGCOMM Computer Communication Review volume 29 pages 241ndash250 ACM 1999

[EQUINIX] CAIDA Chicago passive network monitor Last visit 12012018

[Estan2001] Cristian Estan and George Varghese New directions in traffic measurementand accounting volume 32 ACM 2002

[Fanou2015] Rodeacuterick Fanou Pierre Francois and Emile Aben On the diversity of in-terdomain routing in africa In Passive and Active Measurement pages 41ndash54Springer 2015

[Fanou2016] Rodeacuterick Fanou Gareth Tyson Pierre Francois and Arjuna SathiaseelanPushing the frontier Exploring the african web ecosystem In Proceedingsof the 25th International Conference on World Wide Web pages 435ndash445 Inter-national World Wide Web Conferences Steering Committee 2016

[Feige1992] Uriel Feige and Prabhakar Raghavan Exact analysis of hot-potato routingIn Foundations of Computer Science 1992 Proceedings 33rd Annual Symposiumon pages 553ndash562 IEEE 1992

[Fraleigh2001] Chuck Fraleigh Christophe Diot Bryan Lyles Sue Moon Philippe Owe-zarski Dina Papagiannaki and Fouad Tobagi Design and deployment ofa passive monitoring infrastructure In Thyrrhenian Internatinal Workshop onDigital Communications pages 556ndash575 Springer 2001

[Fraleigh2003] Chuck Fraleigh Sue Moon Bryan Lyles Chase Cotton Mujahid KhanDeb Moll Rob Rockell Ted Seely and SC Diot Packet-level traffic measu-rements from the sprint IP backbone Network IEEE 17(6) 6ndash16 2003

[France2017] Mission Tregraves Haut Deacutebit Plan france tregraves haut deacutebit Last seen 09062017

[GOTICOM2011] Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de laCommunication Goticom Last Seen 09062017

[GSCounter] StatCounter Statcounter global stats - browser os search engine includingmobile usage share Last visit 13102017

[Gettys2011] Jim Gettys and Kathleen Nichols Bufferbloat Dark buffers in the InternetQueue 9(11) 40 2011

[Gevros2001] Panos Gevros Jon Crowcroft Peter Kirstein and Saleem Bhatti Conges-tion control mechanisms and the best effort service model IEEE network15(3) 16ndash26 2001

[Graham1997] Ian Graham Murray Pearson Jed Martens and Stephen Donnelly DAG- a cell capture board for ATMmeasurement systems 1997

105

[Gupta2014] Arpit Gupta Matt Calder Nick Feamster Marshini Chetty Enrico Calan-dro and Ethan Katz-Bassett Peering at the internetrsquos frontier A first lookat isp interconnectivity in africa In Passive and Active Measurement pages204ndash213 Springer 2014

[Ha2008] Sangtae Ha Injong Rhee and Lisong Xu Cubic A new tcp-friendly high-speed tcp variant SIGOPS Oper Syst Rev 42(5) 64ndash74 July 2008

[Herman2001] Paul Herman The tcpstat tool Publicly available at http wwwfrenchfriesnetpaultcpstat 2001

[Huston2000] Geoff Hutson Tcp performance The Internet Protocol Journal 3 2000

[Huston2006] Geoff Huston Gigabit tcp Internet Protocol Journal 9 2006

[IANA-port] IANA Service Name and Transport Protocol Port Number Registry Lastvisit 06202018

[ICTA2017] Information and Communication Technologies Authority of Mauritius IctaLast Seen 09062017

[IOX] Government Information Service Iox submarine cable to drive the newdigital economy of mauritius 2018

[IPMon] ATL Sprint Ipmon project

[Jacobson1988-1] V Jacobson Congestion avoidance and control ACM Computer Com-munications Review 18(4) 314ndash329 August 1988

[Jacobson1989-1] Van Jacobson Craig Leres and S McCanne The tcpdump manualpage Lawrence Berkeley Laboratory Berkeley CA 1989

[Jacobson1989-2] Van Jacobson Craig Leres and Steven McCanne pcap-packet capturelibrary UNIX man page 2001

[Jacobson1997] Van Jacobson Pathchar A tool to infer characteristics of internet paths1997

[Jain1990] Raj Jain Congestion Control in Computer Networks Issues and TrendsIEEE Network Magazine May 1990

[John2010] Wolfgang John Sven Tafvelin and Tomas Olovsson Passive internet mea-surement Overview and guidelines based on experiences Computer Com-munications 33(5) 533ndash550 2010

[Johnson2011] David L Johnson Veljko Pejovic Elizabeth M Belding and Gertjan vanStam Traffic characterization and internet usage in rural Africa In Pro-ceedings of the 20th International Conference Companion on World Wide WebWWW rsquo11 pages 493ndash502 New York NY USA 2011 ACM

[Johnson2016] David L Johnson and Gertjan van Stam The shortcomings of globalisedinternet technology in southern africa 2016

[Katabi2002] Dina Katabi Mark Handley and Charlie Rohrs Congestion control for highbandwidth-delay product networks In Proceedings of the 2002 Conference onApplications Technologies Architectures and Protocols for Computer Communi-cations SIGCOMM rsquo02 pages 89ndash102 New York NY USA 2002 ACM

[Katz2010] Ethan Katz-Bassett Harsha V Madhyastha Vijay Kumar Adhikari ColinScott Justine Sherry Peter Van Wesep Thomas E Anderson and ArvindKrishnamurthy Reverse traceroute In NSDI volume 10 pages 219ndash2342010

[Krajsa2011] Ondrej Krajsa and Lucie Fojtova RTT measurement and its dependence onthe real geographical distance In Telecommunications and Signal Processing(TSP) 2011 34th International Conference on pages 231ndash234 IEEE 2011

106

[LIL1978] Loi numeacutero 78-17 du 6 janvier 1978 relative agrave lrsquoinformatique aux fichiers etaux liberteacutes Last modification on 19 March 2014

[Lan2006] Kun-chan Lan and John Heidemann A measurement study of correlationsof internet flow characteristics Computer Networks 50(1) 46ndash62 2006

[LanYanFock2015] Jean-Christophe Lan-Yan-Fock Geacuteolocalisation drsquoadresses IP 2015

[Larrieu2010] Nicolas Larrieu and Philippe Owezarski Metrology of internet networksDigital Cognitive Technologies Epistemology and the Knowledge Economy pages101ndash117 2010

[Leguay2004] Jeremie Leguay Matthieu Latapy Timur Friedman and Kaveacute SalamatianDescribing and simulating internet routes CoRR csNI0411051 2004

[Leiner1997] Barry M Leiner Vinton G Cerf David D Clark Robert E Kahn LeonardKleinrock Daniel C Lynch Jon Postel Lawrence G Roberts and Stephen SWolff The past and future history of the Internet Communications of theACM 40(2) 102ndash108 1997

[Lemauricien] Le Mauricien Projet cacircble metiss le contrat deacutecrocheacute par alcatel subma-rine networks et electra tlc spa 2018

[Liu2007] Dan Liu Mark Allman Shudong Jin and Limin Wang Congestion controlwithout a startup phase In Workshop on Protocols for Fast Long-Distance Net-works (PFLDnet) 2007

[Lopez2006] Dino Martin Loacutepez-Pacheco Congduc Pham and Laurent Lefevre Nxg03-4 Xcp-i explicit control protocol for heterogeneous inter-networking ofhigh-speed networks In Global Telecommunications Conference 2006 GLO-BECOMrsquo06 IEEE pages 1ndash6 IEEE 2006

[METROPOLIS] Philippe Owezarski Metropolis meacutetrologie pour lrsquointernet et les ser-vices

[MGIX2017] Madagascar Internet Exchange Point Mgix Mauritius internet exchangepoint 2017

[MIXP2017] Mauritius Internet Exchange Point Mixp Mauritius internet exchangepoint 2017

[Maksimovic2014] Mirjana Maksimovic Vladimir Vujovic Nikola Davidovic VladimirMiloševic and Branko Perišic Raspberry pi as internet of things hardware performances and constraints design issues 3 8 2014

[Mediametrie2018-1] Benoit David Lrsquoanneacutee Internet 2017 Internet meacuteta-meacutedia Lastvisit 20042018

[Mediametrie2018-2] Benoit David Lrsquoobservatoire des Usages Digitaux Antilles-Guyane et Reacuteunion - Panorama 2017 Last visit 20042018

[Medina2005] Alberto Medina Mark Allman and Sally Floyd Measuring the evolutionof transport protocols in the internet ACM SIGCOMM Computer Communi-cation Review 35(2) 37ndash52 2005

[Mellia2003-1] Marco Mellia Andrea Carpani and Renato Lo Cigno Tstat Tcp statisticand analysis tool In International Workshop on Quality of Service in Multiser-vice IP Networks pages 145ndash157 Springer 2003

[Mellia2003-2] M Mellia I Stoica and H Zhang TCP-aware packet marking in net-works with diffserv support Elsevier Computer Networks 42(1) 81ndash100 2003

[Mellia2005] Marco Mellia R Lo Cigno and Fabio Neri Measuring ip and tcp behavioron edge nodes with tstat Computer Networks 47(1) 1ndash21 2005

107

[Moore2001] David Moore Ken Keys Ryan Koga Edouard Lagache and K C ClaffyThe coralreef software suite as a tool for system and network administra-tors In Proceedings of the 15th USENIX Conference on System AdministrationLISA rsquo01 pages 133ndash144 Berkeley CA USA 2001 USENIX Association

[NCSUNRL] North Caroline State University - Networking Research Lab Last seen 27022018

[Nagle1984] John Nagle Congestion control in iptcp internetworks 1984

[Nicolay2017-2] Xavier Nicolay Reacutehan Noordally Pascal Anelli Nour Mohammad Mu-rad and Tahiry Razafindralambo Where is my next hop the case of indianocean islands In 2017 Global Information Infrastructure and Networking Sym-posium (GIIS) (GIISrsquo17) St Denis Reunion October 2017

[Nomikos2016] George Nomikos and Xenofontas Dimitropoulos traixroute Detectingixps in traceroute paths In International Conference on Passive and ActiveNetwork Measurement pages 346ndash358 Springer 2016

[Noordally2016] Reacutehan Noordally Xavier Nicolay Pascal Anelli Richard Lorion andPierre Ugo Tournoux Analysis of internet latency The reunion island caseIn Proceedings of the 12th Asian Internet Engineering Conference AINTEC rsquo16pages 49ndash56 New York NY USA 2016 ACM

[Noordally2017] Reacutehan Noordally Yassine Gangat Arnaud Ravoavahy Pascal Anelliand Xavier Nicolay How long delays impact tcp performance for a connec-tivity from reunion island In Next Generation Computing Applications (Next-Comp) 2017 1st International Conference on page 103ndash108 IEEE 07 2017

[ONU2013] ONU The millennium development goals report 2013 Technical reportOrganisation Nations United 2013

[Obar2012] Jonathan A Obar and Andrew Clement Internet surveillance and boome-rang routing A call for Canadian network sovereignty In TEM 2013 Pro-ceedings of the Technology amp Emerging Media Track-Annual Conference of theCanadian Communication Association (Victoria) 2012

[OpenVPN] OpenVPN Openvpn - open source vpn Last visit 09102017

[OpenWrt] OpenWrt Openwrt project Welcome to the openwrt project Last visit 12062018

[Orebaugh2006] Angela Orebaugh Gilbert Ramirez and Jay Beale Wireshark amp Etherealnetwork protocol analyzer toolkit Syngress 2006

[Ostermann2000] Shawn Ostermann Tcptrace A TCP connection analysis tool URL http www tcptrace org 2000

[Owezarski2003-1] Philippe Owezarski Meacutetrologie de la qualiteacute de service Ecole drsquoeacuteteacutetemps reacuteel (ETR2003)-Systemes Reacuteseauxet Applications 2003

[Owezarski2004] Philippe Owezarski and Nicolas Larrieu Internet trafficcharacterizationndashan analysis of traffic oscillations High Speed Networks andMultimedia Communications pages 96ndash107 2004

[PCH] Packet Clearing House Internet exchange directory 2014

[PSAMP] The Internet Engineering Task Force Packet sampling (psamp) 2017

[Paris-traceroute] Paris Traceroute Team Paris traceroute Last visit 09292017

[Paxson1995] Vern Paxson and Sally Floyd Wide area traffic the failure of poissonmodeling IEEEACM Transactions on Networking (ToN) 3(3) 226ndash244 1995

[Paxson1999] Vern Paxson Bro a system for detecting network intruders in real-timeComputer networks 31(23) 2435ndash2463 1999

108

[Paxson2001] Vern Paxson Some not-so-pretty admissions about dealing with internetmeasurements In Workshop on Network-Related Data Management (NRDM2001) 2001

[PeeringDB] Peering DB Peeringdb facilitates the exchange of information related topeering

[Periakaruppan1999] Ram Periakaruppan Evi Nemeth et al GTrace A graphical trace-route tool In LISA volume 99 pages 69ndash78 1999

[Peterson2007] Larry L Peterson and Bruce S Davie Computer networks a systems ap-proach Elsevier 2007

[Phidgets] Phidgets Phidgets products for usb sensing and control

[PlanetLab] PlanetLab an open platform for developing deploying and accessingplanetary-scale services

[PlanetLabEurope] PlanetLab PlanetLab europe an open platform for developing de-ploying and accessing planetary-scale services last visit 09102017

[Pretet2000] Thierry Prete and Olivier Mas Avancement du projet SAFE Technicalreport 16 Janvier 2000

[REUNIX2017] RENATER RENATER Connecteur de savoirs - reunix Last visit 09102017

[RFC1072] V Jacobson and R Braden TCP extensions for long-delay paths RFC 1072October 1988

[RFC1105] K Lougheed and Y Rekhter Border Gateway Protocol (BGP) RFC 1105June 1989

[RFC1700] J Reynolds and J Postel Assigned numbers RFC 1700 October 1994

[RFC1918] Y Rekhter B Moskowitz D Karrenberg G J de Groot and E Lear Ad-dress Allocation for Private Internets RFC 1918 February 1996

[RFC1983] G Malkin (Ed) Internet Usersrsquo Glossary RFC 1983 (Informational) August1996

[RFC2001] W Richard Stevens TCP Slow Start Congestion Avoidance Fast Retrans-mit and Fast Recovery Algorithms RFC 2001 January 1997

[RFC2330] Dr Guy T Almes Jamshid Mahdavi Matt Mathis and Dr Vern PaxsonFramework for IP Performance Metrics RFC 2330 May 1998

[RFC2582] Tom Henderson and Sally Floyd The NewReno Modification to TCPrsquos FastRecovery Algorithm RFC 2582 April 1999

[RFC2678] J Mahdavi and V Paxson IPPM Metrics for Measuring Connectivity RFC2678 (Proposed Standard) September 1999

[RFC2679] G Almes S Kalidindi and M Zekauskas A One-way Delay Metric forIPPM RFC 2679 (Proposed Standard) September 1999 Obsoleted by RFC7679

[RFC2680] G Almes S Kalidindi and M Zekauskas A One-way Packet Loss Metricfor IPPM RFC 2680 (Proposed Standard) September 1999 Obsoleted byRFC 7680

[RFC2681] G Almes S Kalidindi and M Zekauskas A Round-trip Delay Metric forIPPM RFC 2681 (Proposed Standard) September 1999

[RFC2756] P Vixie and D Wessels Hyper Text Caching Protocol (HTCP00) RFC2756 (Experimental) January 2000

109

[RFC2914] Sally Floyd Congestion Control Principles RFC 2914 September 2000

[RFC3031] E Rosen Viswanathan A and R Callon Multiprotocol Label SwitchingArchitecture RFC 3031 January 2001

[RFC3069] D McPherson and B Dykes VLAN Aggregation for Efficient IP AddressAllocation RFC 3069 (Informational) February 2001

[RFC3168] Sally Floyd Dr K K Ramakrishnan and David L Black The Addition ofExplicit Congestion Notification (ECN) to IP RFC 3168 September 2001

[RFC3232] J Reynolds Assigned Numbers RFC 1700 is Replaced by an On-line Da-tabase RFC 3232 January 2002

[RFC3376] B Cain S Deering I Kouvelas B Fenner and A Thyagarajan InternetGroup Management Protocol Version 3 RFC 3376 (Proposed Standard)October 2002 Updated by RFC 4604

[RFC3649] Sally Floyd HighSpeed TCP for Large Congestion Windows RFC 3649December 2003

[RFC3742] S Floyd Limited Slow-Start for TCP with Large Congestion Windows RFC3742 (Experimental) March 2004

[RFC4250] Chris M Lonvick and Sami Lehtinen The Secure Shell (SSH) Protocol As-signed Numbers RFC 4250 January 2006

[RFC4782] Pasi Sarolahti Amit Jain Sally Floyd and Mark Allman Quick-Start forTCP and IP RFC 4782 January 2007

[RFC4950] R Bonica D Gan D Tappan and C Pignataro ICMP extensions for mul-tiprotocol label switching RFC 4950 August 2007

[RFC5166] S Floyd (Ed) Metrics for the Evaluation of Congestion Control Mecha-nisms RFC 5166 (Informational) March 2008

[RFC5475] T Zseby M Molina N Duffield S Niccolini and F Raspall Sampling andFiltering Techniques for IP Packet Selection RFC 5475 (Proposed Standard)March 2009

[RFC5681] Ethan Blanton Dr Vern Paxson and Mark Allman TCP CongestionControl RFC 5681 September 2009

[RFC5735] Michelle S Cotton and Leo Vegoda Special Use IPv4 Addresses RFC 5735January 2010

[RFC5936] E Lewis and A Hoenes (Ed) DNS Zone Transfer Protocol (AXFR) RFC5936 (Proposed Standard) June 2010

[RFC6077] Ed D Papadimitriou M Welzl M Scharf and Bob J Briscoe Open Re-search Issues in Internet Congestion Control RFC 6077 February 2011

[RFC6201] R Asati C Pignataro F Calabria and C Olvera Device Reset Characteri-zation RFC 6201 (Informational) March 2011

[RFC6248] A Morton RFC 4148 and the IP Performance Metrics (IPPM) Registry ofMetrics Are Obsolete RFC 6248 (Informational) April 2011

[RFC6298] Vern Paxson Mark Allman Jerry Chu and Matt Sargent Computing TCPrsquosretransmission timer RFC 6298 June 2011

[RFC6528] F Gont and S Bellovin Defending against Sequence Number Attacks RFC6528 February 2012

[RFC6691] D Borman TCP Options and Maximum Segment Size (MSS) RFC 6691(Informational) July 2012

110

[RFC6761] Marc Krochmal and Stuart Cheshire Special-Use Domain Names RFC6761 February 2013

[RFC6928] J Chu N Dukkipati Y Cheng and M Mathis Increasing TCPrsquos InitialWindow RFC 6928 (Experimental) April 2013

[RFC7414] M Duke R Braden W Eddy and E Blanton and TCP Extensions for HighPerformance RFC 7414 February 2015

[RFC760] DoD standard Internet Protocol RFC 760 January 1980

[RFC776] J Postel Assigned numbers RFC 776 (Historic) January 1981 Obsoletedby RFC 790

[RFC7766] J Dickinson S Dickinson R Bellis A Mankin and D Wessels DNS Trans-port over TCP - Implementation Requirements RFC 7766 (Proposed Stan-dard) March 2016

[RFC793] Information Sciences Institute Transmission Control Protocol RFC 793September 1981

[RFC8311] D Black Relaxing Restrictions on Explicit Congestion Notification (ECN)Experimentation RFC 8311 (Proposed Standard) January 2018

[RFC8312] I Rhee L Xu S Ha A Zimmermann and L Eggert CUBIC for Fast Long-Distance Networks RFC 8312 February 2018

[RITE2014-1] Bob Briscoe Anna Brunstrom Andreas Petlund David Hayes David RosIng-Jyh Tsang Stein Gjessing Gorry Fairhurst Carsten Griwodz and Mi-chael Welz Reducing internet latency A survey of techniques and theirmerits In IEEE Communications Surveys amp Tutorials IEEE 2014 (To appear)

[RITE2014-2] RITE | Reducing Internet Transport Latency Slow internet -more band-with is not the answer 2014

[RaspberryPi] RASPBERRY PI FOUNDATION Raspberry Pi official website Last visit 09102017

[Ravoavahy2017] Arnaud Ravoavahy Meacutetrologie Reacuteseaux 2017

[Ripe2010] RIPE NCC RIPE atlas 2010

[Ros2005] David Ros Protocole de Transport TCP Ed Techniques Ingeacutenieur 2005

[SDTAN2013] Reacutegion Reunion Sphegravere Public and TACTIS Schema directeur drsquoamena-gement numerique du territoire de la reunion Technical report 2013

[Sallantin2014] Renaud Sallantin Optimisation de bout-en-bout du deacutemarrage des connexionsTCP PhD thesis 2014

[SamKnows] SamKnows Ltd Samknowscom 2017

[Sanchez2013] Mario A Saacutenchez John S Otto Zachary S Bischof David R ChoffnesFabiaacuten E Bustamante Balachander Krishnamurthy and Walter WillingerDasu Pushing experiments to the internetrsquos edge In NSDI pages 487ndash4992013

[Scharf2008-1] Michael Scharf Simon Hauger and Jochen Koumlgel Quick-start tcp Fromtheory to practice In Proc 6th Intern Workshop on Protocols for FAST Long-Distance Networks (PFLDnet) Manchester 2008

[Speechecker] Speedchecker Ltd Internet Performance Monitoring | Speedchecker LtdLast visit 29032018

[Steenbergen2009] Richard A Steenbergen A practical guide to (correctly) troubleshoo-ting with traceroute North American Network Operators Group pages 1ndash492009

111

[Sundaresan2011] Srikanth Sundaresan Walter De Donato Nick Feamster RenataTeixeira Sam Crawford and Antonio Pescapegrave Broadband internet perfor-mance a view from the gateway In ACM SIGCOMM computer communica-tion review volume 41 pages 134ndash145 ACM 2011

[Tan2006] Kun Tan Jingmin Song Qian Zhang and Murad Sridharan A compoundtcp approach for high-speed and long distance networks In Proceedings-IEEE INFOCOM 2006

[Tirumala2005] Ajay Tirumala Feng Qin Jon Dugan Jim Ferguson and Kevin GibbsIperf The tcpudp bandwidth measurement tool htt p dast nlanr net-Projects 2005

[Trammell2015] Brian Trammell Mirja Kuumlhlewind Damiano Boppart Iain LearmonthGorry Fairhurst and Richard Scheffenegger Enabling internet-wide de-ployment of explicit congestion notification In International Conference onPassive and Active Network Measurement pages 193ndash205 Springer 2015

[Udoo] UDOO All you need mini pc android + linux + arduino | udoo

[Vergoz2013] Michael Vergoz Classement des opeacuterateurs Internet reacuteunionnais Techni-cal report BinarySec 2013

[WAND] WAND Wand network research group Last visit 09252017

[Wang2004] Ren Wang Giovanni Pau Kenshin Yamada MY Sanadidi and Mario GerlaTcp startup performance in large bandwidth networks In INFOCOM 2004Twenty-third AnnualJoint Conference of the IEEE Computer and CommunicationsSocieties volume 2 pages 796ndash805 IEEE 2004

[Wang2018] Jessie Hui Wang and Changqing An A study on geographic properties ofinternet routing Computer Networks 133 183ndash194 2018

[Wenwei2006] Li Wenwei Zhang Dafang Yang Jinmin and Xie Gaogang On evalua-ting the differences of TCP and ICMP in network measurement ComputerCommunications 30(2) 428ndash439 2007

[WikiPing] Wikipedia ping (logiciel) Last visit 06102017

[Xu2002] Jun Xu Jinliang Fan Mostafa H Ammar and Sue B Moon Prefix-preservingIP address anonymization Measurement-based security evaluation and anew cryptography-based scheme In Network Protocols 2002 Proceedings10th IEEE International Conferenceon pages 280ndash289 IEEE 2002

[Xu2004] Lisong Xu Khaled Harfoush and Injong Rhee Binary increase congestioncontrol (bic) for fast long-distance networks In INFOCOM 2004 Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Socie-ties volume 4 pages 2514ndash2524 IEEE 2004

[Yang2016] Chantal Yang Hussein Suleman and Josiah Chavula A topology visuali-sation tool for national research and education networks in Africa In IST-Africa Week Conference 2016 pages 1ndash11 IIMC 2016

[Zhang2007] Jian Zhang and Andrew Moore Traffic trace artifacts due to monitoringvia port mirroring In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

[Zheleva2015] Mariya Zheleva Paul Schmitt Morgan Vigil and Elizabeth Belding In-ternet bandwidth upgrade implications on performance and usage in ru-ral zambia Information Technologies amp International Development 11(2) ppndash12015

[nPerf2017] nperf awards broadband reunion 2017

112

[rtraceroute] Reacutehan Noordally Arnaud Ravohavay and Xavier Nicolay rtraceroute Lastvisit 18102017

113

Pocircle Recherche Ecoles doctorales

LETTRE DrsquoENGAGEMENT DE NON-PLAGIAT

Je soussigneacute(e) NOORDALLY Reacutehan

en ma qualiteacute de doctorant(e) de

lrsquoUniversiteacute de La Reacuteunion deacuteclare ecirctre conscient(e) que le plagiat est un acte deacutelictueux

passible de sanctions disciplinaires Aussi dans le respect de la proprieacuteteacute intellectuelle et du

droit drsquoauteur je mrsquoengage agrave systeacutematiquement citer mes sources quelle qursquoen soit la forme

(textes images audiovisuel internet) dans le cadre de la reacutedaction de ma thegravese et de toute

autre production scientifique sachant que lrsquoeacutetablissement est susceptible de soumettre le texte

de ma thegravese agrave un logiciel anti-plagiat

Fait agrave Saint-Denis le 06072018

Signature

Extrait du Regraveglement inteacuterieur de lUniversiteacute de La Reacuteunion (valideacute par le Conseil drsquoAdministration en date du 11 deacutecembre 2014)

Article 9 Protection de la proprieacuteteacute intellectuelle ndash Faux et usage de faux contrefaccedilon plagiat

Lrsquoutilisation des ressources informatiques de lrsquoUniversiteacute implique le respect de ses droits de proprieacuteteacute intellectuelle ainsi que ceux de ses partenaires et plus geacuteneacuteralement de tous tiers titulaires de tes droits En conseacutequence chaque utilisateur doit - utiliser les logiciels dans les conditions de licences souscrites - ne pas reproduire copier diffuser modifier ou utiliser des logiciels bases de donneacutees pages Web textes images photographies ou autres creacuteations proteacutegeacutees par le droit drsquoauteur ou un droit privatif sans avoir obtenu preacutealablement lrsquoautorisation des titulaires de ces droits

La contrefaccedilon et le faux Conformeacutement aux dispositions du code de la proprieacuteteacute intellectuelle toute repreacutesentation ou reproduction inteacutegrale ou partielle drsquoune œuvre de lrsquoesprit faite ans le consentement de son auteur est illicite et constitue un deacutelit peacutenal Lrsquoarticle 444-1 du code peacutenal dispose laquo Constitue un faux toute alteacuteration frauduleuse de la veacuteriteacute de nature agrave cause un preacutejudice et accomplie par quelque moyen que ce soit dans un eacutecrit ou tout autre support drsquoexpression de la penseacutee qui a pour objet ou qui peut avoir pour effet drsquoeacutetablir la preuve drsquoun droit ou drsquoun fait ayant des conseacutequences juridiques raquo Lrsquoarticle L335_3 du code de la proprieacuteteacute intellectuelle preacutecise que laquo Est eacutegalement un deacutelit de contrefaccedilon toute reproduction repreacutesentation ou diffusion par quelque moyen que ce soit drsquoune œuvre de lrsquoesprit en violation des droits de lrsquoauteur tels qursquoils sont deacutefinis et reacuteglementeacutes par la loi Est eacutegalement un deacutelit de contrefaccedilon la violation de lrsquoun des droits de lrsquoauteur drsquoun logiciel (hellip) raquo

Le plagiat est constitueacute par la copie totale ou partielle drsquoun travail reacutealiseacute par autrui lorsque la source emprunteacutee nrsquoest pas citeacutee quel que soit le moyen utiliseacute Le plagiat constitue une violation du droit drsquoauteur (au sens des articles L 335-2 et L 335- 3 du code de la proprieacuteteacute intellectuelle) Il peut ecirctre assimileacute agrave un deacutelit de contrefaccedilon Crsquoest aussi une faute disciplinaire susceptible drsquoentraicircner une sanction Les sources et les reacutefeacuterences utiliseacutees dans le cadre des travaux (preacuteparations devoirs meacutemoires thegraveses rapports de stagehellip) doivent ecirctre clairement citeacutees Des citations inteacutegrales peuvent figurer dans les documents rendus si elles sont assorties de leur reacutefeacuterence (nom drsquoauteur publication date eacutediteurhellip) et identifieacutees comme telles par des guillemets ou des italiques

Les deacutelits de contrefaccedilon de plagiat et drsquousage de faux peuvent donner lieu agrave une sanction disciplinaire indeacutependante de la mise en œuvre de poursuites peacutenales

  • Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion
  • Remerciements
  • Reacutesumeacute
  • Abstract
  • Table des matiegraveres
  • Liste des acronymes
  • Introduction
    • Contexte geacuteneacuteral
    • Contexte reacutegional
      • LInternet agrave La Reacuteunion
      • LInternet dans la Zone de lOceacutean Indien
        • Probleacutematique
        • Organisation de la thegravese
          • Eacutetat de lart
            • Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage
              • Controcircle de congestion de TCP
              • La probleacutematique de lutilisation dun reacuteseau agrave grande capaciteacute de stockage
              • Un controcircle de congestion de TCP adapteacute aux LFN
              • Controcircle de congestion avec implication des routeurs
              • Caracteacuterisation de La Reacuteunion
                • Meacutetrologie du trafic Internet
                  • Deacutefinition
                  • Meacutetrologie active
                  • Meacutetrologie passive
                  • Comparatif entre mesures actives et mesures passives
                    • Synthegravese
                      • Caracteacuterisation de la connectiviteacute de La Reacuteunion
                        • Objectifs
                        • Cahier des charges
                          • Evolution
                          • Connectiviteacute
                            • Protocole de mesure
                              • Eacutechantillon de mesure
                              • Eacutevolution
                              • Connectiviteacute
                                • Reacutesultats
                                  • Eacutevolution
                                  • Connectiviteacute de La Reacuteunion
                                  • Connectiviteacute des icircles de la Zone Oceacutean Indien
                                  • Synthegravese des reacutesultats
                                    • Conclusion
                                      • Meacutetrologie sur le service de transport agrave La Reacuteunion
                                        • Objectifs
                                          • Les objectifs de leacutetude
                                          • Les meacutetriques de leacutetude
                                            • Mise en oeuvre dune plate-forme de meacutetrologie
                                              • Pour la capture du trafic
                                              • Pour analyser les traces
                                                • Protocole de mesure
                                                • Reacutesultats
                                                  • Supervision du trafic
                                                  • Performance de TCP
                                                  • Synthegravese des reacutesultats
                                                    • Conclusion
                                                      • Conclusion amp perspectives
                                                        • Synthegravese des travaux
                                                          • Perspectives
                                                            • Table des figures
                                                            • Liste des tableaux
                                                              • Bibliographie
                                                                  • Table des figures
                                                                  • Liste des tableaux
                                                                  • Bibliographie
Page 3: Étude de la connectivité Internet de l'île de la Réunion

Je deacutedie cette thegravese agrave lrsquoensemble des membres de ma famille

I

II

Remerciements

Mes premiers remerciements vont agrave lrsquoendroit de Monsieur Pascal Anelli Maicirctre deconfeacuterences HDR agrave lrsquoUniversiteacute de La Reacuteunion qui a accepteacute drsquoencadrer cette thegravese Jele remercie drsquoavoir mis toute son eacutenergie pour que je puisse mener ces travaux dans lesmeilleures conditions Je le remercie eacutegalement pour la confiance et la patience sans failleqursquoil mrsquoa teacutemoigneacutees durant ces anneacutees

Je remercie Monsieur Richard Lorion Maicirctre de Confeacuterences agrave lrsquoUniversiteacute de LaReacuteunion Malgreacute un emploi du temps surchargeacute il a su me consacrer du temps pouraiguiller mes travaux

Je tiens agrave remercier tout particuliegraverement Madame Laure Petrucci Professeur agrave lrsquoUni-versiteacute Paris 13 et Monsieur Emmanuel Lochin Professeur agrave lrsquoISAE SUPAERO qui mrsquoontfait lrsquohonneur drsquoaccepter de juger ces travaux et drsquoen ecirctre rapporteurs

Je remercie le Professeur Reacutemy Courdier qui a accepteacute de preacutesider mon jury de thegraveseDe par cette acceptation je boucle mon cursus universitaire agrave lrsquoUniversiteacute de La ReacuteunionMes remerciements vont agrave lrsquoattention de Monsieur Promeacutetheacutee Spathis qui consacre deson temps agrave la participation de mon jury de thegravese en tant qursquoexaminateur

Je tiens agrave remercier Messieurs Pierre-Ugo Tournoux et Xavier Nicolay pour les dis-cussions que lrsquoon a eues Cela mrsquoa permis de me remettre dans le droit chemin quand jemrsquoeacutegarais

Je remercie eacutegalement Monsieur Bruno Baynat Maicirctre de confeacuterences agrave lrsquoUniversiteacutede Paris 6 qui a su donner un nouveau souffle agrave ces travaux agrave travers ses conseils lors deson passage

Je remercie eacutegalement Monsieur Denis Fabregravegue Responsable du pocircle TIC agrave La ReacuteunionMonsieur Thierry Pretet travaillant agrave la cellule Investissements publics de la ReacutegionReacuteunion Monsieur Thomas Silverston Chercheur au NICT drsquoavoir accepteacute de faire par-tie de mon comiteacute de suivi de thegravese

Je remercie eacutegalement le Laboratoire drsquoInformatique et de Matheacutematiques dirigeacute parMonsieur Jean Diatta Professeur agrave lrsquoUniversiteacute de La Reacuteunion ainsi que lrsquoensemble desmembres pour lrsquoaccueil et les moyens qui mrsquoont eacuteteacute mis agrave disposition pour le bon deacuterou-lement de cette thegravese

Je remercie eacutegalement la Reacutegion Reacuteunion qui a soutenu financiegraverement ces travaux dethegravese

Je remercie eacutegalement Messieurs Jean-Christophe Lan-Yan-Fock et Arnaud Ravoa-vahy pour les travaux reacutealiseacutes durant leurs stages

Je remercie eacutegalement mes collegravegues mes amis et mes proches pour leurs contribu-tions et leurs encouragements

Je remercie particuliegraverement Aureacutelie Miora Florence et Anne-Claire qui ont eacuteteacute dansla mecircme galegravere que moi

Je tiens agrave remercier du fond du coeur lrsquoensemble des membres de ma famille qui mrsquoonttoujours apporteacute leur soutien et leur encouragement Merci agrave vous

Enfin je tiens agrave remercier toutes les personnes qui ont contribueacute de pregraves ou de loin agravela reacutealisation de ces travaux

III

IV

Reacutesumeacute

Lrsquoaccegraves agrave Internet des icircles de la Zone Oceacutean Indien a la particulariteacute drsquoutiliser deuxlongs cacircbles sous-marins Les routes ont en commun de passer par un de ces liens etdrsquointroduire une composante de deacutelai qui peut ecirctre significative La performance de TCPest lieacutee agrave lrsquoeacutetat des routes et au deacutelai Dans la situation de lrsquoicircle de la Reacuteunion comment secomporte un protocole ayant une deacutependance au deacutelai tel que TCP

Dans cette thegravese nous proposons une eacutetude de lrsquoInternet agrave la Reacuteunion Les travauxvisent agrave pouvoir dresser un bilan de la connectiviteacute Internet Ils srsquoorientent drsquoune partagrave caracteacuteriser la connectiviteacute au niveau du reacuteseau et drsquoautre part agrave traduire ses caracteacute-ristiques au niveau de la couche de transport Ainsi les travaux preacutesenteacutes reposent surdeux eacutetudes de meacutetrologie sur le reacuteseau reacuteunionnais

Le premier examen a pour objectif la caracteacuterisation des deacutelais et des routes emprun-teacutees depuis et en direction de lrsquoicircle Ces travaux reposent sur une plate-forme de mesuresmise en place agrave cet effet Un outil drsquoidentification des routes a eacuteteacute deacuteveloppeacute afin drsquoana-lyser les chemins depuis et vers la Reacuteunion Cet outil utilise une base de donneacutees degeacuteolocalisation construite agrave partir des adresses IP rencontreacutees des deacutelais associeacutes et drsquoin-formations provenant des Registres Internet Reacutegionaux Lrsquoanalyse des reacutesultats montredes caracteacuteristiques propres agrave la reacutegion Reacuteunion

La seconde eacutetude de meacutetrologie vise lrsquoanalyse des flux TCP Des meacutetriques associeacuteesagrave lrsquoobservation des captures de trafic sont identifieacutees afin drsquoeacutetablir les performances deTCP mais eacutegalement les types de trafic entrant et sortant de lrsquoicircle Le volume des eacutecouteseacutetant important un outil drsquoanalyse pour des traitements efficaces et rapides a eacutegalementeacuteteacute deacuteveloppeacute

Les contributions de cette thegravese sont drsquoabord rattacheacutees au contexte reacuteunionnais etsont extrapoleacutees vers lrsquointernet de la Zone Oceacutean Indien Cette thegravese se veut ecirctre un eacuteleacute-ment pour une reacuteflexion avec lrsquoensemble des acteurs de lrsquoInternet agrave la Reacuteunion

Mots cleacutes

Meacutetrologie active Deacutelais Routage Meacutetrologie passive Performance TCP Zone OceacuteanIndien Reacuteunion

V

Abstract

The access to the Internet of the Islands of the Indian Ocean Area has the particularityof using two long submarines cables The routes have in common to go through one ofthese links and introduce a delay component that can be significant The performance ofTCP is linked to the state of the route and the delay In the situation of Reunion Islandhow does a protocol having a dependence on delay such as TCP behaves

In this thesis we propose a study of the Internet in Reunion Island The work aimsto be able to take stock of Internet connectivity They are oriented on the one hand tocharacterize the connectivity at the level of the network and on the other hand to translatethese characteristics at the level of the transport layer Thus the works presented arebased on two metrology studies on the Reunion network

The first review aims to characterize the delays and the routes taken from and to theisland This work is based on a platform of measures put in place for this purpose A roadidentification tool has been developed to analyze roads to and from Reunion Island Thistool uses a geolocation database built from IP addresses encountered associated delaysand information from the Regional Internet Registries The analysis of the results showscharacteristics specific to the Reacuteunion region

The second metrology study aims to analyze TCP flows Metrics associated with theobservation of the catches of traffic are identified in order to establish the performancesof TCP but also the types of traffic entering and leaving the island Since the volume ofthe intercepts is important an analysis tool for efficient and rapid treatments has beendeveloped

The contributions of this thesis are first of all related to the Reunionese context andare extrapolated to the Internet of the Indian Ocean Zone This thesis is meant to be anelement for a reflection with all the actors of the Internet in Reunion Island

Keywords

Active Metrology Delay Routage Passive metrology Performance TCP Indian OceanArea Reunion Island

VI

Table des matiegraveres

Remerciements III

Reacutesumeacute V

Abstract VI

Liste des acronymes IX

Introduction 11 Contexte geacuteneacuteral 12 Contexte reacutegional 1

21 LrsquoInternet agrave La Reacuteunion 122 LrsquoInternet dans la Zone de lrsquoOceacutean Indien 5

3 Probleacutematique 84 Organisation de la thegravese 8

1 Eacutetat de lrsquoart 911 Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage 10

111 Controcircle de congestion de TCP 10112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de

stockage 14113 Un controcircle de congestion de TCP adapteacute aux LFN 17114 Controcircle de congestion avec implication des routeurs 22115 Caracteacuterisation de La Reacuteunion 23

12 Meacutetrologie du trafic Internet 25121 Deacutefinition 25122 Meacutetrologie active 26123 Meacutetrologie passive 32124 Comparatif entre mesures actives et mesures passives 35

13 Synthegravese 36

2 Caracteacuterisation de la connectiviteacute de La Reacuteunion 3921 Objectifs 4022 Cahier des charges 40

221 Evolution 40222 Connectiviteacute 40

23 Protocole de mesure 46231 Eacutechantillon de mesure 46232 Eacutevolution 47233 Connectiviteacute 48

24 Reacutesultats 53241 Eacutevolution 53

VII

242 Connectiviteacute de La Reacuteunion 54243 Connectiviteacute des icircles de la Zone Oceacutean Indien 65244 Synthegravese des reacutesultats 71

25 Conclusion 72

3 Meacutetrologie sur le service de transport agrave La Reacuteunion 7531 Objectifs 75

311 Les objectifs de lrsquoeacutetude 76312 Les meacutetriques de lrsquoeacutetude 76

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie 79321 Pour la capture du trafic 79322 Pour analyser les traces 80

33 Protocole de mesure 8234 Reacutesultats 85

341 Supervision du trafic 86342 Performance de TCP 88343 Synthegravese des reacutesultats 91

35 Conclusion 92

Conclusion amp perspectives 951 Synthegravese des travaux 952 Perspectives 96

Table des figures 100

Liste des tableaux 101

Bibliographie 103

VIII

Liste des acronymes

ACK Acknowledgement

ADSL Asymmetric Digital Subscriber Line

AIMD Additive Increase and Multiplicative Decrease

API Application Programming Interface

ARCEP Autoriteacute de Reacutegulation des Communications Electroniques et des Postes

AS Autonomous System

BDP Bandwidth Delay Product

CAIDA Center for Applied Internet Data Analysis

CDCS Comoros Domestic Cable Sytem

CDF Cumulative Density Function

CIL Correspondant Informatique et Liberteacutes

CWND Congestion Window

CWR Congestion Window Reduce

DNS Domain Name System

DSI Direction des Services Informatiques

DupAck Duplicate Acknowledgement

EASSY Eastern Arfrica Submarine SYstem

ECE ECN Echo

ECN Explicit Congestion Notification

FAI Fournisseurs drsquoAccegraves Internet

FTTH Fiber To The Home

GIX Global Internet eXchange

GNU GNUrsquos Not Unix

GPL General Public Licence

HTTP HyperText Transfer Protocol

HTTPS HyperText Transfer Protocol Secured

IANA Internet Assigned Numbers Authority

ICMP Internet Control Message Protocol

IETF Internet Engineering Task Force

IX

IGMP Internet Group Management Protocol

IMAP Internet Message Access Protocol

IP Internet Protocol

IPPM IP Performance Metrics

IW Initial Window

IXP Internet eXchange Point

LAN Local Area Network

LER Label Edge Router

LFN Long Fat Network

LIM Laboratoire drsquoInformatique et de Matheacutematiques

LION Lower Indian Ocean Network

LSP Label Switched Path

LSR Label Switch Router

MAN Metropolitan Area Network

MPLS MultiProtocol Label Switch

MSS Maximun Segment Size

NRA Noeud de Raccordement drsquoAbonneacutes

NS Nonce Sum

OS Operating System

PDF Probability Density Function

POP Post Office Protocol

PSAMP Packet Sampling

RENATER REseau NAtional de communication eacutelectroniques pour la Technologie lrsquoEnseigne-ment et la Recherche

RIR Regional Internet Registry

RITE Reducing Internet Transport Latency

RSSI Responsable Seacutecuriteacute et Systegravemes drsquoInformation

RTO Retransmission TimeOut

RTT Round-Trip delay Time

SAFE South-Africa Far East

SAT-3 South Africa Transit-3

SCP Ssh CoPy

SEAS Seychelles to East Africa System

SMTP Simple Mail Transfert Protocol

SSH Secure SHell

ssthresh slow-start threshold

TAI Technologies drsquoAccegraves agrave Internet

X

TCP Transmission Control Protocol

TTL Time-To-Live

UDP User Datagram Protocol

VDSL Very-high-bit-rate Digital Subscriber Line

VLAN Virtual Local Area Network

VOD Video on demand

VPN Virtal Private Network

WAN Wide Area Network

WASC West Africa Submarine Cable

ZOI Zone Oceacutean Indien

XI

XII

Introduction

1 Contexte geacuteneacuteral

Depuis sa premiegravere deacutemonstration publique en 1972 Internet a fortement eacutevolueacute[Leiner1997] Dans une premiegravere phase nous avons les changements de services Les uti-lisateurs ont basculeacute des services historiques que sont lrsquoeacutechange drsquoe-mail et la navigationweb vers une utilisation interactive de lrsquoInternet Ces nouveaux services tels que la Voixsur IP les Jeux en ligne le Streaming etc sont maintenant possibles peu importe lrsquoendroitougrave lrsquoon se situe Cela gracircce agrave la seconde phase des innovations de lrsquoInternet lrsquoeacutevolu-tion des technologies logicielles et mateacuterielles Les technologies sont devenues de plusen plus mobiles et proposent des deacutebits drsquoaccegraves agrave lrsquoInternet de plus en plus importantsAinsi nous sommes passeacutes drsquoun accegraves physique de chez soi connecteacutes agrave un ordinateurfixe et une liaison 56 kbits (kilo-bitsseconde) agrave des smartphones et des connexions mo-biles avec un deacutebit theacuteorique minimal descendant de 20 Gbits (Giga-bitsseconde) dansun futur proche pour la technologie 5G En parallegravele lrsquoaccegraves agrave Internet srsquoest deacutemocra-tiseacute Drsquoapregraves une eacutetude de lrsquoOrganisation des Nations Unies le nombre de teacuteleacutephonesmobiles est devenu supeacuterieur au nombre drsquohabitants sur la planegravete [ONU2013] Ces eacutevo-lutions parallegraveles ont bouleverseacute lrsquousage de lrsquoInternet Est-ce que ces eacutevolutions ont eu unimpact sur lrsquoInternet reacuteunionnais

2 Contexte reacutegional

21 LrsquoInternet agrave La Reacuteunion

Pour comprendre la situation de lrsquoInternet agrave La Reacuteunion il est neacutecessaire de relaterlrsquohistoire de la connectiviteacute Internet et de dresser un bilan de lrsquoeacutetat actuel Cet historiqueest effectueacute agrave partir du document [Pretet2000] qui preacutesente lrsquoavancement du projet deconnexion de lrsquoicircle de La Reacuteunion au cacircble sous-marin South-Africa Far East (SAFE)

La premiegravere connexion de La Reacuteunion agrave lrsquoInternet date de 1992 avec la mise en servicedu projet Telecom-2 Agrave cette eacutepoque la seule liaison connectant La Reacuteunion agrave Interneteacutetait une connexion satellitaire Jusqursquoen 2001 et lrsquoarriveacutee du cacircble SAT-3WASCSAFEles deacutebits drsquoaccegraves reacutesidentiels ne deacutepassaient pas les 56 kbits La bande passante totalede lrsquoaccegraves Internet de lrsquoicircle par ce canal satellite eacutetait de 400 Mbits (Meacutega-bitsseconde)tous opeacuterateurs confondus Le coucirct drsquoutilisation de la liaison satellite avoisinait les17 000DMbmois et par opeacuterateur La technologie drsquoaccegraves et le tarif eacuteleveacute limitaient lesusages de lrsquoInternet priveacute agrave des services basiques comme lrsquoeacutechange drsquoe-mail Lrsquoarriveacuteedes cacircbles South Africa Transit-3 (SAT-3)West Africa Submarine Cable (WASC)SAFE en2001 visaient agrave deacutesenclaver numeacuteriquement lrsquoicircle

Ce cacircble drsquoune longueur totale de 28 000 Km (Kilo-megravetres) connecte lrsquoEurope (Es-pagne et Portugal) agrave lrsquoAsie (Inde et Malaisie) en longeant la cocircte Ouest africaine telqursquoillustreacutee par la carte figure 1 Le lien est composeacute de deux paires de fibres optiquesavec une capaciteacute globale de 135 Gbits La reacutepartition des capaciteacutes fut faite en fonction

1

du montant investi par les opeacuterateurs France Teacuteleacutecom fut seacutelectionneacutee pour la Franceavec un deacutebit total de 13 6 Gbits dont 155 Mbits furent alloueacutes agrave la connexion de LaReacuteunion Ce deacutebit eacutetait eacutequivalent agrave la capaciteacute maximale theacuteorique du lien satellite deFrance Teacuteleacutecom Outre la seacutecuriteacute apporteacutee par la fibre optique crsquoest la qualiteacute de la trans-mission qui a eacuteteacute ameacutelioreacutee avec ce support Ce cacircble a eacuteteacute une premiegravere eacutetape dans lamise en place drsquoune autoroute de lrsquoinformation entre lrsquoEurope lrsquoAsie et lrsquoAfrique PourLa Reacuteunion cette autoroute a eacuteteacute un facteur pour la baisse des coucircts de communication eten parallegravele le deacuteploiement de la technologie Asymmetric Digital Subscriber Line (ADSL)Les tarifs de consommation de la bande passante du lien ont connu une baisse impor-tante suite agrave une deacutecision de lrsquoAutoriteacute de Reacutegulation des Communications Electroniques etdes Postes (ARCEP) en 2004 [ARCEP2004] Les tarifs sont passeacutes de 17 000 DMbmois agrave1 550 DMbmois

FIGURE 1 ndash Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000])

Malgreacute la baisse des tarifs lrsquoADSL nrsquoeacutetait preacutesent que dans 6 villes agrave forte densiteacutede population Afin drsquoaugmenter la couverture de lrsquoaccegraves Internet de lrsquoicircle une dorsalefaisant le tour de lrsquoicircle est installeacutee Crsquoest le reacuteseau nommeacute Gazelle dont le deacutebut du deacute-ploiement fut effectueacute dans le courant de lrsquoanneacutee 2003 [SDTAN2013] Cette fibre est ins-talleacutee en hauteur en suivant le reacuteseau Haute Tension drsquoEDF selon le plan de la figure 2(en trait bleu ou fonceacute) Le but de ce reacuteseau est de raccorder lrsquoensemble des Noeud de Rac-cordement drsquoAbonneacutes (NRA) Un NRA est un local heacutebergeant un central teacuteleacutephonique delrsquoopeacuterateur historique France Teacuteleacutecom dans lequel aboutissent les lignes teacuteleacutephoniquesdes abonneacutes communeacutement appeleacutees boucles locales Au delagrave de ces locaux les boucleslocales forment le reacuteseau capillaire Lrsquointerconnexion entre le reacuteseau Gazelle et les NRAest repreacutesenteacutee en vert sur la figure 2

En 2004 La Reacuteunion srsquoest doteacutee drsquoun point drsquoeacutechange (Global Internet eXchange (GIX)ou Internet eXchange Point (IXP)) nommeacute Reunix Il fut pendant pregraves de 10 ans le seul IXPpreacutesent dans la Zone Oceacutean Indien (ZOI) Geacutereacute par le REseau NAtional de communicationeacutelectroniques pour la Technologie lrsquoEnseignement et la Recherche (RENATER) il vise agrave inter-connecter les fournisseurs drsquoaccegraves Internet de La Reacuteunion afin drsquoeacuteviter que le trafic localne sorte de lrsquoicircle et consomme des capaciteacutes sur le cacircble sous-marin En plus de cet eacutequi-pement des technologies de cache ont eacuteteacute deacuteployeacutees sur le territoire LrsquoUniversiteacute de LaReacuteunion a eacuteteacute un des acteurs de ce deacuteploiement

2

FIGURE 2 ndash Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000])

Depuis la deacutecision de lrsquoARCEP en 2004 chaque anneacutee une baisse de 20 agrave 40 duprix du Meacutegabit sur le cacircble sous-marin est enregistreacutee En 2006 pour 50D un abonneacutenrsquoavait droit qursquoagrave la connexion ADSL de 1 Mbits sans aucun service additionnel Lrsquoan-neacutee suivante pour le mecircme tarif la teacuteleacutephonie illimiteacutee vers certains pays a eacuteteacute ajouteacuteeau forfait Dans le courant de lrsquoanneacutee 2010 le forfait est resteacute le mecircme mais le deacutebit alloueacuteest augmenteacute pour atteindre 8 Mbits La Reacuteunion nrsquoa vu lrsquoarriveacutee du triple play (Teacuteleacutevi-sion Teacuteleacutephone Internet) qursquoagrave partir des anneacutees 20112012 avec lrsquoarriveacutee drsquoun nouveaucacircble Lower Indian Ocean Network (LION) Le LION est un cacircble sous-marin reliant LaReacuteunion Maurice et Madagascar depuis 2009 En 2012 une extension est rajouteacutee sousle nom de LION-2 connectant le LION agrave Mayotte et au Kenya Ce nouveau cacircble proposedegraves sa mise en service une capaciteacute deacutepassant le 1 Tbs (Teacuterabitseconde)

Lrsquoaugmentation continue des deacutebits et de la capaciteacute disponible sur le cacircble SAT-3WASCSAFE actuellement agrave 900 Gbits a acceacuteleacutereacute le deacuteploiement de nouveaux ser-vices et de nouvelles technologies drsquoaccegraves agrave Internet pour les abonneacutes Lrsquoicircle de La Reacuteuniondispose actuellement en dehors des connexions mobiles de trois Technologies drsquoAccegraves agrave In-ternet (TAI) La premiegravere est la technologie ADSL preacutesente depuis 2001 Elle propose desdeacutebits asymeacutetriques allant jusqursquoagrave 20 Mbitss en descente Crsquoest le deacutebit qursquoaura lrsquoutilisa-teur en teacuteleacutechargement Depuis 2014 lrsquoopeacuterateur historique Orange (ex-France Teacuteleacutecom)propose la technologie Very-high-bit-rate Digital Subscriber Line (VDSL) 2 avec des deacutebitsallant jusqursquoagrave 100 Mbits descendant La limite physique de cette TAI impose une dis-tance entre lrsquoabonneacute et le distributeur infeacuterieure agrave 1 Km La derniegravere technologie preacutesentesur lrsquoicircle est la fibre optique Deacuteployeacutee depuis 2007 par lrsquoopeacuterateur priveacute ZEOP elle eacutetaitjusqursquoagrave peu principalement deacuteployeacutee dans les villes du Port Sainte Marie et Saint Pierre

Chaque opeacuterateur dispose drsquoune ou plusieurs technologies drsquoaccegraves Chaque technolo-

3

gie est associeacutee agrave un deacutebit maximal theacuteorique La carte 3 1 preacutesente les deacutebits theacuteoriquesqui sont preacutesents sur lrsquoicircle [France2017]

Cette carte montre une dispariteacute des deacutebits selon les zones geacuteographiques de lrsquoicircleLe Plan France Tregraves Haut Deacutebit a pour objectif drsquouniformiser sur lrsquoensemble du territoirefranccedilais les deacutebits avec le deacuteploiement de la technologie drsquoaccegraves fibre optique

FIGURE 3 ndash Carte des deacutebits agrave La Reacuteunion

Reacutecapitulatif

La connexion agrave Internet donne agrave La Reacuteunion des capaciteacutes importantes La preacutesencedrsquoun GIX sur le territoire a limiteacute le trafic reacuteunionnais sur les cacircbles sous-marins La figure4 montre lrsquoensemble des eacuteveacutenements qui ont marqueacute le deacuteveloppement de lrsquoInternet agrave LaReacuteunion jusqursquoagrave nos jours

Depuis la deacutecision de lrsquoARCEP en 2004 [ARCEP2004] et lrsquoarriveacutee du cacircble LION lesopeacuterateurs ont fait le choix drsquoaugmenter les services proposeacutes avec un prix reacutesidentielstable Les derniers services ajouteacutes sont ceux de la Video on demand (VOD) et de la rediffu-sion (Replay) En 2014 le prix moyen du MeacutegabitMois sur le cacircble SAT-3WASCSAFEavoisinait les 25 D En pregraves de 15 ans on note la baisse du coucirct moyen du Meacutegabitmoisde 17 000 D agrave 25 D

Lrsquoeacutevolution de la connectiviteacute Internet agrave La Reacuteunion est lieacutee au deacuteveloppement de laconnectiviteacute des diffeacuterents pays preacutesents dans la Zone Oceacutean Indien

1 Source Observatoire France Tregraves Haut Deacutebit

4

FIGURE 4 ndash Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion

22 LrsquoInternet dans la Zone de lrsquoOceacutean Indien

Les acteurs du deacuteveloppement du numeacuterique dans la Zone Oceacutean Indien

Dans le cadre de nos eacutetudes nous restreignons la ZOI agrave 6 icircles ou archipels suivants(rangeacutes par ordre alphabeacutetique) les Comores Madagascar Maurice Mayotte La Reacuteunionet les Seychelles Agrave lrsquoexception de Mayotte et de La Reacuteunion qui sont des reacutegions fran-ccedilaises les autres icircles et archipels citeacutes sont des pays indeacutependants Nous allons dansun premier temps faire une preacutesentation des principaux acteurs du deacuteveloppement nu-meacuterique dans chaque territoire Le deacuteveloppement de lrsquoInternet dans la ZOI se fait encollaboration avec lrsquoensemble des pays Nous poursuivrons avec les futures installationsdes cacircbles sous-marins dans la ZOI

LrsquoUnion des Comores est une reacutepublique feacutedeacuterale drsquoAfrique Lrsquoarchipel est connecteacuteagrave Internet depuis le 19 Janvier 1998 via une connexion satellite En 2010 le gouverne-ment deacuteploie le Comoros Domestic Cable Sytem (CDCS) qui relie lrsquoensemble des icircles delrsquoarchipel entre elles avec en parallegravele le raccordement au cacircble Eastern Arfrica SubmarineSYstem (EASSY) [Comores2002] Ce cacircble relie lrsquoAfrique du Sud au Soudan en longeantla cocircte Est du continent En 2009 lrsquoAutoriteacute Nationale de Reacutegulation des TIC (ANRTIC) voitle jour De nombreuses missions sont donneacutees agrave cette autoriteacute comme appliquer et fairerespecter la loi des Technologies de lrsquoInformation et de la Communication (TIC) reacuteguler lesecteur des TIC favoriser la coopeacuteration entre les acteurs et geacuterer les diffeacuterends garan-tir une concurrence saine et loyale entre les opeacuterateurs et de deacutevelopper la recherche laformation et les innovations technologiques [ANRTIC2016] En deacutecembre 2016 un troi-siegraveme cacircble connecte lrsquoarchipel agrave Mayotte Actuellement un Vice-Preacutesident chargeacute desTIC travaille en collaboration avec un Conseiller du preacutesident en matiegravere de transports etteacuteleacutecommunications

La Reacutepublique de Madagascar est relieacutee agrave Internet par deux cacircbles sous-marins Lepremier est lrsquoEASSY Le second cacircble est le LION Au niveau des prises de deacutecisions 3 or-ganismes principaux existent Le plus important est le ministegravere des Teacuteleacutecommunicationset des Nouvelles Technologies Il a mis en place le Projet drsquoInfrastructure de Communicationpour Madagascar (PICOM) Lrsquoobjectif est la reacuteduction des coucircts drsquoaccegraves aux services deteacuteleacutecommunications Le second est lrsquoAutoriteacute de Reacutegulation des TEchnologies de Communica-tion (ARTEC) Cet administration octroie les licences aux proprieacutetaires des reacuteseaux arbitreles diffeacuterends entre opeacuterateurs et assure la gestion des spectres [ARTEC2016] Le dernierorganisme est le Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de la Commu-nication (GOTICOM) Il a pour objectif drsquoaccompagner et drsquoameacuteliorer les infrastructuresde teacuteleacutecommunication et de favoriser lrsquointeacutegration des TIC [GOTICOM2011] Depuis2016 un GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Africaine [MGIX2017]

5

La Reacutepublique de Maurice regroupe les icircles Rodrigues et Maurice Sous lrsquoimpulsiondu gouvernement anglais la premiegravere ligne teacuteleacutephonique fut installeacutee en 1883 Actuel-lement en plus drsquoune connexion satellitaire reliant les deux icircles le SAFE et le LIONconnectent Maurice agrave Internet Un ministegravere des Technologies de lrsquoInnovation et desCommunications existe au sein du gouvernement Crsquoest ce mecircme gouvernement quinomme le directeur de lrsquoInformation and Communication Technologies Authority (ICTA) Crsquoestlrsquoautoriteacute de reacutegulation des Teacuteleacutecoms et des Postes Il existe 2 principaux opeacuterateurs quesont Mauritius Telecom et Emtel Une dizaine drsquoopeacuterateurs cohabitent sur lrsquoicircle [ICTA2017]Depuis 2016 un nouveau GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Afri-caine [MIXP2017]

Mayotte est un deacutepartement franccedilais depuis Mars 2011 Le raccordement au cacircbleLION-2 extension du cacircble LION en avril 2012 rend possible lrsquoarriveacutee du haut deacutebit surce territoire En 2013 un GIX geacutereacute par RENATER est installeacute au sein du Rectorat Il senomme Mayotix

Les Seychelles ont vu leur premiegravere connexion Internet introduite dans lrsquoarchipel parAtlas Seychelles Ltd en septembre 1996 En 2012 les Seychelles sont connecteacutes agrave une fibreen provenance de Tanzanie Crsquoest le cacircble Seychelles to East Africa System (SEAS) Crsquoestlrsquounique cacircble sous-marin connectant lrsquoarchipel Le Ministegravere des Technologie de lrsquoInforma-tion et des Communications (MITC) fait office drsquoautoriteacute de Reacutegulation des Teacuteleacutecommuni-cations dans le pays [DICT2017]

Chaque autoriteacute de reacutegulation agrave un impact sur le deacuteveloppement de lrsquoInternet dansson pays Ce deacuteveloppement se reacutepercute sur lrsquoameacutelioration de lrsquoaccegraves Internet dans laZOI

Deacuteveloppement de lrsquointerconnexion de la Zone Oceacutean Indien

Cette reacutegion a connu un premier bouleversement de sa connectiviteacute agrave Internet avecle deacuteploiement du cacircble sous-marin SAT-3WASCSAFE en 2001 pour La Reacuteunion etMaurice Lrsquoarriveacutee du LION en 2009 a connecteacute Madagascar aux deux icircles En 2010 lesComores et Madagascar se sont ouverts une voie vers lrsquoAfrique avec le cacircble EASSY Lrsquoin-terconnexion du LION 2 a deacuteveloppeacute lrsquoInternet agrave Mayotte tandis que le deacuteploiement ducacircble SEAS a ouvert les Seychelles agrave lrsquoInternet haut deacutebit La carte 5 indique les diffeacuterentscacircbles sous-marins preacutesents dans la ZOI

La ZOI srsquoengage dans le deacuteploiement de nouveaux liensLe cacircble MElting poT Indianoceanic Submarine System (METISS) drsquoune longueur de

3 500 kilomegravetres reliera Madagascar Maurice et La Reacuteunion agrave lrsquoAfrique du Sud La bandepassante du cacircble sera de 24 Tbs Sa mise en service est preacutevue pour le courant de lrsquoan-neacutee 2019 [Lemauricien]

Africa-1 est un cacircble reliant lrsquoAfrique du Sud le Moyen Orient et lrsquoAsie centrale Cecacircble de plus de 12 0000 kilomegravetres passera le long de la cocircte Est africaine avant de relierlrsquoArabie Saoudite lrsquoEacutegypte et le Pakistan La mise en service du cacircble est preacutevue pour lecourant de lrsquoanneacutee 2020 [Africa1]

En 2019 sera mis en service le cacircble IOX IOX est un cacircble sous-marin deacutedieacute agrave lrsquoicircleMaurice Il a pour but drsquooffrir une nouvelle liaison agrave Maurice en reliant lrsquoicircle agrave lrsquoAfrique etau reste du monde Il sera doteacute drsquoune capaciteacute de 54 Tbs [IOX]

La carte 6 repreacutesente lrsquoensemble des IXP preacutesents dans la Zone Oceacutean Indien En vertce sont les points drsquoeacutechanges deacutejagrave en service La France a degraves lrsquoanneacutee 2004 mis en placele point drsquoeacutechange agrave La Reacuteunion et en 2012 celui de Mayotte Ceux de Maurice et de

6

FIGURE 5 ndash Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source [Cablesmap])

Madagascar ont eacuteteacute mis en service en 2016 avec lrsquoaide de lrsquoUnion Africaine de lrsquoInter-net Society et du projet AXIS [AXIS] Les points bleus repreacutesentent les points drsquoeacutechangequi sont preacutevus drsquoecirctre deacuteployeacutes dans la zone oceacutean indien par le projet AXIS dans le fu-tur Drsquoici quelques anneacutees lrsquoensemble des territoires de la zone sera eacutequipeacute drsquoun pointdrsquoeacutechange Cet eacutequipement vise a maintenir le trafic de type Metropolitan Area Network(MAN) du pays ougrave il est installeacute Il facilite les eacutechanges entre les opeacuterateurs locaux enreacuteduisant la latence et en augmentant la qualiteacute de service

FIGURE 6 ndash Carte des points drsquoeacutechange preacutesents actuellement et dans un futur prochedans la ZOI

7

3 Probleacutematique

LrsquoInternet et ses applications ont eacuteteacute deacuteveloppeacutes dans des territoires ougrave les routes sontnombreuses Lrsquoicircle de La Reacuteunion comme beaucoup de territoires insulaires ne beacuteneacuteficiepas drsquoun nombre de liaisons physiques directes important Lrsquoeacutevolution de lrsquoInternet al-lant des applications toleacuterantes aux deacutelais vers des applications temps-reacuteel neacutecessite unerobustesse et une qualiteacute de service deacutependantes drsquoun maillage fort et de deacutelais courts

Lrsquoeacutetude drsquo[Anelli2012] a deacutemontreacute que les deacutelais agrave destination drsquoadresses aleacuteatoiressont sensiblement plus longs depuis La Reacuteunion que depuis Paris avec un eacutecart drsquoenvi-ron 180 ms Suite agrave ce constat lrsquoauteur a reacutealiseacute des simulations estimant les deacutebits asso-cieacutes avec un taux de pertes de 10 Ces simulations ont mis en avant des deacutebits eacutecouleacutesplus faibles pour un usager situeacute agrave La Reacuteunion qursquoun usager baseacute agrave Paris Une augmen-tation de la bande passante nrsquoentraicircnerait pas une diminution des deacutelais Le groupe detravail europeacuteen Reducing Internet Transport Latency (RITE) a reacutealiseacute une videacuteo explicativede ce pheacutenomegravene [RITE2014-2]

Cette thegravese vise agrave mettre en lumiegravere les principaux freins des deacutebits eacutecouleacutes

Dans une premiegravere eacutetape nous eacutetudierons lrsquoeacutevolution des deacutelais depuis La Reacuteunionen prenant comme base lrsquoeacutetude reacutealiseacutee par [Anelli2012]

Dans un second temps nous eacutetudierons les routes logiques de lrsquoInternet reacuteunionnais

Dans un dernier temps nous reacutealiserons une proposition drsquoeacutetude de meacutetrologie Cetteeacutetude vise agrave identifier la correacutelation des eacuteveacutenements de congestion entre les flots lrsquoimpor-tance des anomalies affectant Transmission Control Protocol (TCP) (pertes initiales fauxeacuteveacutenements de congestion) la reacutepartition des flots (en taille en protocole en application)et les paramegravetres de performances (taux de pertesRTT deacutebit eacutecouleacute)

4 Organisation de la thegravese

Suite agrave lrsquoexposition de notre probleacutematique le chapitre 1 preacutesente le contexte scienti-fique de nos travaux Dans un premier temps nous allons preacutesenter les caracteacuteristiquesde TCP et sa probleacutematique lieacutee aux reacuteseaux agrave forte capaciteacute de stockage Nous continue-rons avec une preacutesentation de quelques solutions Nous deacuteterminerons si lrsquoaccegraves Internetde La Reacuteunion doit ecirctre consideacutereacute comme un reacuteseau agrave forte capaciteacute de meacutemorisation Lasuite du chapitre inclura la deacutefinition de la meacutetrologie dans les reacuteseaux et une preacutesenta-tion des techniques de mesures active et passive

La premiegravere eacutetude est deacutecrite dans le chapitre 2 et deacutebute par la preacutesentation des ob-jectifs Un cahier des charges permettant de reacutepondre aux objectifs a eacuteteacute reacutedigeacute Ce cahierdes charges a deacuteboucheacute sur le deacuteploiement de la plate-forme de meacutetrologie active RunPLet du deacuteveloppement de deux outils drsquoaide agrave lrsquoanalyse rgeoloc et rtraceroute La preacutesen-tation du protocole de mesure a eacuteteacute reacutealiseacutee dans la partie preacuteceacutedant celle des reacutesultatsLe chapitre se conclut par une synthegravese des reacutesultats qui ont servi agrave nos contributions

La seconde eacutetude est preacutesenteacutee dans le chapitre 3 Les objectifs du chapitre sont preacute-senteacutes dans un premier temps et diviseacutes en deux Ce chapitre preacutesente la mise en oeuvredrsquoune plate-forme de meacutetrologie et du protocole de mesure associeacute Une section reacutesultatassocieacutee agrave une conclusion termine le chapitre Ce chapitre a fait lrsquoobjet drsquoune contributionscientifique

Nous concluons notre thegravese par un reacutesumeacute des diffeacuterentes contributions Un apportsur les perspectives qursquoautorisent nos travaux est proposeacute dans le chapitre 35

8

Chapitre 1

Eacutetat de lrsquoart

Transmission Control Protocol (TCP) est le protocole de transport le plus utiliseacute sur lrsquoIn-ternet Lrsquoeacutetude reacutealiseacutee par Center for Applied Internet Data Analysis (CAIDA) sur une du-reacutee de 2 ans du trafic passant par le point drsquoeacutechange (IXP) EQUNIX de Chicago a montreacuteque 90 97 des paquets Internet Protocol (IP) acheminent des segments TCP [EQUINIX]TCP est un protocole de transport qui rend un service de transfert fiable de donneacuteesLorsque la somme du deacutebit des eacutemetteurs TCP partageant une mecircme ressource du reacute-seau excegravede la capaciteacute de cette ressource il se produit de la congestion La congestionest un pheacutenomegravene indeacutesirable qui met le reacuteseau dans un eacutetat ougrave le service rendu est deacute-gradeacute Cette deacutegradation peut ecirctre seacutevegravere en fonction de lrsquointensiteacute du pheacutenomegravene Poureacuteviter que lrsquoeffet de la congestion empire quand elle apparaicirct TCP integravegre une fonctionde reacutesolution connue sous le nom de controcircle de congestion Le principe est que chaqueeacutemetteur deacutetecte la congestion et diminue son deacutebit drsquoeacutemission Pour se faire le controcirclede congestion srsquoappuie sur la boucle de controcircle constitueacutee entre lrsquoeacutemission drsquoun segmentde donneacutees et la reacuteception de lrsquoacquittement correspondant Le controcircle de congestionagit sur le deacutebit drsquoeacutemission de lrsquoeacutemetteur avec une latence lieacutee au Round-Trip delay Time(RTT) Lorsque le produit du RTT avec la capaciteacute drsquoeacutecoulement offerte par le reacuteseau estrelativement important le controcircle de congestion de TCP peine agrave utiliser les ressourcesdu reacuteseau efficacement Ce produit du deacutelai et du deacutebit repreacutesente la quantiteacute de donneacuteesnon acquitteacutees qui peut circuler On peut assimiler ce produit agrave la capaciteacute de stockage dedonneacutees dans le reacuteseau

Ces derniegraveres anneacutees lrsquoaugmentation de la bande passante a fait croicirctre significative-ment cette capaciteacute de stockage En effet comme les deacutelais nrsquoont pas diminueacute dans lesmecircmes proportions la capaciteacute de stockage nrsquoa fait que croicirctre Cette eacutevolution pose undeacutefi au controcircle de congestion de TCP pour maintenir ses performances Cette eacutevolutiona entraicircneacute une activiteacute intense de recherche pour traiter ce problegraveme de produit deacutelai-bande passante pour TCP Ainsi de nouvelles versions du controcircle de congestion de TCPont eacuteteacute eacutetudieacutees pour lrsquoadapter aux speacutecificiteacutes des reacuteseaux agrave forte capaciteacute de stockageLong Fat Network (LFN)

Si le stockage important de donneacutees dans le reacuteseau pose un problegraveme pour le controcirclede congestion de TCP qursquoen est-il en pratique dans le cas de lrsquoInternet agrave La Reacuteunion Pourreacutepondre agrave cette question il faut pouvoir mesurer lrsquoexistant Depuis quelques anneacutees ily a un inteacuterecirct croissant pour la mesure Une science de la mesure sur lrsquoInternet se deacute-veloppe Il faut chercher dans la croissance continue et soutenue de lrsquoInternet ainsi quedans lrsquoabsence drsquoune exploitation coordonneacutee les motivations agrave deacutevelopper la meacutetrologiesur Internet Cette meacutetrologie vise agrave mieux comprendre le fonctionnement de lrsquoInternet

Ce chapitre se compose de deux sections theacutematiques La premiegravere section 11 traitede la probleacutematique du controcircle de congestion de TCP utiliseacute sur les reacuteseaux agrave grande

9

capaciteacute de stockage La sous-section 111 rappelle le principe du controcircle de conges-tion et sa mise en œuvre dans TCP Dans la partie 112 les problegravemes speacutecifiques ducontrocircle de congestion de TCP appliqueacute dans le contexte des reacuteseaux agrave forte capaciteacute demeacutemorisation sont indiqueacutes Face agrave ces problegravemes des propositions ont eacuteteacute eacutetudieacutees quenous preacutesenterons dans les parties 113 et 114 Pour conclure cette section nous pose-rons dans la sous-section 115 les arguments qui permettent drsquoavancer que lrsquoicircle de LaReacuteunion a une connectiviteacute qui srsquoapparente agrave celle des reacuteseaux agrave forte capaciteacute de sto-ckageLa seconde section 12 est consacreacutee agrave la meacutetrologie du trafic Internet La deacutefinition et lesmeacutethodologies de la meacutetrologie sont indiqueacutees dans la partie 121 La preacutesentation de lameacutetrologie active sera reacutealiseacutee dans la section 122 suivie par celle de la meacutetrologie pas-sive dans la section 123 La comparaison entre la meacutetrologie active et passive termineracette preacutesentation et sera faite dans la partie 124 Pour conclure ce chapitre une synthegraveseest reacutealiseacutee par la section 13 dans laquelle nous tirons les enseignements pour mener deseacutetudes depuis et vers La Reacuteunion

11 Le controcircle de congestion TCP et les reacuteseaux agrave grande capa-citeacute de stockage

TCP est un protocole de transport creacuteeacute en 1980 et deacutecrit pour la premiegravere fois dans le[RFC793] il a subi depuis de nombreuses eacutevolutions comme lrsquoindique le [RFC7414] Lesuccegraves de TCP repose sur son service de transmission fiable et ordonneacutee drsquoun flux de don-neacutees asynchrones Crsquoest un protocole fonctionnant de point agrave point et de bout en bout au-trement dit entre lrsquoeacutemetteur et le reacutecepteur des donneacutees sans concerner les eacutequipementsintermeacutediaires TCP offre un service de communication eacutequivalent agrave un canal virtuel bi-directionnel entre 2 entiteacutes applicatives Le canal de communication se caracteacuterise par satransparence seacutemantique crsquoest-agrave-dire par lrsquoabsence drsquoalteacuteration des donneacutees transfeacutereacuteesPour reacutealiser cette fiabiliteacute de lrsquoeacutechange TCP supervise les eacutechanges de donneacutees par desacquittements (Acknowledgement (ACK)) Cette supervision forme une boucle de controcirclecorrespondant agrave lrsquoeacutemission de donneacutees et agrave la reacuteception de lrsquoacquittement correspondantElle se caracteacuterise par le deacutelai pris nommeacute RTT La correction des donneacutees perdues oualteacutereacutees en cours de transit srsquoeffectue par retransmission de ces donneacutees Si le principe defonctionnement de TCP srsquoeacutenonce facilement sa mise en œuvre est complexe du fait de lanon fiabiliteacute du protocole IP sous-jacent et de la diversiteacute des contextes drsquoutilisation deTCP Lrsquoarticle [Ros2005] deacutetaille les diffeacuterentes caracteacuteristiques du protocole lieacutees agrave lrsquoeacuteta-blissement de connexion la numeacuterotation des donneacutees et agrave la fiabilisation des eacutechanges

Outre lrsquoobjectif de fiabiliteacute TCP a aussi un objectif de performance pour le servicerendu en termes de deacutebit eacutecouleacute et drsquoutilisation des capaciteacutes de transmission du reacuteseauPour atteindre cet objectif pour le service TCP integravegre une fonction de controcircle de flux quirepose sur une fenecirctre glissante geacutereacutee par le reacutecepteur Ainsi le deacutebit drsquoeacutemission peut srsquoali-gner sur le deacutebit de reacuteception de sorte qursquoun reacutecepteur lent ne puisse ecirctre satureacute par unexpeacutediteur rapide La speacutecification initiale de TCP a eacuteteacute conccedilue sans prendre en compteles ressources du reacuteseau Cet oubli a eacuteteacute agrave la source de dysfonctionnements seacutevegraveres du reacute-seau comme lrsquoeffondrement ducirc agrave la congestion (congestion collapse) [Afanasyev2010] Lafonction de controcircle de congestion vise agrave une prise en compte des ressources disponiblesdu reacuteseau et agrave leurs utilisations efficaces Le controcircle de congestion a susciteacute un travail derecherche intensif et ce sujet reste encore drsquoactualiteacute comme lrsquoindique le [RFC6077]

111 Controcircle de congestion de TCP

Drsquoapregraves [Jain1990] la congestion srsquoexprime par lrsquoeacutequation matheacutematique 11

10

sumDemande gt Ressources (11)

Du point de vue drsquoun reacuteseau par commutation de paquets les ressources sont princi-palement les meacutemoires tampon des nœuds de commutation et la capaciteacute de transmissiondes artegraveres de communication La congestion apparaicirct au niveau des nœuds de commu-tation et plus particuliegraverement sur leurs interfaces de sortie La condition pour voir ap-paraicirctre une congestion est laquo si la somme des deacutebits des flux arrivant sur lrsquointerface desortie est supeacuterieure agrave la capaciteacute de transmission du lien en sortie raquo Dans cette situationune file drsquoattente se constitue et quand elle deacuteborde les effets neacutefastes de la congestionse concreacutetisent A savoir que le taux de pertes des paquets augmente dans le reacuteseau cequi se traduit au niveau du service par un deacutebit eacutecouleacute qui chute et un deacutelai de trans-fert qui augmente Dans [Chiu1989] les auteurs montrent que la performance du reacuteseauest lieacutee agrave la charge appliqueacutee au reacuteseau Formellement la charge srsquoexprime comme tauxdrsquoarriveacutee sur le taux de service Informellement la charge repreacutesente la proportion de lademande autrement dit du trafic eacutemis par rapport agrave la capaciteacute de transfert La figure11 illustre lrsquoeacutevolution du deacutebit eacutecouleacute (throughput) et du RTT en fonction de la chargeappliqueacutee au reacuteseau (load) Au deacutebut le deacutebit eacutecouleacute srsquoaccroicirct avec la charge alors queles deacutelais nrsquoaugmentent presque pas On est dans une phase de remplissage des liensLorsque la charge srsquoapproche du taux de remplissage maximum des liens du reacuteseau Ledeacutebit eacutecouleacute nrsquoaugmente presque plus alors que les deacutelais augmentent fortement Crsquoestla phase de remplissage des files drsquoattente Ces deux phases sont seacutepareacutees par un pointcaracteacuteristique qui srsquoappelle le point drsquoinflexion (knee) Lorsque les files drsquoattente sontpleines et que la charge du reacuteseau continue de srsquoaccroicirctre les files drsquoattente vont deacutebor-der Agrave partir de ce point appeleacute le point de retournement (cliff ) le reacuteseau rentre dans lrsquoeacutetatdit drsquoeffondrement ducirc agrave la congestion (congestion collapse)

FIGURE 11 ndash Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989])

Lrsquoeffondrement ducirc agrave la congestion est rapporteacute par [Nagle1984] Dans cet eacutetat le reacute-seau enregistre des retransmissions abusives effectue des transferts avec des deacutelais ten-dant vers lrsquoinfini et rend un service avec un deacutebit eacutecouleacute proche de zeacutero Lrsquoeffondrementducirc agrave la congestion srsquoexplique par le gaspillage des ressources utiliseacutees en amont du point

11

de perte du paquet La solution agrave lrsquoeffondrement ducirc agrave la congestion reacuteside en lrsquoalignementdu deacutebit de lrsquoeacutemetteur agrave la capaciteacute drsquoeacutecoulement du canal de communication offert parle reacuteseau afin de ne produire aucune perte Ainsi les objectifs assigneacutes au controcircle decongestion de TCP sont drsquoeacuteviter lrsquoeacutetat drsquoeffondrement ducirc agrave la congestion drsquoallouer eacutequi-tablement les ressources du reacuteseau entres les flux concurrents et drsquooptimiser les perfor-mances obtenues par chaque flux [RFC2914]

Le controcircle de congestion de TCP fonctionne sur le principe de la boucle fermeacutee avecle reacuteseau vu comme une boicircte noire ainsi preacutesenteacute par la figure 12 Apregraves une stimu-lation sous la forme de lrsquoenvoi de paquets lrsquoobservation du comportement de la boicirctenoire agrave ce stimulus sera analyseacute par le controcircleur situeacute dans lrsquoeacutemetteur Le controcircleur rap-proche lrsquoobservation faite en retour du stimulus (feedback) par rapport agrave lrsquoobjectif affecteacuteau controcircleur Celui-ci par reacutetro-action ajustera le nombre des paquets suivants envoyeacutesCet ajustement est le reacutesultat drsquoune fonction de controcircle qui se base sur une perceptionbinaire des retours agrave savoir absence ou preacutesence de congestion

FIGURE 12 ndash Boucle fermeacutee du CC de TCP

Dans [Gevros2001] lrsquoauteur liste les moyens pour effectuer les observations que lrsquoonnomme en fait des notifications dans le contexte des reacuteseaux Les notifications de lacongestion dans le reacuteseau peuvent ecirctre implicites ou explicites Dans le premier caselles sont deacuteduites par lrsquoabsence drsquoACK Lrsquoaugmentation des deacutelais et les pertes des don-neacutees sont des causes possibles pour la non-reacuteception de lrsquoACK A lrsquoinverse lrsquoabsence decongestion est deacuteduite par la reacuteception drsquoun ACK Cette reacuteception autorise lrsquoenvoi drsquounnouveau paquet comme le montre [Jacobson1988-1] Les notifications peuvent ecirctre ex-plicites si les paquets veacutehiculent une marque mise par lrsquoeacuteleacutement congestionneacute commecrsquoest le cas avec la proposition Explicit Congestion Notification (ECN) [RFC3168] Nous re-viendrons sur cette proposition dans la sous-section 113 Lorsque le controcircleur deacuteduitla preacutesence de congestion il reacuteduit le deacutebit drsquoeacutemission de la source Le deacutebit est controcircleacuteagrave lrsquoaide drsquoune fenecirctre appeleacutee la fenecirctre de congestion (Congestion Window (CWND) ω)Elle indique la quantiteacute de donneacutees qui peut ecirctre eacutemise sur un RTT Autrement dit elleindique combien de donneacutees non acquitteacutees peut recevoir le canal de communicationSa taille eacutevolue dans le temps en fonction de lrsquoeacutetat du reacuteseau et selon une fonction decontrocircle Additive Increase and Multiplicative Decrease (AIMD) La fenecirctre drsquoeacutemission uti-liseacutee par un eacutemetteur TCP est le minimum entre la fenecirctre de congestion et la fenecirctreglissante du controcircle de flux Le controcircle de congestion comporte deux phases distinctes[Gevros2001]

mdash La premiegravere phase se nomme eacutevitement de la congestion (congestion avoidance) et sesitue autour du point drsquoinflexion de la figure 11

mdash La seconde phase se nomme reacutesolution de la congestion (congestion recovery) Ellese deacuteclenche quand lrsquoeacutetat du reacuteseau se situe au delagrave du point drsquoinflexion

Dans la phase de congestion avoidance le controcircle de congestion de TCP utilise deux al-gorithmes le deacutemarrage en douceur (slow-start (SS)) et lrsquoeacutevitement de congestion (conges-tion avoidance (CA)) Au deacutebut de la connexion TCP nrsquoa aucune connaissance de lrsquoeacutetat dureacuteseau autrement dit de lrsquoeacutetat du canal de communication entre lrsquoeacutemetteur et le reacutecep-teur TCP utilise lrsquoalgorithme du deacutemarrage en douceur pour sonder le canal Lrsquoobjectif

12

est drsquoatteindre le point drsquoinflexion rapidement et sans risquer de congestionner le canalpar des rafales Pour cela lrsquoalgorithme du deacutemarrage en douceur va eacutetaler sur plusieursRTT la croissance de la taille fenecirctre de congestion jusqursquoagrave atteindre une estimation dupoint drsquoinflexion Ainsi lrsquoeacutemetteur commence avec une fenecirctre de congestion assez pe-tite et lrsquoouvre au fur et agrave mesure et de plus en plus vite avec lrsquoarriveacutee des acquittementsPlus preacuteciseacutement le rythme de croissance de la taille de la fenecirctre de congestion est surle doublement tous les RTT Quant la fenecirctre de congestion atteint un certain seuil noteacuteslow-start threshold (ssthresh) le deacutemarrage en douceur srsquoarrecircte et lrsquoalgorithme drsquoeacutevite-ment de congestion est maintenant utiliseacute Cet algorithme augmente lineacuteairement et pluslentement que le deacutemarrage en douceur la taille de la fenecirctre de congestion En lrsquoabsencedrsquoindication explicite par le reacuteseau du deacutebit disponible sur le canal de communicationlrsquoeacutemetteur TCP continue de faire le sondage du canal et veacuterifie si le deacutebit eacutecouleacute peut ecirctreencore augmenteacute Pour lrsquoauteur de [Sallantin2014] lorsque la connexion TCP utilise lrsquoal-gorithme drsquoeacutevitement de congestion elle entre alors dans un eacutetat stable Dans cet eacutetat laconnexion doit se deacuterouler avec un deacutebit eacutecouleacute eacuteleveacute Crsquoest une indication que le pointdrsquoinflexion est atteint

La figure 13 donne une repreacutesentation simplifieacutee des eacutetats du controcircle de congestionde TCP Elle indique que lrsquoeacutetat stable peut ecirctre quitteacute si la connexion est libeacutereacutee ou si ily a un eacuteveacutenement de congestion TCP assimile les pertes implicitement agrave un eacuteveacutenementde congestion Lrsquoeacuteveacutenement de congestion fait basculer le controcircle de congestion de TCPdans la phase de reacutesolution de la congestion Dans cette phase la reprise de la perte oudes pertes est effectueacutee et la taille de la fenecirctre de congestion est diminueacutee et ceci afin dediminuer le deacutebit drsquoeacutemission

On distingue deux faccedilons de deacutetecter un eacuteveacutenement de congestion Une meacutethodesrsquoappuie sur la reprise de perte de TCP par retransmission des donneacutees perdues sur ex-piration drsquoun temporisateur (Retransmission TimeOut (RTO)) Une autre meacutethode utilisela caracteacuteristique de TCP qui consiste agrave ce que le reacutecepteur envoie un acquittement agravechaque segment de donneacutees reccedilu en seacutequence Ce segment porte le numeacutero des derniegraveresdonneacutees reccedilues seacutequentiellement Ainsi la reacuteception de donneacutees entraicircnant une rupturede la numeacuterotation en seacutequence geacutenegravere lrsquoeacutemission drsquoun acquittement dupliqueacute (Dupli-cate Acknowledgement (DupAck)) par le reacutecepteur Agrave la reacuteception de trois DupAck parlrsquoeacutemetteur les donneacutees indiqueacutees par la rupture de seacutequencement sont consideacutereacutees per-dues et retransmises sans attendre lrsquoexpiration du RTO Ce principe de retransmissionrapide porte le nom de fast retransmit (FR) Lrsquoalgorithme de reacutecupeacuteration rapide (fast reco-very (FR)) va maintenir la quantiteacute de donneacutees en transit dans le canal de communicationpour eacuteviter lrsquoeacutemission drsquoune rafale lorsqursquoun nouvel acquittement sera reccedilu En lrsquoabsencedu fast recovery agrave la reacuteception drsquoun nouvel acquittement la fenecirctre pourrait se vider parune rafale correspondant agrave des eacutemissions de paquets de donneacutees dos agrave dos sur un deacute-bit supeacuterieur agrave celui du deacutebit drsquoeacutecoulement du canal Ceci aurait pour effet de saturer lecanal et de renvoyer la connexion TCP dans une phase de reacutesolution de la congestion

Lorsque les eacutemissions de lrsquoeacutemetteur sont bloqueacutees par des donneacutees eacutemises et jamaisacquitteacutees le blocage est rompu par le RTO et ceci quel que soit lrsquoeacutetat Les deacutetails dela mise en œuvre des algorithmes du controcircle de congestion TCP sont deacutecrits par le[RFC5681]

Historiquement la version deacutenommeacutee TCP Tahoe incorporait la fonction de controcirclede congestion deacuteveloppeacutee en 1888 Elle comportait les algorithmes de slow-start conges-tion avoidance et de fast retransmit [Jacobson1988-1] La reprise de perte par fast retransmitsouffrait drsquoinefficaciteacute elle a eacuteteacute corrigeacutee avec lrsquoalgorithme du fast recovery Cette versionagrave quatre algorithmes est la version connue sous le nom de Reno et publieacutee la premiegraverefois en 1997 par le [RFC2001] Le couplage fast retransmit - fast recovery souffrait de deacutefauts

13

Deacutebut13

de13

connexion

Deacutemarrage13

en13

douceur

Etat13

stable

FRFR

Fin13

de13

connexion

3 Dupack

nouvel 13

ack

RTO

RTO

cwnd gt ss

tresh

SYN13

SYNACK

FIN-FINACK

FIGURE 13 ndash Etats du controcircle de congestion de TCP

lorsqursquoun eacuteveacutenement de congestion comportait plusieurs pertes Le [RFC2582] apportaitun correctif en 1999 On parla alors de version NewReno du controcircle de congestion En2005 une eacutetude montra que crsquoeacutetait la version du controcircle de congestion de TCP la plusutiliseacutee sur lrsquoInternet [Medina2005] Depuis de nouvelles versions ont eacuteteacute deacuteployeacutees dansles systegravemes drsquoexploitation tels que Windows et Linux appeleacutes respectivement C-TCP[Tan2006] et CUBIC [Ha2008] Dans la section 112 ces versions seront deacutetailleacutees

Le fonctionnement caracteacuteristique du controcircle de congestion de TCP est illustreacute parla figure 14 extraite de [Huston2000] Elle montre lrsquoeacutevolution de la fenecirctre de conges-tion dans le temps (exprimeacutee en terme de RTT) sur un canal de communication virtuelentre 2 stations Il srsquoagit ici drsquoun sceacutenario ideacutealiseacute dans lequel la connexion TCP nrsquoest pasen concurrence avec drsquoautres connexions La congestion se produit toujours agrave la mecircmevaleur de fenecirctre et pour laquelle la file drsquoattente deacuteborde Cette figure montre les deuxcaracteacuteristiques du controcircle de congestion de TCP qui deacutecoulent de la phase drsquoeacutevitementde congestion et de reacutesolution de la congestion et qui sont

mdash Lrsquoagressiviteacute elle provient du sondage du canal de communication LrsquoeacutemetteurTCP va chercher agrave accroicirctre le deacutebit eacutecouleacute en augmentant graduellement son deacutebitdrsquoeacutemission par lrsquoagrandissement de la taille de la fenecirctre de congestion

mdash La reacuteactiviteacute lorsque le canal de communication est plein et qursquoil deacuteborde quandcette perte est deacutetecteacutee lrsquoeacutemetteur TCP reacuteagit et diminue la taille de sa fenecirctre afinde diminuer son deacutebit drsquoeacutemission

Ces deux caracteacuteristiques donnent cette figure en dents de scie de la fenecirctre de conges-tion

112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de sto-ckage

Un reacuteseau agrave forte capaciteacute de stockage est un reacuteseau avec un produit deacutelai-bandepassante (Bandwidth Delay Product (BDP)) eacuteleveacute Dans lrsquoouvrage [Peterson2007] lrsquoauteureffectue une analogie du produit deacutelai-bande passante avec un tuyau Le deacutelai corres-pond agrave la longueur du tuyau et la bande passante au diamegravetre du tube Ainsi le BDPest le volume du tube Dans le cas drsquoun reacuteseau informatique le volume du tuyau srsquoex-prime en bits Ainsi lorsqursquoun canal de communication entre un eacutemetteur et un reacutecepteurpreacutesente un produit deacutelai-bande passante important un volume important de bits (autre-ment dit de donneacutees) peut ecirctre eacutemis avant de recevoir une notification Du point de vue

14

FIGURE 14 ndash Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP

de lrsquoeacutemetteur TCP ce volume de donneacutees injecteacute dans le reacuteseau sont des donneacutees nonencore acquitteacutees Les reacuteseaux qui offrent des canaux de communication avec un pro-duit deacutelai-bande passante important sont nommeacutes en anglais Long Fat Network (LFN) Le[RFC1072] preacutecise qursquoun LFN agrave un produit deacutelai-bande passante supeacuterieur agrave 12 5 Ko

Sachant que le controcircle de congestion de TCP srsquoappuie sur une reacutetro-action selon unepeacuteriode de RTT et que le deacutebit eacutecouleacute maximal est atteint lorsque la fenecirctre drsquoeacutemissionest au moins supeacuterieure au produit deacutelai(RTT)-bande passante du canal de communica-tion lrsquoutilisation de TCP sur un reacuteseau LFN a des conseacutequences neacutegatives sur la perfor-mance Les causes sont agrave chercher du cocircteacute du RTT et du produit deacutelai-bande passante quiprennent tous les deux des valeurs importantesDans le cas du RTT crsquoest le deacutelai de reacuteactiviteacute de TCP qui est impacteacute En effet quandle RTT est eacuteleveacute la dynamique de TCP est ralentie car lrsquoeacutemetteur TCP doit attendre pluslongtemps pour recevoir un ACK et savoir quoi faire par la suite

Pour ce qui concerne le produit deacutelai-bande passante crsquoest le deacutebit eacutecouleacute qui peutecirctre faible par rapport au deacutebit du canal de communication (sa bande passante) La fe-necirctre drsquoeacutemission de TCP nrsquoatteint pas la valeur du produit deacutelai-bande passante lrsquoeacutemet-teur se trouve alors bloqueacute en attente de lrsquoACK pour eacutemettre de nouvelles donneacutees Cespeacuteriodes de blocage concourent agrave faire chuter le taux drsquoutilisation du canal de communi-cation

Par la suite nous allons deacutetailler les conseacutequences de la faible reacuteactiviteacute et drsquoune fe-necirctre drsquoeacutemission importante agrave atteindre sur lrsquoefficaciteacute de TCP La probleacutematique se poseen terme de deacutemarrage de connexion et son implication pour le transfert des flots courtsde taille maximale possible de la fenecirctre de congestion et de reacutesolution de la congestion

Le deacutemarrage de connexion

Le deacutebut des connexions de TCP se fait agrave lrsquoaide de lrsquoalgorithme du deacutemarrage en dou-ceur Nous avons vu preacuteceacutedemment que ce meacutecanisme double la fenecirctre de congestionen un RTT Lorsque la fenecirctre de congestion atteint la valeur seuil ssthresh lrsquoalgorithmedrsquoeacutevitement de congestion est utiliseacute La valeur initiale du seuil est fixeacutee arbitrairementce qui soumet TCP agrave deux problegravemes Le doublement de la fenecirctre de congestion quandelle atteint des valeurs importantes constitue des increacutements avec une granulariteacute de plusen plus grosse Si la valeur de ssthresh est trop grande par rapport au BDP avec un grosincreacutement le deacutepassement du BDP peut conduire agrave eacutemettre trop de paquets causantdes pertes multiples induisant une augmentation de la latence et une reacuteduction du deacute-bit eacutecouleacute Dans le cas ougrave la valeur du ssthresh est trop basse par rapport au BDP la

15

connexion TCP va utiliser preacutematureacutement lrsquoalgorithme drsquoeacutevitement de congestion avecune increacutementation lineacuteaire Ce changement preacutematureacute aura pour conseacutequence une sous-utilisation de lrsquoalgorithme de deacutemarrage en douceur speacutecialement dans le cas ougrave le BDPest tregraves eacuteleveacute [Wang2004]

Le deacutemarrage de connexion est particuliegraverement important pour les flots courts TCP(short lived TCP flow) Un flot court TCP se deacutefinit comme un flot dont la taille est in-feacuterieure ou eacutegale agrave 10 segments TCP [Sallantin2014] La probleacutematique des flots courtsprovient du fait qursquoils nrsquoont pas assez de donneacutees pour quitter lrsquoeacutetape du deacutemarrage endouceur En effet la taille de la fenecirctre de congestion nrsquoa pas le temps drsquoatteindre la va-leur du produit deacutelai-bande passante que la totaliteacute des donneacutees ont eacuteteacute transmises Laconseacutequence est qursquoils ont fonctionneacute avec une fenecirctre de congestion qui est resteacutee rela-tivement petite Dans le cas drsquoun LFN le rapport de la taille de la fenecirctre de congestionsur le produit deacutelai-bande passante tend vers zeacutero et neacutecessite plusieurs RTT Il srsquoensuitque le deacutebit eacutecouleacute est extrecircmement faible De plus si le flot court souffre drsquoun eacuteveacutene-ment de congestion il sera particuliegraverement peacutenaliseacute Il a de fortes chances que la reprisesrsquoeffectue avec un RTO avec un deacutelai maximum de 1 agrave 3 secondes [RFC6298] Ce genrede flots nrsquoa pas toujours assez de donneacutees eacutemises apregraves la perte pour geacuteneacuterer trois Du-pAck et proceacuteder agrave une reprise par fast retransnmit Comme ces flots repreacutesentent drsquoapregraves[Ciullo2009] 90 des flux preacutesents dans lrsquoInternet leur sous-performance sur les LFN estprobleacutematique

La reacutesolution de la congestion

TCP deacutetecte une perte par lrsquoexpiration du RTO ou par la reacuteception de trois DupAckTCP va reacuteagir en deux temps en renvoyant le paquet perdu et en divisant par deux lafenecirctre de congestion Si la taille de la fenecirctre est importante la division par deux vaentraicircner une chute significative de la capaciteacute drsquoenvoi Par rapport au produit deacutelai-bande passante cette division par deux peut entraicircner une sur-reacuteaction de lrsquoeacutemetteur Ledeacutebit eacutecouleacute apregraves un eacuteveacutenement de congestion peut devenir faible et se pose le problegravemede la dynamique de sondage

Dynamique du sondage

TCP a un objectif de performance en terme de deacutebit eacutecouleacute et drsquoutilisation des capa-citeacutes de transmission du reacuteseau TCP possegravede un comportement conservateur Avec lafonction de controcircle AIMD TCP aura besoin drsquoun cycle eacutegal agrave ω2 RTT pour reacutecupeacutererune taille de fenecirctre eacutegale agrave celle avant reacuteduction Dans les reacuteseaux agrave forte capaciteacute destockage TCP tend agrave ecirctre trop prudent agrave ouvrir sa fenecirctre de congestion trop lentementLa capaciteacute de stockage importante demande un nombre de cycles important pour quela fenecirctre de congestion puisse couvrir le BDP Durant ce temps il est important de nepas avoir de pertes Lrsquoexemple donneacute par le [RFC3649] preacutesente un reacuteseau agrave une capa-citeacute de 10 Gbits un deacutelai de 100 ms et une taille de paquets drsquoun maximum de 1500octets Cela demanderait un eacutechange drsquoune dureacutee de deux heures environ De plus la to-taliteacute des paquets devront ecirctre transmis dans la dureacutee indiqueacutee preacuteceacutedemment Le tauxde perte maximal permettant lrsquousage de la totaliteacute de la bande passante est de lrsquoordrede 10minus10 Crsquoest un taux de perte irreacutealiste Il faut donc appliquer une autre fonction decontrocircle pour utiliser efficacement la capaciteacute des liens et pour reacutepondre rapidement auxchangements drsquoeacutetats du reacuteseau

16

113 Un controcircle de congestion de TCP adapteacute aux LFN

Pour rappel dans la partie 111 nous avons vu que le controcircle de congestion de TCPse deacutecoupait en deux phases La premiegravere phase de congestion avoidance comporte les al-gorithmes de sondage alors que la seconde phase dite de congestion recovery comporte lesalgorithmes de reacutesolution de la congestion Nous preacutesentons les propositions qui visentagrave changer le controcircle de congestion de TCP sur ces deux phases pour les adapter auxcontraintes des LFN et donc traiter les problegravemes que nous avons mis en eacutevidence dansla sous-section 112 Lrsquoutilisation de TCP sur des reacuteseaux agrave forte capaciteacute de stockage asusciteacute des propositions qui sont classeacutees dans le tableau 11 Ces propositions vont ecirctredeacutetailleacutees dans la suite de ce manuscrit

TABLE 11 ndash Tableau de synthegravese des propositions

Phase Problegraveme SolutionsCongestion avoidance Deacutemarrage de

connexionInitial Spreading Reacuteduc-tion du RTO Quick-startJump Start

Congestion recoveryReacutesolution decongestion

MulTCP

Dynamique dusondage

HighSpeed TCP C-TCPBIC CUBIC

Le deacutemarrage de connexion

Lrsquoideacutee de la premiegravere solution est de reacuteduire le nombre de cycles au deacutemarrage drsquounflot Le doublement de la taille lorsque la fenecirctre de congestion vaut 2 segments parexemple conduit agrave un increacutement qui reste faible sur un RTT Le principe de la premiegraveresolution est drsquoaugmenter la taille initiale de la fenecirctre de congestion (Initial Window (IW))[RFC6928] Avec une taille initiale de fenecirctre de congestion eacutequivalent agrave 10 Maximun Seg-ment Size (MSS) lrsquoeacutemetteur peut transmettre degraves le deacutebut de connexion une rafale de 10segments Parmi les avantages de cette solution on peut citer la reacuteduction de la latencedu transfert de donneacutees en consideacuterant que le canal ne sera pas congestionneacute Un des in-conveacutenients de cette solution est la possibiliteacute de congestionner la file drsquoattente du goulotdrsquoeacutetranglement Afin de reacutesoudre ce problegraveme [Sallantin2014] propose lrsquoInitial SpreadingCette proposition combine lrsquoaugmentation de la fenecirctre drsquoeacutemission et le meacutecanisme drsquoes-pacement meacutecanisme limitant la preacutesence de rafales Ces travaux ont fait lrsquoobjet drsquouneproposition aupregraves de lrsquoInternet Engineering Task Force (IETF) [Arnal2014]

La deacutetection drsquoune perte au deacutepart du deacutemarrage en douceur se fait agrave travers lrsquoex-piration du RTO soit trois secondes Pour ameacuteliorer la reprise sur erreur le [RFC6298]propose de reacuteduire la dureacutee du RTO agrave une seconde Cette reacuteduction du RTO autorise uneretransmission plus rapide des paquets perdus et apporte un gain relativement importantpour des flots qui ont une latence tregraves faible comme celle des flots courts

Une autre solution eacutevalueacutee par [Scharf2008-1] et deacutecrite par le [RFC4782] se nommeQuick-start Lrsquoeacutemetteur eacutemet une requecircte contenant le deacutebit drsquoeacutemission qursquoil souhaite uti-liser Chaque nœud traverseacute peut alors accepter rejeter ignorer ou modifier la requecircteen fonction de son deacutebit disponible Pour bien fonctionner ce meacutecanisme de neacutegociationneacutecessite que lrsquoensemble des routeurs traverseacutes aient reacutepondu agrave la requecircte La figure 15compare les performances du deacutemarrage en douceur (en rouge) et de Quick-start sur unteacuteleacutechargement vu depuis le serveur Le serveur a eacutemis deux requecirctes la premiegravere agrave undeacutebit de 8192 Mbits (en vert) et lrsquoautre pour un deacutebit drsquoune valeur de 512 Mbits (en

17

bleu) Lrsquoaxe des abscisses repreacutesente la latence (dureacutee de la connexion) depuis lrsquoeacutemissionde la demande drsquoeacutetablissement de connexion et en ordonneacutee le deacutebit drsquoeacutemission Les deacute-bits ont eacuteteacute calculeacutes agrave partir de la quantiteacute de donneacutees moyenne eacutemises en un RTT Les reacute-sultats montrent des performances supeacuterieures de Quick-start par rapport au deacutemarrageen douceur En effet une requecircte de Quick-start avec un deacutebit suffisamment eacuteleveacute per-met drsquoatteindre rapidement lrsquoutilisation maximale de la bande passante disponible Ledeacutemarrage en douceur limite la croissance du deacutebit drsquoeacutemission On remarque eacutegalementque si la valeur seuil du deacutemarrage est trop basse le deacutebit drsquoeacutemission croicirct beaucoupmoins rapidement (lien en pointilleacute sur la figure 15) Quick-start reste performant sur lesflots courts en appliquant un deacutebit drsquoeacutemission qui sera eacutequivalent agrave un flot long

FIGURE 15 ndash Principe de Quick-Start (Source [Scharf2008-1])

Dans lrsquoarticle [Liu2007] lrsquoauteur preacutesente Jump Start Cette proposition reacutealise uneestimation des donneacutees precirctes agrave ecirctre envoyeacutees ainsi que du RTT Lrsquoobjectif est drsquoeacutemettreles segments de faccedilon reacuteguliegravere en un RTT Ce meacutecanisme srsquoavegravere trop agressif dans lesenvironnements congestionneacutes Le nombre de segments envoyeacutes en un RTT peut ecirctreimportant et ainsi causer de seacutevegraveres deacutegradations de performance

La reacutesolution de la congestion

Quand TCP a atteint lrsquoeacutetat stable et qursquoune perte est deacutetecteacutee la fenecirctre de conges-tion va ecirctre diviseacutee par deux Cette reacuteduction diminuera le deacutebit eacutecouleacute Il est importantpour TCP drsquoecirctre reacuteactif vis agrave vis des pertes Pour cela de nouveaux algorithmes doiventecirctre mis en place dans la phase drsquoeacutevitement de congestion Ces algorithmes devront ecirctrereacuteactifs aux pertes mais sans sur-reacuteagir Ces nouveauteacutes doivent permettre de retrouverrapidement un deacutebit eacutecouleacute important

Lorsque plusieurs flux TCP empruntent une route congestionneacutee ils sont soumis aumecircme taux de pertes Le but eacutetant de reacutepartir eacutequitablement la bande passante dispo-nible Une approche de diminution moins agressive de la fenecirctre de congestion consistea reacutealiser des connexions TCP parallegraveles Lrsquoobjectif est drsquoavoir un flux TCP se comportantcomme lrsquoagreacutegation de plusieurs flux

Dans lrsquoarticle [Crowcroft1998] les auteurs proposent une version du controcircle de conges-tion de TCP qui se comporte drsquoune maniegravere eacutequivalente agrave N sessions TCP parallegraveles Ilsrsquoagit de MulTCP MulTCP geacutenegravere un flux TCP unique ougrave les sessions virtuelles sont reacute-parties uniformeacutement afin drsquoobtenir le reacutesultat maximal en terme de deacutebit Le controcircle decongestion de TCP change lorsqursquoil utilise lrsquoalgorithme drsquoeacutevitement de congestion et qursquoil

18

deacutetecte un eacuteveacutenement de congestion (par deacutetection drsquoau moins une perte drsquoun segmentdans une fenecirctre de congestion) Les eacutequations suivantes sont utiliseacutees dans chacun descas MulTCP

ACK ω larr ω +N

ω

DROP ω larr ω times (1minus 1

2N)

(12)

En eacutevitement de congestion lorsqursquoun ACK est reccedilu MulTCP augmente sa fenecirctre decongestion (ω) de N segments par RTT Lors de la perte de segments (DROP) MulTCPreacuteduit sa fenecirctre de ω(2N) plutocirct que la valeur par deacutefaut de ω2 La figure 16 montrelrsquoeacutevolution de la fenecirctre de congestion de MulTCP par rapport agrave TCP On voit sur la fi-gure 16 que MulTCP a de meilleures performances qursquoun flux TCP normal Lorsque lesperformances sont combineacutees le reacutesultat est supeacuterieur agrave un flux unique

FIGURE 16 ndash Simulation de MulTCP avec N=5 (Source [Huston2006])

Dynamique du sondage

Lrsquoobjectif de lrsquoeacutemetteur de TCP est drsquoenvoyer le plus de donneacutees le plus vite possibleMais agrave condition qursquoelles arrivent sans produire de la congestion sinon les donneacutees se-ront perdues et il faudra les reacute-eacutemettre Il faut eacutegalement tenir compte des autres flotsen partageant eacutequitablement les ressources du reacuteseau Une approche pour traiter le pro-blegraveme de la dynamique du sondage consiste agrave changer la fonction de controcircle de TCP

Lrsquoobjectif de HighSpeed-TCP (HS-TCP) est drsquoatteindre les hauts deacutebits en ayant desperformances comparables agrave TCP classique dans les environnements agrave faible BDP [RFC3649]La version du controcircle de congestion HighSpeed-TCP utilise le meacutecanisme drsquoAdditive In-crease and Multiplicative Decrease combineacute agrave un facteur calculeacute en fonction de la taille dela fenecirctre de congestion tel qursquoindiqueacute par les eacutequations 13 En deccedila drsquoun certain seuilde ω la reacuteponse de HighSpeed-TCP est eacutequivalente agrave TCP Reno HS-TCP est limiteacute durantla phase de deacutemarrage en douceur Durant cette phase HS-TCP peut normalement en-voyer un grand nombre de paquets Lrsquoenvoi drsquoun trop grand nombre de donneacutees risquedrsquooccasionner de la congestion Le [RFC3742] propose de limiter agrave 100 paquets la capaciteacutedrsquoenvoi drsquoHS-TCP durant la phase de deacutemarrage en douceur

ACK ω larr ω +α(ω)

ωDROP ω larr (1minus β(ω))times ω

(13)

19

La figure 17 illustre le comportement de la fenecirctre de congestion de HighSpeed-TCPLorsqursquoune perte est deacutetecteacutee la diminution de la fenecirctre est moins importante gracircceau facteur β Le retour a la valeur preacuteceacutedente se fait beaucoup plus rapidement qursquoavecReno ou NewReno (en gris clair sur la figure) gracircce au facteur α Ainsi HS-TCP offre unemeilleure utilisation de la capaciteacute disponible sur le lien

FIGURE 17 ndash Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source [Afanasyev2010])

Dans [Tan2006] lrsquoauteur propose une version de TCP alliant lrsquoapproche pro-activeet reacuteactive Une approche pro-active utilise les variations du RTT pour estimer lrsquoeacutetat dureacuteseau Alors qursquoune approche reacuteactive agit quand lrsquoeacuteveacutenement de congestion srsquoest pro-duit Lrsquoobjectif est de maintenir de bonnes performances sur reacuteseaux avec un haut deacutebitet un grand RTT Compound-TCP (C-TCP) maintient deux fenecirctres de congestion Lrsquounecroicirct de faccedilon lineacuteaire mais deacutecroicirct via un certain coefficient en cas de perte La secondefenecirctre est lieacutee agrave lrsquoapproche pro-active de TCP-Vegas [Brakmo1994] La taille de la fenecirctrede congestion reacuteellement utiliseacutee est la somme des deux fenecirctres Lrsquoeacutequation 14 illustrecette addition

ACK ω larr ωreno + ωfast (14)

Si le RTT est bas alors la fenecirctre ωfast va croicirctre rapidement Si C-TCP rencontre uneperte alors ωreno diminuera rapidement pour compenser lrsquoaugmentation preacuteceacutedente deωfast Ce systegraveme cherche agrave garder une valeur constante de la fenecirctre drsquoeacutemission C-TCPutilise efficacement des liens sur les reacuteseaux agrave forte capaciteacute de stockage C-TCP est sujetau mecircme deacutefaut que TCP-Vegas sur lrsquoexactitude des mesures RTT Si les flux en concur-rence les uns avec les autres dans le reacuteseau observent des valeurs RTT minimales diffeacute-rentes le flux se voyant un RTT plus eacuteleveacute sera beaucoup plus agressif et injuste pourlrsquoautre flux La figure 18 illustre le fonctionnement de la fenecirctre de congestion de C-TCPLa partie convexe de la courbe repreacutesente un fonctionnement plus proche de TCP RenoCela indique donc une valeur de ωfast faible Nous remarquons qursquoapregraves une perte TCPessaye de reacutecupeacuterer rapidement la valeur preacuteceacutedente Lors de pertes multiples la fenecirctrede congestion suit une forme proche agrave ce moment de la courbe de HighSpeed-TCP (voirfigure 17) Ce comportement est la conseacutequence drsquoune valeur eacuteleveacutee de ωfast C-TCP per-met ainsi drsquoatteindre le deacutebit maximum disponible sur le lien tout en lissant sa capaciteacutedrsquoenvoi en se basant sur le RTT C-TCP est la version de TCP installeacutee nativement sur lesystegraveme drsquoexploitation Windows de Microsoft

Lrsquoalgorithme de controcircle de congestion de TCP connu sous le nom Binary IncreaseCongestion control (BIC) vise agrave une convergence rapide [Xu2004] La fenecirctre doit atteindrela taille maximale possible sans qursquoil y ait de pertes Pour cela il met en œuvre une nou-velle fonction du controcircle de la taille de la fenecirctre de congestion La fonction de controcircle

20

FIGURE 18 ndash Comportement de la fenecirctre de congestion de Compound-TCP (Source [Afanasyev2010])

de BIC est structureacutee en trois phases (Additive Increase Binary Search Max Probing) tellesqursquoillustreacutees par la figure 19a Au deacutemarrage de la connexion BIC va increacutementer lineacuteai-rement la fenecirctre de congestion Crsquoest la phase drsquoAdditive Increase

Durant la phase Binary Search BIC va essayer de deacutecouvrir la taille optimale de lafenecirctre de congestion La taille optimale est la taille permettant drsquoeacutemettre le maximum dedonneacutees sans essuyer de pertes Elle se base sur lrsquoeacutetude entre la valeur minimale (ωmin)et la valeur maximale (ωmax) de la fenecirctre de congestion Ces variables vont permettredrsquoaffiner la valeur de la fenecirctre de congestion Au deacutebut de la connexion ωmin est mise agrave1 et ωmax est mis arbitrairement agrave une valeur eacuteleveacutee

Lorsqursquoune perte est deacutetecteacutee la fenecirctre de congestion va ecirctre reacuteduite et prendre pourvaleur la moyenne entre ωmin et ωmax ωmin prend alors pour valeur la taille de la fenecirctrede congestion apregraves reacuteduction et ωmax la valeur de la fenecirctre de congestion avant la perteSi lrsquoeacutecart entre la valeur de la fenecirctre de congestion avant et apregraves la perte est supeacuterieuragrave une constante Smax alors la fonction de controcircle de BIC entre en phase dite AdditiveIncrease Durant cette phase Smax va servir de valeur drsquoincreacutementation pour la fenecirctrede congestion agrave chaque RTT Par la suite et si aucune perte nrsquoest de nouveau deacutetecteacuteela fonction de controcircle de BIC retourne en phase de Binary Search Lrsquoobjectif est de stabi-liser la taille de la fenecirctre aux alentours de la valeur de ωmax rencontreacutee avant la pertepreacuteceacutedente

Lorsque cette valeur est deacutepasseacutee BIC entre dans la phase dite Max Probing Lrsquoaug-mentation de la fenecirctre de congestion est alors lineacuteaire Lrsquoobjectif eacutetant la recherche drsquounnouvel ωmax La figure 19b illustre le fonctionnement de la fenecirctre de congestion dansle temps Lors du deacutebut de connexion BIC se comporte comme Reno avec le meacutecanismedu deacutemarrage en douceur Degraves qursquoune perte est deacutetecteacutee la diminution de la fenecirctre estalors moins agressive qursquoavec Reno Au centre de la courbe nous remarquons la fonctiondrsquoaccroissement avec les trois phases

BIC est un controcircle de congestion performant dans les reacuteseaux agrave forte capaciteacute destockage Neacuteanmoins BIC peut ecirctre trop agressif pour les flux qui ont des courts deacutelaisCela a pour conseacutequence un partage ineacutequitable de la bande passante disponible avec lesflux qui ont des longs deacutelais

Afin de reacutesoudre le problegraveme drsquoiniquiteacute lieacute au RTT lrsquoalgorithme CUBIC propose dechanger la fonction de controcircle de la taille de la fenecirctre de congestion pour la rendreplus agressive La fonction retenue est cubique et son eacutevolution est repreacutesenteacutee par la fi-gure 110a Contrairement agrave la figure drsquoaccroissement de BIC (fig 19a) qui comporte troisphases la fonction drsquoaccroissement de CUBIC nrsquoen compte que deux (fig 110a) Sur lafigure 110b on constate que ces deux phases sont preacutesentes tout au long de lrsquoeacutevolutionde la fenecirctre de congestion de CUBIC Ces deux phases ne sont pas forceacutement conseacute-cutives lrsquoune de lrsquoautre Apregraves la deacutetection drsquoune perte CUBIC va essayer de croicirctre le

21

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez BIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deBIC-TCP (Source [Afanasyev2010])

FIGURE 19 ndash Fonctionnement de BIC TCP

plus rapidement possible jusqursquoagrave ωMax Lorsque ωMax est atteint la taille de la fenecirctre vasrsquoincreacutementer lentement Mais plus la valeur drsquoω est eacuteloigneacutee en taille de ωMax plus lacroissance va srsquoacceacuteleacuterer Lrsquoavantage de CUBIC sur BIC est le remplacement la fonction decontrocircle lineacuteaire par une fonction cubique pour plus drsquoagressiviteacute Lrsquoalgorithme CUBICest deacutecrit par le [RFC8312]

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez CUBIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deCUBIC-TCP (Source [Afanasyev2010])

FIGURE 110 ndash Fonctionnement de CUBIC

114 Controcircle de congestion avec implication des routeurs

Drsquoautres approches ont eacuteteacute eacutetudieacutees pour aider le controcircle de congestion de TCP Cesapproches impliquent les routeurs et ne reposent plus que sur le principe de bout-en-boutpropre agrave TCP

Explicit Congestion Notification (ECN) vise agrave renforcer lrsquoindication drsquoun eacuteveacutenement decongestion [RFC3168] Avec ECN la congestion est signaleacutee avant que la perte drsquoun pa-quet ne se produise Lors de la reacuteception drsquoun paquet indiquant une congestion lrsquoeacutemet-teur va alors reacuteduire sa fenecirctre de congestion et sa fenecirctre drsquoeacutemission La reacuteduction dela capaciteacute drsquoeacutemission de lrsquoeacutemetteur eacutevitera pertes et retransmissions et une reacuteductiondes deacutelais de reprise Lrsquousage de cette option neacutecessite que lrsquoeacutemetteur le reacutecepteur et lesrouteurs du chemin soient capables de geacuterer les notifications explicites Avec ECN lrsquoin-formation de congestion est transmise agrave lrsquoeacutemetteur Aucune indication sur le lieu preacutecisde la congestion est indiqueacutee

eXplicit Control Protocol (XCP) est un protocole de controcircle de congestion utilisantles notifications explicites de deacutebit [Katabi2002] En cela il reprend lrsquoideacutee de Quick-startCependant il se diffeacuterencie par le deacutecouplage opeacutereacute entre la probleacutematique du partageeacutequitable entre les flots et celle de lrsquoefficaciteacute du transfert Dans lrsquoarchitecture de proto-coles XCP se situe entre TCP et IP XCP repose sur un en-tecircte qui va servir aux routeurs

22

traverseacutes pour indiquer le deacutebit drsquoeacutemission pour le flot La valeur drsquoadaptation de la fe-necirctre de congestion est calculeacutee agrave partir des informations contenues dans lrsquoen-tecircte XCPXCP propose un controcircle de congestion qui fonctionne sur un reacuteseau 100 XCP Uneseconde limite est lrsquoiniquiteacute avec les autres protocoles de transport Les performancessont fortement deacutegradeacutees si diffeacuterents protocoles de bout en bout sont exeacutecuteacutes dans lemecircme reacuteseau tels que TCP XCP possegravede de mauvaises performances si des routeurs IPclassiques (non-XCP) se trouvent au niveau du goulot drsquoeacutetranglement

Afin de reacutesoudre le problegraveme drsquointeropeacuterabiliteacute Dans [Lopez2006] lrsquoauteur proposeXCP-interoperable (XCP-i) une version XCP qui garde les meacutecanismes de controcircle XCPsans ajouter drsquoeacutetat de flux Lrsquoobjectif drsquoXCP-i est de deacuteployer XCP sur un reacuteseau com-prenant des routeurs XCP et non-XCP Pour cela XCP-i va fonctionner en deux phasesDans une premiegravere phase il va deacutecouvrir les nuages non-XCP Un nuage non-XCP est unensemble de routeurs non capables de traiter XCP En comparant les champs Time-To-Live(TTL) drsquoIP et drsquoXCP le nombre de routeurs non-XCP preacutesents dans le reacuteseau peut ecirctredeacuteduit La seconde phase consiste agrave deacuteterminer les ressources du nuage non-XCP En ra-joutant un champ last_xcp_routeur XCP-i garde en meacutemoire lrsquoadresse du dernier routeurXCP traverseacute Agrave partir drsquoalgorithmes drsquoestimation de bande passante la bande passantedu nuage non-XCP sera estimeacutee entre les deux nœuds XCP La derniegravere phase pour reacutea-liser une inter-opeacuterabiliteacute complegravete entre routeurs classiques et routeurs XCP consiste agraveprendre en consideacuteration la bande passante estimeacutee dans les calculs du feedback de XCPLe protocole XCP-i va creacuteer un routeur XCP virtuel agrave la place du nuage non-XCP Gracirccea ces meacutecanismes un reacuteseau heacuteteacuterogegravene devient virtuellement homogegravene pour XCP Lesperformances de XCP-i sont comparables agrave celle de XCP [Lopez2006] XCP-i reacutesout leproblegraveme drsquointer-opeacuterabiliteacute de XCP sur des reacuteseaux non 100 XCP

Ces solutions preacutesentent le deacutesavantage de devoir ecirctre deacuteployeacutees eacutegalement au seindes routeurs Le principal avantage de ces solutions est une indeacutependance au deacutelai Lesprobleacutematiques lieacutees au deacutelai que lrsquoon a preacutesenteacutees preacuteceacutedemment sont alors inopeacute-rantes Dans le cadre de La Reacuteunion les deacutelais peuvent ecirctre importants

115 Caracteacuterisation de La Reacuteunion

Lrsquoaugmentation des deacutebits drsquoaccegraves srsquoaccompagne de lrsquoaugmentation de la capaciteacute desliens drsquointerconnexion comme celles des cacircbles sous-marins Malgreacute cette augmentationdes deacutebits le temps de propagation reste inchangeacute Dans cette partie nous deacuteterminonsagrave partir de quel deacutebit un accegraves Internet agrave La Reacuteunion peut ecirctre sujet aux problegravemes ren-contreacutes sur les LFN

Dans la section 21 nous avons vu que La Reacuteunion est raccordeacutee agrave Internet par deuxaccegraves reposant sur des cacircbles sous-marins le SAFE et le LION Le cacircble SAFE est prolongeacutepar le cacircble SAT-3WASC Le temps de propagation (tp) sur un cacircble peut ecirctre estimeacutepar la formule matheacutematique 15 dans laquelle d repreacutesente la distance et c la vitesse depropagation du signal sur le support

tp =d

c(15)

Si nous retenons la route directe entre La Reacuteunion et la France hexagonale qui passepar le plus long des accegraves constitueacute par les cacircbles SAFE et SAT-3WASC Sachant que lecacircble SAFE a une longueur totale de 13 500 km pour aller de lrsquoAfrique du Sud agrave lrsquoAsie Sion fait lrsquohypothegravese que lrsquoicircle de La Reacuteunion se situe agrave une distance eacutequivalente agrave la moitieacutedu cacircble SAFE La longueur du cacircble pour La Reacuteunion est de 6 750 Km La vitesse de

23

propagation du signal pour une fibre optique est eacutegale agrave la vitesse de la lumiegravere (299 792Kms) Lrsquoapplication de la formule 15 donne tp1 avec

tp1 = 12times dSAFEc = 22 52ms (16)

tp1 approxime le temps de propagation entre La Reacuteunion et le point de sortie du cacircbleSAFE en Afrique du Sud ou en Asie Pour obtenir le RTT ce temps est agrave doubler Onobtient alors la valeur RTT1 = 45 04 ms

La seconde partie du trajet de lrsquoAfrique du Sud jusqursquoen Europe emprunte le cacircbleSAT-3WASC Drsquoapregraves [Cablesmap] la longueur du cacircble est de 14 350 Km Le temps depropagation entre lrsquoAfrique du Sud et lrsquoEurope noteacute tp2 srsquoexprime comme

tp2 = (dSATminus3WASC)c = 47 87ms (17)

Le RTT sur ce cacircble est de RTT2 = 95 74 msAu total le RTT incompressible pour joindre lrsquoEurope en passant par les cacircbles SAFESAT-3WASC consiste agrave additionner le RTT de chaque cacircble agrave savoir RTT1 et RTT2 Le RTTincompressible est donc minimal de 140 78ms Ce deacutelai comme nous venons de le calcu-ler ne prend en compte que la propagation Il neacuteglige le temps de transmission du paquetainsi que les temps drsquoattente avant la transmission

Lrsquoeacutetude preacutesenteacutee dans[Anelli2012] a mesureacute un RTT minimal pour les paquets quit-tant lrsquoicircle de La Reacuteunion de 185 ms Ce reacutesultat a eacuteteacute obtenu par une eacutetude de mesuresdepuis les locaux de lrsquoUniversiteacute de La Reacuteunion La figure 111 repreacutesente la Probabi-lity Density Function (PDF) des RTT mesureacutes Cette fonction est compareacutee agrave celle qui estobtenue depuis la France hexagonale et de Paris en particulier On constate une forte si-militude sur la forme des courbes La courbe de La Reacuteunion enregistre un deacutecalage dansle temps de 185 ms par rapport agrave celle de Paris Ce deacutecalage repreacutesente le RTT minimummesureacute pour rejoindre la meacutetropole et acceacuteder agrave lrsquoInternet

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

FIGURE 111 ndash Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

Si lrsquoon considegravere la valeur de BDP de 12 5 Ko indiqueacutee par le [RFC1072] comme lalimite basse drsquoun LFN et si nous reprenons les diffeacuterentes TAI preacutesenteacutees dans la section21 nous pouvons calculer le produit deacutelai-bande passante drsquoun canal de communica-tion entre La Reacuteunion et la meacutetropole Il est fait lrsquohypothegravese pour ce calcul que le goulotdrsquoeacutetranglement est donneacute par lrsquoaccegraves agrave Internet Le tableau 12 preacutesente les reacutesultats ob-tenus

24

TABLE 12 ndash Approximation du produit deacutelai bande passante de la connectiviteacute de LaReacuteunion agrave lrsquoInternet

NomhhhhhhhhhhhhhhhhhhhBande passante

RTT (en secondes)Estimeacute 0141

Mesureacute 0185

Modem56 Kbits 987 o 130 Ko128 Kbits 226 Ko 296 Ko512 Kbits 902 Ko 118 Ko

ADSL1 Mbits 176 Ko 231 Ko8 Mbits 141 Ko 185 Ko20 Mbits 353 Ko 463 Ko

VDSL 50 Mbits 881 Ko 116 Mo

Fibre

35 Mbits 617 Ko 809 Ko100 Mbits 176 Mo 231 Mo200 Mbits 353 Mo 463 Mo

1 Gbits 176 Mo 231 Mo

Le tableau preacutesente en gras les produits deacutelai-bande passante deacutepassant la limite des12 5 Ko Ainsi les reacutesultats sont assez eacuteloquents Degraves que lrsquoon arrive sur un accegraves ADSLavec un deacutebit minimal drsquo1 Mbits nous avons un BDP supeacuterieur agrave la limite fixeacutee par le[RFC1072] Ainsi rapidement lrsquoeacutevolution des deacutebits proposeacutes sur lrsquoicircle et les capaciteacutes descacircbles sous-marins associeacutes agrave un deacutelai eacuteleveacute ont fait de lrsquoInternet reacuteunionnais un reacuteseauqui a les caracteacuteristiques drsquoun LFN

Nous avons vu que TCP est un protocole de transport dont la performance est deacutepen-dante du RTT et du BDP Les deacutelais sont une des caracteacuteristiques des LFN La Reacuteunionest un reacuteseau agrave forte capaciteacute de stockage due agrave des deacutelais importants Il est important demesurer pour comprendre lrsquoimpact de cette caracteacuterisation sur les performances de TCP

12 Meacutetrologie du trafic Internet

Avec lrsquoInternet qui devient de plus en plus gros et de plus en plus complexe la meacutetro-logie est une activiteacute qui vise agrave mieux comprendre le fonctionnement de lrsquoInternet Nousallons dans cette partie du manuscrit preacutesenter les techniques de meacutetrologie appliqueacuteesagrave lrsquoInternet

121 Deacutefinition

Meacutetrologie est un mot composeacute de deux termes grecs Le premier metron signifie lamesure tandis que logos fait reacutefeacuterence agrave la science Par deacutefinition la meacutetrologie deacutesignela science de la mesure Par la suite le terme meacutetrologie fera uniquement reacutefeacuterence agrave la meacute-trologie appliqueacutee aux reacuteseaux informatiquesLa meacutetrologie signifie donc la mesure des caracteacuteristiques drsquoun reacuteseau sous de nombreuxaspects Cette science est devenue un outil indispensable pour avoir une compreacutehensionde divers aspects de lrsquoInternet On peut citer la complexiteacute la qualiteacute de service et laqualiteacute utilisateur la performance du reacuteseau la performance des protocoles le fonction-nement ou encore la validation des modegravelesLa meacutetrologie Internet englobe deux types drsquoactiviteacutes La premiegravere est lrsquoeacutetude des para-megravetres physiques de la qualiteacute de service La seconde consiste a mettre en eacutevidence lesproblegravemes lieacutes agrave lrsquoInternet [Larrieu2010]

25

Dans [Paxson2001] lrsquoauteur preacutesente lrsquoapproche research driven et lrsquoapproche measure-ment driven pour deacutefinir les objectifs drsquoune eacutetude de meacutetrologie Le choix drsquoune approcheva aider une personne souhaitant faire de la meacutetrologie sur la bonne faccedilon drsquoaborderlrsquoeacutetude qursquoelle veut mettre en place

Lrsquoexpression research driven peut ecirctre traduite par axeacutee sur la recherche Elle consisteagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires de lancer les campagnes de mesures et drsquointerpreacuteter les reacute-sultats Une meacutetrique se deacutefinit comme une grandeur mesurable et speacutecifieacutee de maniegravererigoureuse Une bonne meacutetrique doit pouvoir se mesurer de faccedilon reproductible ecirctreutile en pratique pour les utilisateurs et les administrateurs du reacuteseau [RFC2330] Cetteapproche est celle geacuteneacuteralement utiliseacutee par les opeacuterateurs et les groupes de recherchesElle est deacuteveloppeacutee par le groupe de travail IP Performance Metrics (IPPM) de lrsquoIETF Cegroupe de travail a produit de nombreux documents pour deacutefinir les mesures de per-formances Lrsquoapproche research driven comporte un deacutefaut principal En laissant de cocircteacutecertaines meacutetriques des aspects du comportement du reacuteseau ne sont pas eacutetudieacutes Parexemple une eacutetude restreinte aux deacutelais ne peut indiquer les raisons de la variation desdeacutelais dans le temps

Lrsquoapproche measurement driven peut se traduire en la mesure pour la mesure Cettemeacutethode consiste agrave mettre en place une infrastructure de mesures afin de reacutecupeacuterer lemaximum drsquoinformations puis effectuer toutes les analyses possibles sur les traces col-lecteacutees et interpreacuteter les reacutesultats obtenus Une telle meacutethode peut srsquoutiliser lorsque lrsquoonsouhaite mettre en avant le comportement geacuteneacuteral drsquoun lien Cette approche permet agrave ladiffeacuterence de la preacuteceacutedente drsquoanalyser agrave plusieurs reprises une mecircme source de donneacuteesen fonction des reacutesultats obtenus

Le tableau 13 reacutesume les deux approches de conduite de projet en meacutetrologie

TABLE 13 ndash Comparatif entre les approches de meacutetrologie

Research Driven Measurement Driven1 - Meacutetriques deacutefinies preacutealablement2 - Utilisation drsquoun outil adapteacute

1 - Collecte des donneacutees2 - Analyse exhaustive

Ces deux approches sont compleacutementaires lrsquoune de lrsquoautre et srsquoappliquent dans lesdeux classes de techniques de mesures les techniques de mesures actives et les tech-niques de mesures passives

122 Meacutetrologie active

La meacutetrologie active consiste agrave injecter un trafic speacutecifique et agrave mesurer en reacuteceptionlrsquoeffet sur le reacuteseau agrave eacutetudier Lrsquohypothegravese faite par la meacutetrologie active est que la mesurefaite de bout en bout est reacuteveacutelatrice de la performance du service du reacuteseau telle qursquoellepeut ecirctre perccedilue par une application Les paquets eacutemis sont des sondes qui en emprun-tant la route entre la source et la destination expeacuterimentent la performance du canal decommunication Il convient de limiter le trafic des sondes afin qursquoil ne vienne pas pertur-ber le trafic et donc fausser la mesure Les meacutetriques mesureacutees par les mesures activessont geacuteneacuteralement des meacutetriques associeacutees agrave la topologie du reacuteseau ou au trafic commeles routes ou les deacutelais Dans le cas de la meacutetrologie active il se peut que lrsquoeacutemetteur soiteacutegalement le collecteur La figure 112 illustre ce principe

La meacutetrologie active est opeacutereacutee agrave lrsquoaide drsquooutils speacutecifiques de geacuteneacuteration et de collectede sondes Le tableau 14 indique les meacutetriques obtenues avec les outils de meacutetrologiepreacutesenteacutes par la suite

26

FIGURE 112 ndash Principe de la meacutetrologie active

TABLE 14 ndash Classement des outils

XXXXXXXXXXXOutilMeacutetriques

RTT Routes Deacutebits

Ping XTraceroute X XParis Traceroute X XReverse-traceroute X XTraceIXroute X XPathchar XClink XIperf X

La mesure du RTT est geacuteneacuteralement obtenue par lrsquooutil ping (Packet Internet Groper)Cet outil se preacutesente sous la forme drsquoune commande dans un systegraveme de type Unix Ellesert en premier lieu agrave veacuterifier la connectiviteacute agrave Internet et lrsquoaccessibiliteacute drsquoun nœud Ensecond lieu avec cette veacuterification le RTT et la longueur de la route exprimeacutee en nombrede sauts sont deacutetermineacutes Elle utilise le protocole Internet Control Message Protocol (ICMP)pour effectuer la mesure Un message ICMP Echo request est eacutemis Le destinataire renvoieagrave lrsquoeacutemetteur un message ICMP Echo reply La peacuteriode qui seacutepare lrsquoeacutemission de la reacuteceptiondu coteacute eacutemetteur est mesureacutee

Pour en savoir plus sur la connectiviteacute drsquoun nœud et notamment sur la route emprun-teacutee pour atteindre une destination donneacutee lrsquooutil traceroute offre le moyen de cette deacute-couverte [Jacobson1989-1] Cet outil se preacutesente comme pour ping sous la forme drsquounecommande de type Unix Son principe de fonctionnement est baseacute sur un envoi successifde messages avec un champ TTL du paquet IP qui va croissant Le routeur qui reccediloit unmessage dont le TTL du paquet a atteint la valeur zeacutero envoie un message ICMP TimeExceeded pour reporter lrsquoerreur agrave lrsquoeacutemetteur Par ce message il indique en adresse sourcelrsquoadresse IP de son interface qui a rejeteacute le paquet Ainsi si un paquet ayant un TTL posi-tionneacute agrave n est envoyeacute vers une destination donneacutee le routeur situeacute agrave n sauts de la sourceva faire connaicirctre son adresse IP et ceci tant que le chemin vers la destination est supeacute-rieur agrave n sauts [Crovella2006] Le reacutesultat est lrsquoensemble des nœuds traverseacutes reacutepondantau protocole ICMP De nouveaux outils utilisant le principe de traceroute furent deacutevelop-peacutes pour reacutepondre agrave drsquoautres probleacutematiques comme la preacutesence des points drsquoeacutechangeou encore lrsquoasymeacutetrie des liens

La reacuteponse afficheacutee par la commande traceroute nrsquoest pas la seule route existanteEn exeacutecutant agrave plusieurs reprises la mecircme commande traceroute les reacuteponses obtenuespeuvent ecirctre diffeacuterentes A cause de lrsquoeacutequilibrage de charge (load-balancing) la sortie drsquounrouteur ne sera pas toujours la mecircme Lrsquoeacutequilibrage des charges sert agrave reacutepartir le traficsur diffeacuterents liens Ainsi il est possible que deux paquets provenant de la mecircme sourcevers la mecircme destination nrsquoempruntent pas la mecircme route Sur la figure 113 les liensphysiques entre les diffeacuterents nœuds sont indiqueacutes en rouge Les traits en pointilleacute repreacute-sentent le chemin emprunteacute par les messages ICMP envoyeacutes par la source La figure 113amontre le reacutesultat trouveacute par traceroute La route emprunteacutee est SRC A D DST

27

Traceroute va envoyer 3 paquets avec un champ TTL eacutegal agrave 2 Dans le cas de cet exemplelrsquoensemble des paquets est dirigeacute vers B Ainsi malgreacute lrsquoabsence de liaison physique di-recte entre les nœuds A et D traceroute nous indique la preacutesence drsquoune route entre ceuxdeux eacutequipements Lrsquooutil Paris-traceroute vise agrave traiter ce problegraveme [Augustin2006]La figure 113b montre la route deacutecouverte par Paris-traceroute La route afficheacutee estSRC A C DST On remarque que la route obtenue existe physiquement Pour obte-nir ce reacutesultat Paris-traceroute change le numeacutero drsquoidentification du flux agrave lrsquoeacutemission despaquets ICMP Cette modification oblige les routeurs agrave suivre une seule et unique routeParis-traceroute autorise eacutegalement lrsquoaffichage des numeacuteros de voies logiques MPLS

(a) Traceroute

(b) Paris-traceroute

FIGURE 113 ndash Illustration du pheacutenomegravene drsquoeacutequilibrage des charges

MultiProtocol Label Switch (MPLS) est un meacutecanisme de commutation rapide de pa-quets fondeacute sur des adresses de format fixe et sans structure hieacuterarchique [RFC3031]Ces adresses sont des numeacuteros de voies logiques appeleacutees des eacutetiquettes ou labels (paranglicisme) Dans le cas de lrsquoutilisation de traceroute avec MPLS il faut que le routeurMPLS puisse envoyer un message ICMP Le [RFC4950] documente une simple extensionagrave ICMP pour retourner de lrsquoinformation speacutecifique agrave MPLS autrement dit pour qursquounrouteur MPLS puisse indiquer des informations speacutecifiques agrave MPLS dans le paquet ICMPeacutemis en cas de problegraveme [Donnet2012] a eacutetudieacute les possibiliteacutes offertes par des routeursMPLS

Dans les explicit tunnels la structure interne du tunnel est entiegraverement visible et chaquenœud dans le Label Switched Path (LSP) est marqueacute comme nœud MPLS Dans ce type detunnel le champ ttl-propagate qui est dans lrsquoen-tecircte MPLS des paquets et le [RFC4950] sontappliqueacutes Cela signifie que le champ TTL du datagramme IP est deacutecreacutementeacute agrave chaquerouteur rencontreacuteDans les implicit tunnels le LER drsquoentreacutee active lrsquooption ttl-propagate mais les LSR nrsquoim-pleacutementent pas le [RFC4950] La deacutecreacutementation du TTL est effective mais aucune infor-mation de routeur MPLS nrsquoest visibleDans les opaque tunnels crsquoest lrsquoinverse de lrsquoimplicit tunnels Les routeurs impleacutementent le[RFC4950] Le nœud drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Le TTL est alors deacutecreacute-menteacute agrave la sortie du tunnel MPLS Le paquet ICMP-reply indique quand mecircme lrsquoexistencedrsquoun tunnel MPLSPour les invisible tunnels le LER drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Dans ce casle TTL est deacutecreacutementeacute uniquement lors du dernier routeur du tunnel Le [RFC4950] nrsquoestpas impleacutementeacute par le dernier routeur du LSP Cela implique lrsquoabsence drsquoinformation

28

sur le meacutecanisme MPLS au sein des paquets ICMP On nrsquoa alors pas drsquoinformations surlrsquoexistence drsquoun tunnel ICMP sur la route emprunteacutee

Avec lrsquoacheminement avec MPLS des mauvaises valeurs de TTL peuvent ecirctre obte-nues agrave cause du type de tunnel mis en œuvre Il est donc important que le [RFC4950] soitimpleacutementeacute dans les routeurs

FIGURE 114 ndash Taxonomie des configurations de tunnels MPLS et des comportements detraceroute correspondants (Source [Donnet2012] )

Paris-traceroute propose lrsquoaffichage des informations MPLS lorsque celles-ci sont dis-ponibles [Augustin2007] La texte ci-dessous illustre les reacutesultats obtenus par Paris-traceroutesur un Explicit tunnel On y voit lrsquoaffichage des marques MPLS avec le TTL associeacute agravechaque nœud

traceroute [(412131413533456) -gt (818216615733457)]protocol icmp algo hopbyhop duration 3 s1 4121314133 23266 ms 2542 ms 3696 ms2 4121313397 6811 ms 5613 ms 4635 ms3 10322161 5779 ms 6841 ms 4073 msMPLS Label 16445 TTL=1 | 2129964 1032237 2223 ms 2249 ms 2264 msMPLS Label 16386 TTL=2 | 2129965 4121312850 2185 ms 2245 ms 2097 msMPLS Label 16442 TTL=3 | 2129966 10322193 3551 ms 9330 ms 7775 ms7 41213133158 2337 ms 3088 ms 2250 ms8 4121312854 195439 ms 195555 ms 195512 ms9 213242121233 211737 ms 211724 ms 212013 ms10 469148181 234190 ms 234271 ms 234323 ms11 4687222 236854 ms 236798 ms 237063 ms12 213224250110 237108 ms T0 236580 ms T0 236570 msT013 2132242502 237213 ms 236631 ms 236694 ms14 213224201252 239100 ms 239461 ms 238680 ms15 8182166157 250874 ms 249608 ms 248057 ms

Avec traIXroute lrsquoobjectif est de deacutecouvrir les diffeacuterents points de peering (IXP) sur unchemin vers une destination [Nomikos2016] Pour lrsquoidentification des nœuds drsquoeacutechangecette version de traceroute combine deux bases de donneacutees compleacutementaires qui sontPeeringDB [PeeringDB] et Packet Clearing House [PCH] Avec une geacuteolocalisation desadresses retourneacutees la liste des pays traverseacutes peut ecirctre eacutetablie

29

Drsquoapregraves [Steenbergen2009] laquo lrsquooutil de deacutepannage numeacutero 1 pour veacuterifier la connec-tiviteacute drsquoun nœud reste traceroute raquo pour les administrateurs reacuteseaux mais laquo les liens asy-meacutetriques sont les fleacuteaux numeacutero un de lrsquooutil raquo car laquo le chemin de retour est entiegraverementmasqueacute raquo Afin de corriger cela lrsquooutil reverse-traceroute propose drsquoobtenir une routenon pas entre la source et la destination mais entre la destination et la source [Katz2010]pour cela lrsquooutil va utiliser lrsquoenregistrement des adresses IP des routeurs sur le chemindu retour agrave lrsquoaide des options drsquoen-tecircte Record-Route et Timestamp drsquoIP

Pour deacuteterminer le deacutebit pathchar [Jacobson1997] vise agrave donner le deacutebit saut par sautvers une destination Aussi il reprend le principe de traceroute en eacutemettant des sondesavec le champ TTL avec une valeur croissante Lorsqursquoil injecte le trafic de sondes vers unnœud du chemin il le fait avec des paquets de taille variable Ainsi pathchar deacuteterminela bande passante disponible entre chaque nœud rencontreacute

Lrsquooutil Clink [Downey1999] est similaire agrave pathchar La diffeacuterence se fait au niveausur le nombre de paquets envoyeacutes Clink envoie un nombre de paquets plus importantque Pathchar Ainsi les mesures reacutealiseacutees par Clink auront une meilleure preacutecision

Iperf [Tirumala2005] est un outil pour mesurer la bande passante et la qualiteacute drsquounlien reacuteseau Ce dernier est deacutelimiteacute par deux machines sur lesquelles est installeacute IperfUne machine tient le rocircle de serveur tandis que la seconde machine sera parameacutetreacuteecomme client

Pour des mesures plus repreacutesentatives il est neacutecessaire drsquoaugmenter les points decollectes Des outils de meacutetrologie active ont eacuteteacute conccedilus pour ecirctre reacutepartis sur plusieursnœuds Ces outils se preacutesentent sous la forme de plates-formes de meacutetrologie active deacute-ployeacutees agrave travers le monde De nos jours on compte de nombreuses plates-formes demeacutetrologie active Comme chaque plate-forme a un objectif preacutecis et pour identifier laplate-forme approprieacutee pour reacutealiser une eacutetude preacutecise lrsquoauteur de [Bajpai2015-1] effec-tue une comparaison des diffeacuterentes plates-formes selon 5 critegraveres qui sont

1 lrsquoeacutechelle la couverture et la dureacutee de vie de la plate-forme

2 le mateacuteriel physique utiliseacute pour la sonde

3 les meacutetriques disponibles

4 lrsquoarchitecture de mesure de la plate-forme

5 lrsquoimpact de son utilisation pour la recherche

De cette comparaison nous avons gardeacute 4 plates-formes que sont Atlas RIPE NCC BIS-Mark DASU SamKnows Ces plates-formes ont eacuteteacute gardeacutees car elles autorisent lrsquoeacutetudedes performances des reacuteseaux drsquoaccegraves Nous y avons ajouteacute les plates-formes Archipe-lago et Planet-Lab Ces deux plates-formes ne font pas partie du document drsquoorigine maisfont lrsquoobjet drsquoune utilisation par de nombreux participants tel que lrsquoindique le nombrede sondes actives de ces deux plates-formes

En 2007 le CAIDA a deacuteployeacute sa propre plate-forme de mesures [Archipelago] Atravers le deployement de nœuds (des sondes dans le vocabulaire de Archipelago) surlrsquoensemble de la planegravete lrsquoobjectif est drsquooffrir des accegraves pour effectuer des mesures avecdes outils tels que ping et traceroute Archipelago est composeacutee agrave la date du 1er Mars2017 de 170 sondes reacuteparties dans 59 pays et sur tous les continents

Dans le courant de lrsquoanneacutee 2010 le Regional Internet Registry (RIR) europeacuteen RIPENCC a deacutemarreacute la distribution de sondes pour la creacuteation de la plate-forme Atlas [Ripe2010]Cette plate-forme vise agrave creacuteer un reacuteseau de sondes pour lrsquoeacutetude de la connectiviteacute de lrsquoIn-ternet Composeacutee actuellement de pregraves de 10 000 sondes reacuteparties agrave travers le monde elleest capable drsquoeffectuer des tests de meacutetrologie active autour des commandes ping DNSHTTP NTP traceroute et Paris-traceroute

30

Agrave lrsquoinitiative de Georgia Tech la plate-forme Broadband Internet Service Benchmark (BIS-Mark) a vu le jour en 2010 Lrsquoobjectif est la reacutealisation drsquoun eacutetat des lieux des performancesdes accegraves Internet [Sundaresan2011] La plate-forme est composeacutee de 405 routeurs instru-menteacutes avec OpenWrt laquo Le projet OpenWrt est un systegraveme drsquoexploitation Linux ciblantles appareils embarqueacutes OpenWrt fournit un systegraveme de fichiers entiegraverement inscriptibleavec gestion des modules drsquoinstallation de logiciels Cela libegravere la seacutelection et la configu-ration des applications fournies par le fournisseur et permet de personnaliser lrsquoappareilgracircce agrave lrsquoutilisation de progiciels adapteacutes agrave nrsquoimporte quelle application raquo [OpenWrt] Lessondes sont distribueacutees dans 34 pays agrave travers le monde

DASU est un utilitaire deacuteveloppeacute en 2010 agrave lrsquoUniversiteacute de Northwestern Le logicielcouple meacutetrologie active et passive avec pour objectif de caracteacuteriser les performancesdes utilisateurs Lrsquooutil fut deacuteveloppeacute comme une extension drsquoun logiciel peer-to-peer Bit-Torrent [Sanchez2013] Depuis Juillet 2010 plus de 90 000 personnes reacuteparties agrave travers147 pays utilisent DASU

En 2003 des chercheurs ameacutericains ont deacuteployeacute une plate-forme de test Planet-Lab[Chun2003] En 2008 une extension europeacuteenne [PlanetLabEurope] a vu le jour Planet-Lab deacutepasse le seul objectif de meacutetrologie elle vise aussi de tester des nouveaux servicesde communication en situation reacuteelle Les nœuds Planet-Lab ont pour Operating System(OS) Fedora Il est possible drsquoinstaller nrsquoimporte quel logiciel du moment qursquoil est com-patible avec cet OS Avec une certaine liberteacute il est possible drsquoeffectuer des tests et desmesures depuis 425 sites reacutepartis sur tous les continents

La plate-forme SamKnows a vu le jour en 2008 [SamKnows] SamKnows sert agrave lrsquoeacutetudedes performances des connexions des particuliers et des entreprises Elle est composeacuteede pregraves de 440 000 sondes Cette infrastructure est partenaire de 36 Fournisseurs drsquoAccegravesInternet (FAI) de tous les continents

Le tableau 15 reacutesume les possibiliteacutes offertes par les plates-formes La colonne Impactsur la recherche est deacutetermineacutee agrave partir du nombre de citations par des articles scientifiquessuivis par le site Google Scholar

La plate-forme de mesures Atlas RIPE NCC [Ripe2010] a eacuteteacute utiliseacutee dans le contexteinsulaire de Cuba Dans lrsquoarticle [Bischof2015] lrsquoauteur cherche agrave caracteacuteriser lrsquoaccegraves In-ternet cubain Dans ses reacutesultats lrsquoauteur a montreacute une forte asymeacutetrie des routes in-ternationales pour le trafic cubain Drsquoun point de vue de la topologie physique cette icirclepossegravede une connectiviteacute qui peut par certains aspects ressembler agrave de celle de lrsquoicircle de LaReacuteunion

Lrsquoicircle de La Reacuteunion bien que Franccedilaise est rattacheacutee administrativement au RIR dela zone Afrique (AfriNIC) LrsquoAfriNIC est le dernier RIR creacuteeacute et les eacutetudes de meacutetrolo-gie concernant cette zone sont peu nombreuses Nous pouvons citer [Gupta2014] qui sepenche sur lrsquointerconnexion des FAI sur le continent africain Cette eacutetude montre que leseacutechanges de paquets ne se font pas au sein du continent africain mais en Europe La rai-son avanceacutee par lrsquoauteur est un coucirct drsquointer-connexion infeacuterieur en Europe Ces regravegles deroutage on des conseacutequences sur les deacutelais et donc sur les performances sur le servicede transport rendu par TCP Ces reacutesultats ont eacuteteacute confirmeacutes par [Fanou2015] Cette eacutetudesrsquointeacuteresse en plus agrave la stabiliteacute des routes Les reacutesultats ont montreacute que les chemins afri-cains restent stables sur une longue dureacutee Pour les auteurs lrsquoeacutemergence de nouveauxpoints drsquoeacutechanges sur le continent doit aider agrave la reacuteduction des deacutelais agrave conditions queles coucircts drsquointerconnexion soient proches de ceux pratiqueacutes en Europe

Enfin lrsquoarticle [Chavula2017] publieacute en 2017 preacutesente la latence pour les transferts defichiers agrave partir de 53 pays africains diffeacuterents Ces mesures srsquoappuient sur la plate-formeRIPE Atlas [Ripe2010] et Speedchecker [Speechecker] Agrave partir des mesures reacutealiseacutees les

31

TABLE 15 ndash Tableau des plates-formes de mesures de meacutetrologie active

Nom Nombre desondes deacuteployeacutees

Meacutetriques dispo-nibles

Impact sur la re-cherche

Archipelago ~200 Longueur duchemin RTTDNS Autono-mous System(AS)

109

Atlas RIPE NCC ~12 000 RTT RouteHTTP GET etrequecirctes SSL

38

BISMark ~420 RTT taux depertes deacutebiteacutecouleacute tempsde chargementdrsquoune page web

304

DASU ~100 000 Informations surles flux TCP RTTroutes emprun-teacutees reacutesolutionDNS HTTP GETdeacutebit eacutecouleacute

84

PlanetLab ~400 1218SamKnows ~70 000 RTT deacutebit

eacutecouleacute deacutebitutile giguetaux de perteperformance decertains services

154

auteurs avancent que lrsquoAfrique est un continent ineacutegalitaire en terme de latence intra etinter pays Ils ont conclu que lrsquoexistence drsquoune faible latence entre deux FAI drsquoun mecircmepays provient drsquoaccord de peering au sein drsquoun IXP heacutebergeacute soit par le pays concerneacutesoit par un pays voisin

123 Meacutetrologie passive

La meacutetrologie passive a pour objectif la mesure des flots de paquets agrave partir drsquounpoint particulier du reacuteseau appeleacute le point de collecte Elle consiste agrave eacutecouter captureret analyser les paquets IP La figure 115 illustre le principe de la meacutetrologie passiveElle montre que le point de collecte nrsquoest pas forceacutement localiseacute du coteacute eacutemetteur oureacutecepteur Les paquets IP transitant par le point de collecte sont captureacutes et sauvegardeacutesOn appelle alors les fichiers contenant les paquets IP collecteacutes des traces Les mesurespassives peuvent ecirctre effectueacutees agrave diffeacuterents niveaux de granulariteacute

Au niveau microscopique les mesures passives tendent agrave eacutetudier les flots au niveaude la connexion de transport On peut par exemple eacutetudier le nombre de paquets per-dus durant une connexion TCP Au niveau macroscopique les mesures passives sonteffectueacutees sur des meacutetriques agreacutegeacutees comme le deacutebit eacutecouleacute total ou le nombre total deconnexions

32

FIGURE 115 ndash Principe de la meacutetrologie passive

La meilleure faccedilon de reacutealiser des mesures passives au niveau microscopique est decapturer tous les paquets traversant le point de collecte Mais comme il est difficile decapturer tous les paquets lorsque le deacutebit du lien est eacuteleveacute il faut avoir recours agrave lrsquoeacutechan-tillonnage du trafic Dans ce cas les mesures ne sont pas faites sur la totaliteacute des pa-quets traversant le point de collecte mais sur un sous-ensemble bien speacutecifique de cespaquets Le groupe de travail Packet Sampling (PSAMP) de lrsquoIETF travaille sur un algo-rithme drsquoeacutechantillonnage adapteacute au trafic Internet [PSAMP]

Une combinaison entre lrsquoanalyse des deux granulariteacutes est capable de donner uneeacutevaluation reacuteelle du trafic Les informations que lrsquoon peut obtenir par la meacutetrologie pas-sive sont nombreuses Elles reposent sur lrsquoeacutetude des informations contenues dans le da-tagramme IP que ccedila soit dans lrsquoen-tecircte du datagramme IP ou dans celle du message duprotocole de transport Les meacutetriques sont eacutegalement deacutependantes des outils utiliseacutes Onpeut classer les meacutetriques en deux cateacutegories que sont la supervision et la performance

La supervision donne des informations sur le fonctionnement du reacuteseau et la carac-teacuterisation du trafic On peut ainsi eacutetudier les diffeacuterents services et protocole de transportutiliseacutesLa performance se rapporte agrave celle du protocole de transport crsquoest-agrave-dire son fonction-nement ou sur lrsquoanalyse des flots par rapport soit agrave la composante temporelle ou soit agravela composante seacutemantique On peut alors comparer le deacutebit drsquoaccegraves theacuteorique et le deacutebitmesureacute Pour cela on va eacutetudier le taux de perte le RTT et la MSS

La meacutethode de capture peut reposer sur des eacutequipements mateacuteriels deacutedieacutes ou par unsystegraveme logiciel fonctionnant sur un eacutequipement standard Le logiciel srsquoappuie majori-tairement sur la bibliothegraveque Libpcap [Jacobson1989-2] Cette bibliothegraveque capture lespaquets reccedilus mais elle srsquoutilise eacutegalement en lisant des traces de paquets preacutealablementcaptureacutes Le problegraveme principal des solutions logicielles viennent de la vitesse des liensPlus le lien a un deacutebit eacuteleveacute plus la capture au niveau logiciel devient difficile Il fautalors se tourner vers des solutions de mateacuteriels deacutedieacutes La carte DAG [Graham1997] deacute-veloppeacutee par lrsquoeacutequipe [WAND] de lrsquoUniversiteacute de Waikato en Nouvelle Zeacutelande en est unparfait exemple Cette carte de capture est capable de capter les paquets sur des liens detregraves haut deacutebit Ce mateacuteriel se charge drsquoextraire les entecirctes des paquets de les estampillersuivant une horloge synchroniseacutee et de les stocker sur un disque dur

Lrsquoanalyse des donneacutees est reacutealiseacutee selon deux techniques temps reacuteels ou Batch Leprincipe du temps reacuteel est de pouvoir reacutecupeacuterer extraire et restituer de lrsquoinformation entemps reacuteel sur des flux continus de donneacutees Le mode Batch va englober tous les traite-ments de donneacutees neacutecessitant un temps de calcul plus conseacutequent Le premier proceacutedeacutese propose drsquoanalyser agrave la voleacutee ce qui se passe dans le reacuteseau par le branchement drsquouneacutequipement drsquoeacutecoute sur le reacuteseau On se concentre alors sur la performance du lien Desoutils comme Tstat [Mellia2005] ou Netflow [Claise2004] reacutealisent ce genre drsquoanalyse La

33

seconde technique se deacutecompose en deux phases distinctes que sont la capture et lrsquoana-lyse La premiegravere eacutetape est de reacutealiser la capture du trafic appeleacutee des traces Des outilscomme TCPDump [Jacobson1989-1] ou Wireshark [Chappell2010] peuvent enregistrerdes traces sous format DUMP ou PCAP La seconde phase consiste agrave analyser les tracescollecteacutees Les formats de sortie des donneacutees analyseacutees sont deacutependants des outils Lesinformations peuvent ecirctre retranscrites au format texte ou graphique Des outils commeTCPTrace [Ostermann2000] ou TCPStat [Herman2001] peuvent effectuer ce genre drsquoana-lyse de donneacutees Crsquoest avec cette technique qursquoil est possible drsquoeacutetudier les performancesdrsquoun protocole

Il nrsquoexiste pas de plate-forme drsquoaccegraves publique reacutealisant des captures de trafic au ni-veau international Malgreacute cela des traces collecteacutees sont disponibles sur Internet agrave desfins de recherche Dans [Allman2007] les auteurs preacutesentent les regravegles agrave respecter avantde publier des traces Un point est agrave souligner et concerne les adresses IP des paquets Lanon-anonymisation des adresses IP constitue une violation de la vie priveacutee de plus ellepreacutesente un risque drsquoinseacutecuriteacute pour les machines impliqueacutees par les paquets captureacutesCAIDA gegravere un deacutepocirct de partage et propose drsquoacceacuteder agrave des traces collecteacutees agrave traversplusieurs points drsquoeacutechange ameacutericains Pour y acceacuteder il faut indiquer la finaliteacute de lrsquouti-lisation des traces demandeacutees Drsquoautres plates-formes deacutedieacutees agrave des projets ont eacuteteacute misesen place agrave travers le monde

Le projet IPMon de lrsquoopeacuterateur ameacutericain SPRINT consiste agrave identifier les problegravemesdrsquoun reacuteseau deacutejagrave deacuteployeacute afin de pouvoir anticiper son eacutevolution future[IPMon] Danslrsquoarticle [Fraleigh2001] lrsquoauteur preacutesente lrsquoinfrastructure de mesure qui est deacuteployeacutee endivers points du reacuteseau de lrsquoopeacuterateur Les premiers reacutesultats publieacutes dans [Fraleigh2003]ont montreacute une utilisation de plus en plus importante par du trafic multimeacutedia sur le pro-tocole TCP De plus les flots TCP preacutesentent des performances eacuteleveacutees avec des taux dedeacute-seacutequencement faibles et un deacutelai minimal proche du temps de propagation

Le projet METROPOLIS srsquoest inspireacute du projet IPMon Il srsquoagit drsquoun projet franccedilaisavec des points de mesures sur deux types de reacuteseaux Internet diffeacuterents RENATER etle reacuteseau ADSL de France Teacuteleacutecom laquo Lrsquoobjectif de METROPOLIS eacutetait de concevoir denouvelles meacutethodologies pour la meacutetrologie des reacuteseaux IP raquo [METROPOLIS] Dans lecadre de ce projet un outil de caracteacuterisation et drsquoanalyse des traces fut deacuteveloppeacute Cenouvel outil srsquointitule ZOO Une preacutesentation de lrsquooutil sera reacutealiseacutee dans la sous-section322 Les reacutesultats ont mis une eacutevidence lrsquousage preacutedominant du protocole de transportTCP Les applications de type peer-to-peer repreacutesentaient plus de 80 du trafic eacutetudieacute

La position geacuteographique de La Reacuteunion et son rattachement au RIR AfriNIC attirentnotre attention sur les travaux de meacutetrologie passive africains La carte [AfterFibre] preacute-sente les reacuteseaux fibres terrestres et maritimes lieacutes au continent africain On voit ainsi queles reacuteseaux sont ineacutegalement reacutepartis sur le territoire La grandeur du continent et les in-terconnections preacutesentes font du territoire un espace drsquoeacutetude inteacuteressant Crsquoest pourquoide nombreux chercheurs privileacutegient lrsquoeacutetude de la connectiviteacute et des performances delrsquoInternet africain

Dans lrsquoarticle [Johnson2011] une eacutetude sur une zone rurale connecteacutee par satelliteest reacutealiseacutee Les reacutesultats ont montreacute que le trafic est principalement composeacute de fluxweb dont une forte proportion pourrait ecirctre mise en cache Au niveau des deacutelais le RTTmoyen sur la peacuteriode de mesure varie entre 3 et 10 secondes Ce deacutelai rend lrsquoutilisationdes applications temps-reacuteel difficile Le dernier reacutesultat notable de cette analyse est lapreacutesence de trafic geacuteneacutereacute par des logiciels malveillants (malware) Des attaques pour listerles ports UDP et TCP ouverts ont eacuteteacute remarqueacutees

En 2015 les auteurs de [Zheleva2015] ont eacutetudieacute les performances du reacuteseau et le com-portement des usagers apregraves une augmentation de la bande passante en Zambie Lrsquoun des

34

premiers reacutesultats indique une augmentation de plus de 58 de la quantiteacute des donneacuteeseacutechangeacutees Au niveau des performances ils ont pu eacutegalement remarquer une tregraves leacutegegraveredeacutegradation du canal de communication avec un taux de retransmission en hausse Cepourcentage est passeacute de 1 12 agrave 1 16 Le dernier reacutesultat noteacute porte sur lrsquoaugmenta-tion du RTT moyen de plus de 100 passant de 0 1436 s agrave 0 3190 s Lrsquoaugmentation dela bande passante a permis lrsquoaccegraves agrave de nouveaux services entraicircnant des changementspour les usagers

Dans [Fanou2016] lrsquoauteur srsquointeacuteresse aux services proposeacutes et compare la localisa-tion des serveurs Le premier reacutesultat montre lrsquoexternalisation continentale de nombreuxserveurs Ceci a pour conseacutequence drsquoaugmenter les deacutelais et de deacutegrader la performancedu service de communication Il faut pour lrsquoauteur arrecircter de raisonner en terme drsquoin-frastructure mais plus en terme de service et mettre lrsquoutilisateur au centre du systegravemePour cela il propose de rapatrier les services sur le territoire et drsquoaugmenter les accordsdrsquoeacutechanges entre les opeacuterateurs continentaux

Enfin dans [Johnson2016] les auteurs srsquointerrogent sur les faibles performances deTCP en Afrique La preacutesence de zone reculeacutees avec des accegraves satellitaires poussent lesdeacutelais vers des valeurs allant au delagrave des 400 ms Ces longs deacutelais sont agrave rapprocher desdeacutebits faibles De plus une expeacuterimentation sur les performances de TCP en fonction dusystegraveme drsquoexploitation a eacuteteacute meneacutee Les reacutesultats ont mis en eacutevidence que le systegraveme Li-nux avec la version TCP CUBIC est moins sensible au long deacutelais La solution proposeacutee auproblegraveme de la diffeacuterence de connectiviteacute agrave travers le continent est la creacuteation drsquoune ingeacute-nierie reacuteseau (liaison physique protocole de transport nouveau service) tenant comptedu contexte Africain

124 Comparatif entre mesures actives et mesures passives

La meacutetrologie active et la meacutetrologie passive preacutesentent des points communs et despoints de divergences Une fois des objectifs fixeacutes et au moment du choix de la meacutethodeil est important de connaicirctre les avantages et les inconveacutenients lieacutes agrave chaque type demesure Le tableau 16 reacutecapitule syntheacutetiquement ce qui vient drsquoecirctre preacutesenteacute

TABLE 16 ndash Comparatif entre mesures actives et mesures passives

Meacutetrologie Active Meacutetrologie Passive

Avantages

1 - Pour la mesure directe des pa-ramegravetres de QoS principalementle deacutelai le taux de pertes et lagigue

1 - Non intrusives2 - Permettent une mesure directedes paramegravetres utiliseacutes dans lrsquoin-geacutenierie des reacuteseaux

Inconveacutenients

1 - Intrusives le trafic de mesurepeut dans certains cas fausser lesmesures elles-mecircmes2 - Le fait que certains adminis-trateurs et entreprises bloquentou limitent le trafic ICMP peutfausser les reacutesultats obtenus parles techniques actives car ces der-niegraveres font souvent usage de ceprotocole

1 - Elles sont locales (relatives agraveun lien) et il est difficile de leseacutetendre agrave la globaliteacute du reacuteseau2 - Elles ne permettent pas la me-sure directe des paramegravetres deQoS3 - Elles neacutecessitent des ressourcesdisque et meacutemoire vive impor-tantes

35

13 Synthegravese

Ce chapitre a rappeleacute le fonctionnement du controcircle de congestion de TCP Le controcirclede congestion de TCP vise agrave maximiser lrsquoutilisation des ressources et agrave maximiser le deacute-bit utile eacutecouleacute de la connexion Ce controcircle est reacutegi par une boucle fermeacutee caracteacuteriseacuteepar un RTT Plus le deacutelai est eacuteleveacute moins TCP est susceptible de reacuteagir dynamiquementaux eacuteveacutenements de congestion Lorsque le produit du RTT et de la capaciteacute du canalde communication est trop important TCP peine agrave atteindre les objectifs preacuteceacutedemmentpreacutesenteacutes Lrsquoaugmentation progressive de la bande passante sans diminution des deacutelais apour effet lrsquoaugmentation de la capaciteacute de stockage des liens Cet accroissement a uneffet neacutegatif sur les performances de TCP Cet effet neacutegatif impacte le deacutemarrage deconnexion les flots courts la reacutesolution de la congestion et la dynamique du sondagePour diminuer lrsquoeffet de la capaciteacute de stockage des liens sur les performances de TCPde nouveaux controcircles de congestion furent deacuteveloppeacutes Chaque nouvelle version ducontrocircle de congestion ambitionne de reacutesoudre une agrave plusieurs probleacutematiques des reacute-seaux agrave forte capaciteacute de stockage Le deacutemarrage de connexion et les flots courts ont dessolutions communes comme une augmentation de la capaciteacute drsquoeacutemission de TCP agrave lrsquoini-tialisation de la connexion ou la reacuteduction du RTO Les probleacutematiques de reacutesolution decongestion et de dynamique de sondage ont permis la creacuteation de nouvelles versions ducontrocircle de congestion de TCP Ces versions de TCP sont des solutions de bout-en-boutDrsquoautres solutions neacutecessitent un changement de paradigme et lrsquointeraction avec les rou-teurs Ces solutions ont lrsquoavantage drsquoecirctre reacuteactives mais neacutecessitent la mise agrave jour deseacutequipements intermeacutediaires du reacuteseau

Le localisation geacuteographique de La Reacuteunion au milieu de lrsquooceacutean indien place lrsquoicircledans une situation ougrave la capaciteacute de stockage du reacuteseau peut ecirctre importante Nous avonsainsi estimeacute cette capaciteacute agrave lrsquoaide des deacutebits theacuteoriques des accegraves et les deacutelais de propa-gation estimeacutes et mesureacutes Les reacutesultats obtenus ont mis en eacutevidence une capaciteacute destockage autorisant la caracteacuterisation de lrsquoInternet reacuteunionnais comme un reacuteseau agrave fortecapaciteacute de stockage Lrsquoimpact de cette capaciteacute de meacutemorisation nrsquoa pas encore eacuteteacute me-sureacute Crsquoest pourquoi nous nous sommes concentreacutes sur la meacutetrologie Internet

La meacutetrologie active est une science invasive en injectant des paquets dans le reacuteseauLa meacutetrologie active mesure directement des paramegravetres de qualiteacute de service comme lesdeacutelais les routes le taux perte et la gigue Nous avons vu que des outils sont en capa-citeacute de mesurer deux meacutetriques simultaneacutement Certains outils peuvent ecirctre distribueacuteset ainsi former des plates-formes de mesure Ces plates-formes offrent la possibiliteacute auxpersonnes inteacuteresseacutees du monde entier de geacuteneacuterer des donneacutees de mesure agrave travers lemonde Les performances de TCP sont deacutependantes du deacutelai Les deacutelais sont eux-mecircmedeacutependants des routes physiques et logiques emprunteacutees Il est donc important drsquoeacutetudierces deux paramegravetres Connaissant nos besoins nous utiliserons lrsquoapproche research drivenpour lrsquoeacutetude de meacutetrologie active Lrsquoapproche research driven est une approche consistantagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires agrave lrsquoeacutetude Notre eacutetude de meacutetrologie active est preacutesenteacutee dansle chapitre 2

La meacutetrologie passive permet une mesure directe des paramegravetres utiliseacutes Cette classede meacutetrologie est centreacutee sur un lien de mesure Elle utilise lrsquoeacutecoute et la capture desdatagrammes IP La meacutetrologie passive eacutetudie la caracteacuterisation du trafic et la perfor-mance des protocoles Nous avons vu que des outils sont en capaciteacute de reacutealiser les deuxeacutetudes en parallegravele Ne pouvant reacutealiser des eacutetudes de meacutetrologie passive agrave distance denombreux chercheurs ont mis agrave disposition de la communauteacute scientifique des donneacuteespubliques La litteacuterature scientifique propose un grand nombre de meacutetriques pour lrsquoeacutetudedes performances du protocole de transport TCP et de la supervision du trafic Afin de

36

ne pas nous concentrer sur une meacutetrique en particulier nous faisons le choix de ne pasdresser une liste de meacutetriques Notre eacutetude de meacutetrologie passive que nous preacutesente-rons dans le chapitre 3 utilisera lrsquoapproche measurement driven Cette approche consiste agravemettre en place une infrastructure de mesures afin de reacutecupeacuterer le maximum drsquoinforma-tions puis drsquoeffectuer toutes les analyses possibles sur les donneacutees collecteacutees Neacuteanmoinsla meacutetrologie passive souffre de deux faiblesses essentielles (1) elle reste locale et il estdifficile drsquoeacutetendre les reacutesultats agrave la globaliteacute du reacuteseau (2) au niveau microscopique lescaptures aboutissent tregraves rapidement agrave des volumes de traces colossaux

37

38

Chapitre 2

Caracteacuterisation de la connectiviteacute deLa Reacuteunion

Le rapport [Mediametrie2018-2] sur lrsquoaccegraves Internet agrave La Reacuteunion a montreacute que 856de la population reacuteunionnaise de plus de 13 ans srsquoest deacutejagrave connecteacutee agrave Internet 747 deces personnes sont des usagers reacuteguliers En comparaison le rapport [Mediametrie2018-1]montre qursquoaux alentours de 68 de la population franccedilaise meacutetropolitaine se connectequotidiennement Ces sondages montrent lrsquointeacuterecirct pris par lrsquoInternet pour la populationreacuteunionnaise

En 2013 une eacutetude de meacutetrologie reacutealiseacutee par BinarySec vise a effectuer un classementdes fournisseurs drsquoaccegraves Internet de La Reacuteunion Dans le rapport associeacute [Vergoz2013] 9meacutetriques sont preacutesenteacutees Parmi elles le deacutebit descendant moyen est mesureacute agrave 9 36MbsEn comparaison le deacutebit descendant moyen en France meacutetropolitaine mesureacute par[Akamai2015] srsquoeacutelegraveve agrave 8 2 Mbits Akamai utilise la plate-forme Intelligent PlatformTM

pour reacutecolter des donneacutees dont le deacutebit reacuteel La Reacuteunion posseacutedait ainsi un meilleurdeacutebit descendant que la France meacutetropolitaine Le deacutebit moyen franccedilais preacutesenteacute par[Akamai2017] est de 10 75 Mbits Le deacutebit descendant minimum reacuteunionnais mesureacutepar [nPerf2017] est de 18 63 Mbits Ainsi lrsquoeacutecart entre les deacutebits franccedilais et reacuteunionnaissrsquoest accentueacute Malgreacute un deacutebit plus eacuteleveacute La Reacuteunion preacutesente des deacutelais plus eacuteleveacutesque la France

Lrsquoeacutevolution des deacutebits pose la question sur lrsquoeacutevolution des deacutelais depuis la derniegraverecampagne de mesure La figure 111 montre des deacutelais plus importants agrave La Reacuteunion qursquoagraveParis Lrsquoobjectif de ce chapitre est drsquoeacutetudier lrsquoeacutevolution des deacutelais depuis 2012 On srsquointeacute-resse eacutegalement agrave la connectiviteacute de La Reacuteunion en terme de deacutelai et de routes Lrsquoasymeacute-trie des liens est une chose courante dans lrsquoInternet Les questions que lrsquoon se pose de-puis La Reacuteunion doivent eacutegalement ecirctre poseacutees lorsque lrsquoon essaye de joindre lrsquoicircle Dansce chapitre nous allons explorer la connectiviteacute de La Reacuteunion Pour cela nous avonsmis en place un protocole de mesures se basant sur notre propre plate-forme de mesuresrespectant la reacutepartition des destinations Notre plate-forme a pour objectif lrsquoeacutetude desroutes et des deacutelais speacutecifiques de lrsquoicircle par rapport agrave son accegraves Internet via les cacircblessous-marins

Une seconde question est alors apparue Est-ce que ces speacutecificiteacutes sont uniquementcelles de La Reacuteunion ou alors communes aux icircles de la Zone Oceacutean Indien

Dans la section 21 nous preacutesentons les objectifs de notre eacutetude de meacutetrologie et lescontraintes associeacutees Afin de reacutepondre agrave ces contraintes un cahier des charges est preacute-senteacute dans la section 22 Le protocole drsquoeacutetude est deacutecrit dans la section 23 Les reacutesultatsobtenus pour La Reacuteunion suivis de ceux des icircles de lrsquoOceacutean Indien sont preacutesenteacutes dansla section 24

39

21 Objectifs

En 2012 [Anelli2012] a reacutealiseacute une campagne de mesure des deacutelais depuis La Reacuteunionet Paris Cette campagne de meacutetrologie active baseacutee sur la commande ping a pour ob-jectif de deacutemontrer la diffeacuterence de deacutelai et de deacutebit entre La Reacuteunion et Paris Le premierobjectif de nos travaux consiste agrave la mise jour des donneacutees par une nouvelle eacutetude desdeacutelais Nous ferons par la suite reacutefeacuterence agrave cet objectif par le titre Evolution

Le second objectif est lrsquoanalyse de la connectiviteacute Internet de La Reacuteunion Pour arri-ver agrave obtenir une analyse preacutecise de la connectiviteacute Internet reacuteunionnaise une eacutetude surles routes emprunteacutees par les paquets IP en provenance et agrave destination de La Reacuteunionsera reacutealiseacutee Pour cela on utilisera un outil de type traceroute On utilisera les donneacuteesreacutecolteacutees pour lrsquoidentification des portes de lrsquoInternet reacuteunionnais La reacutefeacuterence utiliseacuteepour cet objectif dans le suite du manuscrit est Connectiviteacute

Ayant cibleacute les meacutetriques nous avons fait le choix de la meacutethode research-driven Cettemeacutethode preacutesenteacutee dans la section 121 a lrsquoavantage de se concentrer uniquement surdes meacutetriques deacutecideacutees preacutealablement Dans le cas de notre eacutetude ce sont les deacutelais et lesroutes

22 Cahier des charges

Deux paramegravetres doivent ecirctre pris en consideacuteration lors de la reacutedaction du cahier descharges lrsquooutil de mesure et lrsquooutil drsquoanalyse

221 Evolution

Pour reacutepondre agrave lrsquoobjectif nous allons effectuer une reprise de lrsquoexistant Lrsquooutil demesure sera la commande ping associeacutee agrave la plate-forme Planet-Lab [PlanetLabEurope]Lrsquooutil drsquoanalyse sera identique agrave celui utiliseacute par [Anelli2012]

222 Connectiviteacute

Identification des besoins

Dans le tableau 14 nous avons vu que diffeacuterents outils sont capables de mesurer lesroutes et les deacutelais Lrsquooutil retenu devra limiter les erreurs lieacutees aux meacutecanismes de lrsquoeacutequi-librage de charge et de MPLS Cet outil devra reacutealiser des mesures depuis des nœudsreacutepartis sur lrsquoensemble de lrsquoicircle Pour cela il est neacutecessaire drsquoeffectuer un choix de plate-forme de meacutetrologie active Ce choix se fera sur 2 points la distribution geacuteographiquedes nœuds de mesure et la couverture des diffeacuterents fournisseurs drsquoaccegraves internet

Lrsquooutil drsquoanalyse devra ecirctre en capaciteacute drsquoidentifier les portes de lrsquoInternet reacuteunion-nais agrave travers la geacuteolocalisation des adresses IP drsquoidentifier les marques MPLS preacutesentesdans les donneacutees pour une meilleure compreacutehension des regravegles de routage geacuteneacuterer unecarte des relations entre pays agrave travers les eacutechanges de paquets envoyeacutes et reacutealiser desstatistiques sur les diffeacuterents nœuds emprunteacutes

Mise en œuvre drsquoune infrastructure de meacutetrologie active

Dans la section preacuteceacutedente nous avons vu que notre cahier des charges devra respec-ter 3 principaux critegraveres outil de mesure plate-forme de mesure et outil drsquoanalyse

40

Paris-traceroute

Nous avons vu dans la partie 122 que lrsquoeacutetude des routes et des deacutelais peut se faire agravelrsquoaide drsquoun seul outil traceroute Or cet outil est sujet agrave des impreacutecisions lieacutees agrave lrsquoeacutequili-brage des charges par exemple Souhaitant limiter lrsquoimpact de ces aleacuteas dans nos donneacuteesnous faisons le choix de Paris-traceroute Pour rappel une preacutesentation de lrsquooutil et deses meacutecanismes est faite agrave la section 122

La plate-forme RunPL

Les plates-formes disponibles Similairement dans la section 122 nous avons preacute-senteacute des plates-formes de meacutetrologie active La plate-forme seacutelectionneacutee devra respecterles critegraveres preacutesenteacutes preacuteceacutedemment

Parmi les plates-formes seules Atlas et Planet-Lab ont des sondes preacutesentes sur lrsquoicirclerespectivement 21 et 2 Ces sondes sont reacuteparties de maniegravere ineacutequitable sur lrsquoicircle Lareacutegion Est de lrsquoicircle ne compte qursquoune sonde quand le minimum est de 6 dans les autresreacutegions De plus certains des Fournisseurs drsquoAccegraves Internet (FAI) nrsquoheacutebergent pas de sondede mesure Le reacutesumeacute de notre comparaison est indiqueacute dans le tableau 21

TABLE 21 ndash Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet

Archipelago Atlas BISMark DASU Planet-Lab SamKnowsParis-traceroute

Oui Oui Oui Non Oui Non

Disponibiliteacutesur lrsquoicircle

Non Oui Non Non Oui Non

Couverturede lrsquoicircle

Non Oui Non Non Non Non

Reacutepartitionfournis-seurs

Non Non Non Non Non Non

On constate ainsi qursquoaucune des plates-formes preacutesenteacutees ne remplit la totaliteacute descritegraveres de seacutelection Nous avons souhaiteacute deacuteployer notre propre infrastructure Cettenouvelle plate-forme reacutepondra agrave nos critegraveres en offrant une meilleure couverture de lrsquoicirclesur les aspects geacuteographiques FAI et Technologies drsquoAccegraves agrave Internet (TAI) Lrsquoeacutechantillon depopulation est repreacutesenteacute par un ensemble drsquoeacutetudiants Notre plate-forme nous autoriseeacutegalement agrave ecirctre maicirctre de lrsquoinfrastructure de mesures que lrsquoon souhaite mettre en placeAfin de seacutelectionner les outils (physiques et logiciels) les plus adapteacutes agrave nos objectifsnous avons deacutecideacute des speacutecificiteacutes de notre plate-forme

Creacuteation et deacuteploiement de la plate-forme RunPL La plate-forme que lrsquoon souhaitedeacuteployer devra respecter un scheacutema de connectiviteacute bien preacutecis repreacutesenteacute par la figure21 La Sonde de mesure est le cœur de la plate-forme La Destination correspond agrave uneadresse IP ou un nom de domaine agrave joindre pour obtenir des informations sur les routesemprunteacutees et les deacutelais associeacutes Le Serveur de stockage est preacutesent pour deacutelester la sondede mesure LrsquoOrdinateur distant repreacutesente lrsquoadministrateur de la plate-forme Ne pouvantse deacuteplacer pour configurer la sonde un accegraves distant doit ecirctre reacutealiseacute Il est illustreacute parle train en pointilleacute sur la figure Le trait plein entre la sonde et la destination correspondagrave lrsquointeraction entre la sonde et la destination Cette interaction repreacutesente les mesuresque lrsquoon obtiendra sur les performances des liens Les sondes de mesure devront pou-voir effectuer les mesures sans limitation de destinations Elles devront afin de limiter

41

le stockage effectuer un deacutelestage des mesures collecteacutees sur un serveur de stockage Ceserveur de stockage tout comme la sonde de mesure devra pouvoir ecirctre joint par lrsquoordi-nateur distant Cette communication a un double objectif Le premier est la reacutecupeacuterationdes donneacutees pour les analyses Le second est la mise agrave jour du protocole de mesure sineacutecessaire Une interaction seacutecuriseacutee est eacutetablie entre lrsquoordinateur distant la sonde et leserveur de stockage Cette liaison est caracteacuteriseacutee par les pointilleacutes sur la figure 21

FIGURE 21 ndash Scheacutema drsquointerconnexion de la plate-forme

Les speacutecificiteacutes de notre plate-forme se deacutecomposent en deux grandes parties quesont la partie mateacuterielle et la partie systegraveme

Mateacuterielle Un cahier des charges speacutecifique agrave notre plate-forme de mesure doit ecirctrereacutealiseacute La premiegravere partie concerne le choix du mateacuteriel physique

La partie mateacuterielle de la plate-forme de mesure est formeacutee de deux composants lasonde de mesure et le serveur de stockage des donneacutees Le serveur de stockage serafourni par le Laboratoire drsquoInformatique et de Matheacutematiques (LIM) Seule la sonde de me-sure sera indiqueacutee dans le cahier des charges Le mateacuteriel seacutelectionneacute devra respecter lescritegraveres preacutecis Ces critegraveres ont eacuteteacute deacutecideacutes en eacutetudiant les solutions proposeacutees par lesplates-formes preacuteceacutedemment eacutetudieacutees

mdash Peu encombrant de nombreuses sondes proposeacutees par les diffeacuterentes plates-formessont tregraves discregravetes Notre sonde devra eacutegalement ecirctre peu visible Nous souhaitonsque la sonde soit directement connecteacutee sur le routeur de lrsquousager

mdash Peu coucircteux le coucirct unitaire de chaque kit ne devait pas deacutepasser 50D afin que lrsquoonpuisse avoir un nombre de nœuds conseacutequent Un kit sera composeacute de la sonde deson cacircble alimentation drsquoune carte meacutemoire et drsquoun cacircble reacuteseau

mdash Peu eacutenergivore la facture drsquoeacutelectriciteacute eacutetant agrave la charge de lrsquousager nous souhai-tions une solution agrave faible consommation drsquoeacutenergie

mdash Diversiteacute du systegraveme drsquoexploitation (OS) Le systegraveme drsquoexploitation choisi devrasupporter lrsquoinstallation de Paris-traceroute

La seconde partie du cahier des charges de notre plate-forme se concentre sur le choixdu systegraveme drsquoexploitation

Pour rappel sur la figure 21 nous avons repreacutesenteacute en pointilleacute des interactions seacute-curiseacutees Ces eacutechanges concernent lrsquoaccegraves distant agrave la sonde au serveur de stockage et agravela sauvegarde des donneacutees de mesures sur le serveur Le systegraveme drsquoexploitation devracorrespondre aux critegraveres de seacutelection suivants

42

mdash Paris-traceroute Le systegraveme drsquoexploitation devra inteacutegrer Paris-traceroute dans seslibrairies drsquoinstallations ou supporter lrsquoinstallation du code source

mdash Licence GNU-GPL Des modifications du systegraveme seront potentiellement neacuteces-saires

mdash Accegraves distant Le mateacuteriel devant ecirctre geacutereacute agrave distance Un accegraves Secure SHell (SSH)devra donc ecirctre configureacute Le protocole SSH [RFC4250] fut deacuteveloppeacute pour per-mettre lrsquoaccegraves agrave distance de terminaux

mdash Transmission seacutecuriseacutee Lrsquoaccegraves au diffeacuterents composants de la plate-forme devrase faire drsquoune faccedilon seacutecuriseacutee La restriction se fera agrave travers un systegraveme drsquoidentifi-cation

Seacutelection du mateacuteriel [Maksimovic2014] reacutealise une comparaison de diffeacuterents micro-ordinateurs tels que Arduino [Arduino] BeagleBone [Beaglebone] Phidgets [Phidgets]Udoo [Udoo] et RaspberryPi [RaspberryPi] Dans ce comparatif les critegraveres utiliseacutes sontproches de ceux que lrsquoon a seacutelectionneacutes Le tableau 22 reacutesume lrsquoensemble des critegraveres deseacutelection du mateacuteriel Il provient directement de lrsquoarticle [Maksimovic2014]

TABLE 22 ndash Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

Critegraveres Arduino BeagleBone Phidegts Raspberry Pi UdooEncombrement(en mm)

7553 863533 813533 8565398 11085

Coucirct (en $ parnœud

30 45 50-200 25-35 99-135

Eacutenergie (en V) 7-12 5 6-15 5 6-15

Systegraveme

drsquoexploitation

Linux ang-strom

Linux

RaspbianUbuntuAndroidArchLinuxFreeBSDFedoraRISC OS

UbuntuAn-droidLinuxArchLi-nux

Nous avons mis en eacutevidence les valeurs respectant les critegraveres Nous faisons le choixdu Raspberry Pi car il possegravede le plus de critegraveres respecteacutes

Seacutelection du systegraveme drsquoexploitation Le premier critegravere de seacutelection est lrsquoinstalla-tion de Paris-traceroute Drsquoapregraves [Paris-traceroute] lrsquooutil est disponible sur les systegravemesRaspbian Ubuntu ArchLinux et FreeBSDConcernant les licences lrsquoensemble des OS ne sont pas eacutequivalents Ainsi seul RaspbianUbuntu et ArchLinux proposent une licence General Public Licence (GPL) RISC OS est as-socieacute agrave une licence proprieacutetaire Android FreeBSD et Fedora sont sous licence de logiciellibre et open source Les licences de distribution open source vont nous autoriser agrave ajou-ter modifier voire supprimer des parties du code pour qursquoil corresponde plus facilementagrave nos besoinsDe nombreux OS proposent nativement la version cliente du protocole SSH La versionserveur peut ecirctre activeacutee lors de lrsquoinstallation du systegraveme drsquoexploitation Lrsquoaccegraves distantnous permettra eacutegalement la mise agrave jour des outils et des OS pour des raisons de seacutecu-riteacuteLa seacutecurisation des eacutechanges se fera au travers drsquoun Virtal Private Network (VPN) Un

43

VPN est un systegraveme permettant de creacuteer un lien direct entre des ordinateurs distants[Coonjah2015] reacutealise une comparaison entre deux outils permettant la creacuteation de VPNOpenSSH et OpenVPN OpenSSH propose de meilleures performances qursquoOpenVPN auniveau de lrsquoutilisation de la bande passante et des temps de transferts de fichiers Malgreacutecela nous avons pris le parti drsquoutiliser OpenVPN car crsquoest un outil majoritairement uti-liseacute par les entreprises [Coonjah2015] Cet utilitaire nous propose la mise en place drsquouneconnexion seacutecuriseacutee baseacutee sur lrsquoidentification agrave travers un certificat drsquoauthentificationLe VPN permet de joindre agrave travers un adressage priveacute les diffeacuterentes sondes qui se-ront distribueacutees sur lrsquoicircle de La Reacuteunion Drsquoapregraves le site officiel drsquo[OpenVPN] lrsquooutil peutsrsquoinstaller facilement sur les distributions Rapsbian Ubuntu et Fedora

Le choix du systegraveme drsquoexploitation va deacutependre des critegraveres de seacutelection Nous reacuteca-pitulons les critegraveres preacutesenteacutes preacuteceacutedemment dans le tableau 23

TABLE 23 ndash Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur RaspberryPi

Critegraveres Raspbian Ubuntu Android ArchLinux FreeBSD Fedora RISC OSParis-traceroute

Oui Oui Non Oui Oui Non Non

Licence GPL GPL ASL GNULinux

BSD CreativeCom-mons

CastleTechno-logiesLtdLicence

Accegraves dis-tant (SSH)

Oui Oui Oui Oui Oui Oui Oui

OpenVPN Oui Oui Non Non Non Oui Non

Deux systegravemes disponibles pour Raspberry Pi reacutepondent agrave nos critegraveres Raspbian etUbuntu Nous faisons le choix du systegraveme Raspbian Cet OS est une distribution Linuxentiegraverement revue pour des performances optimales sur la carte Raspberry Pi Fortementinspireacutee par la distribution Linux Debian elle propose les mecircmes caracteacuteristiques que ladistribution dite de Bureau Les sondes nrsquoeacutetant pas eacutequipeacutees drsquoun systegraveme drsquoaffichagenous optons pour lrsquoinstallation la plus leacutegegravere possible avec uniquement les paquets neacute-cessaires agrave notre eacutetude

Lrsquooutil drsquoanalyse rTraceroute

Dans la section 21 nous avons preacutesenteacute les contraintes lieacutees agrave la seacutelection drsquoun outildrsquoanalyse des donneacutees de type traceroute Pour rappel ces contraintes sont les suivantes la geacuteolocalisation des adresses IP lrsquoidentification des liens MPLS la geacuteneacuteration drsquounecarte des liens logiques et la geacuteneacuteration drsquoun fichier comportant des statistiques sur lesdiffeacuterents nœuds rencontreacutes

Les outils disponibles Il existe diffeacuterents outils drsquoanalyse des routes que lrsquoon peut ran-ger en trois cateacutegories les geacuteneacuterateurs de donneacutees brutes les plates-formes de mesures etles outils drsquoanalyse graphiques Lrsquooutil que lrsquoon souhaite utiliser entre dans la troisiegravemecateacutegorie La litteacuterature autour drsquooutils graphiques pour lrsquoanalyse des routes nrsquoest pasaussi complegravete que lrsquoon pourrait croire

Gtrace est un outil creacuteeacute par [Periakaruppan1999] Cet outil reproduit graphiquementles reacutesultats obtenus par Traceroute Le logiciel geacutenegravere ses propres donneacutees avant de les

44

repreacutesenter sous forme graphique La geacuteolocalisation ne se fait pas sur les adresses IPmais sur le nom Domain Name System (DNS) des nœuds rencontreacutes La localisation drsquounnœud nrsquoest valideacutee qursquoapregraves croisement des informations entre les abreacuteviations des villeset aeacuteroports drsquoinformations contenues dans deux bases de donneacutees Une derniegravere veacuteri-fication est reacutealiseacutee agrave lrsquoaide de la commande nslookup Actuellement cet outil nrsquoest plusmaintenu Il nrsquoimpleacutemente pas le [RFC4950] permettant lrsquoidentification des nœuds MPLSdans les routes

[Aben2015] preacutesente un outil drsquoanalyse des routes inteacutegreacute agrave Atlas RIPE NCC Cet outildrsquoanalyse se nomme OpenIPMap Il utilise la base de donneacutees de RIPE pour effectuer lageacuteolocalisation des donneacutees Les routes sont ensuite traceacutees sur une carte interactive Lesmesures geacuteneacutereacutees par Atlas sont directement visibles et peuvent srsquointeacutegrer dans OpenIP-Map Lrsquoidentification des nœuds MPLS ainsi que la partie statistique ne sont pas inclusesdans les sorties proposeacutees par OpenIPMap

Dans [Yang2016] lrsquoauteur preacutesente un outil drsquoanalyse des routes centreacute sur le conti-nent africain African Visual Route Le design de lrsquooutil srsquoinspire largement du projetOpenIPMap [Aben2015] Lrsquooutil possegravede un deacutefaut important Il lit uniquement les fi-chiers provenant de la plate-forme Atlas

Le tableau 24 preacutesente les possibiliteacutes offertes par chaque outil preacutesenteacute preacuteceacutedem-ment

TABLE 24 ndash Fonctions disponibles dans les outils graphiques drsquoanalyse des routes

African Visual Route Gtrace OpenIPMapGeacuteolocalisation Oui Oui OuiIdentificationdes liens MPLS

Non Non Non

Cartographie Oui Oui OuiStatistiques Non Non Non

On peut constater que par rapport agrave nos besoins les outils listeacutes preacutesentent des la-cunes Les critegraveres drsquoaffichage des liens MPLS et la partie statistique sur les nœuds inter-meacutediaires nrsquoont pu ecirctre remplis Pour ces raisons nous avons deacuteveloppeacute un outil drsquoana-lyse rTraceroute

Deacuteveloppement de rTraceroute

Geacuteolocalisation Dans le cadre de nos travaux la geacuteolocalisation drsquoadresse IP consi-degravere la position geacuteographique de lrsquoadresse les informations sur le deacutetenteur de lrsquoadresseet lrsquoAutonomous System (AS) associeacutes Un AS est un ensemble drsquoeacutequipements et de reacuteseauxsous une mecircme autoriteacute rTraceroute geacuteolocalise les adresses IP rencontreacutees agrave travers unebase de donneacutees impleacutementeacutee au sein du LIM Cette base de donneacutees est remplie au furet agrave mesure que de nouvelles adresses IP sont remonteacutees par les mesures Lrsquoidentificationdes nouvelles adresses se fait par un script deacuteveloppeacute en python sous ma direction parun eacutetudiant de Licence 3eme anneacutee [LanYanFock2015] Cet outil nommeacute rgeoloc utiliseles commandes de lrsquoApplication Programming Interface (API) de RIPE NCC En interro-geant une base de donneacutees drsquoun RIR nous espeacuterons limiter les erreurs lieacutees agrave la geacuteoloca-lisation Pour nos besoins nous limitons les informations lieacutees agrave la localisation et au FAICes informations sont Pays Latitude Longitude Nom du FAI Numeacutero de lrsquoASLes informations (pays longitude latitude) seront utiliseacutees par la suite pour effectuer

45

des calculs de distance entre deux adresses IP Le nom du FAI autorise le suivi des ac-cords drsquoeacutechanges de paquets sur les routes Le numeacutero de lrsquoAS nous offre la possibiliteacutede suivre les diffeacuterents chemins emprunteacutes en termes drsquoAS diffeacuterents

rgeoloc est capable drsquoextraire les informations de deacutelais et de longueurs de routesdrsquoun fichier traceroute Il peut eacutegalement deacutecouper un fichier contenant plusieurs don-neacutees traceroute en fichier unitaire

La geacuteolocalisation des adresses associeacutees agrave lrsquoidentification des liens MPLS va aider agravela compreacutehension des routes de lrsquoInternet dans le monde

Identification des liens MPLS Paris-traceroute indique dans ses sorties les liensMPLS rencontreacutes [Augustin2007] indique que lrsquoidentification des liens se fait par la lec-ture des informations contenues dans les paquets reccedilus par lrsquooutil rTraceroute va identi-fier les marques MPLS et les repreacutesenter en un coloris diffeacuterent sur les cartes

Cartographie Lors de la geacuteolocalisation des adresses IP lrsquoinformation neacutecessaire agravela cartographie est le pays Lors de cette identification deux nouvelles informations sontassocieacutees agrave lrsquoIP Ce sont les coordonneacutees du pays pour la carte passeacutee en paramegravetre Agravepartir de ces nouvelles coordonneacutees rTraceroute va geacuteneacuterer une nouvelle carte affichantlrsquoensemble des liens logiques (entre pays) preacutesents dans les traces analyseacutees

Statistique rTraceroute geacutenegravere des statistiques sur chaque nœud rencontreacute La cleacutedrsquoidentification drsquoun nœud est son adresse IP et sa position sur la route analyseacutee Les sta-tistiques geacuteneacutereacutees sont lrsquooccurrence de la paire drsquoidentification le deacutelai minimal obtenupour joindre ce nœud agrave cette position et le pays rattacheacute agrave lrsquoadresse IP

Notre outil est actuellement disponible sur le site du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrrtraceroute [rtraceroute] Cet outil est distribueacute sous licencelibre pour une large diffusion dans la communauteacute scientifique

23 Protocole de mesure

La connectiviteacute particuliegravere de lrsquoicircle par les deux cacircbles sous-marins provoque un in-teacuterecirct de lrsquoeacutetude des routes emprunteacutees Lrsquoun des objectifs de nos mesures est drsquoeacutetudierlrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012 et 2016 Le second objec-tif est lrsquoeacutetude de la connectiviteacute en terme de routes de deacutelais et des accegraves logiques delrsquoInternet reacuteunionnais

Notre protocole de mesure se divise en 3 parties La premiegravere partie preacutesente lespoints communs entre les deux objectifs La seconde consiste agrave effectuer une comparai-son de lrsquoeacutetat actuel avec le travail effectueacute preacuteceacutedemment par [Anelli2012] Le troisiegravemepoint concerne les mesures drsquoidentification des portes de lrsquoaccegraves Internet de La Reacuteunion

231 Eacutechantillon de mesure

Lrsquoeacutechantillon drsquoadresses IP que lrsquoon va utiliser dans nos eacutetudes se doit drsquoecirctre repreacute-sentatif et preacutecis La preacutecision srsquoobtient par la taille drsquoun eacutechantillon La repreacutesentativiteacutepar le respect de la distribution des adresses IP dans lrsquoInternet

Il existe 232 adresses IPv4 avec une reacutepartition bien speacutecifique Drsquoapregraves les [RFC3232RFC5735 RFC6761] 592 708 865 adresses sont reacuteserveacutees On peut citer en exemple lesadresses de type 1921680016 Ce bloc est reacuteserveacute aux reacuteseaux priveacutes Son utilisationpreacutevue est documenteacutee dans le [RFC1918] Telles que deacutecrites dans ce standard les adresses

46

de ce bloc nrsquoapparaissent pas leacutegitimement sur lrsquoInternet publicApregraves soustraction il ne reste que 3 702 258 431 adresses agrave reacutepartir dans les diffeacuterentspays et FAI Ces IP sont distribueacutees par preacutefixes par les RIR dont RIPE NCC pour lrsquoEu-rope et AfriNIC pour le continent africain Afin drsquoavoir un eacutechantillon preacutecis nous avonsgeacuteneacutereacute aleacuteatoirement 1 000 000 drsquoadresses non reacuteserveacutees Ces adresses ont eacuteteacute testeacutees parle protocole ICMP Ce test nous assure que les adresses IP sont des adresses que nouspourrons utiliser par la suite Nous avons ainsi valideacute 84 000 adresses Neacuteanmoins nousnrsquoavons aucune garantie sur la modification des attributions des adresses IP au fil dutemps

Pour que notre jeu de destinations soit repreacutesentatif nous avons geacuteolocaliseacute les adressesvalides Nous avons regroupeacute les reacutesultats par continent pour une meilleure lisibiliteacute Lereacutesultat obtenu est illustreacute par la figure 22a

Nous pouvons constater une forte dispariteacute entre les diffeacuterents continents LrsquoOceacuteanieet lrsquoAfrique ont moins de 1 de preacutesence dans notre jeu On constate eacutegalement une fortepreacutesence drsquoadresse de type BOGONS Ces adresses font parti de blocs encore non alloueacutespar les RIR ou alors reacuteserveacutees par lrsquoInternet Assigned Numbers Authority (IANA) maispreacutesentes au sein de lrsquoInternet On peut citer lrsquoadresse 10012016100 en exemple Cetteadresse est marqueacutee comme reacuteserveacutee par lrsquoIANA par RIPE NCC Ce nombre drsquoadressesest en diminution avec lrsquoattribution des blocs restant aux diffeacuterents FAI Pour validerce reacutesultat nous lrsquoavons compareacute agrave la distribution datant de Mai 2016 du site CountryIP-Blocks 1 Le regroupement est illustreacute par la figure 22b On remarque un certain eacutequilibreentre lrsquoEurope et lrsquoAsie et une domination de lrsquoAmeacuterique du Nord

Notre reacutepartition est diffeacuterente en de trop nombreux points agrave celle de CountryIP-Blocks Les donneacutees communiqueacutees par CountryIPBlocks proviennent des RIR Cettedistribution est donc plus proche de la reacutepartition reacuteelle Crsquoest pourquoi agrave partir de notreensemble drsquoadresses initales nous seacutelectionnerons un sous ensemble en respectant la dis-tribution preacutesenteacutee par la figure 22b

232 Eacutevolution

En 2012 [Anelli2012] a effectueacute une campagne de ping depuis Paris et La ReacuteunionCette campagne reacutealiseacutee sur le FAI RENATER avait pour objectif la mise en eacutevidence dela diffeacuterence des deacutelais entre Paris et La Reacuteunion Afin drsquoeacutetudier lrsquoeacutevolution des deacutelaiset de la longueur des routes depuis lrsquoeacutetude preacuteceacutedente nous avons reacutealiseacute une nouvellecampagne de ping depuis Paris et La Reacuteunion Cette campagne a mis a contribution lesnœuds [PlanetLabEurope] de lrsquoUniversiteacute de La Reacuteunion et de lrsquoUniversiteacute Pierre et Ma-rie Curie

Agrave partir du jeu drsquoadresses preacutepareacute preacutesenteacute preacuteceacutedemment nous avons tireacute le maxi-mum drsquoadresses IP possibles tout en respectant la reacutepartition geacuteographique de la figure22b Nous avons obtenu un jeu de 40 000 adresses Nous avons fait le choix drsquoutiliserun eacutechantillon drsquoadresses diffeacuterentes par rapport agrave la premiegravere eacutetude Cette deacutecision pro-vient de notre volonteacute drsquoobtenir des donneacutees repreacutesentatives de lrsquoeacutetat actuel de lrsquoInterneten terme de reacutepartition des adresses Chaque mesure sera indeacutependante lrsquoune de lrsquoautreEn effet pour qursquoune mesure se lance il faut que la preacuteceacutedente soit finie

Lrsquoanalyse se deacuteroulera agrave lrsquoidentique de ce qui srsquoest fait pour lrsquoeacutetude preacuteceacutedente agravelrsquoexception drsquoune modification Nous y ajouterons la comparaison de la longueur desroutes Les reacutesultats associeacutes agrave cette eacutetude seront preacutesenteacutes dans la section 241

1 Source httpswww countryipblocks net

47

(a) IP seacutelectionneacutee au hasard (b) CountryIPBlocks

FIGURE 22 ndash Distribution geacuteographique des adresses IPv4 publiques

233 Connectiviteacute

La seconde eacutetude de meacutetrologie active concerne lrsquoeacutetude de la connectiviteacute de La ReacuteunionPour reacutepondre agrave notre objectif nous mettons en place deux protocoles de mesure Unprotocole eacutetudiant la connectiviteacute Depuis La Reacuteunion et un protocole dans le sens Vers LaReacuteunion

Depuis La Reacuteunion

Notre eacutetude de meacutetrologie se compose de plusieurs phases

1 la preacuteparation du jeu de destinations

2 la reacutealisation des mesures par les sondes

3 la quantification des perturbations de nos mesures sur lrsquoaccegraves des usagers

4 la collecte des reacutesultats obtenus par les sondes

5 lrsquoanalyse des reacutesultats

Preacuteparation La reacutepartition geacuteographique preacutesenteacutee dans la figure 22b ne peut pas srsquoap-pliquer agrave lrsquointeacutegraliteacute de notre ensemble de deacutepart Afin de pouvoir garder cette reacutepar-tition nous avons reacuteduit notre jeu de destinations agrave 10 000 adresses Cette reacuteduction estneacutecessaire afin que lrsquoensemble de nos mesures puissent ecirctre reacutealiseacutees en un deacutelai de 24heures Bien que le nombre drsquoadresses seacutelectionneacutees repreacutesente moins de 1 des adressesIP publiques de lrsquoInternet il est neacuteanmoins suffisant pour que notre jeu reste preacutecis

48

Reacutealisation Chaque sonde eacutetant indeacutependante lrsquoautomatisation du lancement des me-sures degraves le deacutemarrage est neacutecessaire De fait une proceacutedure a eacuteteacute implanteacutee au seinde lrsquoOS Cette proceacutedure va autoriser le deacutemarrage des mesures degraves la fin de la phasedrsquoinitialisation de lrsquoensemble des services de Raspbian La mise en place des mesures estdiviseacutee en 2 eacutetapes

La premiegravere consiste pour chaque sonde agrave creacuteer ses propres sceacutenarios de mesuresUn sceacutenario est un fichier contenant deux colonnes destination et intervalle de temps Lapremiegravere colonne contient les 10 000 adresses IP de destination La seconde colonne re-groupe des valeurs qui serviront drsquoeacutecart entre deux mesures Ces valeurs ont eacuteteacute geacuteneacutereacuteessuivant une loi exponentielle de taux 864 Ce taux provient de lrsquoeacutequation 21 ci-dessous

taux = nombre de secondes par journombre dprimeadresses IP = 8640010000 = 8 64(21)

Les valeurs obtenues seront identiques sur lrsquoensemble des sondes de mesures Chaquesceacutenario sera creacuteeacute en tirant aleacuteatoirement une adresse IP et un eacutecart Une fois que lrsquoen-semble des sceacutenarios est eacutecrit et numeacuteroteacute de 1 agrave 28 la sonde va programmeacute dans le tempslrsquoexeacutecution de la seconde eacutetape gracircce agrave la commande at

La seconde eacutetape consiste agrave lire le sceacutenario du jour et agrave joindre la destination par lrsquooutilde mesure La commande exacte exeacutecuteacutee par chaque test est

Paris-traceroute -m 255 -n -p icmp ip

Dans laquelle les options indiquent

mdash -m 255 la valeur du champ TTL du paquet est mise agrave sa valeur maximale (255)Nous faisons le choix drsquoautoriser lrsquooutil agrave essayer de joindre la destination jusqursquoagraveeacutepuisement de la valeur maximale autoriseacutee par le protocole pour identifier certainsproblegravemes de routage

mdash -n pas de reacutesolution de DNS Afin drsquooptimiser les mesures nous avons eacutelimineacute lareacutesolution des noms des routeurs Seules les adresses IP seront afficheacutees

mdash -p icmp le protocole utiliseacute pour la mesure [Wenwei2006] effectue une eacutetude com-parative entre les protocoles ICMP et TCP pour les mesures de deacutelai Ils ont montreacuteque dans certaines conditions les reacutesultats sont similaires Quand le ratio α calculeacuteentre le RTT moyen et le RTT minimal tend agrave ecirctre important (supeacuterieur agrave 20) TCPest moins stable que son concurrent Crsquoest pour cette raison que nous avons fait lechoix de lrsquoICMP

mdash ip adresse IP de destination que la commande va essayer de joindre

Veacuterification La sonde va consommer de la bande passante de chaque connexion Inter-net Lrsquoestimation du deacutebit de la mesure deacutepend du nombre moyen de paquets eacutemis parmesure et de la dureacutee moyenne drsquoune mesure Agrave lrsquoaide drsquoune peacuteriode de test nous avonspu calculer divers paramegravetres drsquoune mesure reacutealiseacutee avec Paris-traceroute Les informa-tions obtenues concernent la dureacutee drsquoune mesure et le nombre de paquets eacutechangeacutes Lesreacutesultats obtenus montrent qursquoune mesure dure en moyenne 28 secondes et se composede 54 paquets de 64 octets Une mesure geacutenegravere donc un deacutebit drsquoeacutemission de 987 bitss agravelrsquoentreacutee de lrsquointerface reacuteseau Le deacutebit geacuteneacutereacute effectif (au niveau du support) est de 1265bitss Le deacutebit geacuteneacutereacute par rapport au deacutebit drsquoaccegraves drsquoun accegraves ADSL est alors neacutegli-geable

49

Drsquoapregraves le rapport [Vergoz2013] le deacutebit montant le plus faible mesureacute est de 128 33KbsLa charge calculeacutee repreacutesente pregraves de 1 de la capaciteacute du lien drsquoaccegraves Comme il yaura en moyenne 4 mesures simultaneacutees la capaciteacute consommeacutee correspond donc agrave 4Cette situation correspond au pire cas Dans la situation courante drsquoun accegraves theacuteorique enMbits nous pouvons avancer que la sonde nrsquoaura aucun impact sensible sur la connec-tiviteacute du participant

Collecte Une phase de collecte des donneacutees de mesures est reacutealiseacutee Le but de cetteeacutetape est de libeacuterer de lrsquoespace disque sur la sonde Chaque jour agrave minuit un nouveausceacutenario est lanceacute Une fois que 7 sceacutenarios ont eacuteteacute lus la sonde va creacuteer une archive Lenom de lrsquoarchive sera composeacute de la date de creacuteation de lrsquoarchive du nom de la sonde etde la TAI Le nom propose un classement rapide des donneacutees que ccedila soit par TAI ou pardate Lrsquoarchive contiendra les mesures des 7 jours preacuteceacutedents Lrsquoarchive est envoyeacutee sur leserveur de stockage localiseacute au sein du laboratoire Une comparaison de lrsquoempreinte MD5de lrsquoarchive preacutesente sur le serveur et sur la sonde de mesure sera reacutealiseacutee Si les deuxempreintes sont identiques alors la suppression de lrsquoarchive heacutebergeacutee sur le RaspberryPi est reacutealiseacutee Le jour drsquoenvoi des donneacutees sur le serveur aucune mesure nrsquoest effectueacuteeafin de ne pas geacuteneacuterer de bruit suppleacutementaire sur le lien Le lendemain de la copiedes donneacutees la sonde va amorcer 7 nouveaux jours de mesures Un cycle de mesuresest composeacute de 7 jours de mesures conseacutecutifs et drsquoun jour drsquoenvoi des donneacutees versle serveur de stockage Ce cycle est reacutepeacuteteacute 4 fois par mois La figure 23 scheacutematise lefonctionnement drsquoune sonde de mesure sur une dureacutee de 32 jours soit 4 cycles de mesureet de collecte

La plate-forme reacutealise des mesures en continue jusqursquoagrave lrsquoarrecirct complet de lrsquoappareil demesures Nous nrsquoavons pour lrsquoinstant pas programmeacute drsquoarrecirct des mesures Dans le cadrede lrsquoanalyse reacutealiseacutee dans ce manuscrit nous avons pris un cycle complet de mesure soit32 jours Nous nrsquoeffectuons pas drsquoanalyse comparative temporelle de nos mesures

Analyse La plate-forme reacutealise les mesures par cycle de 7 jours Lrsquoanalyse des tracesreacutecolteacutees se fait en plusieurs eacutetapes Le processus drsquoanalyse commence par la deacutecoupedu fichier de donneacutees en fichiers atomiques Chaque fichier atomique contiendra uni-quement le reacutesultat drsquoune mesure Chaque fichier de donneacutees reacutecolteacutees par jour va doncecirctre deacutecouper en 10 000 fichiers atomiques Cette deacutecoupe est reacutealiseacutee par lrsquooutil rgeolocLrsquoanalyse des fichiers atomiques diffegravere selon lrsquoobjectif

Lrsquoextraction des deacutelais srsquoeffectue agrave lrsquoaide de rgeoloc Lors de lrsquoextraction les informa-tions sur les deacutelais sont accompagneacutees de la longueur du chemin et des adresses IP sourceet destination

Nous souhaitons deacuteterminer si les routes Internet provenant de La Reacuteunion sont sy-meacutetriques ou non Pour cela une eacutetude des deacutelais et des routes vers La Reacuteunion est effec-tueacutee

Vers La Reacuteunion

Les routes asymeacutetriques sont freacutequentes et principalement dues agrave des politiques deroutage et agrave lrsquoingeacutenierie de trafic Des meacutecanismes comme lrsquoeacutequilibrage de charge (load-balancing) Hot Potato Routing ou encore BGP (Border Gate Protocol) peuvent eacutegalementgeacuteneacuterer un pheacutenomegravene drsquoasymeacutetrie des liensHot Potato Routing est un pheacutenomegravene lieacute au routage sans regraveglement Le routeur transfegraverele paquet aussi vite que possible vers un routeur situeacute en aval sur la route [Feige1992Wang2018]

50

FIGURE 23 ndash Fonctionnement de la sonde

BGP est protocole de routage inter-AS deacutefini dans le [RFC1105] En fonction des informa-tions eacutechangeacutees deux paquets peuvent ne pas suivre la mecircme chemin IP mais suivre unchemin AS identique

Afin de veacuterifier la preacutesence des liens asymeacutetriques nous avons mis en place le proto-cole suivant en utilisant la plate-forme Atlas RIPE NCC [Ripe2010]

Preacuteparation Pour notre eacutetude et en accord avec les Conditions Geacuteneacuterales drsquoUtilisation(CGU) drsquoAtlas nous avons seacutelectionneacute le nombre maximal de sondes autoriseacutees soit1 000 Ces sondes serviront de sources pour nos mesures La seacutelection des sondes srsquoestfaite selon deux critegraveresLe premier est le fait que la sonde soit active En effet mecircme si la sonde nrsquoest pas joi-gnable Atlas continue drsquoindiquer la sonde dans ses donneacuteesLa seconde indication neacutecessaire agrave la seacutelection drsquoune sonde est son pays drsquoheacutebergementIl est neacutecessaire de garder la mecircme reacutepartition geacuteographique que les destinations seacutelec-tionneacutees pour lrsquoeacutetude preacuteceacutedente (voir Figure 22b)

La seacutelection des destinations srsquoest effectueacutee sur les critegraveres drsquoidentification des FAI etdes TAI disponibles sur lrsquoicircle Tout comme notre plate-forme de mesure de la section 233

51

il est pour nous important que nos destinations respectent une pariteacute sur ces critegraveres deseacutelection Afin de nous assurer que nos destinations soient physiquement heacutebergeacutees surlrsquoicircle nous avons pris la deacutecision de seacutelectionner des sondes de mesure de lrsquoeacutetude preacuteceacute-dente Lrsquoutilisation drsquoAtlas eacutetant reacutegi par un systegraveme drsquoutilisation et de creacuteation de creacuteditnous avons ducirc limiter le nombre de nos destinations agrave 10 IP publiques de la plate-formeRunPL Nous avons pleinement conscience que ce nombre nrsquoest pas forceacutement repreacute-sentatif du nombre drsquoadresse IP disponibles sur lrsquoIcircle de La Reacuteunion mais nous sommesrestreint par les CGU drsquoAtlas

Reacutealisation Atlas propose deux possibiliteacutes de programmation des sondes La premiegraveresrsquoeffectue agrave travers son interface graphique Le second choix est drsquoutiliser une API Commeil est fastidieux de programmer un nombre important de mesures agrave travers lrsquointerfacegraphique nous faisons le choix drsquoutiliser lrsquoAPI Pour effectuer 10 000 mesures par journous avons fait le choix de garder le taux de la loi exponentielle de lrsquoeacutetude preacuteceacutedentesoit 8 64 secondes Afin de limiter les pheacutenomegravenes de synchronisation le calendrier demesures a eacuteteacute geacuteneacutereacute aleacuteatoirement Nous nous sommes assureacutes que chaque sonde demesures allait effectivement joindre lrsquoensemble des destinations par jour

Veacuterification La veacuterification des perturbations se fait sur la bande passante descendanteEn effet ce sont les sondes de la plate-forme RunPL qui geacutenegraverent du trafic en continu Ilne faut pas que les mesures de la section 233 soient impacteacutees par lrsquoarriveacutee des paquetsentrants Le nombre maximal de paquets arrivant jusqursquoau routeur de lrsquoheacutebergeur estde 3 Un paquet possegravede un poids maximal de 64 octets Un poids total de 1536 bitsest envoyeacute agrave la destination Une mesure eacutetant programmeacutee toutes les 8 secondes nousutilisons cette valeur comme variable pour calculer le deacutebit Nous avons donc un deacutebitde 192 bits

Drsquoapregraves le rapport [Vergoz2013] le deacutebit descendant le plus faible mesureacute est de 1 58Mbits Notre mesure impact repreacutesente donc approximativement 0 12 de la capaciteacutedu lien Cet impact est neacutegligeable agrave un instant donneacute

Collecte La plate-forme Atlas stocke automatiquement les reacutesultats lieacutes agrave ses expeacuteri-mentations sur son propre serveur Une fois lrsquoensemble des mesures reacutealiseacutees nous avonsreacutecupeacutereacute les reacutesultats Un total de 300 000 fichiers correspondant aux 300 000 mesuresont eacuteteacute teacuteleacutechargeacutes du serveur drsquoAtlas

Analyse Cette partie de lrsquoeacutetude est fortement similaire agrave lrsquoanalyse effectueacutee pour lrsquoeacutetudedes routes et deacutelais depuis La Reacuteunion Une seule partie diffegravere En effet comme indiqueacutedans la section preacuteceacutedente chaque fichier collecteacute repreacutesente une mesure Nous nrsquoavonsdonc pas la neacutecessiteacute drsquoeffectuer une phase de deacutecoupage de nos donneacutees en fichiersatomiques

Reacutecapitulatif

Afin de pouvoir effectuer une comparaison entre les deux protocoles de mesures surlrsquoeacutetude des routes et des deacutelais associeacutes le tableau 25 reacutesume les deux protocoles sur lemois de mesure analyseacute

Nous constatons une diffeacuterence notable en terme de sources et de destinations Cettediffeacuterence impacte le nombre de fichiers atomiques que lrsquoon a obtenus Le nombre defichiers atomiques provient de la multiplication entre le nombre de sources le nombre dedestinations et le nombre de jours de mesures Cela correspond au nombre maximal de

52

TABLE 25 ndash Reacutesumeacute des caracteacuteristiques du jeu de donneacutees

Depuis VersSondes de mesures Raspberry Pi Atlas RIPE NCC

Nombres de Destinations 10 000 IP 10 raspberry-piNombres de sources 27 1 000

Nombres de jours de mesures 28 30Outil de mesure Paris-traceroute

Nombres de fichiers atomiques 7 560 000 300 000

Nombres de fichiers analyseacutes 1 015 180 38 714

fichiers que lrsquoon peut obtenir La derniegravere ligne du tableau indique le nombre de fichiersque lrsquoon a pu analyser apregraves veacuterification des mesures et nettoyage des fichiers erroneacutesCe nettoyage se fait par lrsquooutil drsquoanalyse rTraceroute Dans la section 233 nous avons puanalyser 13 43 des donneacutees De la section 233 12 91 des donneacutees ont eacuteteacute exploiteacutesNous avons dans les deux cas un taux de pertes de donneacutees important

24 Reacutesultats

Dans la suite de notre manuscrit et pour des raisons pratiques nous avons reacuteduit lenom des continents agrave deux lettres La correspondance entre lrsquoacronyme et le nom completest indiqueacutee dans le tableau 26

TABLE 26 ndash Correspondance entre acronymes et noms des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

Cette correspondance provient de lrsquoutilisation des deux premiegraveres lettres de chaquecontinent en version anglophone

241 Eacutevolution

La comparaison avec lrsquoexistant fut diviseacutee en deux Dans un premier temps nousavons compareacute les deacutelais Par la suite nous avons utiliseacute une partie des donneacutees nonencore exploiteacutees pour reacutealiser une comparaison de la longueur des routes

Distribution du RTT

Les mesures obtenues ont permis drsquoeffectuer une comparaison avec les donneacutees reacute-colteacutees en 2012 par [Anelli2012] Nous avons effectueacute une campagne de ping en 2016 afindrsquoeacutetudier lrsquoeacutevolution des deacutelais depuis Paris et La Reacuteunion La figure 24 illustre lrsquoeacutevolu-tion de la distribution du RTT en 4 ans

Entre 2012 et 2016 le jeu drsquoadresses IP de destination fut diffeacuterent En 2012 aucunereacutepartition geacuteographique ne fut eacutetablie En 2016 la distribution des adresses est cellepreacutesenteacutee dans la partie 231 Malgreacute ces diffeacuterences nous remarquons que les courbesont les mecircmes tendances en 2012 et en 2016 Des pics sont preacutesents aux environs desvaleurs 005 01 et 03 secondes pour Paris en 2012 Des pics sont identifieacutes aux valeurs02 035 et 05 secondes pour La Reacuteunion en 2012 Les pics sont preacutesents aux alentours desmecircmes valeurs sur les deux campagnes de mesure Nous eacutemettons lrsquohypothegravese que ces

53

pics correspondent aux 3 continents les plus repreacutesenteacutes dans nos eacutechantillons agrave savoirlrsquoAmeacuterique du Nord lrsquoAsie et lrsquoEurope Nous veacuterifierons cela par la suite

Malgreacute un eacutecart de 4 ans entre les deux campagnes de mesures on constate une sta-biliteacute du deacutelai minimal aux alentours de 02 secondes La stabiliteacute du deacutelai srsquoest elle ac-compagneacutee drsquoune stabiliteacute de la longueur des routes

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(a) 2012

0

0002

0004

0006

0008

001

0012

0014

0016

01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(b) 2016

FIGURE 24 ndash Comparaison des deacutelais entre Paris et La Reacuteunion

Longueur du chemin

Dans le section preacuteceacutedente nous avons constateacute que le deacutelai minimal pour quitter lrsquoicircleest resteacute stable en 4 ans Nous allons essayer de corroborer cette stabiliteacute du deacutelai par unestabiliteacute de la longueur des routes sur la mecircme peacuteriode

La longueur des routes fut obtenue par lrsquoanalyse inverse du TTL Le [RFC1700] preacute-conise une valeur de deacutepart de 64 Or le site Wikipeacutedia [WikiPing] indique que le TTLinitial peut varier Les valeurs les plus communes sont 64 128 voire 255 dans certains casNous avons donc en fonction de la valeur du TTL soustrait une valeur de deacutepart agrave la va-leur indiqueacutee pour obtenir la longueur de la route Dans les donneacutees datant de 2012 leslongueurs de certaines routes sont eacutegales agrave 127 Ne pouvant deacutecider de la valeur de TTLde deacutepart nous avons fait le choix de ne garder que les reacutesultats dont le TTL afficheacute parping est supeacuterieur ou eacutegal agrave 128 Pour les donneacutees de 2016 nous nrsquoavons pas reacutepertorieacutede valeurs comprises dans lrsquointervalle [ 120 208] De fait nous avons gardeacute lrsquoensembledes valeurs obtenues

La figure 25 illustre lrsquoeacutevolution des routes entre les deux jeux de reacutesultats En 2012la longueur des routes eacutevolue entre 10 et 40 nœuds avec un pic agrave 24 nœuds En 2016les routes ont une longueur qui varie entre 5 et 30 sauts avec un pic agrave 17 Un eacutecart de 7nœuds repreacutesenteacute sur notre figure

Les deacutelais entre La Reacuteunion et Paris sont resteacutes stables entre 2012 et 2016 Sur la mecircmepeacuteriode la longueur des routes depuis La Reacuteunion a diminueacute

242 Connectiviteacute de La Reacuteunion

La section 241 a montreacute lrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012et 2016 Malgreacute ces eacutetudes aucune caracteacuterisation de la connectiviteacute de La Reacuteunion nrsquoaeacuteteacute reacutealiseacutee Dans cette section nous allons effectuer cette caracteacuterisation en termes dedeacutelais et des routes emprunteacutees

54

FIGURE 25 ndash Eacutevolution de la longueur des routes entre 2012 et 2016

Geacuteneacuteraliteacutes

Nous avons en plus des informations sur les deacutelais et la longueur des routes desinformations sur les adresses IP rencontreacutees tout au long des mesures Ainsi nous avonsdeacutecideacute de reacutepartir notre analyse sur 4 principales meacutetriques que sont

mdash La longueur du chemin est deacutetermineacutee par le nombre de nœuds rencontreacute par Paris-traceroute

mdash Le deacutelai analyseacute est le RTT Il est associeacute agrave la destination jointe

mdash La localisation des adresses IP avant (resp apregraves) le passage par les cacircbles sous-marins quand nos donneacutees arrivent (resp quittent) agrave La Reacuteunion

mdash La distance geacuteographique correspond agrave la distance reacuteelle (en Km) entre la source etla destination Pour cela on utilise lrsquoeacutequation (22) Ils srsquoagit de lrsquoeacutequation de calculde distance entre deux points sur une sphegravere

d = arccos[cos(x)times cos(y)times cos(m)times cos(n) ++ cos(x)times sin(y)times cos(m)times sin(n) ++ sin(x)times sin(m)]times 6371 1 [km]

(22)

ougrave

mdash (xy) (mn) sont respectivement la latitude et la longitude de la source et de la des-tination (en radians)

mdash 63711 km est la reacutefeacuterence en radius de la Terre

Les coordonneacutees geacuteographiques des adresses IP ont eacuteteacute obtenues par notre outil degeacuteolocalisation Nous avons ainsi pu calculer la distance geacuteographique entre deux adressesIP Si nous prenons lrsquoexemple de la reacutepartition geacuteographique des adresses IP des sondesatlas et des destinations seacutelectionneacutees nous obtenons la figure 26 Les deux courbes sontsimilaires en terme de reacutepartition des distances La diffeacuterence des valeurs de lrsquoaxe des

55

ordonneacutees provient du nombre plus important drsquoeacutechantillons pour la figure 26a Surcette figure il est difficile de visualiser la distance des adresses relatives au continentoceacuteanique La faible eacutepaisseur de la probabiliteacute des adresses oceacuteaniques est eacutegalementpreacutesente sur la figure 26b On constate sur cette figure une preacutesence plus importantedrsquoadresses IP africaines et asiatiques

(a) Depuis (b) Vers

FIGURE 26 ndash Distribution de la distance geacuteographique par continent

La reacutepartition des adresses IP dans le monde et leur distance geacuteographique ont-ellesun impact sur la distribution des deacutelais Crsquoest agrave cette question que nous allons essayerde reacutepondre dans la section suivante

Distribution du RTT par continent

La figure 27 repreacutesente la distribution des deacutelais obtenus par nos mesures incluantla reacutepartition par continent Nous avons utiliseacute un regroupement des deacutelais par eacutecart de10 ms On constate rapidement que les deux figures nrsquoont pas la mecircme tendance Dans lasection 241 nous avions eacutemis lrsquohypothegravese que les pics preacutesents sur les courbes des deacutelaiseacutetaient associeacutes aux continents les plus preacutesents dans la geacuteolocalisation des adresses IP

La comparaison que lrsquoon peut effectuer avec les donneacutees de lrsquoexistant est celle delrsquoeacutetude Depuis Ainsi on remarque que la figure garde la mecircme forme avec la preacutesencedes 3 pics Sur la figure 27a nous pouvons identifier ces pics Ces pics repreacutesentent lrsquoEu-rope lrsquoAmeacuterique du Nord et lrsquoAsie On constate que le deacutelai minimal est stable avec unevaleur proche des 200 ms

Dans lrsquoexpeacuterimentation Vers La Reacuteunion nous constatons la preacutesence de non pas 3mais de 2 pics Le pic relatif au continent asiatique a disparu De plus les deacutelais associeacutesagrave ce continent sont moins concentreacutes Pour les autres continents la distribution des deacute-lais est relativement identique agrave lrsquoexpeacuterimentation preacuteceacutedente Nous pouvons remarquerla preacutesence de deacutelais africains vers La Reacuteunion aux alentours des 100 ms Les deacutelais de-puis lrsquoEurope sont sensiblement eacutequivalents agrave ceux de lrsquoeacutetude Depuis avec des deacutelaiscompris entre 180 et 190ms

Agrave la lecture des reacutesultats nous pouvons confirmer que lrsquohypothegravese avanceacutee preacuteceacute-demment est juste

Nous avons connaissance drsquoune relation entre la distance et le temps mis pour parcou-rir cette distance Ayant constateacute lrsquoeacutevolution des deacutelais nous allons maintenant eacutetudierlrsquoeacutevolution de la distance parcourue

56

(a) Depuis (b) Vers

FIGURE 27 ndash Distribution du RTT par continent

Longueur du chemin par continent

Nous avons pu dans la section 241 constater une diminution des routes entre 2012et 2016 Les figures 28 indiquent la reacutepartition de la longueur des routes obtenues enfonction des continents La premiegravere constatation est la forte similitude entre les deuxcourbes

Sur la figure 28a on remarque la preacutesence drsquoun pic pour une longueur de 18 nœudsCela indique que peu importe le continent de destination la probabiliteacute drsquoavoir une routedrsquoune longueur de 18 sauts est importante

Dans le sens Vers le pic est quasiment identique selon le continent de deacutepart Lavaleur geacuteneacuterale se situe agrave une valeur de 15 nœuds pour lrsquoAmeacuterique du Nord lrsquoOceacuteanieet lrsquoAmeacuterique du Sud et agrave une valeur de 16 sauts pour les autres continents

Avec un eacutecart de 2 agrave 3 sauts selon le sens on peut donc consideacuterer que la longueur duchemin reste identique pour lrsquoInternet reacuteunionnais

(a) Depuis (b) Vers

FIGURE 28 ndash Distribution de la longueur des routes par continent

Longueur du chemin et distance geacuteographique

Le premier reacutesultat analyseacute concerne la distance logique par rapport agrave la distancephysique Dans lrsquoarticle [Leguay2004] lrsquoauteur a calculeacute la moyenne des chemins dans

57

lrsquoInternet agrave partir drsquoun jeu incluant plus de 7 000 000 de donneacutees La valeur obtenue estde 15 57 sauts

Dans nos reacutesultats la valeur moyenne calculeacutee est de 17 11 eacutequipements traverseacutesavant de joindre la destination Cette valeur regroupe lrsquoensemble de nos donneacutees sansaucune distinction de la localisation de la source drsquoeacutemission En eacutetudiant uniquementles donneacutees Depuis les routes ont une longueur moyenne de 17 37 sauts Si on analysela longueur des routes des donneacutees entrant sur lrsquoicircle on obtient une moyenne de 16 85eacutequipements On observe deacutejagrave une premiegravere asymeacutetrie des routes selon que lrsquoon quitteou que lrsquoon joint lrsquoicircle de La Reacuteunion

Les figures 29a et 29b illustrent les reacutesultats obtenus Chaque figure est diviseacutee endeux On a inseacutereacute en bas de chaque figure la PDF de la longueur du chemin en fonctionde la distance entre sources et destinations Tandis qursquoen haut les aires dessineacutees parles ellipses contiennent 95 des eacutechantillons rattacheacutes agrave chaque continent Les barresdrsquoerreurs repreacutesentent quant agrave elles la moyenne et lrsquoeacutecart-type de la longueur du cheminassocieacutes agrave chaque continent

Nous remarquons que depuis La Reacuteunion la majoriteacute des distance sont situeacutees danstrois grandes reacutegions Le premier regroupement se situe entre 8 000 et 12 000 km Cebloc inclus lrsquoAsie lrsquoOceacuteanie lrsquoEurope et lrsquoAmeacuterique du sud Le second bloc comporteque lrsquoAmeacuterique du Nord et se situe au delagrave des 14 000 km Reste le cas africain Ce conti-nent est tregraves proche de La Reacuteunion Les destinations et sources africaines sont toutesinfeacuterieures agrave 10 000 km

Lrsquoanalyse geacuteneacuterale des reacutesultats obtenus montre que le nombre de sauts nrsquoest pas deacute-pendant de la distance geacuteographique Sur la figure 29a on constate des chemins aussilongs sur la boucle locale que pour joindre certaines destinations lointaines On a eacutegale-ment repreacutesenteacute sur les figures PL(d) = α times d + β qui est la fonction lineacuteaire de la lon-gueur du chemin comme fonction de la distance geacuteographique Le tableau 27 regroupeles eacutequations obtenues selon lrsquoexpeacuterimentation

TABLE 27 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

Expeacuterimentation Eacutequation PL(d)Depuis La Reacuteunion 1 58 lowast 10minus5 timesD + 16 65

Vers La Reacuteunion 7 50 lowast 10minus5 timesD + 18 32

La valeur obtenue pour α qui est le coefficient directeur de la droite possegravede unmultiplicateur eacutegal agrave 10minus5 Cette valeur indique le nombre de sauts suppleacutementaires pourchaque kilomegravetre Les valeurs de α proches de zeacutero indiquent clairement que la distancegeacuteographique nrsquoimpacte pas la longueur du chemin quelle que soit lrsquoexpeacuterimentation

Impact de la longueur du chemin sur le RTT

Les figures 210a et 210b repreacutesentent la distribution du RTT comme fonction dunombre de sauts ainsi que la meacutediane et les PDF Est eacutegalement preacutesente en bas dechacune des figures la probabiliteacute de densiteacute de la longueur du chemin

Les figures montrent une croissance du deacutelai avec lrsquoaugmentation du nombre denœuds jusqursquoagrave une certaine limite Sur la figure 210a repreacutesentant lrsquoeacutetude Depuis nousremarquons des deacutelais importants deacutepassant les 3 secondes Cette valeur des 3 secondespeut ecirctre atteinte degraves que lrsquoon deacutepasse le 9eme saut Agrave lrsquoinverse sur lrsquoeacutetude Vers illustreacuteepar la figure 210b nous constatons une certaine stabiliteacute du deacutelai Les valeurs restent

58

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 29 ndash Relation entre la longueur de la route et la distance geacuteographique

majoritairement infeacuterieures agrave 2 secondes Lrsquoeacutetude de la meacutediane nous indique des routesplus courtes lorsque lrsquoon essaye de joindre La Reacuteunion Il y a une forte variation de lameacutediane agrave la fin de la figure due au nombre drsquoeacutechantillons pour chaque valeur de lalongueur des routes Afin drsquoidentifier le deacutelai associeacute agrave chaque nouveau nœud la fonc-tion lineacuteaire D(d) = α times d + β du deacutelai comme fonction de la longueur du chemin esteacutegalement repreacutesenteacutee

Le tableau 28 indique les eacutequations obtenues lors de lrsquoanalyse des donneacuteesLa variable drsquoajustement β ne sera pas analyseacutee bien qursquoelle repreacutesente un deacutelai mi-

nimal Nous avons vu dans la partie preacuteceacutedente que ce deacutelai eacutetait eacutequivalent peu importe

59

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 210 ndash Relation entre la longueur de la route et les deacutelais

TABLE 28 ndash Formule de correacutelation du deacutelai en fonction de la longueur du chemin

Expeacuterimentation Eacutequation D(PL)Depuis La Reacuteunion 11 11times PL+ 204 92

Vers La Reacuteunion 6 22times PL+ 249 66

lrsquoexpeacuterimentation La pente de la droite repreacutesenteacutee par le coefficient α indique la valeurassocieacutee agrave chaque nouvel eacutequipement Cette valeur diffegravere fortement selon lrsquoexpeacuterimen-tation mise en place Ainsi le temps accordeacute agrave chaque eacutequipement est beaucoup pluslong lorsque nos donneacutees quittent La Reacuteunion que dans le sens inverse avec un coef-ficient proche du double Cela signifie que pour chaque saut suppleacutementaire un deacutelaiadditionnel de 6 22ms (resp 11 11ms) doit ecirctre pris en compte lorsque lrsquoon joint (resp

60

quitte) La Reacuteunion On passe quasiment du simple au double

Nous avons preacuteceacutedemment analyseacute les Cumulative Density Function (CDF) des lon-gueurs des routes logiques par continent Nous avions constateacute pour certains continentsune forte similitude entre les diffeacuterentes courbes Cette observation est de nouveau preacute-sente ici Les deux PDF sur la longueur des chemins emprunteacutes sont similaires Neacutean-moins le fait drsquoavoir un plus grand nombre drsquoeacutechantillons sur lrsquoexpeacuterimentation Depuisa permis un lissage de la courbe

Correacutelation entre deacutelai et distance geacuteographique

Dans [Krajsa2011] les auteurs se sont inteacuteresseacutes agrave lrsquoimpact de la distance sur le RTTLes reacutesultats ont eacuteteacute obtenus a partir drsquoune eacutetude de meacutetrologie active reacutealiseacutee dans despays agrave forte connectiviteacute en terme de liaisons sous-marines Les auteurs ont deacutetermineacuteune fonction lineacuteaire repreacutesenteacutee par lrsquoeacutequation suivante

y = 0 0128times x (23)

Cette eacutequation preacutedit le deacutelai en fonction drsquoune distance geacuteographique donneacutee Nousallons eacutetudier la pertinence de ce modegravele dans le cas de lrsquoicircle de La Reacuteunion On se reacutefegravereagrave ce modegravele par la notation Expected Internet RTT for a given geographical Distance (EIRD)

La figure 211 est composeacuteee de trois parties En haut nous avons repreacutesenteacute les dis-tances couvertes par chaque continent La figure 211a (resp fig 211b) graphe la fonctionExpected RTT (ER) pour le cas Depuis (resp Vers) et le modegravele EIRD Le modegravele ER(d) vientde la repreacutesentation sous forme lineacuteaire de lrsquoimpact de la distance geacuteographique sur lesdeacutelais obtenus Nous avons eacutegalement repreacutesenteacute les 5eme 10eme 25eme 75eme 90eme et95eme percentiles Les points preacutesents agrave lrsquointeacuterieur des barres drsquoerreurs indiquent le 50eme

percentile Au bas de chaque figure la PDF de la distance geacuteographique est repreacutesenteacutee

Lrsquoeacutetude de la reacutepartition de nos destinations (resp sources) pour notre eacutetude montreque les distances vont drsquoune valeur infeacuterieure agrave 10 km jusqursquoagrave pregraves de 20 000 km Nousconstatons un regroupement des continents entre 5 000 et 10 000 km pour lrsquoeacutetude DepuisLe regroupement se fait agrave une distance plus grande (comprise en 7 500 et 14 000 km)pour Vers Ces valeurs sont remarqueacutees dans la PDF de chaque eacutetude Malgreacute la preacutesenceseule du continent Nord Ameacutericain apregraves 15 000 km la densiteacute de probabiliteacute drsquoavoir unedestination prise dans cet ensemble est importante

Les figures montrent une complegravete opposition entre le modegravele EIRD et nos reacutesul-tats Afin drsquoeffectuer une meilleure comparaison nous avons traduit nos reacutesultats sousla forme ER(d) = αtimes d+ β fonction lineacuteaire du deacutelai en fonction de la distance geacuteogra-phique Une repreacutesentation graphique de ER(d) est indiqueacutee sur les figures Les eacutequa-tions obtenues sont indiqueacutees dans le tableau 29

TABLE 29 ndash Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique

Expeacuterimentation Eacutequation d(t) R2

EIRD y = 0 0128times t 0 9794

ER(d) (Depuis La Reacuteunion) y = minus62 92 lowast 10minus4 times t+ 477 6 16 80 lowast 10minus3ER(d) (Vers La Reacuteunion) y = minus29 4 lowast 10minus5 times t+ 358 1 14 81 lowast 10minus5

Les coefficients de deacutetermination (R2) entre les fonctions lineacuteaires et nos donneacutees in-diquent que nous nrsquoavons pas pu trouver de modegravele de preacutediction suffisamment preacuteciscontrairement au modegravele EIRD Nous constatons eacutegalement que les pentes de nos mo-degraveles ER(d) sont toutes deux neacutegatives Cela signifie que le deacutelai sera plus court pour

61

(a) Depuis La Reacuteunion

(b) Vers La Reacuteunion

FIGURE 211 ndash Relation entre les deacutelais et la distance geacuteographique

joindre une distance eacuteloigneacutee physiquement degraves que lrsquoon emprunte les cacircbles sous-marins La preacutesence du GIX Reunix sur lrsquoicircle permet drsquoavoir des deacutelais courts du mo-ment que lrsquoon reste sur la boucle locale Gazelle (cf section 21) Par exemple le deacutelai pourjoindre un pays europeacuteen est plus court que le deacutelai pour joindre les pays de la ZOI Cereacutesultat est contraire agrave lrsquoanalyse EIRD Il peut srsquoexpliquer en partie par le fait lrsquoeacutetude preacute-senteacute dans [Krajsa2011] est reacutealiseacutee dans des lieux ougrave la connectiviteacute (en terme de liaisonssous-marines) est importante

La partie drsquoanalyse des routes emprunteacutees va nous aider agrave valider ou infirmer lrsquohy-pothegravese suivante Les coefficients α obtenus sur nos eacutequations ER(d) proviennent du routage

Analyse des routes

Dans la section 22 nous avons montreacute lrsquoexistence de liens physiques reliant lrsquoen-semble des icircles de la ZOI Nous cherchons agrave caracteacuteriser lrsquoefficaciteacute des routes emprunteacutees

62

drsquoun point de vue geacuteographique La figure 212 repreacutesente les diffeacuterents points drsquoentreacuteeset de sorties logiques de lrsquoInternet reacuteunionnais que nous avons extraits de nos donneacutees

Des donneacutees obtenues de lrsquoeacutetude Depuis nous avons extrait le pays du premier nœudbaseacute agrave lrsquoexteacuterieur de lrsquoicircle Cette information nous permet drsquoeacutetudier les sorties logiques delrsquoInternet reacuteunionnais Le reacutesultat obtenu est indiqueacute par la figure 212a La taille du lienest proportionnelle au nombre drsquoeacutechantillons passant par ce pays Nous deacutenombrons4 sorties dont 3 en Europe Malgreacute lrsquoabsence de lien direct avec lrsquoAmeacuterique du Norddepuis La Reacuteunion nous avons identifieacute une sortie dans la moitieacute ouest des Eacutetats-UnisLes sorties physiques directes de La Reacuteunion qui sont baseacutees en Afrique Asie et sur lesicircles de la ZOI ne sont pas utiliseacutees La majoriteacute du routage de nos donneacutees avec pregraves de97 srsquoeffectue en France

Dans la figure 212b nous indiquons le dernier eacutequipement localiseacute en dehors deLa Reacuteunion pour une destination finale localiseacutee sur lrsquoicircle Ce sont les entreacutees logiquesde lrsquoInternet reacuteunionnais que nous avons pu obtenir des donneacutees provenant de lrsquoeacutetudeVers Le nombre drsquoentreacutees est double par rapport au nombre de sorties et plus reacuteparti enterme de continent Quatre continents sont directement relieacutes agrave notre icircle lrsquoAfrique lrsquoAsielrsquoEurope et lrsquoAmeacuterique du Sud Le continent europeacuteen est largement repreacutesenteacute dans nosdonneacutees avec 99 51 transitant sur ce territoire La France hexagonale capte 99 33 desdonneacutees soit la quasi-totaliteacute de nos donneacutees Nous avons tout de mecircme pu identifier desliaisons minimales avec lrsquoAfrique du Sud lrsquoInde le Sri Lanka et le Paraguay Ce dernierest le seul agrave ne pas ecirctre directement relieacute agrave lrsquoicircle par un cacircble sous-marin

Le tableau 210 reacutesume les informations contenues dans les figures 212a et 212b Leslignes sont rangeacutees par taux drsquoutilisation deacutecroissant

TABLE 210 ndash Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunionnais

Depuis La Reacuteunion Vers La Reacuteunion

France (9699) 18101 msAllemagne (1 03) 299 26 msEacutetat-Unis (1 03) 293 15 msItalie (1 03) 289 46 ms

France (9933) 18330 msAfrique du Sud (0 45) 66 42 msBelgique (0 1) 197 48 msItalie (0 04) 202 59 msSloveacutenie (0 04) 205 50msInde (0 01) 161 45 msParaguay (0 01) 454 36 msSri Lanka (0 01) 207 88 ms

La preacutesence de liens directs entre La Reacuteunion et des pays beaucoup plus eacuteloigneacutestels que les Eacutetats-Unis ou le Paraguay sans cacircbles physiques directs est symptomatiquede lrsquoabsence drsquoinformations ou drsquoerreurs de geacuteolocalisation Nous pouvons preacutesenter etexpliquer quelques points preacutesents dans nos reacutesultats

1 Les erreurs de geacuteolocalisation Les erreurs de geacuteolocalisation sont principalementdues agrave une mauvaise utilisation des blocs drsquoadresses IP par les opeacuterateurs Ils preacute-fegraverent utiliser des adresses qui leur ont deacutejagrave eacuteteacute attribueacutees que drsquoeffectuer une de-mande drsquoadresse IP aupregraves drsquoun RIR Un exemple est lrsquoadresse IP rsquo19416714221rsquoCette adresse est attribueacutee agrave lrsquoopeacuterateur franccedilais RENATER Comme RENATERpossegravede la nationaliteacute franccedilaise le pays de localisation de lrsquoadresse est rsquoFRANCErsquoOr il srsquoavegravere que cette adresse est utiliseacutee comme adresse publique de lrsquoUniversiteacutede La Reacuteunion Elle est donc localiseacutee sur lrsquoicircle Un raisonnement similaire peut srsquoef-fectuer sur les autres reacutegions drsquooutre-mer posseacutedant des relations avec lrsquoopeacuterateurRENATER Les filiales drsquoopeacuterateur meacutetropolitain comme Orange peuvent eacutegale-ment utiliser ce systegraveme sur lrsquoensemble de leur reacuteseau Pour reacutesoudre ce problegraveme

63

(a) Sorties

(b) Entreacutees

FIGURE 212 ndash Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais

nous avons effectueacute une analyse du deacutelai Si le deacutelai associeacute agrave certaines adresses IPcorrespond au deacutelai theacuteorique associeacute au continent nous avons consideacutereacute que lageacuteolocalisation est correcte Dans les cas contraires nous nrsquoavons pas la possibiliteacutedrsquoecirctre sucircrs agrave 100 de la bonne localisation

2 Les accords de peering se font dans un pays avant que le paquet nrsquoemprunte le cacircblesous-marin Lrsquoexemple illustreacute par la figure 213 montre que les eacutechanges entre deuxadresses IP srsquoeffectuent au sein drsquoun IXP Ces eacutechanges peuvent se faire entre deuxpays distants au sein drsquoun troisiegraveme pays Dans notre exemple lrsquoeacutechange entre LaReacuteunion et les USA se fait en France

3 Lrsquoencapsulation des donneacutees au sein du systegraveme MPLS geacutenegravere eacutegalement des in-coheacuterences au sein de nos analyses Lrsquoexemple que lrsquoon peut indiquer est lrsquoanalysede la mesure numeacuteroteacutee 4178740 2 chez Atlas RIPE NCC Cette trace est composeacuteede 5 sauts entre le Paraguay et La Reacuteunion avec un lien direct Or il nrsquoexiste aucuncacircble physique entre ces deux points du monde Une encapsulation au niveau In-

2 httpsatlasripenetmeasurements4178740

64

Internet InternetUtilisateur DestinationIXP (FR)

RE US

FIGURE 213 ndash Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dansun pays tiers

visible des donneacutees nrsquoindique pas le parcours preacutecis des donneacutees tel que lrsquoindiquelrsquoauteur de lrsquoarticle [Donnet2012]

Ces explications ne sont pas les seules mais potentiellement les plus freacutequemmentrencontreacutees Dans notre cas les points 2 et 3 semblent ecirctre les raisons preacutedominantesLes marques du systegraveme MPLS sont dues agrave la division de la capaciteacute des cacircbles pour lesdiffeacuterents opeacuterateurs et agrave la connexion en diffeacuterents points pour reacutegeacuteneacuterer le signal

Des reacutesultats de nos eacutetudes nous deacuteplorons lrsquoabsence de peering reacutegional Cette ano-malie est la principale cause de la tendance des courbes obtenues dans le tableau 29 Eneacutetudiant les diffeacuterents IXP nous constatons lrsquoabsence drsquoopeacuterateurs communs entre les 3icircles comme lrsquoillustre la figure 214 Ces informations proviennent directement des sitesinternet officiels des IXP [MIXP2017 MGIX2017 REUNIX2017] On peut neacuteanmoins no-ter la preacutesence des filiales de lrsquoopeacuterateur Orange agrave Madagascar et agrave La Reacuteunion Il srsquoagitdans le cas drsquoOrange Madagascar de lrsquoexploitation du nom sans ecirctre dirigeacutee par lrsquoen-treprise Orange De cette figure on peut deacuteduire que les eacutechanges drsquoinformations et dedonneacutees se font dans une reacutegion eacuteloigneacutee de la ZOI et agrave un niveau plus eacuteleveacute On peutsupposer que ce sont des Tiers-1 qui se chargent du peering de cette zone Afin de vali-der cette hypothegravese nous avons deacuteployeacute des sondes de mesures de RunPL sur les icirclesvoisines

FIGURE 214 ndash FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien

243 Connectiviteacute des icircles de la Zone Oceacutean Indien

Nous avons vu dans la section 22 que les icircles de la ZOI partagent des routes phy-siques en commun Nous avons constateacute dans la section 242 que La Reacuteunion possegravede

65

une connectiviteacute Internet particuliegravere Nous sommes donc en droit de nous demander sicette connectiviteacute est commune agrave lrsquoensemble des icircles de la ZOI ou non Nous avons pu deacute-ployer un minimum de deux sondes par pays eacutetudieacute Le protocole de mesure et drsquoanalysemis en place est en tout point identique agrave celui utiliseacute pour lrsquoeacutetude de la connectiviteacute deLa Reacuteunion Ainsi nous avons utiliseacute les mecircmes meacutetriques pour valider la comparaison

Distribution du RTT par pays eacutetudieacute

La figure 215 illustre la reacutepartition des deacutelais des icircles de la ZOI selon le pays drsquooriginedes mesures (215a) et du continent de destination (215b) Comme pour La Reacuteunion nousremarquons la preacutesence des trois pics

Drsquoapregraves la figure 215b ces pics ont la mecircme signification que dans la situation preacute-ceacutedente crsquoest-agrave-dire la preacutesence des deacutelais pour joindre lrsquoEurope lrsquoAmeacuterique du Nord etlrsquoAsie

Sur la figure 215a on remarque eacutegalement des valeurs minimales et maximales dif-feacuterentes selon le pays Ainsi les Seychelles ont les deacutelais les plus courts de la ZOI Agravelrsquoinverse crsquoest La Reacuteunion qui possegravede le plus de deacutelais au delagrave des 800 ms

Le comportement des deacutelais eacutetant communs agrave lrsquoensemble de la ZOI nous allons main-tenant eacutetudier la longueur des routes pour chaque icircle eacutetudieacutee

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 215 ndash Distribution des deacutelais des icircles de la ZOI

Longueur des routes par pays eacutetudieacute

La figure 216 repreacutesente la densiteacute de probabiliteacute de la longueur des routes En confon-dant les destinations nous pouvons eacutetudier la reacutepartition de la distance en fonction delrsquoicircle source (216a) Nous avons appliqueacute le mecircme raisonnement en meacutelangeant les icirclessources pour se concentrer sur la destination (216b) Les figures eacutetudieacutees nrsquoont pas lamecircme forme que celles uniquement deacutedieacutees agrave La Reacuteunion En effet la courbe 216 pos-segravede 2 pics

Sur la figure 216a on remarque que cette diffeacuterence est fortement accentueacutee par lapreacutesence des donneacutees reacuteunionnaises

Sur la figure 216b on voit une diffeacuterence de comportement en fonction du contientjoint Ainsi lrsquoAfrique lrsquoAsie et lrsquoEurope ont la preacutesence drsquoun seul pic Cela signifie queces continents seront majoritairement joints par des routes comprises entre 10 en 20 sautsPour les Ameacuteriques et lrsquoOceacuteanie il y a deux pics Cela sous-entend la preacutesence de deuxgrandes routes avec lrsquoune plus courte que lrsquoautre La plus petite est composeacutee de 13sauts La seconde route est quant agrave elle drsquoune longueur de 16 sauts

66

Cette diffeacuterence peut srsquoexpliquer par la preacutesence de routes emprunteacutees diffeacuterentes enfonction des pays de destinations Pour corroborer cela nous allons poursuivre lrsquoeacutetudeen fonction des meacutetriques preacutesenteacutees dans la section 242

0

003

006

009

012

0 5 10 15 20 25 30 35 40

P [

X=

x]

Longueur du chemin (en noeuds)

Mayotte

Seychelles

Reunion

Maurice

Madagascar

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 216 ndash Longueur des routes emprunteacutees

Longueur du chemin et distance geacuteographique

Dans cette section on va eacutetudier la relation entre la longueur du chemin et la distancegeacuteographique On a vu agrave travers le reacutesultat preacuteceacutedent que le choix du continent avaitun impact sur la longueur du chemin Pour plus de lisibiliteacute nous avons repreacutesenteacute lesreacutesultats sous la forme drsquoeacutequations lineacuteaires repreacutesenteacutes par lrsquoeacutequation 24

PL(d) = αtimes d+ β (24)

Les eacutequations obtenues sont indiqueacutees dans le tableau 211 et repreacutesenteacutees graphique-ment par la figure 217

TABLE 211 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation PL(d)Madagascar y = minus0 000303631times d+ 26 1771

Maurice y = minus0 000183807times d+ 18 4231

Reacuteunion y = minus9 18819 lowast 10minus5 times d+ 17 1201

Seychelles y = minus0 000183362times d+ 18 9892

Mayotte y = minus7 15288 lowast 10minus5 times d+ 18 4781

Nous pouvons seacuteparer nos reacutesultats en 3 groupes Drsquoun cocircteacute les deacutepartements fran-ccedilais avec La Reacuteunion et Mayotte Dans un second groupe lrsquoicircle Maurice et les SeychellesEt dans un troisiegraveme groupe Madagascar Les reacutesultats de La Reacuteunion et de Mayotte sontsimilaires La pente α est quasi-nulle et lrsquoeacutecart sur le coefficient β est de 1 saut Ce reacutesul-tat est similaire agrave celui obtenu preacuteceacutedemment Maurice et les Seychelles ont eacutegalementdes coefficients proches Les pentes sont leacutegegraverement neacutegatives Cela implique une petitedeacutependance du nombre de sauts en fonction de la distance geacuteographique Le cas le plusinteacuteressant est Madagascar Nous allons nous inteacuteresser plus en deacutetail agrave son comporte-ment

Madagascar possegravede les coefficients α et β les plus eacuteleveacutes Cela signifie que le payspossegravede une route minimale plus longue que les autres icircles Son coefficient α neacutegatif

67

10

20

30

0 5000 10000 15000 20000

Pat

h L

ength

PL

(N

um

ber

of

hops)

Distance d (Km)

MGMURESCYT

FIGURE 217 ndash Relation entre la longueur de la route et la distance geacuteographique

est presque deux fois plus eacuteleveacute que pour Maurice et les Seychelles Lrsquoimpact de la dis-tance sur le nombre de sauts est donc plus fort La figure 218 a eacuteteacute reacutealiseacutee selon le mecircmescheacutema que les figures 28 La repreacutesentation de la PDF de la distance des destinations parrapport aux sondes deacuteployeacutees agrave Madagascar montre deux grands groupes Le premiersitueacute entre 5 000 et 10 000 kilomegravetres Ce groupe regroupe Asie Europe Oceacuteanie et Ameacute-rique du Sud Le second groupe eacutevoluant aux alentours des 15 000 kilomegravetres englobe latotaliteacute des adresses IP geacuteolocaliseacutees en Ameacuterique du Nord Le nombre drsquoadresses prove-nant du continent africain est compris entre 0 et 10 000 La pente neacutegative suggegravere doncque les routes vers les continents eacuteloigneacutes sont plus courtes que les routes vers des desti-nations proches geacuteographiquement Neacuteanmoins la lecture des cercles montre des routesglobalement aussi longues quel que soit le continent

Impact de la longueur du chemin sur le RTT

Tout comme la section preacuteceacutedente nous avons repreacutesenteacute les reacutesultats sous formedrsquoeacutequations lineacuteaires Le tableau 212 regroupe les eacutequations obtenues tandis que la fi-gure 219 les repreacutesente graphiquement

TABLE 212 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation D(PL)Madagascar y = 13 5709times t+ 119 717

Maurice y = 14 296times t+ 171 69

Reacuteunion y = 14 2259times t+ 166 84

Seychelles y = 17 3953times t+ 35 3596

Mayotte y = 16 3138times t+ 90 9087

Comme on pouvait srsquoy attendre le deacutelai srsquoaccroicirct avec le nombre de sauts Les coef-ficients α obtenus sont proches les uns des autres La diffeacuterence se fait plus sur la valeurdrsquoajustement β Cette valeur correspond au deacutelai minimal Les Seychelles ont la pente

68

FIGURE 218 ndash Relation entre la longueur de la route et la distance geacuteographique pourMadagascar

la plus eacuteleveacutee et la valeur drsquoajustement la plus basse Cela signifie que malgreacute un deacute-lai minimal faible le temps mis par un paquet dans chaque routeur est plus importantque pour les autres icircles Mayotte est sensiblement dans le mecircme cas Pour Maurice et LaReacuteunion les pentes sont proches et la valeur de β eacutegalement Ces deux icircles auraient doncun comportement similaire

0

50

100

150

200

250

300

350

400

10 20 30

RT

T D

elay

(m

s)

Path Length PL (Number of hops)

MGMURESCYT

FIGURE 219 ndash Relation entre la longueur de la route et les deacutelais

69

Correacutelation entre deacutelai et distance geacuteographique

Nous avions vu que pour La Reacuteunion il y avait une incoheacuterence sur la relation entrele deacutelai et la distance geacuteographique En effet nous avions comme reacutesultat le fait que ledeacutelai deacutecroissait avec la distance Ce scheacutema se reproduit eacutegalement pour les autres icirclesde la ZOI tel qursquoillustreacute par la figure 220 Les eacutequations associeacutees agrave chaque pays sontpreacutesenteacutees dans le tableau 213

TABLE 213 ndash Formule de correacutelation de la distance geacuteographique et du RTT

icircle de deacutepart Eacutequation PL(t)Madagascar y = minus0 0053913times t+ 476 626

Maurice y = minus0 00418997times t+ 438 177

Reacuteunion y = minus0 00370839times t+ 440 249

Seychelles y = minus0 00344991times t+ 368 501

Mayotte y = minus0 0015904times t+ 397 1

On constate des pentes fortement diffeacuterentes en fonction des pays Ainsi Mayotte aune pente beaucoup plus douce que les autres icircles Malgreacute un β proche on voit que lrsquoeacutecartdes deacutelais entre La Reacuteunion et Maurice srsquoaccroicirct avec la distance La pente de Madagascarest tregraves importante Ccedila indique une forte deacutecroissance du deacutelai avec la distance Ainsi ledeacutelai pour joindre lrsquoicircle Maurice sera beaucoup plus important que pour joindre les paysdrsquoAmeacuterique du Nord

Lrsquoune des conseacutequences de ces reacutesultats est la preacutesence drsquoun deacutelai plus eacuteleveacute pourjoindre les icircles de la ZOI que pour joindre des destinations plus lointaines Et cela malgreacutedes routes toutes aussi longues Cela montre une contradiction agrave travers nos reacutesultatsPour comprendre cela il est neacutecessaire drsquoeacutetudier les portes de sorties de lrsquoInternet desicircles de la ZOI

300

350

400

450

500

0 5000 10000 15000 20000

RT

T D

elay

(m

s)

Distance d (Km)

MGMURESCYT

FIGURE 220 ndash Relation entre les deacutelais et la distance geacuteographique

Analyse des portes de sortie

Chaque icircle de la ZOI possegravede ses propres routes avec ses propres regravegles et ses propressorties Agrave la fin de la section 242 nous avons eacutemis lrsquohypothegravese suivante les eacutechanges de

70

paquets entre les FAI des icircles de la ZOI ne se font pas au sein de la ZOILa figure 221 indique le nombre de sorties que lrsquoon a pu relever durant nos mesures

(221a) et le pourcentage de leur reacutepartition geacuteographique (221b)

En analysant la figure 221b on constate que la majoriteacute des pays de sortie est situeacuteeen Europe avec 9463 On remarque lrsquoabsence de sortie au niveau Africain et drsquointer-connexion directe entre les icircles de la ZOI

Sur la figure 221a on remarque qursquoagrave lrsquoexception de Mayotte chaque pays a plus de20 sorties diffeacuterentes Pour La Reacuteunion crsquoest un reacutesultat fortement diffeacuterent de celui ob-tenu dans la section 242 Cela peut srsquoexpliquer par les mecircmes raisons que lors de lrsquoeacutetudepreacuteceacutedente pour rappel les raisons invoqueacutees sont potentiellement des erreurs de geacuteolo-calisation des accords de peering direct dans un pays tiers ou encore de lrsquoencapsulationMPLS

0

5

10

15

20

25

30

35

40

45

50

MG

MU

RE

SC YT

Num

ber

of

links

(a) Nombre de points de sorties pour chaqueicircle de la ZOI

0

20

40

60

80

100

AS

EU NA

Use

d l

inks

()

(b) En fonction du continent

FIGURE 221 ndash Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI

La figure 222 montre la reacutepartition des sorties en pourcentage selon les pays (fig222a) et les continents (222b) pour La Reacuteunion En comparaison avec les reacutesultats ob-tenus preacuteceacutedemment on constate une forte diminution du pourcentage de sorties geacuteo-localiseacutees en France hexagonale (FR) Nous sommes passeacutes de 9699 agrave une valeur de55408 Neacuteanmoins le pourcentage par continent reste extrecircmement eacuteleveacute avec 951636de sorties localiseacutees en Europe

Agrave travers lrsquoanalyse des points de sorties de lrsquoInternet des icircles de la ZOI nous validonslrsquohypothegravese preacutesenteacutee selon laquelle les accords drsquoeacutechanges entre opeacuterateurs des icircles dela ZOI se font agrave travers un Tiers-1

244 Synthegravese des reacutesultats

Lrsquoeacutetude des routes et des deacutelais meneacutee durant nos travaux de thegravese a eacuteteacute diviseacutee entrois grandes parties La premiegravere consistait agrave comparer lrsquoeacutetat actuel avec une eacutetude reacutea-liseacutee quatre ans auparavant La seconde phase de meacutetrologie active a mis en avant uneanalyse plus fine de la connectiviteacute Internet de La Reacuteunion avec lrsquoeacutetude des routes Laderniegravere partie avait pour objectif de comparer la connectiviteacute Internet de La Reacuteunionavec les autres icircles de la ZOI

La campagne de ping meneacutee agrave lrsquoUniversiteacute de La Reacuteunion au sein du LIM a montreacuteune reacuteduction de la longueur des routes depuis La Reacuteunion En deacutepit de la reacuteduction desroutes nous avons constateacute une stabiliteacute des deacutelais aux alentours des 200 ms

71

0

20

40

60

80

100

US-C

O

US

GB

FR

Use

d l

inks

()

(a) par pays

0

20

40

60

80

100

EU NA

Use

d l

inks

()

(b) par continent

FIGURE 222 ndash Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion

Notre seconde eacutetude faite agrave partir de donneacutees de type traceroute meneacutee depuis dif-feacuterents points de mesures reacutepartis sur lrsquoicircle a montreacute des reacutesultats inteacuteressants Le pre-mier reacutesultat est la correacutelation des deacutelais et de la localisation des destinations jointesdepuis lrsquoicircle de La reacuteunion Nous avions constateacute des pics sur la PDF des deacutelais Cespics correspondaient bien agrave la reacutepartition des continents dans notre jeu de destinationsLa longueur des routes est quant agrave elle moins impacteacutee par cette reacutepartition des des-tinations Nous avons tout de mecircme trouveacute une forte symeacutetrie aux courbes peu im-porte le sens de lrsquoeacutetude Agrave partir de ces donneacutees nous avons eacutetudieacute les relations sui-vantes Longueur du chemin Distance geographique Longueur du chemin RTTet RTT Distance geographique La premiegravere concordance a montreacute que la longueurdu chemin nrsquoest pas deacutependante de la distance geacuteographique La seconde correacutelation amontreacute une premiegravere asymeacutetrie des liens En effet le temps associeacute agrave chaque nœud dutrajet est tregraves diffeacuterent selon que lrsquoon quitte ou que lrsquoon essaye de joindre La Reacuteunion Ledernier rapport a mis en eacutevidence une particulariteacute de lrsquoaccegraves Internet de La Reacuteunion Agravelrsquoinverse de tout sens commun les deacutelais provenant et agrave destination de La Reacuteunion vonten deacutecroissant en fonction de la distance geacuteographique Lrsquoanalyse des routes et plus par-ticuliegraverement les points drsquoentreacutees et de sorties logiques de lrsquoInternet reacuteunionnais a permisdrsquoexpliquer ce comportement

Notre derniegravere eacutetude utilise le mecircme protocole et la mecircme plate-forme que lrsquoeacutetudepreacuteceacutedente Nous avons reacuteussi agrave distribuer des sondes sur les icircles de la ZOI Agrave traverscette eacutetude nous avons pu constater un comportement proche pour lrsquoensemble des icircleseacutetudieacutees Ainsi nous avons pu trouver des speacutecificiteacutes de lrsquoInternet de la ZOI La dis-tance geacuteographique a un impact sur la longueur de la route le deacutelai associeacute agrave chaquenœud de la route est similaire Mais surtout le deacutelai pour toute destination baseacutee agrave lrsquoex-teacuterieur drsquoune icircle est plus long pour les distances geacuteographiques courtes Ce comporte-ment srsquoexplique par une inter-connexion des FAI reacutegionaux agrave travers des Tiers-1 situeacutesmajoritairement en Europe

25 Conclusion

Dans ce chapitre nous avons eacutetudieacute la connectiviteacute de La Reacuteunion en terme de deacutelaiset de routes emprunteacutees

Lors de la premiegravere section nous avons vu que La Reacuteunion ne propose pas drsquoinfra-structure permettant la mise en place de notre eacutetude La premiegravere eacutetape fut le deacuteploie-ment de raspberry-pi sur lrsquoensemble de lrsquoicircle Ces sondes connecteacutees agrave lrsquoensemble des FAI

72

et TAI utilisent lrsquooutil Paris-traceroute pour reacutealiser des mesures de deacutelais et de routesCet outil est moins sensible au pheacutenomegravene drsquoeacutequilibrage de charges que le traceroutetraditionnel

Une fois notre plate-forme deacuteployeacutee nous avons reacutealiseacute des mesures durant plusieursmois Ces mesures actives eacutetudient la connectiviteacute depuis et vers La Reacuteunion Cette vo-lonteacute drsquoeffectuer les mesures dans les deux sens provient de la forte preacutesence de routesasymeacutetriques dans lrsquoInternet

Nos donneacutees ont montreacute que La Reacuteunion est confronteacutee agrave ce pheacutenomegravene Nous avonseffectueacute une analyse selon 4 paramegravetres le deacutelai la distance geacuteographique la longueurdu chemin et les routes emprunteacutees La litteacuterature ne proposant pas drsquooutil respectantnos critegraveres de seacutelection nous avons deacuteveloppeacute notre propre outil drsquoanalyse rTrace-route Nous avons souhaiteacute partager notre outil drsquoanalyse agrave travers une publicationDans lrsquoattente drsquoune publication scientifique un site internet deacutedieacute agrave lrsquooutil est dispo-nible [rtraceroute]

Le premier reacutesultat concerne la longueur des routes Les routes reacuteunionnaises sontplus longues que la moyenne mondiale On constate eacutegalement une diffeacuterence selon lesens de communication En eacutetudiant lrsquoimpact de la distance kilomeacutetrique sur la longueuron voit qursquoaucune correacutelation nrsquoexiste entre les deux paramegravetres Les routes Internet dela boucle locale sont aussi longues que les routes reliant des points situeacutes agrave plus de 15 000kmLorsqursquoun paquet traverse un nœud un deacutelai associeacute au traitement agrave lrsquoeacutemission et agrave lapropagation des donneacutees vers le saut suivant peut ecirctre calculeacute Cette valeur diffegravere eacutenor-meacutement selon que lrsquoon quitte ou que lrsquoon joint La Reacuteunion On a un coefficient de 1 79entre les deux valeurs Cela corrobore lrsquoasymeacutetrie des liens mais aucunement un com-portement speacutecifique agrave la connectiviteacute reacuteunionnaiseLrsquoun des reacutesultats les plus inteacuteressants concerne la relation entre la distance geacuteogra-phique et les deacutelais associeacutes Contrairement agrave ce que lrsquoon pouvait attendre la connectiviteacutereacuteunionnaise deacutecroicirct les deacutelais avec lrsquoincreacutementation de la distance lorsque le trafic em-prunte les cacircbles sous-marinsDans lrsquoanalyse des routes nous avons constateacute que lrsquointer-connexion reacutegionale se faitnon pas au sein de la ZOI mais dans une zone eacuteloigneacutee La Reacuteunion possegravede 3 sortiesphysiques que sont lrsquoAsie lrsquoAfrique et lrsquoEurope Pour autant seule la France hexagonalesemble ecirctre inteacuteressante pour les FAI locaux Plus de 97 de nos donneacutees sortent agrave traversce pays localiseacute agrave plus de 10 000 km

Nous avons confirmeacute le fait que lrsquointer-connexion se fait dans une zone eacuteloigneacutee agravetravers lrsquoeacutetude de la connectiviteacute de la ZOI Cette eacutetude a deacutemontreacute un comportementsimilaire entre La Reacuteunion et les icircles de la zone La seule diffeacuterence notable provient dunombre de portes de sorties pour les icircles Neacuteanmoins elles sont agrave une tregraves forte majoriteacutegeacuteolocaliseacutees en Europe

Le deacutelai minimal mesureacute pour La Reacuteunion et la configuration actuelle de la connec-tiviteacute Internet reacuteunionnaise peuvent avoir des conseacutequences sur les performances desprotocoles de transport comme TCP Pour veacuterifier cela une eacutetude de meacutetrologie passivea eacuteteacute reacutealiseacutee Cette eacutetude est preacutesenteacutee dans le chapitre 3

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors dela confeacuterence Asian INTernet Engineering Conference (AINTEC) en 2016 [Noordally2016]Cette publication a eacuteteacute axeacutee sur les reacutesultats reacuteunionnais Une seconde contribution deacute-dieacutee agrave la connectiviteacute des icircles de la ZOI a eacuteteacute publieacutee lors de la confeacuterence Global Informa-tion Infrastructure and Networking Symposium (GIIS) en 2017 [Nicolay2017-2]

73

74

Chapitre 3

Meacutetrologie sur le service de transportagrave La Reacuteunion

TCP est un protocole de transport dont la performance est deacutependante du RTT etdu taux de perte des segments Plus exactement ces deux paramegravetres entrent en comptepour deacuteterminer le deacutelai pris par la fenecirctre de congestion pour qursquoelle atteigne une taillequi couvre le produit deacutelai-bande passante du canal virtuel qui relie la source agrave la desti-nation Aussi TCP voit ses performances reacuteduites lorsque ce produit augmente et changede facteur drsquoeacutechelle Les reacutesultats obtenus par lrsquoeacutetude de la connectiviteacute de lrsquoicircle de LaReacuteunion ont montreacute un RTT minimal de 180 ms pour le trafic quittant lrsquoicircle de La Reacuteunion(cf tableau 210) Avec les technologies drsquoaccegraves agrave haut deacutebit il devient techniquementpossible que des connexions TCP depuis ou vers La Reacuteunion souffrent des symptocircmesque lrsquoon retrouve avec lrsquoutilisation drsquoun LFN

Dans ce chapitre nous allons eacutetudier quel peut ecirctre lrsquoimpact de la capaciteacute de stockagedes canaux de communication depuis et vers lrsquoicircle La Reacuteunion sur les performances deTCP Pour cela nous allons nous appuyer sur de la meacutetrologie passive afin de pouvoirfaire des observations sur la performance de TCP Dans ce chapitre nous preacutesentonsla meacutethode que nous avons appliqueacutee afin drsquoestimer par la meacutetrologie le service quenous obtenons agrave La Reacuteunion Lrsquoobjectif ici nrsquoest pas drsquoobtenir des reacutesultats repreacutesentatifsde lrsquoInternet applicables agrave La Reacuteunion dans sa globaliteacute mais de mener une premiegravereexpeacuterience pour valider la meacutethode et les outils que nous pourrions ensuite appliqueraupregraves des diffeacuterents opeacuterateurs locaux

Ce chapitre se compose de quatre sections La premiegravere section 31 fixe les objectifs delrsquoeacutetude de meacutetrologie Elle preacutesente les meacutetriques agrave deacuteterminer pour pouvoir atteindreces objectifs La partie 32 preacutesente la meacutethode de mise en œuvre de la plate-forme demeacutetrologie Le protocole de mesure mis en place pour la reacutealisation drsquoune eacutetude est preacute-senteacute dans la section 33 Enfin cette section est suivie par la partie 34 qui preacutesente lesreacutesultats que lrsquoon peut obtenir et lrsquointerpreacutetation qui peut en ecirctre faite

31 Objectifs

Lrsquoeacutetude des deacutelais aller-retour (RTT) et des routes Internet de lrsquoicircle de La Reacuteunion quenous avons preacutesenteacutee dans le chapitre preacuteceacutedent a mis en eacutevidence une connectiviteacute speacute-cifique Lrsquoaccegraves agrave lrsquoInternet passe principalement par la meacutetropole avec un RTT minimalde 180 ms Ce RTT multiplieacute par un deacutebit drsquoaccegraves de 1 Mbits deacutebit theacuteorique minimalproposeacute dans les diffeacuterentes offres par les FAI donne une quantiteacute de donneacutees eacutemisespar anticipation de 22 5 Ko Ce calcul prend comme hypothegravese que le goulot drsquoeacutetran-glement est le lien drsquoaccegraves de lrsquohocircte Ce produit deacutelai bande passante repreacutesente la taille

75

de la fenecirctre drsquoeacutemission agrave partir de laquelle une transmission continue de lrsquoeacutemetteur de-vient possible Avec une valeur de 22 5 Ko cela place le canal de communication de LaReacuteunion dans la cateacutegorie des reacuteseaux agrave forte capaciteacute de stockage (LFN) Dans la section21 nous avons vu que La Reacuteunion est pleinement inteacutegreacutee au plan tregraves haut deacutebit delrsquoeacutetat franccedilais Ce plan a pour objectif de deacuteployer une infrastructure de distribution enfibre optique (Fiber To The Home (FTTH)) sur lrsquoensemble du territoire franccedilais Cela aurapour conseacutequence si les deacutelais ne sont pas en diminution drsquoaugmenter la capaciteacute destockage du canal de communication

311 Les objectifs de lrsquoeacutetude

Le lien drsquoaccegraves de La Reacuteunion conduit agrave consideacuterer lrsquoInternet avec les caracteacuteristiquesdrsquoun reacuteseau agrave forte capaciteacute de stockage Ceci est ducirc agrave un deacutelai minimal eacuteleveacute Avec cedeacutelai des deacutegradations potentielles des performances de TCP sont envisageables La miseen place drsquoune eacutetude de meacutetrologie passive agrave lrsquoeacutechelle reacutegionale nrsquoa pas encore eacuteteacute reacuteali-seacutee Les opeacuterateurs ont une connaissance partielle de la situation de lrsquoicircle Afin drsquoobtenirune vision globale de lrsquousage de lrsquoInternet sur lrsquoicircle de La Reacuteunion il nous faut reacutepondreaux diffeacuterentes questions suivantes

mdash Quel est lrsquoimpact de lrsquoaugmentation de la capaciteacute de stockage sur les performancesdu protocole TCP

mdash Est-ce que lrsquoaugmentation des deacutebits theacuteoriques est reacutecupeacutereacutee dans les deacutebits me-sureacutes par TCP

Dans la section 123 nous avons preacutesenteacute lrsquoarticle [Zheleva2015] Pour rappel dans cettepublication les auteurs ont mis en avant un changement drsquoutilisation des services Internetapregraves une augmentation de la bande passante Nous allons eacutegalement reacutepondre agrave desquestions orienteacutees vers la supervision du trafic Ces questions sont les suivantes

mdash Quels sont les protocoles de transport utiliseacutes

mdash Quels sont les services les plus freacutequents

mdash Quelle est la distribution geacuteographique des services joints

Les reacuteponses agrave ces questions impliqueront lrsquoapparition drsquoautres questions

312 Les meacutetriques de lrsquoeacutetude

Le tableau 31 indique les meacutetriques que lrsquoon va eacutetudier Chaque meacutetrique eacutetudieacuteesera mise en relation avec une des questions poseacutees preacuteceacutedemment

Meacutetriques de supervision

La supervision du trafic consiste agrave analyser le flux geacuteneacuteral de paquets qui transite ausein drsquoun eacutequipement comme un routeur ou un commutateur On parle drsquoeacutetude macro-scopique telle qursquoindiqueacutee dans le rapport [Owezarski2003-1] Les informations analy-seacutees par la supervision sont geacuteneacuteralement les informations analyseacutees par un adminis-trateur Reacuteseau ou encore un FAI En reacuteponse aux questions sur la supervision nousavons seacutelectionneacute dans un premier temps lrsquoidentification des protocoles de transportLe champ protocole de lrsquoen-tecircte IP indique le protocole de niveau suivant utiliseacute dans lapartie des donneacutees du datagramme Internet [RFC760] Les valeurs des diffeacuterents proto-coles sont speacutecifieacutees en reacutefeacuterence [RFC3232 IANA-port]

76

TABLE 31 ndash Les meacutetriques de meacutetrologie passive

Meacutetriques En-tecircte Champs

Supervisiondu trafic

Caracteacuterisation des destinationsIP

Adressessources etdestinations

Protocole de transport employeacute ProtocoleService utiliseacute

TCP

Numeacutero deport

Performanceprotocolaire

Performance deTCP

Eacuteveacutenement de congestion ECNNS+ CWRNumeacutero deseacutequence

RTT TimestampPertes Numeacutero de

seacutequencedeacute-seacutequencementsRetransmissions

Deacutebits binaires

EacutecouleacuteTimestampNumeacutero deseacutequencefenecirctre

DescendantMontant

UtileCaracteacuterisationdes flots

DeacutebitDureacutee Timestamp

Longueur Nombrede paquetseacutechangeacutes

Nous avons vu preacuteceacutedemment que les services eacutevoluent dans le temps et selon lesdeacutebits [Zheleva2015] Lrsquoanalyse du champ numeacutero de port de lrsquoen-tecircte TCP aide agrave lrsquoidenti-fication du Service utiliseacute Chaque numeacutero de port est associeacute agrave un service preacutecis deacutefinidans le [RFC776]

En regravegle geacuteneacuterale le trafic Internet est diviseacute en trois cateacutegories en fonction de ladestination par rapport agrave la source Crsquoest le groupe de travail 802 de lrsquoIETF qui est encharge des caracteacuterisations

mdash Local Area Network (LAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir une zonede quelques kilomegravetres carreacutes ou moins Parce que le reacuteseau est connu pour necouvrir qursquoune petite zone des optimisations peuvent ecirctre faites dans les protocolesde signal de reacuteseau qui permettent des deacutebits de donneacutees jusqursquoagrave 100 Mbits raquo[RFC1983]

mdash Metropolitan Area Network (MAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir unezone proche de celle drsquoune grande ville Ces reacuteseaux sont mis en œuvre par destechniques innovantes comme le passage de cacircbles agrave fibres optiques dans les tun-nels du meacutetro raquo [RFC1983]

mdash Wide Area Network (WAN) laquo Un reacuteseau geacuteneacuteralement construit avec des lignesseacuteries qui couvrent une large zone geacuteographique raquo [RFC1983]

La reacutepartition des adresses IP de destination va permettre drsquoidentifier le pays ougrave se si-tue lrsquoinformation Cette information peut permettre de connaicirctre la pertinence du lieudrsquoheacutebergement de lrsquoinformation par rapport au service et agrave lrsquoapplication utiliseacutee Nousutilisons pour cela la base de donneacutees associeacutee agrave lrsquooutil rTraceroute outil drsquoanalyse gra-phique des traces preacutesenteacute dans la section 222 Dans le cas ougrave une adresse IP nrsquoest pas

77

reacutepertorieacutee dans notre base de donneacutees lrsquoinformation sera extraite de la base de donneacuteesde RIPE NCC avec lrsquooutil rgeoloc [LanYanFock2015]

Meacutetriques de performance

Le groupe de travail IPPM de lrsquoIETF a deacutefini dans diffeacuterents documents des meacutetriquesde bases comme la mesure de connectiviteacute [RFC2678] le deacutelai unidirectionnel [RFC2679]le taux de perte unidirectionnel [RFC2680] Ces deux derniegraveres meacutetriques sont eacutegalementdeacutefinies dans le sens aller-retour avec le [RFC2681]

Nous avons comme objectif la comparaison du deacutebit theacuteorique et le deacutebit mesureacute Lecalcul du deacutebit mesureacute par TCP se fait agrave travers 3 meacutetriques le RTT la taille de la fe-necirctre drsquoeacutemission et la probabiliteacute de perte de paquets Le RTT est le deacutelai entre la misedu premier bit de la question sur le cacircble et la reacuteception du dernier bit de la reacuteponse[RFC2681] Il est calculeacute par la diffeacuterence de temps entre lrsquoeacutemission du paquet et la reacute-ception de lrsquoACK correspondant Si le RTT est trop important TCP peut consideacuterer unpaquet comme perdu

Une perte est deacutefinie comme laquo lrsquoeacutemission drsquoun paquet par la source mais non reccedilupar la destination raquo [RFC2680] Si le paquet est perdu alors TCP va reacuteduire la fenecirctredrsquoeacutemission

La fenecirctre drsquoeacutemission est calculeacutee agrave partir du champ Fenecirctre des segments TCP Cechamp est deacutefini dans le [RFC6528] comme le nombre drsquooctets de donneacutees commenccedilantpar celui indiqueacute dans le champ drsquoaccuseacute de reacuteception que lrsquoexpeacutediteur de ce segment estprecirct agrave accepter

Agrave lrsquoaide de la formule indiqueacutee par lrsquoeacutequation 31 il est possible de calculer le deacutebitmesureacute par TCP

Debit =FenetreRTTradic

Probabilite perte(31)

Les deacutebits mesureacutes pourront ecirctre classeacutes selon qursquoils soient montants descendantsconfondus ou utiles Cette diffeacuterenciation srsquoexplique par le fait que la comparaison avecle deacutebit theacuteorique est montant et descendant Le deacutebit eacutecouleacute (throughput) correspond laquo aunombre de paquets ou de bits par seconde raquo [RFC6201] Le deacutebit utile (goodput) corres-pond laquo au nombre de paquets ou de bits utiles (non retransmis) par seconde raquo[RFC5166]

Lrsquoeacutetude des performances du protocole TCP passe dans un premier temps par lrsquoeacutetudedes pertes et des retransmissions

Une retransmission est deacutefinie par le [RFC6298] comme eacutetant le laquo segment le plusancien qui nrsquoa pas eacuteteacute acquitteacute par le reacutecepteur TCP raquo Pour obtenir le nombre de re-transmissions on regarde les numeacuteros de seacutequences des segments TCP Si dans un flotIP un numeacutero de seacutequence apparaicirct plusieurs fois alors cela implique la retransmissiondu paquet Les retransmissions seront seacutepareacutees selon la raison de la retransmission (fastretransmit) ou retransmissions abusives (spurious retransmit)Le [RFC5681] explique le pheacutenomegravene pouvant provoquer une retransmission par le meacute-canisme de fast retransmit La retransmission drsquoun paquet due au meacutecanisme de fast re-transmit est calculeacutee en fonction du nombre drsquoacquittements dupliqueacutes et de la diffeacuterencetemporelle entre le paquet de donneacutees observeacutees et le preacuteceacutedent acquittementLes paquets spurious retransmit sont des paquets subissant des fausses retransmissions Sile numeacutero de seacutequence du paquet attendu est infeacuterieur ou eacutegal au numeacutero drsquoacquittementdu preacuteceacutedent ACK alors le paquet observeacute est un paquet retransmis abusivement

78

Lorsque le paquet est reacute-eacutemis il va se produire du deacute-seacutequencement Le deacute-seacutequencementse deacutefinit dans le [RFC6248] laquo Lrsquoarriveacutee ordonneacutee est une proprieacuteteacute que lrsquoon trouve dansles paquets qui transitent par leur chemin ougrave le numeacutero de seacutequence des paquets aug-mente avec chaque nouvelle arriveacutee et il nrsquoy a pas de reacutegression La deacutetection du reacute-ordonnancement agrave destination est baseacutee sur lrsquoordre drsquoarriveacutee des paquets par rapport agraveune valeur de reacutefeacuterence non inverseacutee raquo

Les paquets retransmis peuvent eacutegalement servir agrave lrsquoidentification des eacuteveacutenementsde congestion Pour identifier ces eacuteveacutenements deux techniques peuvent ecirctre mises enplaceLa premiegravere consiste a eacutetudier la preacutesence des drapeaux ECN et Congestion Window Re-duce (CWR) dans les en-tecirctes des paquets TCP [RFC8311]La seconde technique se propose drsquoeacutetudier les variations de la fenecirctre drsquoeacutemission de TCPCette eacutetude doit ecirctre coupleacutee avec lrsquoanalyse des pheacutenomegravenes de pertes et de retransmis-sion autour de cet eacuteveacutenement

Dans la section 112 nous avons constateacute que la capaciteacute de stockage drsquoun lien estprobleacutematique pour les flots courts Afin de poursuivre lrsquoeacutetude de lrsquoimpact de la capa-citeacute de stockage des liens de lrsquoInternet reacuteunionnais nous allons caracteacuteriser les flux Lacaracteacuterisation drsquoun flot peut se faire selon la dureacutee (temps eacutecouleacute entre le premier etle dernier paquet) la taille (nombre de paquets eacutechangeacutes) et le ratio entre la dureacutee et lataille Drsquoapregraves les travaux reacutealiseacutes par [Lan2006] un flot se caracteacuterise par la deacutefinitionsuivante laquo a flow is an unidirectional series of IP packets with same source and destinationaddresses port numbers and protocol numbers raquo Ce qui peut se traduire par la deacutefinition sui-vante laquo un flot est une seacuterie de paquets IP avec le mecircme tuple suivant (adresse IP sourceport source adresse IP destination port destination protocole IP) raquo Dans ce cas preacutecisune connexion TCP de par son coteacute bi-directionnel est constitueacutee de deux flots

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie

La mise en place drsquoune eacutetude de meacutetrologie passive au sein du territoire reacuteunionnaissoulegraveve trois contraintes

La premiegravere est la mise en place drsquoun accord de partenariat avec un ou plusieurs FAILrsquoobjectif de ce partenariat est la mise en place drsquoun systegraveme drsquoeacutecoute et de capture dedonneacutees au sein de leur infrastructure tout en garantissant une confidentialiteacute maximaleagrave leur clients et agrave lrsquoentreprise

Une seconde contrainte est la seacutelection drsquoun outil de mesure Cet outil sera capablenon seulement drsquoeacutecouter les donneacutees circulant sur une interface mais eacutegalement de cap-turer les donneacutees sous diverses extensions

La derniegravere contrainte est lieacutee agrave la seacutelection drsquoun outil drsquoanalyse Cet outil sera ca-pable drsquoapporter un support de reacuteponses aux questions poseacutees preacuteceacutedemment Il devrareacutepondre agrave des critegraveres que lrsquoon deacutetaillera par la suite

Le trafic eacutetant variable drsquoun instant t agrave lrsquoinstant t+1 nous allons mettre en place un sys-tegraveme de capture de donneacutees Ce systegraveme permettra lrsquoanalyse a posteriori des meacutetriquesEn fonction des reacutesultats drsquoautres meacutetriques pourront ecirctre extraites des donneacutees Deplus la capture nous autorise apregraves quelques deacutemarches administratives de partagerles traces aupregraves de la communauteacute scientifique

321 Pour la capture du trafic

Nous avons vu dans le chapitre 1 que les outils neacutecessaires agrave la reacutealisation drsquoeacutetudes demeacutetrologie passive sont nombreux Notre analyse sera la plus large possible en terme de

79

meacutetriques Nous devrons en fonction des reacutesultats obtenus eacutetudier drsquoautres meacutetriquesque celles choisies en premier lieu Pour ces raisons nous faisons le choix de reacutealiser descaptures du trafic Dans la section 123 nous avons preacutesenteacute les outils disponibles pourla capture de trafic Nous allons dans un premier temps utiliser une solution logicielleDans le cas ougrave les deacutebits sur les liens seraient trop eacuteleveacutes nous basculerons alors vers unesolution mateacuterielle

322 Pour analyser les traces

De nombreux outils drsquoanalyse de traces existent dans la litteacuterature Afin drsquoen choi-sir un nous allons deacutetailler des critegraveres de seacutelection Nous preacutesenterons quelques outilsdrsquoanalyse existants en mettant en avant leurs reacuteponses aux critegraveres preacutesenteacutes Nous fini-rons par la preacutesentation drsquoun outil drsquoanalyse de traces deacuteveloppeacute au sein du LIM

Deacutefinition des critegraveres

Lrsquooutil drsquoanalyse pour la plate-forme de meacutetrologie passive devra reacutepondre aux cri-tegraveres de seacutelection suivants

1 Protection de la vie priveacutee des utilisateurs Pour respecter ce critegravere une fonctiondrsquoanonymisation des traces doit ecirctre appliqueacutee La loi Informatique et Liberteacute de1978 reacuteglemente le traitement des donneacutees personnelles [LIL1978] Une trace estune eacutecoute drsquoun trafic initieacute par un utilisateur Les donneacutees transporteacutees nrsquoont pasagrave ecirctre lues En plus des donneacutees ce sont aussi les adresses IP qui ne doivent pasapparaitre en clair

2 traiter une volumeacutetrie importante Le volume des traces eacutetant variable il est neacuteces-saire que lrsquooutil soit capable de traiter des traces de grande taille Potentiellementce sont des fichiers de traces de plusieurs dizaines de Go (Giga-octets) qui peuventecirctre ameneacutes agrave ecirctre traiteacutes

3 proposer des meacutetriques adapteacutees Pour reacutealiser une analyse approfondie il fautque la liste des meacutetriques proposeacutees par lrsquooutil drsquoanalyse soit la plus large possibleAgrave ce titre nous avons preacutesenteacute dans le tableau 31 une base de meacutetriques a analyser

Les outils drsquoanalyse disponibles

Il existe de nombreux outils drsquoanalyse de donneacutees de meacutetrologie passive Nous pro-posons une classification selon les possibiliteacutes offertes par chaque outil CAIDA pro-pose sur son site internet une partie deacutedieacutee aux diffeacuterents outils de meacutetrologie passive[CAIDA-Tools]

BRO est un outil pour la deacutetection drsquointrus sur le reacuteseau en temps-reacuteel agrave partir demeacutetrologie passive Il est preacutesenteacute pour la premiegravere fois dans lrsquoarticle [Paxson1999] Agravepartir drsquoun systegraveme de script il accepte en entreacutee des fichiers de taille importante Leprincipal deacutefaut de Bro par rapport agrave nos critegraveres de seacutelection est le non-respect de la viepriveacutee

CoralReef [Moore2001] est une suite logicielle deacuteveloppeacutee par CAIDA en 1999 Cetoutil reacutealise des analyses de donneacutees que ccedila soit en temps reacuteel ou sur des traces Le critegraverede respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pas respecteacuteLrsquooutil est plus adapteacute agrave lrsquoeacutetude des caracteacuteristique du trafic qursquoau performance de TCPAinsi les meacutetriques lieacutees agrave lrsquoeacutetude des performances ne sont pas incluses dans le code delrsquooutil

Netflow est un outil proprieacutetaire Il neacutecessite lrsquoutilisation drsquoun mateacuteriel de la marqueCISCO plus la licence du logiciel Lrsquooutil reacutealise principalement la supervision du trafic

80

transitant sur le mateacuteriel Le respect de la vie priveacutee est ici respecteacute mais les meacutetriques deperformance protocolaire ne sont pas inclues

TCPStat [Herman2001] rapporte certaines statistiques du trafic transitant agrave traversune interface reacuteseau Crsquoest un outil qui peut travailler sur un flot en temps reacuteel ou enanalysant un fichier de trace Cet outil ne permet pas lrsquoanonymisation des adresses IPPeu de meacutetriques sont ainsi renseigneacutees On pourrait obtenir les deacutebits et la volumeacutetriedes paquets IPv4 eacutechangeacutes

TCPTrace [Ostermann2000] est un logiciel qui permet le traitement de traces drsquoeacutecouteOutil tregraves complet il a deacutejagrave fait ses preuves sur drsquoautres projets de meacutetrologie passive Lecritegravere de respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pasrempli La meacutetrique de caracteacuterisation des destinations et la reacutepartition geacuteographique nesont pas incluses dans les meacutetriques proposeacutees par lrsquooutil

Tstat [Mellia2003-1] est un outil qui peut reacutealiser la collecte et lrsquoanalyse du trafic Cetteanalyse se fait sur diffeacuterents niveaux passant des paquets agrave la couche applicative Cetteanalyse reacutealise une anonymisation des adresses IP Les meacutetriques de caracteacuterisations desdestinations et de reacutepartitions geacuteographiques ne sont pas inteacutegreacutees dans lrsquooutil

Wireshark [Orebaugh2006] est un outil graphique drsquoanalyse reacuteseau tregraves reacutepandu Cetoutil permet de filtrer et drsquoanalyser des donneacutees entrantes et sortantes drsquoun point entemps reacuteel ou sur des traces collecteacutees Il autorise eacutegalement la capture et la lecture detraces Lrsquooutil preacutesente des lacunes sur les trois critegraveres preacutesenteacutes

ZOO est un outil deacuteveloppeacute dans le cadre du projet Metropolis Creacuteeacute par le Labora-toire drsquoAnalyse et drsquoArchitecture des Systegravemes (LAAS) le logiciel essaie de trouver un moyende mesurer la qualiteacute du service de trouver des paramegravetres pour deacutefinir le processus detrafic et drsquoaider agrave eacutemettre un modegravele adapteacute pour le trafic [Owezarski2004] Au niveaudes meacutetriques preacutesenteacutees ce sont principalement des statistiques et des informations desupervision qui sont disponibles Lrsquoanonymisation des adresses IP nrsquoest pas incluse dansles caracteacuteristiques de lrsquooutil

Le tableau 31 sert de base pour la reacuteponse aux critegraveres deacutedieacutes des meacutetriques Netflowpossegravede un catalogue de meacutetriques restreint agrave la supervision du trafic TCPTrace et Tstatsont des outils qui auraient pu correspondre agrave nos besoins mais les meacutetriques de caracteacute-risation des destinations et la reacutepartition geacuteographiques sont absentes Nrsquoayant pu faireun choix sur un outil pouvant reacutepondre agrave la totaliteacute des critegraveres nous nous orientons versle deacuteveloppement drsquoun analyseur de traces

Deacuteveloppement de Xanalyse

Lrsquoanalyse des traces de meacutetrologie passive peut srsquoeffectuer avec de nombreux outilsDans la section preacuteceacutedente nous avons preacutesenteacute les critegraveres de diffeacuterenciation de cesoutils Tstat et TCPTrace sont des outils tregraves complets Ces deux outils auraient pu nousconvenir Neacuteanmoins le temps de traitement des fichiers de volumeacutetrie importante estbeaucoup trop important Ducirc agrave cela nous avons pris le parti de deacutevelopper un nouveloutil drsquoanalyse de traces Xanalyse

Le premier critegravere concerne le respect de la vie priveacutee Une approche simple pouranonymiser une adresse IP est de la faire correspondre avec une adresse IP aleacuteatoireUne telle meacutethode rend la trace inutilisable dans des situations utilisant la logique desadressages IP Lrsquoanonymisation drsquoadresse est performante si elle preacuteserve le mecircme preacute-fixe Autrement dit si deux adresses IP partagent k-bits de preacutefixes leurs eacutequivalencesanonymiseacutees conserveront ces k-bits de preacutefixes en commun La meacutethode crypto-pan deacute-crite dans lrsquoarticle [Xu2002] sert de base agrave la fonction drsquoanonymisation mise en œuvreLrsquoanonymisation srsquoappliquera que lors de lrsquoaffichage des reacutesultats Nous avons besoin de

81

lrsquoadresse pour deux meacutetriques de supervision que sont la reacutepartition du trafic et la geacuteo-localisation Concernant le champ Donneacutees des paquets TCP il nrsquoest pas utiliseacute Lrsquoeacutetudene recommande que les en-tecirctes

Sur lrsquoaspect du traitement drsquoune volumeacutetrie importante Xanalyse fut deacuteveloppeacute avecla volonteacute de maximiser lrsquoutilisation des ressources de la machine hocircte Pour cela nousavons eu lrsquoideacutee drsquoutiliser la programmation parallegravele (thread) La paralleacutelisation permetlrsquoexeacutecution de plusieurs instructions simultaneacutement

Le calcul des meacutetriques fut directement reacutealiseacute en consideacuterant leurs deacutefinitions dansles diffeacuterents RFC tel que nous lrsquoavons deacutecrit dans la section 312 Une partie statistiquefut eacutegalement inteacutegreacutee agrave notre outil Des calculs de moyenne de variance et drsquoeacutecart-typefurent inteacutegreacutes Ces calculs se font agrave la toute fin du programme Durant le deacuteveloppe-ment nous avons corroboreacute lrsquoensemble de nos reacutesultats avec les reacutesultats de TCPTraceCette comparaison a eacuteteacute mise en place pour veacuterifier lrsquoexactitude de nos reacutesultats Le deacuteve-loppement de lrsquooutil fut reacutealiseacute sous ma direction dans le cadre drsquoun stage de fin drsquoeacutetudede Master 2 [Ravoavahy2017]

Pour finir nous avons reacutealiseacute une validation par comparaison entre Xanalyse et TCP-Trace Le tableau 32 montre le bilan de cette comparaison

TABLE 32 ndash Comparaison de performances

TCPTrace XanalyseTemps drsquoanalyse sur une trace de 20 Go 10 jours 7 joursTemps drsquoanalyse sur une trace de 1 Go 1 Heure 3 Min

Xanalyse se reacutevegravele ecirctre un outil beaucoup plus rapide que TCPTrace avec des reacutesul-tats identiques sur le calcul des meacutetriques Cet outil est actuellement disponible sur lesite du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrxanalyse

33 Protocole de mesure

Le protocole de mesure preacutesente les diffeacuterentes phases que lrsquoon souhaite mettre enplace durant lrsquoeacutetude Elles sont ainsi au nombre de cinq les contraintes reacuteglementairesla veacuterification des perturbations la capture du trafic la collecte et lrsquoanalyse Ce protocolefut reacutedigeacute en prenant en consideacuteration les conseils indiqueacutes dans [John2010] Dans cetarticle les auteurs deacutelivrent diffeacuterents conseils et indications baseacutes sur lrsquoexpeacuterience deplusieurs acteurs de meacutetrologie passive

Notre protocole a eacuteteacute mis en place dans le but de rassurer lrsquoensemble des acteurs Ceprotocole fut testeacute dans le cadre drsquoune eacutetude de meacutetrologie passive du LIM

Contraintes reacuteglementaires Avant toute eacutetude de meacutetrologie Internet passive au seinde lrsquoUniversiteacute de La Reacuteunion il faut obtenir lrsquoautorisation du preacutesident de lrsquoeacutetablisse-ment Le preacutesident consultera le Correspondant Informatique et Liberteacutes (CIL) et le Respon-sable Seacutecuriteacute et Systegravemes drsquoInformation (RSSI) de lrsquouniversiteacute Ces personnes deacutefiniront enfonction des objectifs de lrsquoeacutetude les limites de notre eacutetude en accord avec les lois fran-ccedilaises Les limites imposeacutees par la preacutesidence de lrsquoUniversiteacute indiqueacutees par le CIL et leRSSI furent celles autour de la vie priveacutee Agrave ce titre nous nrsquoavions pas le droit drsquoeacutetudierle trafic en temps reacuteel nrsquoy drsquoeacutetudier le champ Donneacutees des paquets TCP Nous avionseacutegalement lrsquoobligation drsquoanonymiser lrsquoensemble des adresses IP priveacutees rencontreacutees Laderniegravere obligation fut la restriction de nos eacutecoutes au LIM Ces obligations furent res-pecteacutees dans le deacuteveloppement de lrsquooutil drsquoanalyse

82

Afin de ne capturer que le trafic du Laboratoire nous avons travailleacute en collaborationavec la Direction des Services Informatiques (DSI) de lrsquoUniversiteacute Ce partenariat a pourobjectif drsquoisoler le trafic du LIM dans un Virtual Local Area Network (VLAN) speacutecifique UnVLAN est laquo un meacutecanisme par lequel les hocirctes qui reacutesident dans la mecircme infrastructurephysique commuteacutee mais des domaines de diffusion virtuelle seacutepareacutes sont adresseacutes agravepartir du mecircme sous-reacuteseau IPv4 et partagent une adresse IP de passerelle par deacutefautcommune supprimant ainsi lrsquoexigence drsquoun sous-reacuteseau IP deacutedieacute pour chaque reacuteseaulocal virtuel (Local Area Network (LAN) ou MAN) raquo [RFC3069] Les VLAN seacuteparent lesusagers selon leur autorisations et les types de connexion Par exemple un enseignant-chercheur a plus de droits qursquoun eacutetudiant Une personne connecteacutee par connexion filairea des droits diffeacuterents drsquoune personne connecteacutee par agrave un reacuteseau sans fil Le RSSI delrsquoUniversiteacute ne souhaitant pas obliger les membres du LIM agrave participer agrave cette eacutetudeune campagne de preacutevention fut organiseacutee Les personnes ayant explicitement eacutemis lesouhait de ne pas participer agrave notre eacutetude seraient de facto connecteacutees agrave un autre VLANpar la DSI Au sein du laboratoire tout le personnel a accepteacute de participer agrave notre eacutetude

Veacuterification des perturbations La figure 31 illustre lrsquointer-connectiviteacute mise en placepour lrsquoeacutecoute du LIMChaque ordinateur du laboratoire geacutenegravere un trafic Internet qui passe par le VLAN dulaboratoire Par le systegraveme de port-mirroring le routeur va creacuteer une copie des paquetstransitant par le port du VLAN laboratoire Le paquet copieacute sera alors redirigeacute vers lasonde de capture La sonde de capture aura deux interfaces reacuteseaux La premiegravere (Eth0)sera deacutedieacutee agrave la capture des paquets provenant de la technique de port-mirroring La se-conde carte reacuteseau (Eth1) servira pour lrsquoaccegraves distant agrave la sonde de captureLrsquoordinateur drsquoaccegraves possegravede une cleacute priveacutee permettant lrsquoaccegraves agrave distance agrave la sonde decapture Cette porte drsquoentreacutee seacutecuriseacutee permet une gestion agrave distance de la sonde Lestraces collecteacutees seront transfeacutereacutees sur un serveur de stockage deacutedieacute au sein du LIM Letransfert se fera agrave lrsquoaide de la commande SCP et lrsquoaccegraves seacutecuriseacute preacutesenteacute preacuteceacutedemmentLrsquoaccegraves distant et le transfert des traces font partie inteacutegrante du trafic geacuteneacutereacute par lesmembres du laboratoire Les perturbations peuvent survenir agrave deux niveaux au routeuret agrave la sonde Au niveau de la sonde drsquoeacutecoute le deacutebit affecteacute en entreacutee-sortie du VLANdu laboratoire est eacutegal agrave 1 000 Mbits Ce deacutebit est devenu freacutequent sur les cartes reacuteseauxvendues sur les ordinateurs grand public Les caracteacuteristiques de la carte reacuteseau deacutedieacuteeagrave la capture accepte un deacutebit maximum eacutegal au deacutebit du VLAN du LIM On considegraverealors que le taux de pertes occasionneacute par la carte de capture peut ecirctre neacutegligeableAu niveau du routeur la fonction port-mirroring copie lrsquointeacutegraliteacute des segments IP en-trant sur un port Le paquet original est redirigeacute vers lrsquoadresse de destination incluse dansle champ destination de lrsquoen-tecircte IP Le paquet forgeacute au sein du routeur est dirigeacute versun port deacuteclareacute lors de la programmation de lrsquoeacutequipement La fonction de port-mirroringfait partie des techniques deacuteveloppeacutees dans le but drsquoeacutetudier le comportement drsquoun reacute-seau [Zhang2007] a eacutetudieacute les deacuterives lieacutes agrave la fonction port-mirroring Cette fonctionneacutecessite la mise en meacutemoire tampon des paquets provenant du lien eacutetudieacute jusqursquoagrave ceqursquoils puissent ecirctre transmis sur le lien miroir Cette mise en meacutemoire tampon joue sur lasynchronisation des paquets entre le lien eacutetudieacute et le lien miroir Lors de la transmissiondes paquets sur le lien miroir est-ce que la transmission srsquoest faite dans lrsquoordre drsquoarriveacuteesur le port eacutetudieacute Il y a donc une question drsquoordonnancement des paquets agrave eacutetudier Lameacutemoire tampon du routeur nrsquoest pas infinie Il existe donc des cas ougrave la meacutemoire estremplie occasionnant agrave ce moment lagrave des pertes Les reacutesultats de [Zhang2007] ont misen avant une diffeacuterence de synchronisation entre les paquets du lien eacutetudieacute et les paquetsdu lien miroir La diffeacuterence de synchronisation implique eacutegalement des erreurs dans lereacute-ordonnancement des paquets Ces erreurs auront pour conseacutequences des erreurs dans

83

lrsquoanalyse des performances de TCP Pour reacutesoudre ces problegravemes les auteurs preacuteconisentlrsquousage drsquoune carte physique speacutecifique agrave lrsquoeacutetude passive comme les cartes DAG

FIGURE 31 ndash Scheacutema de distribution de la plate-forme de mesure

Capture du trafic La mise en place des mesures se fait degraves la mise sous tension de lasonde et la fin du chargement du systegraveme drsquoexploitation La capture des donneacutees auraune dureacutee comprise entre 1 et 23 heures Elle srsquoeffectue agrave lrsquoaide de la commande

tcpdump -i eth0 -w trace-$timestamptrace amp

Dans laquelle les options indiquent

mdash -i eth0 indique lrsquointerface de capture Nous avons preacutevu une seconde interfacereacuteseau pour lrsquoaccegraves distant seacutecuriseacute

mdash -w trace-$timestamptrace cette option deacutesigne le fichier drsquoeacutecriture Les fichiers sontnommeacutes par le timestamp de deacutebut

Une fois la capture finie la sonde va deacutecider du temps avant la prochaine eacutecouteCette dureacutee nrsquoexceacutedera pas 24 heures Lrsquoobjectif est drsquoavoir des mesures quotidiennesmais programmeacutees de maniegravere aleacuteatoire sur la dureacutee drsquoeacutecoute et sur lrsquoeacutecart entre deuxmesures

Le paragraphe de veacuterifications des perturbations a deacutemontreacute qursquoil est difficile demettre en place une capture de la totaliteacute des paquets Une solution de capture est lrsquoeacutechan-tillonnage Dans notre cas nous avons reacutealiseacute un eacutechantillonnage indeacutependant du contenu[RFC5475] Cet eacutechantillonnage est reacutealiseacute sans prendre en consideacuteration le contenu dupaquet Ayant une volonteacute drsquoobtenir un grand nombre de donneacutees nous avons mis enplace une dureacutee de capture maximale de 23 heures et un eacutecart entre deux captures de 24heures

Collecte Une phase de collecte des traces est reacuteguliegraverement reacutealiseacutee Lrsquoobjectif est delibeacuterer de lrsquoespace disque au niveau de la sonde de capture Lorsque la sonde a fini dereacutealiser sa capture elle va envoyer le fichier de capture vers un serveur de stockage ausein du LIM Nous avons vu que le fichier de capture est nommeacute selon une nomenclaturespeacutecifique Pour rappel cette nomenclature comporte la date (au format timestamp) dudeacutebut de lrsquoeacutecoute La deacutenomination du fichier autorise un classement des traces par datede capture Ce classement peut permettre une eacutetude temporelle du trafic

Lrsquoenvoi du fichier se fait agrave travers lrsquointerface eth1 La technique utiliseacutee pour le trans-fert est la commande SCP Lrsquoutilisation de lrsquoempreinte MD5 du fichier nous assure que letransfert des donneacutees srsquoest reacutealiseacute correctement En cas de diffeacuterence entre les empreintes

84

le transfert srsquoeffectue agrave nouveau Lrsquoobjectif est de veacuterifier lrsquointeacutegriteacute des donneacutees transfeacute-reacutes

Le scheacutema 32 scheacutematise le fonctionnement de notre sonde de mesure Nous consi-deacuterons que la fonction de port-mirroring est deacutejagrave programmeacutee sur le routeur DSI

Degraves que la sonde est alimenteacutee eacutelectriquement et que lrsquoOS est chargeacute la sonde vaveacuterifier qursquoune capture est programmeacutee Si aucune capture de trace nrsquoest programmeacuteela sonde va en planifier une dans les prochaines 24 heures Si la sonde a connaissancedrsquoune programmation elle va alors reacutealiser la capture La sonde va enregistrer le traficsur une dureacutee allant entre 1 et 23 heures Lorsque la capture est finie la sonde va alorsprogrammer le prochain enregistrement La sonde va eacutegalement envoyer la trace vers leserveur de stockage

Capture

Alimentation

eacutelectrique

Veacuterification

dune capture

Programmation

dune capture

Collecte

PreacutesenteAbsente

24 heures maximum

1 - 23 heures maximum

FIGURE 32 ndash Scheacutema de fonctionnement de la plateforme de mesure

Analyse Lrsquoanalyse des donneacutees obtenues se fait en deux eacutetapes La premiegravere consiste agraveutiliser lrsquooutil Xanalyse pour obtenir les reacutesultats bruts La seconde eacutetape est lrsquoextractiondes donneacutees pour les repreacutesenter sous forme graphique

34 Reacutesultats

Notre eacutetude se cantonne agrave mesurer les performances du trafic au sein du LIM Le LIMfait partie inteacutegrante de lrsquoUniversiteacute de La Reacuteunion et agrave ce titre les usages de lrsquoInternetau sein de lrsquoeacutetablissement sont reacuteglementeacutes Ainsi lrsquoeacutetude des meacutetriques de supervisionpourraient ne pas correspondre agrave un usage plus libeacuteral de lrsquoInternet Pour rappel lesmeacutetriques eacutetudieacutees sont indiqueacutees dans le tableau 31

Nous avons fait le choix de seacuteparer notre eacutetude en deux La partie supervision donneun aperccedilu de lrsquousage du reacuteseau Internet au sein du LIM Nous essaierons dans la mesuredu possible de faire des extrapolations avec lrsquousage de lrsquoInternet agrave La Reacuteunion La sectionperformance est celle qui est la plus inteacuteressante Crsquoest elle qui va nous indiquer les deacutegra-dations occasionneacutees par les longs deacutelais pour La Reacuteunion

85

341 Supervision du trafic

Le tableau 33 montre la distribution des 4 protocoles de transport rencontreacutes

TABLE 33 ndash Distribution des protocoles encapsuleacutes dans IP

Protocole ICMP IGMP TCP UDPPourcentage 572 001 9249 178

La preacutesence du protocole ICMP agrave plus de 5 srsquoexplique par la preacutesence des sondesde mesures de RunPL Pour rappel lrsquoobjectif de cette plate-forme est drsquoeacutetudier la connec-tiviteacute de La Reacuteunion et des icircles de la Zone Oceacutean Indien agrave travers de la meacutetrologie activeNous avons dans le chapitre 2 preacutesenteacute des reacutesultats lieacutes agrave ces eacutetudes Lrsquousage du pro-tocole ICMP est freacutequent au sein de lrsquoInternet Une eacutetude du trafic reacuteunionnais mettraiteacutegalement lrsquousage de ce protocole

Le protocole Internet Group Management Protocol (IGMP) deacutefini dans le [RFC3376] estun protocole utiliseacute par les systegravemes IPv4 (hocirctes et routeurs) pour signaler leur appar-tenance agrave un groupe de multidiffusion IP agrave tout routeur multicast voisin Son usage estrestreint au sein drsquoun reacuteseau priveacute

Le protocole User Datagram Protocol (UDP) a une preacutesence infeacuterieure agrave 2 Son rocircleest la transmission de donneacutees simples sans fiabiliteacute Son usage est geacuteneacuteralement li-miteacute au service DNS Reacutecemment lrsquoentreprise Google a deacuteveloppeacute lrsquooption QUIC QUICpermet au navigateur Google Chrome drsquoeffectuer des requecirctes HyperText Transfer Protocol(HTTP)HyperText Transfer Protocol Secured (HTTPS) sur le protocole UDP [Carlucci2015]a eacutetudieacute les performances de ce systegraveme Les reacutesultats obtenus ont montreacute un meilleurgoodput que TCP-CUBIC malgreacute un taux de perte plus important Lrsquousage de QUIC estlimiteacute au navigateur Google Chrome navigateur le plus reacutepandu agrave La Reacuteunion drsquoapregraves[GSCounter] Neacuteanmoins cette option est deacutesactiveacutee par deacutefaut

Les reacutesultats de TCP sont en accord avec lrsquoeacutetude reacutealiseacutee par [EQUINIX] Avec unpourcentage de 92 49 TCP est majoritaire Les services proposeacutes par TCP sont plusnombreux que ceux offerts par les autres protocoles de transport

Le tableau 34 indique les services utiliseacutes Les services ont eacuteteacute rangeacutes par pourcentagereleveacute

TABLE 34 ndash Reacutepartition des services utiliseacutes par TCP

Service SSH DNS Mail Non identi-fieacutes

Autres HTTPS HTTP

Percent 002 163 491 721 945 3297 4379

La preacutesence du service Secure SHell (SSH) srsquoexplique par les accegraves distants agrave diffeacuterentsoutils propres au laboratoire On peut citer les nœuds Planet-Lab [PlanetLab] agrave traversle monde les sondes de la plate-forme RunPL lrsquoaccegraves agrave la sonde de capture pour cetteeacutetude lrsquoaccegraves agrave des serveurs distants etc

163 des paquets eacutechangeacutes dans nos traces sont des requecirctes de DNS Ces paquetspermettent de convertir un nom de domaine en adresse IP Lrsquoutilisation du DNS avec leprotocole TCP a eacuteteacute restreint aux transferts de zone et aux reacuteponses dont la taille est tropimportante pour UDP [RFC5936 RFC6691 RFC7766]

Le service intituleacute Mail regroupe les services identifieacutes par les ports numeacuteroteacutes 25110 143 465 995 et 993 Ces ports correspondent respectivement agrave Simple Mail TransfertProtocol (SMTP) Post Office Protocol (POP) Internet Message Access Protocol (IMAP) et leursversions seacutecuriseacutees SMTPs POPs IMAPs Lrsquoutilisation de ces ports est faite par les agents

86

de messagerie comme Windows Live Mail Mozilla Thunderbird ou Mail Lrsquoeacutechange decourriel repreacutesente 4 91 des paquets eacutechangeacutes Ce pourcentage est fausseacute par lrsquoutilisa-tion des interfaces web des messageries Par exemple on peut utiliser la page web duservice de message Gmail de Google pour envoyer directement des mails Le service uti-liseacute est alors un service web HTTP ou HTTPS

Le service nommeacute Non identifieacutes est une connexion dont le numeacutero de port nrsquoest pasrattacheacute agrave un service en particulier Ce sont geacuteneacuteralement des numeacuteros supeacuterieurs agrave 1 000

La partie Autres regroupe plusieurs services Ces services sont assez divers On peutainsi y retrouver lrsquoutilisation du port numeacuteroteacute 139 correspondant agrave netbios-ssn Ce servicede NetBIOS autorise lrsquoeacutechange de message en mode connecteacute On peut eacutegalement citerlrsquousage du service Hyper Text Caching Protocol (HTCP) [RFC2756] Ce service est utiliseacutepour partager et deacutecouvrir les contenus des caches (anteacutemeacutemoires) HTTP entre serveursmandataires

Nous avons deacutecideacute de garder la seacuteparation entre les services HTTP et HTTPS HTTPSest lrsquousage de HTTP avec un chiffrement Ce chiffrement permet au visiteur de veacuterifierlrsquoidentiteacute du site web gracircce agrave un certificat Ces services sont preacute-dominants au sein duLIM

Lrsquousage de ces services peut ecirctre deacutegradeacute si lrsquoon quitte La Reacuteunion Le tableau 35 in-dique la reacutepartition du trafic selon le type drsquoadresse de destination

TABLE 35 ndash Distribution du trafic

Trafic LAN MAN WANPourcentage 2165 0 7835

La reacutepartition srsquoest faite selon la geacuteolocalisation des adresses IP Le trafic LAN cor-respond agrave des eacutechanges entre adresses priveacutees Le trafic identifieacute MAN correspond agrave deseacutechanges entre adresses geacuteolocaliseacutees agrave La Reacuteunion On constate ainsi qursquoaucune infor-mation chercheacutee par les utilisateurs nrsquoest geacuteolocaliseacutee agrave La Reacuteunion Le trafic Wide AreaNetwork (WAN) repreacutesente le trafic transitant par les cacircbles sous-marins Ce deacutecoupageest rendu possible par lrsquointer-connexion des opeacuterateurs au sein du GIX Reunix Ce deacutecou-page ne serait pas le mecircme si on eacutetudiait la totaliteacute du trafic de La Reacuteunion Ainsi onconstate qursquoil nrsquoy a aucun service dont la destination finale serait La Reacuteunion

Le tableau 37 indique la reacutepartition des destinations de type WAN Le tableau 36rappelle la correspondance entre lrsquoacronyme et le nom complet de chaque continent

TABLE 36 ndash Correspondance entre acronymes et nom des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

TABLE 37 ndash Distribution geacuteographique des destinations WAN

Continent AF AS EU NA OC SAPourcentage 019 168 4850 4867 064 032

On constate que la reacutepartition des continents est fortement ineacutegale LrsquoEurope et lrsquoAmeacute-rique du Nord concentrent plus de 97 des destinations reacuteunies Lrsquoeacutetude reacutealiseacutee par[Fanou2016] a montreacute une incoheacuterence dans lrsquoaccegraves aux contenus Les reacutesultats ont ainsiprouveacute que malgreacute la preacutesence drsquoune infrastructure web deacuteveloppeacutee sur le continent afri-cain la majoriteacute du contenu eacutetait stockeacute sur les continents europeacuteen et nord-ameacutericain

87

Dans le cadre de La Reacuteunion les regravegles de routage vues dans le chapitre preacuteceacutedent sonten coheacuterence avec la reacutepartition des continents

342 Performance de TCP

Un flot peut ecirctre caracteacuteriseacute selon sa longueur (nombre de paquets ou octets eacutechan-geacutes) sa dureacutee (dureacutee des eacutechanges entre le premier et le dernier paquet captureacute) et sonratio Chaque caracteacuterisation est associeacutee agrave deacutenomination selon que le flux est court oulong Il existe plusieurs deacutefinitions de limites de chaque caracteacuterisation Dans le tableau38 nous indiquons le nom associeacute agrave chaque flux selon sa caracteacuterisation ainsi que desexemples de limites

Pour rappel nous avons deacutefini un flot comme laquo une seacuterie de paquets IP avec le mecircmetuple suivant ldquoadresse IP source port source adresse IP destination port destinationprotocole IPrdquo raquo Dans notre eacutetude nous consideacutererons un flot TCP sans tenir compte desmeacutecanismes drsquoeacutetablissement et de fermeture de connexion Ainsi un flot pourra conteniruniquement des paquets de donneacutees et drsquoacquittement

TABLE 38 ndash Tableau de deacutenomination des flux selon [Lan2006]`````````````Meacutetrique

Taille des fluxCourts Longs limites

Longueur Souris Eacuteleacutephant 10 paquets [Sallantin2014]1 de lrsquoutilisation du lien[Estan2001] 100 Ko[Lan2006]

Dureacutee Libellule Tortue 2 secondes[Brownlee2002] 15 mi-nutes [Lan2006]

Deacutebit Gueacutepard Escargot 100 Kos [Lan2006]

Les limites varient selon les eacutetudes Pour notre eacutetude les limites seront choisies enfonction des reacutesultats Nous comparerons nos limites avec celles indiqueacutees dans le ta-bleau ci-dessus Dans notre preacutesentation la caracteacuterisation des flux confond flux montantet flux descendant Drsquoapregraves la loi de Pareto environ 80 des effets sont le produit de 20des causes Dans lrsquoInternet 80 du trafic est reacutealiseacute par seulement 20 de flux eacuteleacutephants[Paxson1995] Nous regarderons si cette loi est respecteacutee par les limites proposeacutees

Dans la figure 33 nous avons repreacutesenteacute les CDF de la longueur des flux selon lespaquets (33a) et le nombre drsquooctets (33b) Les traits verticaux repreacutesentent les limitesindiqueacutees dans le tableau 38 Sur la figure 33a le trait vertical repreacutesente la limite des10 paquets de [Sallantin2014] Sur la figure 33b le trait vertical drsquoune valeur de 10 000octets repreacutesente la limite indiqueacutee par [Lan2006] Le trait de droite repreacutesente les 1 dela capaciteacute du lien drsquoaccegraves soit 107 octets (100 Ko)

Sur la figure 33a plus de 50 des flux sont des flux mono-paquet Les flux infeacuterieursagrave la limite proposeacutee par [Sallantin2014] de 10 paquets ont une probabiliteacute de 0 67 Notretrafic est donc constitueacute drsquoune majoriteacute de flots courts sur les paquets La seacuteparation de80 du trafic se fait agrave partir de 18 paquets

Lrsquoaxe des abscisses de la figure 33b deacutemarre agrave 500 octets avec une probabiliteacute de 0 28La valeur de deacutepart de lrsquoaxe des abscisses repreacutesente le pas utiliseacute pour le calcul de laCDF Le premier axe vertical repreacutesenteacute agrave 10 000 octets seacutepare 79 27 des flux sont desflux courts La limite proposeacutee par [Estan2001] est repreacutesenteacutee agrave 107 octets Cette seacutepara-tion indique que 99 des flux sont des flux courts Aucune des deux limites proposeacutees

88

ne permet une eacutetude fine de la seacuteparation des flux La limite proposeacutee par [Lan2006]approche la reacutepartition de Pareto

(a) Paquets (b) Octets

FIGURE 33 ndash Longueur des flux

La dureacutee drsquoun flot TCP correspond au deacutelai qui seacutepare la capture du premier et dudernier paquets du flot La figure 34 repreacutesente la PDF pour la dureacutee des flots en se-condes Le pas utiliseacute pour effectuer le traceacute est de 1 seconde Ce pas srsquoexplique par lavaleur minimale que peut prendre le RTO comme deacutefini dans le [RFC6298] La ligne ver-ticale repreacutesente la limite de [Brownlee2002] eacutegale agrave 2 secondes

La dureacutee maximale enregistreacutee pour un flot est de 61 192 secondes soit plus de 10heures drsquoeacutechange Au delagrave des 60 secondes la probabiliteacute drsquoavoir un flot supeacuterieur agravecette dureacutee est eacutegale agrave 0 081 Nous consideacuterons cette probabiliteacute neacutegligeable Plus de 59de nos flux sont infeacuterieurs agrave la limite repreacutesenteacutee par lrsquoexpiration du RTO (1 seconde) Lalimite des deux secondes indique que 64 des flux eacutechangeacutes sont des flux courts Pouratteindre la reacutepartition indiqueacutee par la loi de Pareto la seacuteparation devrait atteindre les 10secondes

Les figures 35 repreacutesentent la reacutepartition du deacutebit utile moyen de chaque flux selonle nombre de paquets par seconde (35a) et le nombre drsquooctets par seconde (35b) Laligne verticale sur la figure 35a repreacutesente la limite seacuteparant les flux courts et les fluxlongs Drsquoune valeur de 10 paquetsseconde elle est deacuteduite de la limite de 10 paquetsde la longueur des flux preacutesenteacutes preacuteceacutedemment La limite de 100 Ko de [Lan2006] suitle mecircme raisonnement Ils sont partis de la limite de la longueur des flux pour choisir lalimite de caracteacuterisation des flux sur les deacutebits

La figure 35a deacutemarre avec des deacutebits peu eacuteleveacutes mais nombreux Ainsi les flux infeacute-rieurs agrave la limite des 10 paquetsseconde repreacutesentent plus de 90 des flux rencontreacutesOn peut donc en deacuteduire que le trafic analyseacute a tregraves forte majoriteacute de flux agrave tregraves bas deacutebit

La figure 35b est calculeacutee avec le mecircme pas que pour la longueur des flux soit 500 oc-tets En analysant la figure on remarque ainsi que les flux infeacuterieurs ou eacutegaux agrave 500 octetsont une probabiliteacute drsquoexister proche de 09 La limite preacutesenteacutee par [Lan2006] autorise unecaracteacuterisation de 99 de nos flux en tant que flux courts

Tout comme lrsquoindiquaient [Paxson1995 Ciullo2009] le trafic est constitueacute en majoriteacutede flots courts Dans les trois caracteacuterisations effectueacutees (longueur dureacutee deacutebit) le traficeacutetudieacute est constitueacute agrave plus 50 voire 90 comme pour les deacutebits de flots courts

TCP est un protocole srsquoappuyant sur les deacutelais et le systegraveme drsquoacquittement pouradapter ses eacutemissions On a vu dans le chapitre 2 que lrsquoicircle de La Reacuteunion possegravede un

89

FIGURE 34 ndash Flux TCP - Densiteacute de la dureacutee de communication

(a) Paquetsseconde (b) Octetsseconde

FIGURE 35 ndash Deacutebits des flux

comportement particulier vis-agrave-vis de ce paramegravetre Nous faisons lrsquohypothegravese qursquoune desconseacutequences de ce fonctionnement est que La Reacuteunion possegravede une forte sensibiliteacute auxeacuteveacutenements de congestions Nous avons deux outils permettant de confirmer ce postulat

1 Le premier est lrsquoidentification des diffeacuterentes options preacutesentes dans lrsquoen-tecircte TCPplus particuliegraverement les options ECN Echo (ECE) Explicit Congestion Notification(ECN)Nonce Sum (NS) et CWR Le passage du bit de ces options agrave 1 indique unegestion des eacuteveacutenements de congestion

2 La seconde possibiliteacute est de repeacuterer les reacuteductions de la fenecirctre de TCP et les typesde retransmissions qui ont lieu aux alentours de cette diminution

Avec la premiegravere meacutethode nous nrsquoavons trouveacute aucun paquet avec une option degestion de la congestion (ECN) agrave 1 Cela indique que les eacuteveacutenements de congestion nepeuvent ecirctre identifieacutes par la lecture des drapeaux Les auteurs de [Trammell2015] ontmontreacute que le nombre de serveurs reacutepondant agrave la neacutegociation de lrsquooption ECE agrave traversle monde a augmenteacute ces derniegraveres anneacutees Lrsquoabsence de paquets deacutebutant la neacutegociation

90

donc provenant des utilisateurs du reacuteseau du laboratoire peut srsquoexpliquer par 3 hypo-thegravesesLa premiegravere est lrsquoobsolescence des ordinateurs du Laboratoire drsquoInformatique et de Ma-theacutematiques En effet il faut un systegraveme drsquoexploitation reacutecent pour que la version de TCPpuisse marquer les paquets avec lrsquooption Cette hypothegravese est vite abandonneacutee sachantque plusieurs participants agrave notre eacutetude possegravedent des ordinateurs acheteacutes agrave partir delrsquoanneacutee 2014La seconde hypothegravese est la suppression de lrsquooption par un eacutequipement reacuteseau traverseacute agravelrsquoUniversiteacute de La Reacuteunion Cette piste fut abandonneacutee apregraves un test de mesures Ce testconsistait agrave envoyer des paquets avec lrsquooption ECN agrave 1 et agrave regarder leurs options agrave leurarriveacutee au point de capture Les reacutesultats obtenus ont montreacute que lrsquooption eacutetait inchan-geacuteeLa derniegravere possibiliteacute est que le systegraveme drsquoexploitation ne marque pas lrsquoensemble despaquets avec le drapeau de neacutegociation Certains routeurs ou pare-feux incompatiblespeuvent bloquer le trafic entre deux hocirctes impleacutementant ECN [Bauer2011] Crsquoest pourcette raison qursquoelle est deacutesactiveacutee implicitement sur la plupart des systegravemes drsquoexploita-tion contemporains Nous avons confirmeacute cette hypothegravese agrave travers une demande drsquouti-lisation de la commande sysctl et des options de TCP des systegravemes drsquoexploitation DebianUbuntu et Mac OS X Les reacutesultats ont ainsi montreacute que les systegravemes drsquoexploitation eacutetu-dieacutes nrsquoactivaient pas cette option de TCP

Dans tous les cas lrsquoabsence des options ECE ECNNS et CWR est neacutefaste pour lesperformances de TCP Les travaux reacutealiseacutes par [Mellia2003-2] ont montreacute que les per-formances de TCP sont accrues lorsque les paquets sont marqueacutes avec ces options Sanselles les eacuteveacutenements de congestion sont plus difficiles agrave identifier

La seconde faccedilon drsquoidentifier les eacuteveacutenements de congestion est plus compliqueacutee agravemettre en place Il srsquoagit drsquoidentifier les reacuteductions de fenecirctre et drsquoeacutetudier des pertes etoudes retransmissions de paquets Elle provoque des incertitudes Sur un total de 42 386 540paquets nous avons identifieacute 21 022 400 paquets indiquant une diminution de fenecirctreSoit pregraves drsquoun paquet sur deux

Le tableau 39 indique les pourcentages des paquets retransmis etou perdus

TABLE 39 ndash Reacutepartition des paquets

fast retrans-mit

spurious retrans-mit

Paquetsperdus

Non retransmiset non perdus

Pourcentage 5 2times 10minus3 7 8times 10minus3 14times10minus3 99 97

On constate que le pourcentage des paquets retransmis ou perdus sont ridicules avecmoins de 1 des paquets eacutechangeacutes Ces pourcentages sont en deccedilagrave des valeurs que TCPpeut produire dans certaines zones Aux Eacutetat-Unis [Gettys2011] a eacutetudieacute le taux de pertesur un lien montant agrave 2 Mbits lors drsquoun transfert de fichiers drsquoun poids de 20 Go Letaux de perte est tregraves eacuteleveacute avec 33 de moyenne En comparaison avec ces eacutetudes reacuteali-seacutees lrsquoicircle de La Reacuteunion possegravede des performances de TCP que lrsquoon pourrait qualifier denormales

343 Synthegravese des reacutesultats

Lrsquoanalyse mise en place a pour objectif de tester en conditions reacuteelles notre plate-forme de mesure et la chaicircne drsquoanalyse

Lrsquoeacutetude du trafic du LIM a eacuteteacute deacutecoupeacutee en deux parties La premiegravere concerne lasupervision du trafic et traite de la composition La seconde partie se concentre sur les

91

performances du protocole de transport TCP sur le trafic agrave destination de lrsquoexteacuterieur delrsquoicircle de La ReacuteunionLrsquoeacutetude des donneacutees collecteacutees a mis en avant la preacutedominance drsquoun trafic empruntantles cacircbles sous-marins agrave destination de lrsquoEurope et de lrsquoAmeacuterique du Nord Ces deuxdestinations heacutebergent de nombreux serveurs de donneacutees scientifiquesLrsquointerrogation de ces serveurs se fait agrave partir du protocole TCP en utilisant les servicesHTTP ou HTTPS Le protocole TCP est majoritaire dans les protocoles rencontreacutes toutcomme les services preacutesenteacutes

Sur lrsquoeacutetude des performance du protocole TCP nous avons effectueacute une caracteacuteri-sation des flots en terme de longueur (paquets eacutechangeacutes) de dureacutee et de vitesse Lamajoriteacute de nos flots sont des flots courts contenant peu de donneacutees

35 Conclusion

Dans ce chapitre nous avons preacutesenteacute la meacutethode mise en place pour la reacutealisationdrsquoune eacutetude de meacutetrologie passive sur lrsquoicircle de La Reacuteunion

La Reacuteunion est une icircle dont la connectiviteacute en terme de deacutelais et de routes est par-ticuliegravere telle que le chapitre 2 preacutesente Lrsquoaugmentation progressive des deacutebits drsquoaccegravesa pour conseacutequence lrsquoaugmentation de la capaciteacute de stockage des liens On considegravereqursquoun lien possegravede une forte capaciteacute de stockage quand le produit deacutelai bande passante(BDP) associeacute agrave ce lien deacutepasse la limite de 12 5 Ko Pour La Reacuteunion la capaciteacute destockage minimale calculeacutee est de 22 5 ko Cette capaciteacute de stockage entraicircne des deacutegra-dations sur les performances du protocole TCP Nous avons souhaiteacute eacutetudier lrsquoimpact dela capaciteacute de stockage des liens sur les performances du protocole TCP agrave La ReacuteunionLrsquoaugmentation de la capaciteacute des liens entraicircne eacutegalement un changement des usagesNous souhaitons eacutegalement eacutetudier les diffeacuterents services utiliseacutes dans lrsquoInternet agrave LaReacuteunion

Le cahier des charges fut preacutesenteacute dans la section 31 Le cahier mis en place preacutesenteles meacutetriques de lrsquoeacutetude Ces meacutetriques ont eacuteteacute seacutelectionneacutees afin de reacutepondre aux objec-tifs preacutesenteacutes ci-dessus Elles couvriront un aspect supervision du trafic pour lrsquoeacutetude desservices et la reacutepartition geacuteographique Lrsquoaspect des performances du protocole TCP seraanalyseacute agrave travers les deacutebits les deacutelais les pertes les retransmissions et la preacutesence deseacuteveacutenements de congestion

Pour obtenir ces meacutetriques il est neacutecessaire de mettre en place une infrastructure demesure et une chaicircne drsquoanalyse La section 32 preacutesente lrsquoinfrastructure mise en place Lavariabiliteacute du trafic dans le temps nous a encourageacutes agrave mettre en place une plate-formede capture de trafic Le choix de lrsquooutil de capture nrsquoest pas deacutefinitif Il est deacutependant dudeacutebit associeacute au lien de capture Diffeacuterents outils drsquoanalyses de donneacutees passives existentDans le paragraphe 322 nous avons reacutealiseacute une comparaison des diffeacuterents outils selondes critegraveres de seacutelection Ces critegraveres sont au nombre de 3 protection de la vie priveacutee trai-tement drsquoune volumeacutetrie de donneacutees importante et le calcul des meacutetriques seacutelectionneacuteesAucun des outils preacutesenteacutes ne reacutepondait agrave la totaliteacute des critegraveres A la suite de ce constatnous avons fait le choix de deacutevelopper un outil reacutepondant agrave ces 3 critegraveres Lrsquoavantage decet outil est qursquoil pourra eacutevoluer en parallegravele agrave lrsquoeacutevolution de lrsquoeacutetude

Ces outils furent mis en place au sein du Laboratoire drsquoInformatique et de Matheacutematiquesdans le cadre drsquoune phase de test Les reacutesultats obtenus ont eacuteteacute compareacutes avec les reacutesultatsobtenus par TCPTrace afin de nous assurer de lrsquoexactitude de nos reacutesultats Le protocolede mesure mis en place pour cette eacutetude est deacutecrit dans la section 33 Dans ce protocolenous avons preacutesenteacute les contraintes reacuteglementaires imposeacutees par lrsquoUniversiteacute Nous nous

92

sommes ensuite assureacutes que le systegraveme mis en place pour la capture du trafic nrsquoeacutetaitsoumis agrave aucune perturbation Le systegraveme choisi pour eacutecouter le lien fut celui de port-mirroring Cette fonction des routeurs permet de copier lrsquoensemble des paquets entrantsur un lien vers un second lien Cette recopie est soumise agrave la limitation de la capaciteacutede meacutemoire des eacutequipements Elle peut entraicircner des erreurs au niveau de la datationdes paquets et dans lrsquoordre de reacute-eacutemission des paquets vers le lien miroir Dans cetteeacutetude la capture du trafic srsquoest faite agrave lrsquoaide du logiciel TCPDump Reacuteguliegraverement unephase de deacutelestage de la meacutemoire de la sonde de capture vers un serveur de stockage dulaboratoire a eacuteteacute mise en place

Les reacutesultats preacutesenteacutes dans la section 34 nous donnent une vision biaiseacutee du com-portement de lrsquoInternet reacuteunionnais Ces reacutesultats ne peuvent correspondre au compor-tement de TCP pour lrsquoensemble de lrsquoInternet de La Reacuteunion Ces reacutesultats nous donnentdes indications sur le comportement de TCP dans le cadre drsquoune connexion agrave forte capa-citeacute de meacutemorisation

Dans la partie supervision on a vu la preacutedominance du protocole TCP des servicesHTTP et HTTPS Ces usages srsquoaccompagnent drsquoune reacutepartition geacuteographique tregraves in-eacutegale LrsquoEurope et lrsquoAmeacuterique du Nord sont les deux continents avec lesquels les interac-tions sont les plus nombreuses (plus de 48 du trafic pour chaque continent)

Au niveau des performances de TCP nous avons pu voir que la majoriteacute des flotseacutetudieacutes sont des flots courts que ccedila soit en longueurs en dureacutees et en deacutebits Aucun eacuteveacute-nement de congestion ne fut releveacute Cela indique que la capaciteacute drsquoenvoi des eacutemetteursnrsquoa pas couvert le BDP du lien Cela srsquoest ressenti au niveau de la reacutepartition des paquetsRetransmissions et pertes nrsquoont repreacutesenteacute pregraves de 0 03 des paquets eacutechangeacutes

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors de laconfeacuterence Next Generation Computing Applications (NextComp) en 2017 [Noordally2017]

93

94

Conclusion amp Perspectives

1 Synthegravese des travaux

Les travaux de cette thegravese sont placeacutes dans le cadre reacutegional de lrsquoaccegraves de lrsquoicircle de LaReacuteunion agrave lrsquoInternet Ils visent agrave identifier les caracteacuteristiques qui ont une influence sur lesperformances de lrsquoInternet agrave La Reacuteunion La Reacuteunion est un deacutepartement drsquooutre-mer si-tueacute dans lrsquoOceacutean Indien Lrsquoicircle est connecteacutee agrave Internet agrave travers deux cacircbles sous-marins le SAFE et le LION Le SAFE relie lrsquoAfrique agrave lrsquoAsie Le LION interconnecte Madagascarlrsquoicircle Maurice et La Reacuteunion Lrsquoarriveacutee de ces cacircbles sur lrsquoicircle a permis le deacuteveloppement duhaut deacutebit et du tregraves haut deacutebit sur lrsquoicircle avec lrsquoarriveacutee des technologies ADSL VDSL etFTTH Des extensions agrave ces cacircbles permettent de remonter jusqursquoen Europe La Reacuteunionpossegravede REUNIX un point drsquointer-connexion (IXP) pour les opeacuterateurs locaux Ce typedrsquoaccegraves agrave Internet est speacutecifique aux icircles de la zone oceacutean indien Dans un premier tempsnous avons eacutetudieacute la connectiviteacute de lrsquoicircle sous lrsquoangle des deacutelais et des routes Dans unsecond temps lrsquoeacutetude a porteacute sur les flots TCP

TCP est le protocole de transport majoritaire dans lrsquoInternet qui rend un service detransport fiable et efficace de donneacutees Lrsquoefficaciteacute srsquoappreacutecie en terme de deacutebit eacutecouleacutepour le service rendu et drsquoutilisation des capaciteacutes de transmission du reacuteseau Lrsquoobjectifdrsquoefficaciteacute est du ressort du controcircle de flux et du controcircle de congestion Ces fonctionsagissent selon une peacuteriode correspondant au RTT de la connexion On voit alors que laperformance de TCP est deacutependante du deacutelai que va expeacuterimenter la connexion TCP

Nous avons dans un premier temps eacutetudieacute lrsquoeacutevolution du deacutelai et de la longueur desroutes entre 2012 et 2016 Cette eacutetude a mis en eacutevidence une stabiliteacute des deacutelais malgreacuteune reacuteduction de la longueur des routes Cette eacutetude a eacuteteacute reacutealiseacutee depuis un seul pointde mesure Afin drsquoeacutetudier en deacutetail la connectiviteacute de La Reacuteunion nous avons deacuteployeacuteune plate-forme de meacutetrologie active speacutecifique agrave lrsquoeacutetude Durant plusieurs mois nousavons mesureacute les deacutelais et les routes depuis et vers La Reacuteunion agrave lrsquoaide de lrsquooutil Paris-traceroute Lrsquoanalyse des reacutesultats a eacuteteacute reacutealiseacutee agrave partir de deux outils deacuteveloppeacutes pourle besoin de lrsquoeacutetude rgeoloc et rtraceroute rgeoloc sert agrave la geacuteolocalisation des adressesIP et agrave lrsquoextraction des deacutelais et de la longueur des routes depuis un fichier de sortiede traceroute rtraceroute est un outil drsquoanalyse graphique des routes Il va utiliser lesdonneacutees obtenues depuis rgeoloc pour placer sur une carte les diffeacuterents pays traverseacutespar les donneacutees collecteacutees

Les reacutesultats ont eacuteteacute eacutetudieacutes selon quatre critegraveres les deacutelais la longueur des routesla distance geacuteographique entre la source et la destination et lrsquoidentification des portesde lrsquoInternet reacuteunionnais Nous avons ainsi pu mettre en eacutevidence lrsquoindeacutependance de lalongueur de la route en fonction de la distance geacuteographique Nous avons calculeacute le deacutelaineacutecessaire agrave chaque noeud traverseacute Cette valeur est fortement deacutependante du sens decirculation de lrsquoinformation La relation entre le deacutelai et la distance geacuteographique a misen eacutevidence une incoheacuterence Le deacutelai neacutecessaire pour joindre une destination ou ecirctrejoint depuis lrsquoexteacuterieur de lrsquoicircle est inversement proportionnel agrave la distance geacuteographiqueCela signifie donc que plus la distance est importante moins le deacutelai est eacuteleveacute Nous

95

avons eacutetudieacute ce comportement vis agrave vis des portes de lrsquoInternet reacuteunionnais et mis enavant le fait que plus de 97 du trafic reacuteunionnais passe par la France hexagonale sanstenir compte si crsquoest du trafic montant ou descendant Ce comportement a eacutegalement eacuteteacuteeacutetudieacute pour les icircles de la ZOI dans le sens montant Le deacutelai minimal mesureacute accompagneacutedu routage analyseacute peut avoir des conseacutequences sur les performances drsquoun protocole detransport deacutependant au deacutelai comme lrsquoest TCP

Lrsquoaugmentation de la bande passante sur le reacuteseau de distribution de lrsquoicircle et sur lesliens reliant lrsquoIle agrave lrsquoInternet nrsquoont pas permis la reacuteduction des deacutelais Cela a pour conseacute-quence lrsquoaugmentation de la capaciteacute de stockage des canaux de communication La ca-paciteacute de stockage est calculeacutee agrave partir de la bande passante et du RTT On parle de Pro-duit Deacutelai-Bande passante (BDP) Si le BDP deacutepasse la valeur seuil de 12 5 Ko alors lecanal est consideacutereacute comme un reacuteseau agrave forte capaciteacute de stockage (LFN) Si on considegravereque le deacutebit drsquoaccegraves theacuteorique fourni par les FAI est le goulot drsquoeacutetranglement alors uncanal de communication sur lrsquoInternet depuis La Reacuteunion possegravede un BDP minimal eacutegalagrave 22 5 Ko Lorsque le transport des donneacutees srsquoeffectue avec TCP en passant par un LFNceci agrave des implications sur les performances du service rendu par TCP Lrsquoobjectif a eacuteteacute deconcevoir un systegraveme meacutetrologique pour pouvoir eacutetudier le service et analyser le fonc-tionnement du protocole Nous avons mis en place et expeacuterimenteacute une infrastructure demeacutetrologie passive interne au laboratoire En parallegravele nous avons conccedilu un outil drsquoana-lyse de traces drsquoeacutecoute speacutecifiques agrave notre eacutetude Lrsquoensemble de la chaicircne de mesure etdrsquoanalyse a eacuteteacute testeacute durant un mois au sein du LIM Les reacutesultats obtenus ont eacuteteacute valideacutespar comparaison agrave ceux fournis par drsquoautres outils

2 Perspectives

icircle de La Reacuteunion

La mise en place drsquoune eacutetude de meacutetrologie passive en collaboration avec les diffeacute-rents FAI permettrait drsquoeacutetudier le reacuteel impact de lrsquoeacuteloignement de La Reacuteunion sur lesperformances du protocole de transport TCP De plus lrsquoanalyse de supervision permet-trait drsquoidentifier des leviers pour limiter le rapatriement de trafic commun par les cacircblessous-marins

Zone Oceacutean Indien

Cette thegravese a mis en eacutevidence une connectiviteacute particuliegravere en terme de deacutelais et deroutes depuis lrsquoicircle de La Reacuteunion et les icircles de la Zone Oceacutean Indien dans le sens De-puis Lrsquoasymeacutetrie des routes est freacutequente dans lrsquoInternet Crsquoest pourquoi une eacutetude desdeacutelais et des routes depuis le monde agrave destination des sondes de la plate-forme RunPLbaseacutees sur les icircles de la ZOI peut ecirctre pertinente

Par la suite une eacutetude de meacutetrologie passive similaire agrave celle que lrsquoon veut mettreen place sur le territoire reacuteunionnais pourrait ecirctre reacutealiseacutee Lrsquoobjectif est de mettre eneacutevidence un comportement speacutecifique en terme drsquousage et de performance protocolairepour lrsquoensemble des usagers de la zone Cette eacutetude aura eacutegalement comme but le calculde la volumeacutetrie eacutechangeacutee et des services utiliseacutes entre les diffeacuterents territoires Si lesreacutesultats montrent une preacutedominance des trafics de consultation (accegraves agrave un serveur)la technique drsquooffloading pourrait ecirctre envisageacutee Cette meacutethode inspireacutee des travaux de[Baron2016] impliquerait lrsquousage des transports aeacuteriens pour charger des caches locauxDrsquoautres solutions seront eacutegalement eacutetudieacutees comme lrsquoimpleacutementation de serveurs departage de contenus localiseacutes sur lrsquoicircle

96

Territoires ultra-marins franccedilais

La Reacuteunion et Mayotte sont deux territoires franccedilais localiseacutes dans la ZOI Mais drsquoautresreacutegions ultra-marines peuvent ecirctre soumises agrave des comportements similaires Pour veacuteri-fier cette hypothegravese des eacutetudes de meacutetrologie active et passive pourraient venir validerou non cette hypothegravese Pour reacutepondre agrave cela nous privileacutegierons lrsquoenvoi de sondes dela plate-forme RunPL

Zone Isoleacutee

La derniegravere perspective que lrsquoon souhaite mettre en avant est le concept de ZoneIsoleacutee Si plusieurs reacutesultats des perspectives preacuteceacutedentes sont en adeacutequation avec lesreacutesultats obtenus et preacutesenteacutes dans cette thegravese nous aimerions deacutefinir ce concept Unepremiegravere deacutefinition serait axeacutee sur les trois points suivants

mdash Un routage limiteacute Un maillage important est un standard dans les zones bienconnecteacutees Les routes et les possibiliteacutes de trouver le plus court chemin sont nom-breuses Une faible valeur signifie de faibles alternatives ce qui sous-entend que laroute prise nrsquoest pas forceacutement la plus courte mais celle par deacutefaut

mdash Peering reacutegional et trafic interne Lrsquoensemble du trafic drsquoune zone va vers un GIXdrsquoautres pays pour des raisons de coucirct Lrsquoabsence drsquoaccords de peering entre lesFAI drsquoun mecircme pays ou ceux drsquoune mecircme zone geacuteographique ne permet pas ladiversiteacute des routes et augmente ainsi le deacutelai [Obar2012]

mdash Forts deacutelais Le deacutelai est un paramegravetre important de lrsquoaccegraves Internet Les forteslatences peuvent impacter les autres paramegravetres des connexions TCP [RITE2014-1]

97

98

Table des figures

1 Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000]) 2

2 Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000]) 33 Carte des deacutebits agrave La Reacuteunion 44 Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion 55 Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source

[Cablesmap]) 76 Carte des points drsquoeacutechange preacutesents actuellement et dans un futur proche

dans la ZOI 7

11 Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989]) 11

12 Boucle fermeacutee du CC de TCP 1213 Etats du controcircle de congestion de TCP 1414 Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP 1515 Principe de Quick-Start (Source [Scharf2008-1]) 1816 Simulation de MulTCP avec N=5 (Source [Huston2006]) 1917 Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source

[Afanasyev2010]) 2018 Comportement de la fenecirctre de congestion de Compound-TCP (Source

[Afanasyev2010]) 2119 Fonctionnement de BIC TCP 22110 Fonctionnement de CUBIC 22111 Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

24112 Principe de la meacutetrologie active 27113 Illustration du pheacutenomegravene drsquoeacutequilibrage des charges 28114 Taxonomie des configurations de tunnels MPLS et des comportements de

traceroute correspondants (Source [Donnet2012] ) 29115 Principe de la meacutetrologie passive 33

21 Scheacutema drsquointerconnexion de la plate-forme 4222 Distribution geacuteographique des adresses IPv4 publiques 4823 Fonctionnement de la sonde 5124 Comparaison des deacutelais entre Paris et La Reacuteunion 5425 Eacutevolution de la longueur des routes entre 2012 et 2016 5526 Distribution de la distance geacuteographique par continent 5627 Distribution du RTT par continent 5728 Distribution de la longueur des routes par continent 5729 Relation entre la longueur de la route et la distance geacuteographique 59210 Relation entre la longueur de la route et les deacutelais 60211 Relation entre les deacutelais et la distance geacuteographique 62

99

212 Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais 64213 Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dans

un pays tiers 65214 FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien 65215 Distribution des deacutelais des icircles de la ZOI 66216 Longueur des routes emprunteacutees 67217 Relation entre la longueur de la route et la distance geacuteographique 68218 Relation entre la longueur de la route et la distance geacuteographique pour

Madagascar 69219 Relation entre la longueur de la route et les deacutelais 69220 Relation entre les deacutelais et la distance geacuteographique 70221 Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI 71222 Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion 72

31 Scheacutema de distribution de la plate-forme de mesure 8432 Scheacutema de fonctionnement de la plateforme de mesure 8533 Longueur des flux 8934 Flux TCP - Densiteacute de la dureacutee de communication 9035 Deacutebits des flux 90

100

Liste des tableaux

11 Tableau de synthegravese des propositions 1712 Approximation du produit deacutelai bande passante de la connectiviteacute de La

Reacuteunion agrave lrsquoInternet 2513 Comparatif entre les approches de meacutetrologie 2614 Classement des outils 2715 Tableau des plates-formes de mesures de meacutetrologie active 3216 Comparatif entre mesures actives et mesures passives 35

21 Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet 4122 Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

4323 Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur Raspberry

Pi 4424 Fonctions disponibles dans les outils graphiques drsquoanalyse des routes 4525 Reacutesumeacute des caracteacuteristiques du jeu de donneacutees 5326 Correspondance entre acronymes et noms des continents 5327 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 5828 Formule de correacutelation du deacutelai en fonction de la longueur du chemin 6029 Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique 61210 Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunion-

nais 63211 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 67212 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 68213 Formule de correacutelation de la distance geacuteographique et du RTT 70

31 Les meacutetriques de meacutetrologie passive 7732 Comparaison de performances 8233 Distribution des protocoles encapsuleacutes dans IP 8634 Reacutepartition des services utiliseacutes par TCP 8635 Distribution du trafic 8736 Correspondance entre acronymes et nom des continents 8737 Distribution geacuteographique des destinations WAN 8738 Tableau de deacutenomination des flux selon [Lan2006] 8839 Reacutepartition des paquets 91

101

102

Bibliographie

[ANRTIC2016] ANRTIC Autoriteacute Nationale de Reacutegulation des TIC 2016

[ARCEP2004] Autoriteacute de Reacutegulation des Teacuteleacutecommunications Deacutecision n04-375 delrsquoautoriteacute de reacutegulations des teacuteleacutecommunications en date du 4 mai 2004 seprononccedilant sur un diffeacuterent opposant mobius agrave france teacuteleacutecom 2004

[ARTEC2016] Autoriteacute de Reacutegulation des TEchnologies de Communication Artec 2016

[AXIS] African internet exchange system project 2016

[Aben2015] Emile Aben Infrastructure geolocation - plan of action 2015

[Afanasyev2010] A Afanasyev N Tilley P Reiher and L Kleinrock Host-to-hostcongestion control for tcp IEEE Communications Surveys amp Tutorials 12(3)Third quarter 2010

[Africa1] Telegeography Submarine Cable Submarine cable map 2018

[AfterFibre] Steve Song African undersea and terrestrial fibre optic cables Last visit 09262017

[Akamai2015] Akamai Akamairsquos [state of the internet] 2015

[Akamai2017] Akamai Akamairsquos [state of the internet] 2017

[Allman2007] Mark Alllman and Vern Paxson Issues and etiquette concerning use ofshared measurement data In Proceedings of the 7th ACM SIGCOMM confe-rence on Internet measurement pages 135ndash140 ACM 2007

[Anelli2012] Pascal Anelli Des aleacuteas de la communication de la transmission au trans-port Habilitation agrave diriger des recherches en informatique Universiteacute deLa Reacuteunion 2012

[Archipelago] Kimberly Claffy Young Hyun Ken Keys Marina Fomenkov and DmitriKrioukov Internet mapping from art to science In Conference For Home-land Security 2009 CATCHrsquo09 Cybersecurity Applications amp Technology pages205ndash211 IEEE 2009

[Arduino] Arduino AG Arduino home

[Arnal2014] F Arnal E Dubois E Chaput and A Beylot Internet-draft r sallantin in-tended status Proposed standard e bouttier expires April 30 2015 cnes-tastesa c baudoin 2014

[Augustin2006] Brice Augustin Xavier Cuvellier Benjamin Orgogozo Fabien Viger Ti-mur Friedman Matthieu Latapy Cleacutemence Magnien and Renata TeixeiraAvoiding traceroute anomalies with paris traceroute In Proceedings of the 6thACM SIGCOMM conference on Internet measurement pages 153ndash158 ACM2006

[Augustin2007] Brice Augustin Timur Friedman and Renata Teixeira Multipath tracingwith paris traceroute In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

103

[Bajpai2015-1] Vaibhav Bajpai and Juumlrgen Schoumlnwaumllder A survey on internet perfor-mance measurement platforms and related standardization efforts IEEECommunications Surveys amp Tutorials 17(3) 1313ndash1341 2015

[Baron2016] Benjamin Baron Transport intermodal de donneacutees massives pour le deacutelestage desreacuteseaux drsquoinfrastructure PhD thesis Paris 6 2016

[Bauer2011] Steven Bauer Robert Beverly and Arthur Berger Measuring the state of ecnreadiness in servers clients and routers In Proceedings of the 2011 ACM SIG-COMM conference on Internet measurement conference pages 171ndash180 ACM2011

[Beaglebone] BeagleBoardorg Foundation Beagleboardorg - community supportedopen hardware computers for making

[Bischof2015] Zachary S Bischof John P Rula and Fabiaacuten E Bustamante In and out ofCuba Characterizing Cubarsquos connectivity In Proceedings of the 2015 ACMConference on Internet Measurement Conference pages 487ndash493 ACM 2015

[Brakmo1994] Lawrence S Brakmo Sean W OrsquoMalley and Larry L Peterson TCP Vegas New techniques for congestion detection and avoidance volume 24 ACM 1994

[Brownlee2002] Nevil Brownlee and KC Claffy Understanding internet traffic streams dragonflies and tortoises Communications Magazine IEEE 40(10) 110ndash1172002

[CAIDA-Tools] Center for Applied Internet Data Analysis Caida tools - overview

[Cablesmap] Telegeography Submarine cable map

[Carlucci2015] Gaetano Carlucci Luca De Cicco and Saverio Mascolo Http over udp An experimental investigation of quic In Proceedings of the 30th Annual ACMSymposium on Applied Computing SAC rsquo15 pages 609ndash614 New York NYUSA 2015 ACM

[Chappell2010] Laura Chappell and G Combs Wireshark network analysis the officialWireshark certified network analyst study guide Protocol Analysis InstituteChappell University 2010

[Chavula2017] Josiah Chavula Amreesh Phokeer Agustin Formoso and Nick FeamsterInsight into africarsquos country-level latencies In AFRICON 2017 IEEE pages938ndash944 IEEE 2017

[Chiu1989] Dah-Ming Chiu and Raj Jain Analysis of the increase and decrease algo-rithms for congestion avoidance in computer networks Computer Networksand ISDN systems 17(1) 1ndash14 1989

[Chun2003] Brent Chun David Culler Timothy Roscoe Andy Bavier Larry PetersonMike Wawrzoniak and Mic Bowman PlanetLab An overlay testbed forbroad-coverage services SIGCOMM Comput Commun Rev 33(3) 3ndash12July 2003

[Ciullo2009] D Ciullo M Mellia and M Meo Two schemes to reduce latency in shortlived TCP flows IEEE Communications Letters 13(10) October 2009

[Claise2004] Benoit Claise Cisco systems netflow services export 2004

[Comores2002] Mwezinet Lrsquoarriveacutee drsquointernet aux comores Last Seen 09062017

[Coonjah2015] Irfaan Coonjah Pierre Clarel Catherine and KMS Soyjaudah Perfor-mance evaluation and analysis of layer 3 tunneling between openssh andopenvpn in a wide area network environment In Computing Communica-tion and Security (ICCCS) 2015 International Conference on pages 1ndash4 IEEE2015

104

[Crovella2006] Mark Crovella and Balachander Krishnamurthy Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc New YorkNY USA 2006

[Crowcroft1998] Jon Crowcroft and Philippe Oechslin Differentiated end-to-end in-ternet services using a weighted proportional fair sharing tcp ACM SIG-COMM Computer Communication Review 28(3) 53ndash69 1998

[DICT2017] Government of Seychelles Office of the president Department of informa-tion communication technology 2016

[Donnet2012] Benoit Donnet Matthew Luckie Pascal Meacuterindol and Jean-Jacques Pan-siot Revealing mpls tunnels obscured from traceroute ACM SIGCOMMComputer Communication Review 42(2) 87ndash93 2012

[Downey1999] Allen B Downey Using pathchar to estimate internet link characteristicsIn ACM SIGCOMM Computer Communication Review volume 29 pages 241ndash250 ACM 1999

[EQUINIX] CAIDA Chicago passive network monitor Last visit 12012018

[Estan2001] Cristian Estan and George Varghese New directions in traffic measurementand accounting volume 32 ACM 2002

[Fanou2015] Rodeacuterick Fanou Pierre Francois and Emile Aben On the diversity of in-terdomain routing in africa In Passive and Active Measurement pages 41ndash54Springer 2015

[Fanou2016] Rodeacuterick Fanou Gareth Tyson Pierre Francois and Arjuna SathiaseelanPushing the frontier Exploring the african web ecosystem In Proceedingsof the 25th International Conference on World Wide Web pages 435ndash445 Inter-national World Wide Web Conferences Steering Committee 2016

[Feige1992] Uriel Feige and Prabhakar Raghavan Exact analysis of hot-potato routingIn Foundations of Computer Science 1992 Proceedings 33rd Annual Symposiumon pages 553ndash562 IEEE 1992

[Fraleigh2001] Chuck Fraleigh Christophe Diot Bryan Lyles Sue Moon Philippe Owe-zarski Dina Papagiannaki and Fouad Tobagi Design and deployment ofa passive monitoring infrastructure In Thyrrhenian Internatinal Workshop onDigital Communications pages 556ndash575 Springer 2001

[Fraleigh2003] Chuck Fraleigh Sue Moon Bryan Lyles Chase Cotton Mujahid KhanDeb Moll Rob Rockell Ted Seely and SC Diot Packet-level traffic measu-rements from the sprint IP backbone Network IEEE 17(6) 6ndash16 2003

[France2017] Mission Tregraves Haut Deacutebit Plan france tregraves haut deacutebit Last seen 09062017

[GOTICOM2011] Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de laCommunication Goticom Last Seen 09062017

[GSCounter] StatCounter Statcounter global stats - browser os search engine includingmobile usage share Last visit 13102017

[Gettys2011] Jim Gettys and Kathleen Nichols Bufferbloat Dark buffers in the InternetQueue 9(11) 40 2011

[Gevros2001] Panos Gevros Jon Crowcroft Peter Kirstein and Saleem Bhatti Conges-tion control mechanisms and the best effort service model IEEE network15(3) 16ndash26 2001

[Graham1997] Ian Graham Murray Pearson Jed Martens and Stephen Donnelly DAG- a cell capture board for ATMmeasurement systems 1997

105

[Gupta2014] Arpit Gupta Matt Calder Nick Feamster Marshini Chetty Enrico Calan-dro and Ethan Katz-Bassett Peering at the internetrsquos frontier A first lookat isp interconnectivity in africa In Passive and Active Measurement pages204ndash213 Springer 2014

[Ha2008] Sangtae Ha Injong Rhee and Lisong Xu Cubic A new tcp-friendly high-speed tcp variant SIGOPS Oper Syst Rev 42(5) 64ndash74 July 2008

[Herman2001] Paul Herman The tcpstat tool Publicly available at http wwwfrenchfriesnetpaultcpstat 2001

[Huston2000] Geoff Hutson Tcp performance The Internet Protocol Journal 3 2000

[Huston2006] Geoff Huston Gigabit tcp Internet Protocol Journal 9 2006

[IANA-port] IANA Service Name and Transport Protocol Port Number Registry Lastvisit 06202018

[ICTA2017] Information and Communication Technologies Authority of Mauritius IctaLast Seen 09062017

[IOX] Government Information Service Iox submarine cable to drive the newdigital economy of mauritius 2018

[IPMon] ATL Sprint Ipmon project

[Jacobson1988-1] V Jacobson Congestion avoidance and control ACM Computer Com-munications Review 18(4) 314ndash329 August 1988

[Jacobson1989-1] Van Jacobson Craig Leres and S McCanne The tcpdump manualpage Lawrence Berkeley Laboratory Berkeley CA 1989

[Jacobson1989-2] Van Jacobson Craig Leres and Steven McCanne pcap-packet capturelibrary UNIX man page 2001

[Jacobson1997] Van Jacobson Pathchar A tool to infer characteristics of internet paths1997

[Jain1990] Raj Jain Congestion Control in Computer Networks Issues and TrendsIEEE Network Magazine May 1990

[John2010] Wolfgang John Sven Tafvelin and Tomas Olovsson Passive internet mea-surement Overview and guidelines based on experiences Computer Com-munications 33(5) 533ndash550 2010

[Johnson2011] David L Johnson Veljko Pejovic Elizabeth M Belding and Gertjan vanStam Traffic characterization and internet usage in rural Africa In Pro-ceedings of the 20th International Conference Companion on World Wide WebWWW rsquo11 pages 493ndash502 New York NY USA 2011 ACM

[Johnson2016] David L Johnson and Gertjan van Stam The shortcomings of globalisedinternet technology in southern africa 2016

[Katabi2002] Dina Katabi Mark Handley and Charlie Rohrs Congestion control for highbandwidth-delay product networks In Proceedings of the 2002 Conference onApplications Technologies Architectures and Protocols for Computer Communi-cations SIGCOMM rsquo02 pages 89ndash102 New York NY USA 2002 ACM

[Katz2010] Ethan Katz-Bassett Harsha V Madhyastha Vijay Kumar Adhikari ColinScott Justine Sherry Peter Van Wesep Thomas E Anderson and ArvindKrishnamurthy Reverse traceroute In NSDI volume 10 pages 219ndash2342010

[Krajsa2011] Ondrej Krajsa and Lucie Fojtova RTT measurement and its dependence onthe real geographical distance In Telecommunications and Signal Processing(TSP) 2011 34th International Conference on pages 231ndash234 IEEE 2011

106

[LIL1978] Loi numeacutero 78-17 du 6 janvier 1978 relative agrave lrsquoinformatique aux fichiers etaux liberteacutes Last modification on 19 March 2014

[Lan2006] Kun-chan Lan and John Heidemann A measurement study of correlationsof internet flow characteristics Computer Networks 50(1) 46ndash62 2006

[LanYanFock2015] Jean-Christophe Lan-Yan-Fock Geacuteolocalisation drsquoadresses IP 2015

[Larrieu2010] Nicolas Larrieu and Philippe Owezarski Metrology of internet networksDigital Cognitive Technologies Epistemology and the Knowledge Economy pages101ndash117 2010

[Leguay2004] Jeremie Leguay Matthieu Latapy Timur Friedman and Kaveacute SalamatianDescribing and simulating internet routes CoRR csNI0411051 2004

[Leiner1997] Barry M Leiner Vinton G Cerf David D Clark Robert E Kahn LeonardKleinrock Daniel C Lynch Jon Postel Lawrence G Roberts and Stephen SWolff The past and future history of the Internet Communications of theACM 40(2) 102ndash108 1997

[Lemauricien] Le Mauricien Projet cacircble metiss le contrat deacutecrocheacute par alcatel subma-rine networks et electra tlc spa 2018

[Liu2007] Dan Liu Mark Allman Shudong Jin and Limin Wang Congestion controlwithout a startup phase In Workshop on Protocols for Fast Long-Distance Net-works (PFLDnet) 2007

[Lopez2006] Dino Martin Loacutepez-Pacheco Congduc Pham and Laurent Lefevre Nxg03-4 Xcp-i explicit control protocol for heterogeneous inter-networking ofhigh-speed networks In Global Telecommunications Conference 2006 GLO-BECOMrsquo06 IEEE pages 1ndash6 IEEE 2006

[METROPOLIS] Philippe Owezarski Metropolis meacutetrologie pour lrsquointernet et les ser-vices

[MGIX2017] Madagascar Internet Exchange Point Mgix Mauritius internet exchangepoint 2017

[MIXP2017] Mauritius Internet Exchange Point Mixp Mauritius internet exchangepoint 2017

[Maksimovic2014] Mirjana Maksimovic Vladimir Vujovic Nikola Davidovic VladimirMiloševic and Branko Perišic Raspberry pi as internet of things hardware performances and constraints design issues 3 8 2014

[Mediametrie2018-1] Benoit David Lrsquoanneacutee Internet 2017 Internet meacuteta-meacutedia Lastvisit 20042018

[Mediametrie2018-2] Benoit David Lrsquoobservatoire des Usages Digitaux Antilles-Guyane et Reacuteunion - Panorama 2017 Last visit 20042018

[Medina2005] Alberto Medina Mark Allman and Sally Floyd Measuring the evolutionof transport protocols in the internet ACM SIGCOMM Computer Communi-cation Review 35(2) 37ndash52 2005

[Mellia2003-1] Marco Mellia Andrea Carpani and Renato Lo Cigno Tstat Tcp statisticand analysis tool In International Workshop on Quality of Service in Multiser-vice IP Networks pages 145ndash157 Springer 2003

[Mellia2003-2] M Mellia I Stoica and H Zhang TCP-aware packet marking in net-works with diffserv support Elsevier Computer Networks 42(1) 81ndash100 2003

[Mellia2005] Marco Mellia R Lo Cigno and Fabio Neri Measuring ip and tcp behavioron edge nodes with tstat Computer Networks 47(1) 1ndash21 2005

107

[Moore2001] David Moore Ken Keys Ryan Koga Edouard Lagache and K C ClaffyThe coralreef software suite as a tool for system and network administra-tors In Proceedings of the 15th USENIX Conference on System AdministrationLISA rsquo01 pages 133ndash144 Berkeley CA USA 2001 USENIX Association

[NCSUNRL] North Caroline State University - Networking Research Lab Last seen 27022018

[Nagle1984] John Nagle Congestion control in iptcp internetworks 1984

[Nicolay2017-2] Xavier Nicolay Reacutehan Noordally Pascal Anelli Nour Mohammad Mu-rad and Tahiry Razafindralambo Where is my next hop the case of indianocean islands In 2017 Global Information Infrastructure and Networking Sym-posium (GIIS) (GIISrsquo17) St Denis Reunion October 2017

[Nomikos2016] George Nomikos and Xenofontas Dimitropoulos traixroute Detectingixps in traceroute paths In International Conference on Passive and ActiveNetwork Measurement pages 346ndash358 Springer 2016

[Noordally2016] Reacutehan Noordally Xavier Nicolay Pascal Anelli Richard Lorion andPierre Ugo Tournoux Analysis of internet latency The reunion island caseIn Proceedings of the 12th Asian Internet Engineering Conference AINTEC rsquo16pages 49ndash56 New York NY USA 2016 ACM

[Noordally2017] Reacutehan Noordally Yassine Gangat Arnaud Ravoavahy Pascal Anelliand Xavier Nicolay How long delays impact tcp performance for a connec-tivity from reunion island In Next Generation Computing Applications (Next-Comp) 2017 1st International Conference on page 103ndash108 IEEE 07 2017

[ONU2013] ONU The millennium development goals report 2013 Technical reportOrganisation Nations United 2013

[Obar2012] Jonathan A Obar and Andrew Clement Internet surveillance and boome-rang routing A call for Canadian network sovereignty In TEM 2013 Pro-ceedings of the Technology amp Emerging Media Track-Annual Conference of theCanadian Communication Association (Victoria) 2012

[OpenVPN] OpenVPN Openvpn - open source vpn Last visit 09102017

[OpenWrt] OpenWrt Openwrt project Welcome to the openwrt project Last visit 12062018

[Orebaugh2006] Angela Orebaugh Gilbert Ramirez and Jay Beale Wireshark amp Etherealnetwork protocol analyzer toolkit Syngress 2006

[Ostermann2000] Shawn Ostermann Tcptrace A TCP connection analysis tool URL http www tcptrace org 2000

[Owezarski2003-1] Philippe Owezarski Meacutetrologie de la qualiteacute de service Ecole drsquoeacuteteacutetemps reacuteel (ETR2003)-Systemes Reacuteseauxet Applications 2003

[Owezarski2004] Philippe Owezarski and Nicolas Larrieu Internet trafficcharacterizationndashan analysis of traffic oscillations High Speed Networks andMultimedia Communications pages 96ndash107 2004

[PCH] Packet Clearing House Internet exchange directory 2014

[PSAMP] The Internet Engineering Task Force Packet sampling (psamp) 2017

[Paris-traceroute] Paris Traceroute Team Paris traceroute Last visit 09292017

[Paxson1995] Vern Paxson and Sally Floyd Wide area traffic the failure of poissonmodeling IEEEACM Transactions on Networking (ToN) 3(3) 226ndash244 1995

[Paxson1999] Vern Paxson Bro a system for detecting network intruders in real-timeComputer networks 31(23) 2435ndash2463 1999

108

[Paxson2001] Vern Paxson Some not-so-pretty admissions about dealing with internetmeasurements In Workshop on Network-Related Data Management (NRDM2001) 2001

[PeeringDB] Peering DB Peeringdb facilitates the exchange of information related topeering

[Periakaruppan1999] Ram Periakaruppan Evi Nemeth et al GTrace A graphical trace-route tool In LISA volume 99 pages 69ndash78 1999

[Peterson2007] Larry L Peterson and Bruce S Davie Computer networks a systems ap-proach Elsevier 2007

[Phidgets] Phidgets Phidgets products for usb sensing and control

[PlanetLab] PlanetLab an open platform for developing deploying and accessingplanetary-scale services

[PlanetLabEurope] PlanetLab PlanetLab europe an open platform for developing de-ploying and accessing planetary-scale services last visit 09102017

[Pretet2000] Thierry Prete and Olivier Mas Avancement du projet SAFE Technicalreport 16 Janvier 2000

[REUNIX2017] RENATER RENATER Connecteur de savoirs - reunix Last visit 09102017

[RFC1072] V Jacobson and R Braden TCP extensions for long-delay paths RFC 1072October 1988

[RFC1105] K Lougheed and Y Rekhter Border Gateway Protocol (BGP) RFC 1105June 1989

[RFC1700] J Reynolds and J Postel Assigned numbers RFC 1700 October 1994

[RFC1918] Y Rekhter B Moskowitz D Karrenberg G J de Groot and E Lear Ad-dress Allocation for Private Internets RFC 1918 February 1996

[RFC1983] G Malkin (Ed) Internet Usersrsquo Glossary RFC 1983 (Informational) August1996

[RFC2001] W Richard Stevens TCP Slow Start Congestion Avoidance Fast Retrans-mit and Fast Recovery Algorithms RFC 2001 January 1997

[RFC2330] Dr Guy T Almes Jamshid Mahdavi Matt Mathis and Dr Vern PaxsonFramework for IP Performance Metrics RFC 2330 May 1998

[RFC2582] Tom Henderson and Sally Floyd The NewReno Modification to TCPrsquos FastRecovery Algorithm RFC 2582 April 1999

[RFC2678] J Mahdavi and V Paxson IPPM Metrics for Measuring Connectivity RFC2678 (Proposed Standard) September 1999

[RFC2679] G Almes S Kalidindi and M Zekauskas A One-way Delay Metric forIPPM RFC 2679 (Proposed Standard) September 1999 Obsoleted by RFC7679

[RFC2680] G Almes S Kalidindi and M Zekauskas A One-way Packet Loss Metricfor IPPM RFC 2680 (Proposed Standard) September 1999 Obsoleted byRFC 7680

[RFC2681] G Almes S Kalidindi and M Zekauskas A Round-trip Delay Metric forIPPM RFC 2681 (Proposed Standard) September 1999

[RFC2756] P Vixie and D Wessels Hyper Text Caching Protocol (HTCP00) RFC2756 (Experimental) January 2000

109

[RFC2914] Sally Floyd Congestion Control Principles RFC 2914 September 2000

[RFC3031] E Rosen Viswanathan A and R Callon Multiprotocol Label SwitchingArchitecture RFC 3031 January 2001

[RFC3069] D McPherson and B Dykes VLAN Aggregation for Efficient IP AddressAllocation RFC 3069 (Informational) February 2001

[RFC3168] Sally Floyd Dr K K Ramakrishnan and David L Black The Addition ofExplicit Congestion Notification (ECN) to IP RFC 3168 September 2001

[RFC3232] J Reynolds Assigned Numbers RFC 1700 is Replaced by an On-line Da-tabase RFC 3232 January 2002

[RFC3376] B Cain S Deering I Kouvelas B Fenner and A Thyagarajan InternetGroup Management Protocol Version 3 RFC 3376 (Proposed Standard)October 2002 Updated by RFC 4604

[RFC3649] Sally Floyd HighSpeed TCP for Large Congestion Windows RFC 3649December 2003

[RFC3742] S Floyd Limited Slow-Start for TCP with Large Congestion Windows RFC3742 (Experimental) March 2004

[RFC4250] Chris M Lonvick and Sami Lehtinen The Secure Shell (SSH) Protocol As-signed Numbers RFC 4250 January 2006

[RFC4782] Pasi Sarolahti Amit Jain Sally Floyd and Mark Allman Quick-Start forTCP and IP RFC 4782 January 2007

[RFC4950] R Bonica D Gan D Tappan and C Pignataro ICMP extensions for mul-tiprotocol label switching RFC 4950 August 2007

[RFC5166] S Floyd (Ed) Metrics for the Evaluation of Congestion Control Mecha-nisms RFC 5166 (Informational) March 2008

[RFC5475] T Zseby M Molina N Duffield S Niccolini and F Raspall Sampling andFiltering Techniques for IP Packet Selection RFC 5475 (Proposed Standard)March 2009

[RFC5681] Ethan Blanton Dr Vern Paxson and Mark Allman TCP CongestionControl RFC 5681 September 2009

[RFC5735] Michelle S Cotton and Leo Vegoda Special Use IPv4 Addresses RFC 5735January 2010

[RFC5936] E Lewis and A Hoenes (Ed) DNS Zone Transfer Protocol (AXFR) RFC5936 (Proposed Standard) June 2010

[RFC6077] Ed D Papadimitriou M Welzl M Scharf and Bob J Briscoe Open Re-search Issues in Internet Congestion Control RFC 6077 February 2011

[RFC6201] R Asati C Pignataro F Calabria and C Olvera Device Reset Characteri-zation RFC 6201 (Informational) March 2011

[RFC6248] A Morton RFC 4148 and the IP Performance Metrics (IPPM) Registry ofMetrics Are Obsolete RFC 6248 (Informational) April 2011

[RFC6298] Vern Paxson Mark Allman Jerry Chu and Matt Sargent Computing TCPrsquosretransmission timer RFC 6298 June 2011

[RFC6528] F Gont and S Bellovin Defending against Sequence Number Attacks RFC6528 February 2012

[RFC6691] D Borman TCP Options and Maximum Segment Size (MSS) RFC 6691(Informational) July 2012

110

[RFC6761] Marc Krochmal and Stuart Cheshire Special-Use Domain Names RFC6761 February 2013

[RFC6928] J Chu N Dukkipati Y Cheng and M Mathis Increasing TCPrsquos InitialWindow RFC 6928 (Experimental) April 2013

[RFC7414] M Duke R Braden W Eddy and E Blanton and TCP Extensions for HighPerformance RFC 7414 February 2015

[RFC760] DoD standard Internet Protocol RFC 760 January 1980

[RFC776] J Postel Assigned numbers RFC 776 (Historic) January 1981 Obsoletedby RFC 790

[RFC7766] J Dickinson S Dickinson R Bellis A Mankin and D Wessels DNS Trans-port over TCP - Implementation Requirements RFC 7766 (Proposed Stan-dard) March 2016

[RFC793] Information Sciences Institute Transmission Control Protocol RFC 793September 1981

[RFC8311] D Black Relaxing Restrictions on Explicit Congestion Notification (ECN)Experimentation RFC 8311 (Proposed Standard) January 2018

[RFC8312] I Rhee L Xu S Ha A Zimmermann and L Eggert CUBIC for Fast Long-Distance Networks RFC 8312 February 2018

[RITE2014-1] Bob Briscoe Anna Brunstrom Andreas Petlund David Hayes David RosIng-Jyh Tsang Stein Gjessing Gorry Fairhurst Carsten Griwodz and Mi-chael Welz Reducing internet latency A survey of techniques and theirmerits In IEEE Communications Surveys amp Tutorials IEEE 2014 (To appear)

[RITE2014-2] RITE | Reducing Internet Transport Latency Slow internet -more band-with is not the answer 2014

[RaspberryPi] RASPBERRY PI FOUNDATION Raspberry Pi official website Last visit 09102017

[Ravoavahy2017] Arnaud Ravoavahy Meacutetrologie Reacuteseaux 2017

[Ripe2010] RIPE NCC RIPE atlas 2010

[Ros2005] David Ros Protocole de Transport TCP Ed Techniques Ingeacutenieur 2005

[SDTAN2013] Reacutegion Reunion Sphegravere Public and TACTIS Schema directeur drsquoamena-gement numerique du territoire de la reunion Technical report 2013

[Sallantin2014] Renaud Sallantin Optimisation de bout-en-bout du deacutemarrage des connexionsTCP PhD thesis 2014

[SamKnows] SamKnows Ltd Samknowscom 2017

[Sanchez2013] Mario A Saacutenchez John S Otto Zachary S Bischof David R ChoffnesFabiaacuten E Bustamante Balachander Krishnamurthy and Walter WillingerDasu Pushing experiments to the internetrsquos edge In NSDI pages 487ndash4992013

[Scharf2008-1] Michael Scharf Simon Hauger and Jochen Koumlgel Quick-start tcp Fromtheory to practice In Proc 6th Intern Workshop on Protocols for FAST Long-Distance Networks (PFLDnet) Manchester 2008

[Speechecker] Speedchecker Ltd Internet Performance Monitoring | Speedchecker LtdLast visit 29032018

[Steenbergen2009] Richard A Steenbergen A practical guide to (correctly) troubleshoo-ting with traceroute North American Network Operators Group pages 1ndash492009

111

[Sundaresan2011] Srikanth Sundaresan Walter De Donato Nick Feamster RenataTeixeira Sam Crawford and Antonio Pescapegrave Broadband internet perfor-mance a view from the gateway In ACM SIGCOMM computer communica-tion review volume 41 pages 134ndash145 ACM 2011

[Tan2006] Kun Tan Jingmin Song Qian Zhang and Murad Sridharan A compoundtcp approach for high-speed and long distance networks In Proceedings-IEEE INFOCOM 2006

[Tirumala2005] Ajay Tirumala Feng Qin Jon Dugan Jim Ferguson and Kevin GibbsIperf The tcpudp bandwidth measurement tool htt p dast nlanr net-Projects 2005

[Trammell2015] Brian Trammell Mirja Kuumlhlewind Damiano Boppart Iain LearmonthGorry Fairhurst and Richard Scheffenegger Enabling internet-wide de-ployment of explicit congestion notification In International Conference onPassive and Active Network Measurement pages 193ndash205 Springer 2015

[Udoo] UDOO All you need mini pc android + linux + arduino | udoo

[Vergoz2013] Michael Vergoz Classement des opeacuterateurs Internet reacuteunionnais Techni-cal report BinarySec 2013

[WAND] WAND Wand network research group Last visit 09252017

[Wang2004] Ren Wang Giovanni Pau Kenshin Yamada MY Sanadidi and Mario GerlaTcp startup performance in large bandwidth networks In INFOCOM 2004Twenty-third AnnualJoint Conference of the IEEE Computer and CommunicationsSocieties volume 2 pages 796ndash805 IEEE 2004

[Wang2018] Jessie Hui Wang and Changqing An A study on geographic properties ofinternet routing Computer Networks 133 183ndash194 2018

[Wenwei2006] Li Wenwei Zhang Dafang Yang Jinmin and Xie Gaogang On evalua-ting the differences of TCP and ICMP in network measurement ComputerCommunications 30(2) 428ndash439 2007

[WikiPing] Wikipedia ping (logiciel) Last visit 06102017

[Xu2002] Jun Xu Jinliang Fan Mostafa H Ammar and Sue B Moon Prefix-preservingIP address anonymization Measurement-based security evaluation and anew cryptography-based scheme In Network Protocols 2002 Proceedings10th IEEE International Conferenceon pages 280ndash289 IEEE 2002

[Xu2004] Lisong Xu Khaled Harfoush and Injong Rhee Binary increase congestioncontrol (bic) for fast long-distance networks In INFOCOM 2004 Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Socie-ties volume 4 pages 2514ndash2524 IEEE 2004

[Yang2016] Chantal Yang Hussein Suleman and Josiah Chavula A topology visuali-sation tool for national research and education networks in Africa In IST-Africa Week Conference 2016 pages 1ndash11 IIMC 2016

[Zhang2007] Jian Zhang and Andrew Moore Traffic trace artifacts due to monitoringvia port mirroring In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

[Zheleva2015] Mariya Zheleva Paul Schmitt Morgan Vigil and Elizabeth Belding In-ternet bandwidth upgrade implications on performance and usage in ru-ral zambia Information Technologies amp International Development 11(2) ppndash12015

[nPerf2017] nperf awards broadband reunion 2017

112

[rtraceroute] Reacutehan Noordally Arnaud Ravohavay and Xavier Nicolay rtraceroute Lastvisit 18102017

113

Pocircle Recherche Ecoles doctorales

LETTRE DrsquoENGAGEMENT DE NON-PLAGIAT

Je soussigneacute(e) NOORDALLY Reacutehan

en ma qualiteacute de doctorant(e) de

lrsquoUniversiteacute de La Reacuteunion deacuteclare ecirctre conscient(e) que le plagiat est un acte deacutelictueux

passible de sanctions disciplinaires Aussi dans le respect de la proprieacuteteacute intellectuelle et du

droit drsquoauteur je mrsquoengage agrave systeacutematiquement citer mes sources quelle qursquoen soit la forme

(textes images audiovisuel internet) dans le cadre de la reacutedaction de ma thegravese et de toute

autre production scientifique sachant que lrsquoeacutetablissement est susceptible de soumettre le texte

de ma thegravese agrave un logiciel anti-plagiat

Fait agrave Saint-Denis le 06072018

Signature

Extrait du Regraveglement inteacuterieur de lUniversiteacute de La Reacuteunion (valideacute par le Conseil drsquoAdministration en date du 11 deacutecembre 2014)

Article 9 Protection de la proprieacuteteacute intellectuelle ndash Faux et usage de faux contrefaccedilon plagiat

Lrsquoutilisation des ressources informatiques de lrsquoUniversiteacute implique le respect de ses droits de proprieacuteteacute intellectuelle ainsi que ceux de ses partenaires et plus geacuteneacuteralement de tous tiers titulaires de tes droits En conseacutequence chaque utilisateur doit - utiliser les logiciels dans les conditions de licences souscrites - ne pas reproduire copier diffuser modifier ou utiliser des logiciels bases de donneacutees pages Web textes images photographies ou autres creacuteations proteacutegeacutees par le droit drsquoauteur ou un droit privatif sans avoir obtenu preacutealablement lrsquoautorisation des titulaires de ces droits

La contrefaccedilon et le faux Conformeacutement aux dispositions du code de la proprieacuteteacute intellectuelle toute repreacutesentation ou reproduction inteacutegrale ou partielle drsquoune œuvre de lrsquoesprit faite ans le consentement de son auteur est illicite et constitue un deacutelit peacutenal Lrsquoarticle 444-1 du code peacutenal dispose laquo Constitue un faux toute alteacuteration frauduleuse de la veacuteriteacute de nature agrave cause un preacutejudice et accomplie par quelque moyen que ce soit dans un eacutecrit ou tout autre support drsquoexpression de la penseacutee qui a pour objet ou qui peut avoir pour effet drsquoeacutetablir la preuve drsquoun droit ou drsquoun fait ayant des conseacutequences juridiques raquo Lrsquoarticle L335_3 du code de la proprieacuteteacute intellectuelle preacutecise que laquo Est eacutegalement un deacutelit de contrefaccedilon toute reproduction repreacutesentation ou diffusion par quelque moyen que ce soit drsquoune œuvre de lrsquoesprit en violation des droits de lrsquoauteur tels qursquoils sont deacutefinis et reacuteglementeacutes par la loi Est eacutegalement un deacutelit de contrefaccedilon la violation de lrsquoun des droits de lrsquoauteur drsquoun logiciel (hellip) raquo

Le plagiat est constitueacute par la copie totale ou partielle drsquoun travail reacutealiseacute par autrui lorsque la source emprunteacutee nrsquoest pas citeacutee quel que soit le moyen utiliseacute Le plagiat constitue une violation du droit drsquoauteur (au sens des articles L 335-2 et L 335- 3 du code de la proprieacuteteacute intellectuelle) Il peut ecirctre assimileacute agrave un deacutelit de contrefaccedilon Crsquoest aussi une faute disciplinaire susceptible drsquoentraicircner une sanction Les sources et les reacutefeacuterences utiliseacutees dans le cadre des travaux (preacuteparations devoirs meacutemoires thegraveses rapports de stagehellip) doivent ecirctre clairement citeacutees Des citations inteacutegrales peuvent figurer dans les documents rendus si elles sont assorties de leur reacutefeacuterence (nom drsquoauteur publication date eacutediteurhellip) et identifieacutees comme telles par des guillemets ou des italiques

Les deacutelits de contrefaccedilon de plagiat et drsquousage de faux peuvent donner lieu agrave une sanction disciplinaire indeacutependante de la mise en œuvre de poursuites peacutenales

  • Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion
  • Remerciements
  • Reacutesumeacute
  • Abstract
  • Table des matiegraveres
  • Liste des acronymes
  • Introduction
    • Contexte geacuteneacuteral
    • Contexte reacutegional
      • LInternet agrave La Reacuteunion
      • LInternet dans la Zone de lOceacutean Indien
        • Probleacutematique
        • Organisation de la thegravese
          • Eacutetat de lart
            • Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage
              • Controcircle de congestion de TCP
              • La probleacutematique de lutilisation dun reacuteseau agrave grande capaciteacute de stockage
              • Un controcircle de congestion de TCP adapteacute aux LFN
              • Controcircle de congestion avec implication des routeurs
              • Caracteacuterisation de La Reacuteunion
                • Meacutetrologie du trafic Internet
                  • Deacutefinition
                  • Meacutetrologie active
                  • Meacutetrologie passive
                  • Comparatif entre mesures actives et mesures passives
                    • Synthegravese
                      • Caracteacuterisation de la connectiviteacute de La Reacuteunion
                        • Objectifs
                        • Cahier des charges
                          • Evolution
                          • Connectiviteacute
                            • Protocole de mesure
                              • Eacutechantillon de mesure
                              • Eacutevolution
                              • Connectiviteacute
                                • Reacutesultats
                                  • Eacutevolution
                                  • Connectiviteacute de La Reacuteunion
                                  • Connectiviteacute des icircles de la Zone Oceacutean Indien
                                  • Synthegravese des reacutesultats
                                    • Conclusion
                                      • Meacutetrologie sur le service de transport agrave La Reacuteunion
                                        • Objectifs
                                          • Les objectifs de leacutetude
                                          • Les meacutetriques de leacutetude
                                            • Mise en oeuvre dune plate-forme de meacutetrologie
                                              • Pour la capture du trafic
                                              • Pour analyser les traces
                                                • Protocole de mesure
                                                • Reacutesultats
                                                  • Supervision du trafic
                                                  • Performance de TCP
                                                  • Synthegravese des reacutesultats
                                                    • Conclusion
                                                      • Conclusion amp perspectives
                                                        • Synthegravese des travaux
                                                          • Perspectives
                                                            • Table des figures
                                                            • Liste des tableaux
                                                              • Bibliographie
                                                                  • Table des figures
                                                                  • Liste des tableaux
                                                                  • Bibliographie
Page 4: Étude de la connectivité Internet de l'île de la Réunion

II

Remerciements

Mes premiers remerciements vont agrave lrsquoendroit de Monsieur Pascal Anelli Maicirctre deconfeacuterences HDR agrave lrsquoUniversiteacute de La Reacuteunion qui a accepteacute drsquoencadrer cette thegravese Jele remercie drsquoavoir mis toute son eacutenergie pour que je puisse mener ces travaux dans lesmeilleures conditions Je le remercie eacutegalement pour la confiance et la patience sans failleqursquoil mrsquoa teacutemoigneacutees durant ces anneacutees

Je remercie Monsieur Richard Lorion Maicirctre de Confeacuterences agrave lrsquoUniversiteacute de LaReacuteunion Malgreacute un emploi du temps surchargeacute il a su me consacrer du temps pouraiguiller mes travaux

Je tiens agrave remercier tout particuliegraverement Madame Laure Petrucci Professeur agrave lrsquoUni-versiteacute Paris 13 et Monsieur Emmanuel Lochin Professeur agrave lrsquoISAE SUPAERO qui mrsquoontfait lrsquohonneur drsquoaccepter de juger ces travaux et drsquoen ecirctre rapporteurs

Je remercie le Professeur Reacutemy Courdier qui a accepteacute de preacutesider mon jury de thegraveseDe par cette acceptation je boucle mon cursus universitaire agrave lrsquoUniversiteacute de La ReacuteunionMes remerciements vont agrave lrsquoattention de Monsieur Promeacutetheacutee Spathis qui consacre deson temps agrave la participation de mon jury de thegravese en tant qursquoexaminateur

Je tiens agrave remercier Messieurs Pierre-Ugo Tournoux et Xavier Nicolay pour les dis-cussions que lrsquoon a eues Cela mrsquoa permis de me remettre dans le droit chemin quand jemrsquoeacutegarais

Je remercie eacutegalement Monsieur Bruno Baynat Maicirctre de confeacuterences agrave lrsquoUniversiteacutede Paris 6 qui a su donner un nouveau souffle agrave ces travaux agrave travers ses conseils lors deson passage

Je remercie eacutegalement Monsieur Denis Fabregravegue Responsable du pocircle TIC agrave La ReacuteunionMonsieur Thierry Pretet travaillant agrave la cellule Investissements publics de la ReacutegionReacuteunion Monsieur Thomas Silverston Chercheur au NICT drsquoavoir accepteacute de faire par-tie de mon comiteacute de suivi de thegravese

Je remercie eacutegalement le Laboratoire drsquoInformatique et de Matheacutematiques dirigeacute parMonsieur Jean Diatta Professeur agrave lrsquoUniversiteacute de La Reacuteunion ainsi que lrsquoensemble desmembres pour lrsquoaccueil et les moyens qui mrsquoont eacuteteacute mis agrave disposition pour le bon deacuterou-lement de cette thegravese

Je remercie eacutegalement la Reacutegion Reacuteunion qui a soutenu financiegraverement ces travaux dethegravese

Je remercie eacutegalement Messieurs Jean-Christophe Lan-Yan-Fock et Arnaud Ravoa-vahy pour les travaux reacutealiseacutes durant leurs stages

Je remercie eacutegalement mes collegravegues mes amis et mes proches pour leurs contribu-tions et leurs encouragements

Je remercie particuliegraverement Aureacutelie Miora Florence et Anne-Claire qui ont eacuteteacute dansla mecircme galegravere que moi

Je tiens agrave remercier du fond du coeur lrsquoensemble des membres de ma famille qui mrsquoonttoujours apporteacute leur soutien et leur encouragement Merci agrave vous

Enfin je tiens agrave remercier toutes les personnes qui ont contribueacute de pregraves ou de loin agravela reacutealisation de ces travaux

III

IV

Reacutesumeacute

Lrsquoaccegraves agrave Internet des icircles de la Zone Oceacutean Indien a la particulariteacute drsquoutiliser deuxlongs cacircbles sous-marins Les routes ont en commun de passer par un de ces liens etdrsquointroduire une composante de deacutelai qui peut ecirctre significative La performance de TCPest lieacutee agrave lrsquoeacutetat des routes et au deacutelai Dans la situation de lrsquoicircle de la Reacuteunion comment secomporte un protocole ayant une deacutependance au deacutelai tel que TCP

Dans cette thegravese nous proposons une eacutetude de lrsquoInternet agrave la Reacuteunion Les travauxvisent agrave pouvoir dresser un bilan de la connectiviteacute Internet Ils srsquoorientent drsquoune partagrave caracteacuteriser la connectiviteacute au niveau du reacuteseau et drsquoautre part agrave traduire ses caracteacute-ristiques au niveau de la couche de transport Ainsi les travaux preacutesenteacutes reposent surdeux eacutetudes de meacutetrologie sur le reacuteseau reacuteunionnais

Le premier examen a pour objectif la caracteacuterisation des deacutelais et des routes emprun-teacutees depuis et en direction de lrsquoicircle Ces travaux reposent sur une plate-forme de mesuresmise en place agrave cet effet Un outil drsquoidentification des routes a eacuteteacute deacuteveloppeacute afin drsquoana-lyser les chemins depuis et vers la Reacuteunion Cet outil utilise une base de donneacutees degeacuteolocalisation construite agrave partir des adresses IP rencontreacutees des deacutelais associeacutes et drsquoin-formations provenant des Registres Internet Reacutegionaux Lrsquoanalyse des reacutesultats montredes caracteacuteristiques propres agrave la reacutegion Reacuteunion

La seconde eacutetude de meacutetrologie vise lrsquoanalyse des flux TCP Des meacutetriques associeacuteesagrave lrsquoobservation des captures de trafic sont identifieacutees afin drsquoeacutetablir les performances deTCP mais eacutegalement les types de trafic entrant et sortant de lrsquoicircle Le volume des eacutecouteseacutetant important un outil drsquoanalyse pour des traitements efficaces et rapides a eacutegalementeacuteteacute deacuteveloppeacute

Les contributions de cette thegravese sont drsquoabord rattacheacutees au contexte reacuteunionnais etsont extrapoleacutees vers lrsquointernet de la Zone Oceacutean Indien Cette thegravese se veut ecirctre un eacuteleacute-ment pour une reacuteflexion avec lrsquoensemble des acteurs de lrsquoInternet agrave la Reacuteunion

Mots cleacutes

Meacutetrologie active Deacutelais Routage Meacutetrologie passive Performance TCP Zone OceacuteanIndien Reacuteunion

V

Abstract

The access to the Internet of the Islands of the Indian Ocean Area has the particularityof using two long submarines cables The routes have in common to go through one ofthese links and introduce a delay component that can be significant The performance ofTCP is linked to the state of the route and the delay In the situation of Reunion Islandhow does a protocol having a dependence on delay such as TCP behaves

In this thesis we propose a study of the Internet in Reunion Island The work aimsto be able to take stock of Internet connectivity They are oriented on the one hand tocharacterize the connectivity at the level of the network and on the other hand to translatethese characteristics at the level of the transport layer Thus the works presented arebased on two metrology studies on the Reunion network

The first review aims to characterize the delays and the routes taken from and to theisland This work is based on a platform of measures put in place for this purpose A roadidentification tool has been developed to analyze roads to and from Reunion Island Thistool uses a geolocation database built from IP addresses encountered associated delaysand information from the Regional Internet Registries The analysis of the results showscharacteristics specific to the Reacuteunion region

The second metrology study aims to analyze TCP flows Metrics associated with theobservation of the catches of traffic are identified in order to establish the performancesof TCP but also the types of traffic entering and leaving the island Since the volume ofthe intercepts is important an analysis tool for efficient and rapid treatments has beendeveloped

The contributions of this thesis are first of all related to the Reunionese context andare extrapolated to the Internet of the Indian Ocean Zone This thesis is meant to be anelement for a reflection with all the actors of the Internet in Reunion Island

Keywords

Active Metrology Delay Routage Passive metrology Performance TCP Indian OceanArea Reunion Island

VI

Table des matiegraveres

Remerciements III

Reacutesumeacute V

Abstract VI

Liste des acronymes IX

Introduction 11 Contexte geacuteneacuteral 12 Contexte reacutegional 1

21 LrsquoInternet agrave La Reacuteunion 122 LrsquoInternet dans la Zone de lrsquoOceacutean Indien 5

3 Probleacutematique 84 Organisation de la thegravese 8

1 Eacutetat de lrsquoart 911 Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage 10

111 Controcircle de congestion de TCP 10112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de

stockage 14113 Un controcircle de congestion de TCP adapteacute aux LFN 17114 Controcircle de congestion avec implication des routeurs 22115 Caracteacuterisation de La Reacuteunion 23

12 Meacutetrologie du trafic Internet 25121 Deacutefinition 25122 Meacutetrologie active 26123 Meacutetrologie passive 32124 Comparatif entre mesures actives et mesures passives 35

13 Synthegravese 36

2 Caracteacuterisation de la connectiviteacute de La Reacuteunion 3921 Objectifs 4022 Cahier des charges 40

221 Evolution 40222 Connectiviteacute 40

23 Protocole de mesure 46231 Eacutechantillon de mesure 46232 Eacutevolution 47233 Connectiviteacute 48

24 Reacutesultats 53241 Eacutevolution 53

VII

242 Connectiviteacute de La Reacuteunion 54243 Connectiviteacute des icircles de la Zone Oceacutean Indien 65244 Synthegravese des reacutesultats 71

25 Conclusion 72

3 Meacutetrologie sur le service de transport agrave La Reacuteunion 7531 Objectifs 75

311 Les objectifs de lrsquoeacutetude 76312 Les meacutetriques de lrsquoeacutetude 76

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie 79321 Pour la capture du trafic 79322 Pour analyser les traces 80

33 Protocole de mesure 8234 Reacutesultats 85

341 Supervision du trafic 86342 Performance de TCP 88343 Synthegravese des reacutesultats 91

35 Conclusion 92

Conclusion amp perspectives 951 Synthegravese des travaux 952 Perspectives 96

Table des figures 100

Liste des tableaux 101

Bibliographie 103

VIII

Liste des acronymes

ACK Acknowledgement

ADSL Asymmetric Digital Subscriber Line

AIMD Additive Increase and Multiplicative Decrease

API Application Programming Interface

ARCEP Autoriteacute de Reacutegulation des Communications Electroniques et des Postes

AS Autonomous System

BDP Bandwidth Delay Product

CAIDA Center for Applied Internet Data Analysis

CDCS Comoros Domestic Cable Sytem

CDF Cumulative Density Function

CIL Correspondant Informatique et Liberteacutes

CWND Congestion Window

CWR Congestion Window Reduce

DNS Domain Name System

DSI Direction des Services Informatiques

DupAck Duplicate Acknowledgement

EASSY Eastern Arfrica Submarine SYstem

ECE ECN Echo

ECN Explicit Congestion Notification

FAI Fournisseurs drsquoAccegraves Internet

FTTH Fiber To The Home

GIX Global Internet eXchange

GNU GNUrsquos Not Unix

GPL General Public Licence

HTTP HyperText Transfer Protocol

HTTPS HyperText Transfer Protocol Secured

IANA Internet Assigned Numbers Authority

ICMP Internet Control Message Protocol

IETF Internet Engineering Task Force

IX

IGMP Internet Group Management Protocol

IMAP Internet Message Access Protocol

IP Internet Protocol

IPPM IP Performance Metrics

IW Initial Window

IXP Internet eXchange Point

LAN Local Area Network

LER Label Edge Router

LFN Long Fat Network

LIM Laboratoire drsquoInformatique et de Matheacutematiques

LION Lower Indian Ocean Network

LSP Label Switched Path

LSR Label Switch Router

MAN Metropolitan Area Network

MPLS MultiProtocol Label Switch

MSS Maximun Segment Size

NRA Noeud de Raccordement drsquoAbonneacutes

NS Nonce Sum

OS Operating System

PDF Probability Density Function

POP Post Office Protocol

PSAMP Packet Sampling

RENATER REseau NAtional de communication eacutelectroniques pour la Technologie lrsquoEnseigne-ment et la Recherche

RIR Regional Internet Registry

RITE Reducing Internet Transport Latency

RSSI Responsable Seacutecuriteacute et Systegravemes drsquoInformation

RTO Retransmission TimeOut

RTT Round-Trip delay Time

SAFE South-Africa Far East

SAT-3 South Africa Transit-3

SCP Ssh CoPy

SEAS Seychelles to East Africa System

SMTP Simple Mail Transfert Protocol

SSH Secure SHell

ssthresh slow-start threshold

TAI Technologies drsquoAccegraves agrave Internet

X

TCP Transmission Control Protocol

TTL Time-To-Live

UDP User Datagram Protocol

VDSL Very-high-bit-rate Digital Subscriber Line

VLAN Virtual Local Area Network

VOD Video on demand

VPN Virtal Private Network

WAN Wide Area Network

WASC West Africa Submarine Cable

ZOI Zone Oceacutean Indien

XI

XII

Introduction

1 Contexte geacuteneacuteral

Depuis sa premiegravere deacutemonstration publique en 1972 Internet a fortement eacutevolueacute[Leiner1997] Dans une premiegravere phase nous avons les changements de services Les uti-lisateurs ont basculeacute des services historiques que sont lrsquoeacutechange drsquoe-mail et la navigationweb vers une utilisation interactive de lrsquoInternet Ces nouveaux services tels que la Voixsur IP les Jeux en ligne le Streaming etc sont maintenant possibles peu importe lrsquoendroitougrave lrsquoon se situe Cela gracircce agrave la seconde phase des innovations de lrsquoInternet lrsquoeacutevolu-tion des technologies logicielles et mateacuterielles Les technologies sont devenues de plusen plus mobiles et proposent des deacutebits drsquoaccegraves agrave lrsquoInternet de plus en plus importantsAinsi nous sommes passeacutes drsquoun accegraves physique de chez soi connecteacutes agrave un ordinateurfixe et une liaison 56 kbits (kilo-bitsseconde) agrave des smartphones et des connexions mo-biles avec un deacutebit theacuteorique minimal descendant de 20 Gbits (Giga-bitsseconde) dansun futur proche pour la technologie 5G En parallegravele lrsquoaccegraves agrave Internet srsquoest deacutemocra-tiseacute Drsquoapregraves une eacutetude de lrsquoOrganisation des Nations Unies le nombre de teacuteleacutephonesmobiles est devenu supeacuterieur au nombre drsquohabitants sur la planegravete [ONU2013] Ces eacutevo-lutions parallegraveles ont bouleverseacute lrsquousage de lrsquoInternet Est-ce que ces eacutevolutions ont eu unimpact sur lrsquoInternet reacuteunionnais

2 Contexte reacutegional

21 LrsquoInternet agrave La Reacuteunion

Pour comprendre la situation de lrsquoInternet agrave La Reacuteunion il est neacutecessaire de relaterlrsquohistoire de la connectiviteacute Internet et de dresser un bilan de lrsquoeacutetat actuel Cet historiqueest effectueacute agrave partir du document [Pretet2000] qui preacutesente lrsquoavancement du projet deconnexion de lrsquoicircle de La Reacuteunion au cacircble sous-marin South-Africa Far East (SAFE)

La premiegravere connexion de La Reacuteunion agrave lrsquoInternet date de 1992 avec la mise en servicedu projet Telecom-2 Agrave cette eacutepoque la seule liaison connectant La Reacuteunion agrave Interneteacutetait une connexion satellitaire Jusqursquoen 2001 et lrsquoarriveacutee du cacircble SAT-3WASCSAFEles deacutebits drsquoaccegraves reacutesidentiels ne deacutepassaient pas les 56 kbits La bande passante totalede lrsquoaccegraves Internet de lrsquoicircle par ce canal satellite eacutetait de 400 Mbits (Meacutega-bitsseconde)tous opeacuterateurs confondus Le coucirct drsquoutilisation de la liaison satellite avoisinait les17 000DMbmois et par opeacuterateur La technologie drsquoaccegraves et le tarif eacuteleveacute limitaient lesusages de lrsquoInternet priveacute agrave des services basiques comme lrsquoeacutechange drsquoe-mail Lrsquoarriveacuteedes cacircbles South Africa Transit-3 (SAT-3)West Africa Submarine Cable (WASC)SAFE en2001 visaient agrave deacutesenclaver numeacuteriquement lrsquoicircle

Ce cacircble drsquoune longueur totale de 28 000 Km (Kilo-megravetres) connecte lrsquoEurope (Es-pagne et Portugal) agrave lrsquoAsie (Inde et Malaisie) en longeant la cocircte Ouest africaine telqursquoillustreacutee par la carte figure 1 Le lien est composeacute de deux paires de fibres optiquesavec une capaciteacute globale de 135 Gbits La reacutepartition des capaciteacutes fut faite en fonction

1

du montant investi par les opeacuterateurs France Teacuteleacutecom fut seacutelectionneacutee pour la Franceavec un deacutebit total de 13 6 Gbits dont 155 Mbits furent alloueacutes agrave la connexion de LaReacuteunion Ce deacutebit eacutetait eacutequivalent agrave la capaciteacute maximale theacuteorique du lien satellite deFrance Teacuteleacutecom Outre la seacutecuriteacute apporteacutee par la fibre optique crsquoest la qualiteacute de la trans-mission qui a eacuteteacute ameacutelioreacutee avec ce support Ce cacircble a eacuteteacute une premiegravere eacutetape dans lamise en place drsquoune autoroute de lrsquoinformation entre lrsquoEurope lrsquoAsie et lrsquoAfrique PourLa Reacuteunion cette autoroute a eacuteteacute un facteur pour la baisse des coucircts de communication eten parallegravele le deacuteploiement de la technologie Asymmetric Digital Subscriber Line (ADSL)Les tarifs de consommation de la bande passante du lien ont connu une baisse impor-tante suite agrave une deacutecision de lrsquoAutoriteacute de Reacutegulation des Communications Electroniques etdes Postes (ARCEP) en 2004 [ARCEP2004] Les tarifs sont passeacutes de 17 000 DMbmois agrave1 550 DMbmois

FIGURE 1 ndash Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000])

Malgreacute la baisse des tarifs lrsquoADSL nrsquoeacutetait preacutesent que dans 6 villes agrave forte densiteacutede population Afin drsquoaugmenter la couverture de lrsquoaccegraves Internet de lrsquoicircle une dorsalefaisant le tour de lrsquoicircle est installeacutee Crsquoest le reacuteseau nommeacute Gazelle dont le deacutebut du deacute-ploiement fut effectueacute dans le courant de lrsquoanneacutee 2003 [SDTAN2013] Cette fibre est ins-talleacutee en hauteur en suivant le reacuteseau Haute Tension drsquoEDF selon le plan de la figure 2(en trait bleu ou fonceacute) Le but de ce reacuteseau est de raccorder lrsquoensemble des Noeud de Rac-cordement drsquoAbonneacutes (NRA) Un NRA est un local heacutebergeant un central teacuteleacutephonique delrsquoopeacuterateur historique France Teacuteleacutecom dans lequel aboutissent les lignes teacuteleacutephoniquesdes abonneacutes communeacutement appeleacutees boucles locales Au delagrave de ces locaux les boucleslocales forment le reacuteseau capillaire Lrsquointerconnexion entre le reacuteseau Gazelle et les NRAest repreacutesenteacutee en vert sur la figure 2

En 2004 La Reacuteunion srsquoest doteacutee drsquoun point drsquoeacutechange (Global Internet eXchange (GIX)ou Internet eXchange Point (IXP)) nommeacute Reunix Il fut pendant pregraves de 10 ans le seul IXPpreacutesent dans la Zone Oceacutean Indien (ZOI) Geacutereacute par le REseau NAtional de communicationeacutelectroniques pour la Technologie lrsquoEnseignement et la Recherche (RENATER) il vise agrave inter-connecter les fournisseurs drsquoaccegraves Internet de La Reacuteunion afin drsquoeacuteviter que le trafic localne sorte de lrsquoicircle et consomme des capaciteacutes sur le cacircble sous-marin En plus de cet eacutequi-pement des technologies de cache ont eacuteteacute deacuteployeacutees sur le territoire LrsquoUniversiteacute de LaReacuteunion a eacuteteacute un des acteurs de ce deacuteploiement

2

FIGURE 2 ndash Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000])

Depuis la deacutecision de lrsquoARCEP en 2004 chaque anneacutee une baisse de 20 agrave 40 duprix du Meacutegabit sur le cacircble sous-marin est enregistreacutee En 2006 pour 50D un abonneacutenrsquoavait droit qursquoagrave la connexion ADSL de 1 Mbits sans aucun service additionnel Lrsquoan-neacutee suivante pour le mecircme tarif la teacuteleacutephonie illimiteacutee vers certains pays a eacuteteacute ajouteacuteeau forfait Dans le courant de lrsquoanneacutee 2010 le forfait est resteacute le mecircme mais le deacutebit alloueacuteest augmenteacute pour atteindre 8 Mbits La Reacuteunion nrsquoa vu lrsquoarriveacutee du triple play (Teacuteleacutevi-sion Teacuteleacutephone Internet) qursquoagrave partir des anneacutees 20112012 avec lrsquoarriveacutee drsquoun nouveaucacircble Lower Indian Ocean Network (LION) Le LION est un cacircble sous-marin reliant LaReacuteunion Maurice et Madagascar depuis 2009 En 2012 une extension est rajouteacutee sousle nom de LION-2 connectant le LION agrave Mayotte et au Kenya Ce nouveau cacircble proposedegraves sa mise en service une capaciteacute deacutepassant le 1 Tbs (Teacuterabitseconde)

Lrsquoaugmentation continue des deacutebits et de la capaciteacute disponible sur le cacircble SAT-3WASCSAFE actuellement agrave 900 Gbits a acceacuteleacutereacute le deacuteploiement de nouveaux ser-vices et de nouvelles technologies drsquoaccegraves agrave Internet pour les abonneacutes Lrsquoicircle de La Reacuteuniondispose actuellement en dehors des connexions mobiles de trois Technologies drsquoAccegraves agrave In-ternet (TAI) La premiegravere est la technologie ADSL preacutesente depuis 2001 Elle propose desdeacutebits asymeacutetriques allant jusqursquoagrave 20 Mbitss en descente Crsquoest le deacutebit qursquoaura lrsquoutilisa-teur en teacuteleacutechargement Depuis 2014 lrsquoopeacuterateur historique Orange (ex-France Teacuteleacutecom)propose la technologie Very-high-bit-rate Digital Subscriber Line (VDSL) 2 avec des deacutebitsallant jusqursquoagrave 100 Mbits descendant La limite physique de cette TAI impose une dis-tance entre lrsquoabonneacute et le distributeur infeacuterieure agrave 1 Km La derniegravere technologie preacutesentesur lrsquoicircle est la fibre optique Deacuteployeacutee depuis 2007 par lrsquoopeacuterateur priveacute ZEOP elle eacutetaitjusqursquoagrave peu principalement deacuteployeacutee dans les villes du Port Sainte Marie et Saint Pierre

Chaque opeacuterateur dispose drsquoune ou plusieurs technologies drsquoaccegraves Chaque technolo-

3

gie est associeacutee agrave un deacutebit maximal theacuteorique La carte 3 1 preacutesente les deacutebits theacuteoriquesqui sont preacutesents sur lrsquoicircle [France2017]

Cette carte montre une dispariteacute des deacutebits selon les zones geacuteographiques de lrsquoicircleLe Plan France Tregraves Haut Deacutebit a pour objectif drsquouniformiser sur lrsquoensemble du territoirefranccedilais les deacutebits avec le deacuteploiement de la technologie drsquoaccegraves fibre optique

FIGURE 3 ndash Carte des deacutebits agrave La Reacuteunion

Reacutecapitulatif

La connexion agrave Internet donne agrave La Reacuteunion des capaciteacutes importantes La preacutesencedrsquoun GIX sur le territoire a limiteacute le trafic reacuteunionnais sur les cacircbles sous-marins La figure4 montre lrsquoensemble des eacuteveacutenements qui ont marqueacute le deacuteveloppement de lrsquoInternet agrave LaReacuteunion jusqursquoagrave nos jours

Depuis la deacutecision de lrsquoARCEP en 2004 [ARCEP2004] et lrsquoarriveacutee du cacircble LION lesopeacuterateurs ont fait le choix drsquoaugmenter les services proposeacutes avec un prix reacutesidentielstable Les derniers services ajouteacutes sont ceux de la Video on demand (VOD) et de la rediffu-sion (Replay) En 2014 le prix moyen du MeacutegabitMois sur le cacircble SAT-3WASCSAFEavoisinait les 25 D En pregraves de 15 ans on note la baisse du coucirct moyen du Meacutegabitmoisde 17 000 D agrave 25 D

Lrsquoeacutevolution de la connectiviteacute Internet agrave La Reacuteunion est lieacutee au deacuteveloppement de laconnectiviteacute des diffeacuterents pays preacutesents dans la Zone Oceacutean Indien

1 Source Observatoire France Tregraves Haut Deacutebit

4

FIGURE 4 ndash Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion

22 LrsquoInternet dans la Zone de lrsquoOceacutean Indien

Les acteurs du deacuteveloppement du numeacuterique dans la Zone Oceacutean Indien

Dans le cadre de nos eacutetudes nous restreignons la ZOI agrave 6 icircles ou archipels suivants(rangeacutes par ordre alphabeacutetique) les Comores Madagascar Maurice Mayotte La Reacuteunionet les Seychelles Agrave lrsquoexception de Mayotte et de La Reacuteunion qui sont des reacutegions fran-ccedilaises les autres icircles et archipels citeacutes sont des pays indeacutependants Nous allons dansun premier temps faire une preacutesentation des principaux acteurs du deacuteveloppement nu-meacuterique dans chaque territoire Le deacuteveloppement de lrsquoInternet dans la ZOI se fait encollaboration avec lrsquoensemble des pays Nous poursuivrons avec les futures installationsdes cacircbles sous-marins dans la ZOI

LrsquoUnion des Comores est une reacutepublique feacutedeacuterale drsquoAfrique Lrsquoarchipel est connecteacuteagrave Internet depuis le 19 Janvier 1998 via une connexion satellite En 2010 le gouverne-ment deacuteploie le Comoros Domestic Cable Sytem (CDCS) qui relie lrsquoensemble des icircles delrsquoarchipel entre elles avec en parallegravele le raccordement au cacircble Eastern Arfrica SubmarineSYstem (EASSY) [Comores2002] Ce cacircble relie lrsquoAfrique du Sud au Soudan en longeantla cocircte Est du continent En 2009 lrsquoAutoriteacute Nationale de Reacutegulation des TIC (ANRTIC) voitle jour De nombreuses missions sont donneacutees agrave cette autoriteacute comme appliquer et fairerespecter la loi des Technologies de lrsquoInformation et de la Communication (TIC) reacuteguler lesecteur des TIC favoriser la coopeacuteration entre les acteurs et geacuterer les diffeacuterends garan-tir une concurrence saine et loyale entre les opeacuterateurs et de deacutevelopper la recherche laformation et les innovations technologiques [ANRTIC2016] En deacutecembre 2016 un troi-siegraveme cacircble connecte lrsquoarchipel agrave Mayotte Actuellement un Vice-Preacutesident chargeacute desTIC travaille en collaboration avec un Conseiller du preacutesident en matiegravere de transports etteacuteleacutecommunications

La Reacutepublique de Madagascar est relieacutee agrave Internet par deux cacircbles sous-marins Lepremier est lrsquoEASSY Le second cacircble est le LION Au niveau des prises de deacutecisions 3 or-ganismes principaux existent Le plus important est le ministegravere des Teacuteleacutecommunicationset des Nouvelles Technologies Il a mis en place le Projet drsquoInfrastructure de Communicationpour Madagascar (PICOM) Lrsquoobjectif est la reacuteduction des coucircts drsquoaccegraves aux services deteacuteleacutecommunications Le second est lrsquoAutoriteacute de Reacutegulation des TEchnologies de Communica-tion (ARTEC) Cet administration octroie les licences aux proprieacutetaires des reacuteseaux arbitreles diffeacuterends entre opeacuterateurs et assure la gestion des spectres [ARTEC2016] Le dernierorganisme est le Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de la Commu-nication (GOTICOM) Il a pour objectif drsquoaccompagner et drsquoameacuteliorer les infrastructuresde teacuteleacutecommunication et de favoriser lrsquointeacutegration des TIC [GOTICOM2011] Depuis2016 un GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Africaine [MGIX2017]

5

La Reacutepublique de Maurice regroupe les icircles Rodrigues et Maurice Sous lrsquoimpulsiondu gouvernement anglais la premiegravere ligne teacuteleacutephonique fut installeacutee en 1883 Actuel-lement en plus drsquoune connexion satellitaire reliant les deux icircles le SAFE et le LIONconnectent Maurice agrave Internet Un ministegravere des Technologies de lrsquoInnovation et desCommunications existe au sein du gouvernement Crsquoest ce mecircme gouvernement quinomme le directeur de lrsquoInformation and Communication Technologies Authority (ICTA) Crsquoestlrsquoautoriteacute de reacutegulation des Teacuteleacutecoms et des Postes Il existe 2 principaux opeacuterateurs quesont Mauritius Telecom et Emtel Une dizaine drsquoopeacuterateurs cohabitent sur lrsquoicircle [ICTA2017]Depuis 2016 un nouveau GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Afri-caine [MIXP2017]

Mayotte est un deacutepartement franccedilais depuis Mars 2011 Le raccordement au cacircbleLION-2 extension du cacircble LION en avril 2012 rend possible lrsquoarriveacutee du haut deacutebit surce territoire En 2013 un GIX geacutereacute par RENATER est installeacute au sein du Rectorat Il senomme Mayotix

Les Seychelles ont vu leur premiegravere connexion Internet introduite dans lrsquoarchipel parAtlas Seychelles Ltd en septembre 1996 En 2012 les Seychelles sont connecteacutes agrave une fibreen provenance de Tanzanie Crsquoest le cacircble Seychelles to East Africa System (SEAS) Crsquoestlrsquounique cacircble sous-marin connectant lrsquoarchipel Le Ministegravere des Technologie de lrsquoInforma-tion et des Communications (MITC) fait office drsquoautoriteacute de Reacutegulation des Teacuteleacutecommuni-cations dans le pays [DICT2017]

Chaque autoriteacute de reacutegulation agrave un impact sur le deacuteveloppement de lrsquoInternet dansson pays Ce deacuteveloppement se reacutepercute sur lrsquoameacutelioration de lrsquoaccegraves Internet dans laZOI

Deacuteveloppement de lrsquointerconnexion de la Zone Oceacutean Indien

Cette reacutegion a connu un premier bouleversement de sa connectiviteacute agrave Internet avecle deacuteploiement du cacircble sous-marin SAT-3WASCSAFE en 2001 pour La Reacuteunion etMaurice Lrsquoarriveacutee du LION en 2009 a connecteacute Madagascar aux deux icircles En 2010 lesComores et Madagascar se sont ouverts une voie vers lrsquoAfrique avec le cacircble EASSY Lrsquoin-terconnexion du LION 2 a deacuteveloppeacute lrsquoInternet agrave Mayotte tandis que le deacuteploiement ducacircble SEAS a ouvert les Seychelles agrave lrsquoInternet haut deacutebit La carte 5 indique les diffeacuterentscacircbles sous-marins preacutesents dans la ZOI

La ZOI srsquoengage dans le deacuteploiement de nouveaux liensLe cacircble MElting poT Indianoceanic Submarine System (METISS) drsquoune longueur de

3 500 kilomegravetres reliera Madagascar Maurice et La Reacuteunion agrave lrsquoAfrique du Sud La bandepassante du cacircble sera de 24 Tbs Sa mise en service est preacutevue pour le courant de lrsquoan-neacutee 2019 [Lemauricien]

Africa-1 est un cacircble reliant lrsquoAfrique du Sud le Moyen Orient et lrsquoAsie centrale Cecacircble de plus de 12 0000 kilomegravetres passera le long de la cocircte Est africaine avant de relierlrsquoArabie Saoudite lrsquoEacutegypte et le Pakistan La mise en service du cacircble est preacutevue pour lecourant de lrsquoanneacutee 2020 [Africa1]

En 2019 sera mis en service le cacircble IOX IOX est un cacircble sous-marin deacutedieacute agrave lrsquoicircleMaurice Il a pour but drsquooffrir une nouvelle liaison agrave Maurice en reliant lrsquoicircle agrave lrsquoAfrique etau reste du monde Il sera doteacute drsquoune capaciteacute de 54 Tbs [IOX]

La carte 6 repreacutesente lrsquoensemble des IXP preacutesents dans la Zone Oceacutean Indien En vertce sont les points drsquoeacutechanges deacutejagrave en service La France a degraves lrsquoanneacutee 2004 mis en placele point drsquoeacutechange agrave La Reacuteunion et en 2012 celui de Mayotte Ceux de Maurice et de

6

FIGURE 5 ndash Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source [Cablesmap])

Madagascar ont eacuteteacute mis en service en 2016 avec lrsquoaide de lrsquoUnion Africaine de lrsquoInter-net Society et du projet AXIS [AXIS] Les points bleus repreacutesentent les points drsquoeacutechangequi sont preacutevus drsquoecirctre deacuteployeacutes dans la zone oceacutean indien par le projet AXIS dans le fu-tur Drsquoici quelques anneacutees lrsquoensemble des territoires de la zone sera eacutequipeacute drsquoun pointdrsquoeacutechange Cet eacutequipement vise a maintenir le trafic de type Metropolitan Area Network(MAN) du pays ougrave il est installeacute Il facilite les eacutechanges entre les opeacuterateurs locaux enreacuteduisant la latence et en augmentant la qualiteacute de service

FIGURE 6 ndash Carte des points drsquoeacutechange preacutesents actuellement et dans un futur prochedans la ZOI

7

3 Probleacutematique

LrsquoInternet et ses applications ont eacuteteacute deacuteveloppeacutes dans des territoires ougrave les routes sontnombreuses Lrsquoicircle de La Reacuteunion comme beaucoup de territoires insulaires ne beacuteneacuteficiepas drsquoun nombre de liaisons physiques directes important Lrsquoeacutevolution de lrsquoInternet al-lant des applications toleacuterantes aux deacutelais vers des applications temps-reacuteel neacutecessite unerobustesse et une qualiteacute de service deacutependantes drsquoun maillage fort et de deacutelais courts

Lrsquoeacutetude drsquo[Anelli2012] a deacutemontreacute que les deacutelais agrave destination drsquoadresses aleacuteatoiressont sensiblement plus longs depuis La Reacuteunion que depuis Paris avec un eacutecart drsquoenvi-ron 180 ms Suite agrave ce constat lrsquoauteur a reacutealiseacute des simulations estimant les deacutebits asso-cieacutes avec un taux de pertes de 10 Ces simulations ont mis en avant des deacutebits eacutecouleacutesplus faibles pour un usager situeacute agrave La Reacuteunion qursquoun usager baseacute agrave Paris Une augmen-tation de la bande passante nrsquoentraicircnerait pas une diminution des deacutelais Le groupe detravail europeacuteen Reducing Internet Transport Latency (RITE) a reacutealiseacute une videacuteo explicativede ce pheacutenomegravene [RITE2014-2]

Cette thegravese vise agrave mettre en lumiegravere les principaux freins des deacutebits eacutecouleacutes

Dans une premiegravere eacutetape nous eacutetudierons lrsquoeacutevolution des deacutelais depuis La Reacuteunionen prenant comme base lrsquoeacutetude reacutealiseacutee par [Anelli2012]

Dans un second temps nous eacutetudierons les routes logiques de lrsquoInternet reacuteunionnais

Dans un dernier temps nous reacutealiserons une proposition drsquoeacutetude de meacutetrologie Cetteeacutetude vise agrave identifier la correacutelation des eacuteveacutenements de congestion entre les flots lrsquoimpor-tance des anomalies affectant Transmission Control Protocol (TCP) (pertes initiales fauxeacuteveacutenements de congestion) la reacutepartition des flots (en taille en protocole en application)et les paramegravetres de performances (taux de pertesRTT deacutebit eacutecouleacute)

4 Organisation de la thegravese

Suite agrave lrsquoexposition de notre probleacutematique le chapitre 1 preacutesente le contexte scienti-fique de nos travaux Dans un premier temps nous allons preacutesenter les caracteacuteristiquesde TCP et sa probleacutematique lieacutee aux reacuteseaux agrave forte capaciteacute de stockage Nous continue-rons avec une preacutesentation de quelques solutions Nous deacuteterminerons si lrsquoaccegraves Internetde La Reacuteunion doit ecirctre consideacutereacute comme un reacuteseau agrave forte capaciteacute de meacutemorisation Lasuite du chapitre inclura la deacutefinition de la meacutetrologie dans les reacuteseaux et une preacutesenta-tion des techniques de mesures active et passive

La premiegravere eacutetude est deacutecrite dans le chapitre 2 et deacutebute par la preacutesentation des ob-jectifs Un cahier des charges permettant de reacutepondre aux objectifs a eacuteteacute reacutedigeacute Ce cahierdes charges a deacuteboucheacute sur le deacuteploiement de la plate-forme de meacutetrologie active RunPLet du deacuteveloppement de deux outils drsquoaide agrave lrsquoanalyse rgeoloc et rtraceroute La preacutesen-tation du protocole de mesure a eacuteteacute reacutealiseacutee dans la partie preacuteceacutedant celle des reacutesultatsLe chapitre se conclut par une synthegravese des reacutesultats qui ont servi agrave nos contributions

La seconde eacutetude est preacutesenteacutee dans le chapitre 3 Les objectifs du chapitre sont preacute-senteacutes dans un premier temps et diviseacutes en deux Ce chapitre preacutesente la mise en oeuvredrsquoune plate-forme de meacutetrologie et du protocole de mesure associeacute Une section reacutesultatassocieacutee agrave une conclusion termine le chapitre Ce chapitre a fait lrsquoobjet drsquoune contributionscientifique

Nous concluons notre thegravese par un reacutesumeacute des diffeacuterentes contributions Un apportsur les perspectives qursquoautorisent nos travaux est proposeacute dans le chapitre 35

8

Chapitre 1

Eacutetat de lrsquoart

Transmission Control Protocol (TCP) est le protocole de transport le plus utiliseacute sur lrsquoIn-ternet Lrsquoeacutetude reacutealiseacutee par Center for Applied Internet Data Analysis (CAIDA) sur une du-reacutee de 2 ans du trafic passant par le point drsquoeacutechange (IXP) EQUNIX de Chicago a montreacuteque 90 97 des paquets Internet Protocol (IP) acheminent des segments TCP [EQUINIX]TCP est un protocole de transport qui rend un service de transfert fiable de donneacuteesLorsque la somme du deacutebit des eacutemetteurs TCP partageant une mecircme ressource du reacute-seau excegravede la capaciteacute de cette ressource il se produit de la congestion La congestionest un pheacutenomegravene indeacutesirable qui met le reacuteseau dans un eacutetat ougrave le service rendu est deacute-gradeacute Cette deacutegradation peut ecirctre seacutevegravere en fonction de lrsquointensiteacute du pheacutenomegravene Poureacuteviter que lrsquoeffet de la congestion empire quand elle apparaicirct TCP integravegre une fonctionde reacutesolution connue sous le nom de controcircle de congestion Le principe est que chaqueeacutemetteur deacutetecte la congestion et diminue son deacutebit drsquoeacutemission Pour se faire le controcirclede congestion srsquoappuie sur la boucle de controcircle constitueacutee entre lrsquoeacutemission drsquoun segmentde donneacutees et la reacuteception de lrsquoacquittement correspondant Le controcircle de congestionagit sur le deacutebit drsquoeacutemission de lrsquoeacutemetteur avec une latence lieacutee au Round-Trip delay Time(RTT) Lorsque le produit du RTT avec la capaciteacute drsquoeacutecoulement offerte par le reacuteseau estrelativement important le controcircle de congestion de TCP peine agrave utiliser les ressourcesdu reacuteseau efficacement Ce produit du deacutelai et du deacutebit repreacutesente la quantiteacute de donneacuteesnon acquitteacutees qui peut circuler On peut assimiler ce produit agrave la capaciteacute de stockage dedonneacutees dans le reacuteseau

Ces derniegraveres anneacutees lrsquoaugmentation de la bande passante a fait croicirctre significative-ment cette capaciteacute de stockage En effet comme les deacutelais nrsquoont pas diminueacute dans lesmecircmes proportions la capaciteacute de stockage nrsquoa fait que croicirctre Cette eacutevolution pose undeacutefi au controcircle de congestion de TCP pour maintenir ses performances Cette eacutevolutiona entraicircneacute une activiteacute intense de recherche pour traiter ce problegraveme de produit deacutelai-bande passante pour TCP Ainsi de nouvelles versions du controcircle de congestion de TCPont eacuteteacute eacutetudieacutees pour lrsquoadapter aux speacutecificiteacutes des reacuteseaux agrave forte capaciteacute de stockageLong Fat Network (LFN)

Si le stockage important de donneacutees dans le reacuteseau pose un problegraveme pour le controcirclede congestion de TCP qursquoen est-il en pratique dans le cas de lrsquoInternet agrave La Reacuteunion Pourreacutepondre agrave cette question il faut pouvoir mesurer lrsquoexistant Depuis quelques anneacutees ily a un inteacuterecirct croissant pour la mesure Une science de la mesure sur lrsquoInternet se deacute-veloppe Il faut chercher dans la croissance continue et soutenue de lrsquoInternet ainsi quedans lrsquoabsence drsquoune exploitation coordonneacutee les motivations agrave deacutevelopper la meacutetrologiesur Internet Cette meacutetrologie vise agrave mieux comprendre le fonctionnement de lrsquoInternet

Ce chapitre se compose de deux sections theacutematiques La premiegravere section 11 traitede la probleacutematique du controcircle de congestion de TCP utiliseacute sur les reacuteseaux agrave grande

9

capaciteacute de stockage La sous-section 111 rappelle le principe du controcircle de conges-tion et sa mise en œuvre dans TCP Dans la partie 112 les problegravemes speacutecifiques ducontrocircle de congestion de TCP appliqueacute dans le contexte des reacuteseaux agrave forte capaciteacute demeacutemorisation sont indiqueacutes Face agrave ces problegravemes des propositions ont eacuteteacute eacutetudieacutees quenous preacutesenterons dans les parties 113 et 114 Pour conclure cette section nous pose-rons dans la sous-section 115 les arguments qui permettent drsquoavancer que lrsquoicircle de LaReacuteunion a une connectiviteacute qui srsquoapparente agrave celle des reacuteseaux agrave forte capaciteacute de sto-ckageLa seconde section 12 est consacreacutee agrave la meacutetrologie du trafic Internet La deacutefinition et lesmeacutethodologies de la meacutetrologie sont indiqueacutees dans la partie 121 La preacutesentation de lameacutetrologie active sera reacutealiseacutee dans la section 122 suivie par celle de la meacutetrologie pas-sive dans la section 123 La comparaison entre la meacutetrologie active et passive termineracette preacutesentation et sera faite dans la partie 124 Pour conclure ce chapitre une synthegraveseest reacutealiseacutee par la section 13 dans laquelle nous tirons les enseignements pour mener deseacutetudes depuis et vers La Reacuteunion

11 Le controcircle de congestion TCP et les reacuteseaux agrave grande capa-citeacute de stockage

TCP est un protocole de transport creacuteeacute en 1980 et deacutecrit pour la premiegravere fois dans le[RFC793] il a subi depuis de nombreuses eacutevolutions comme lrsquoindique le [RFC7414] Lesuccegraves de TCP repose sur son service de transmission fiable et ordonneacutee drsquoun flux de don-neacutees asynchrones Crsquoest un protocole fonctionnant de point agrave point et de bout en bout au-trement dit entre lrsquoeacutemetteur et le reacutecepteur des donneacutees sans concerner les eacutequipementsintermeacutediaires TCP offre un service de communication eacutequivalent agrave un canal virtuel bi-directionnel entre 2 entiteacutes applicatives Le canal de communication se caracteacuterise par satransparence seacutemantique crsquoest-agrave-dire par lrsquoabsence drsquoalteacuteration des donneacutees transfeacutereacuteesPour reacutealiser cette fiabiliteacute de lrsquoeacutechange TCP supervise les eacutechanges de donneacutees par desacquittements (Acknowledgement (ACK)) Cette supervision forme une boucle de controcirclecorrespondant agrave lrsquoeacutemission de donneacutees et agrave la reacuteception de lrsquoacquittement correspondantElle se caracteacuterise par le deacutelai pris nommeacute RTT La correction des donneacutees perdues oualteacutereacutees en cours de transit srsquoeffectue par retransmission de ces donneacutees Si le principe defonctionnement de TCP srsquoeacutenonce facilement sa mise en œuvre est complexe du fait de lanon fiabiliteacute du protocole IP sous-jacent et de la diversiteacute des contextes drsquoutilisation deTCP Lrsquoarticle [Ros2005] deacutetaille les diffeacuterentes caracteacuteristiques du protocole lieacutees agrave lrsquoeacuteta-blissement de connexion la numeacuterotation des donneacutees et agrave la fiabilisation des eacutechanges

Outre lrsquoobjectif de fiabiliteacute TCP a aussi un objectif de performance pour le servicerendu en termes de deacutebit eacutecouleacute et drsquoutilisation des capaciteacutes de transmission du reacuteseauPour atteindre cet objectif pour le service TCP integravegre une fonction de controcircle de flux quirepose sur une fenecirctre glissante geacutereacutee par le reacutecepteur Ainsi le deacutebit drsquoeacutemission peut srsquoali-gner sur le deacutebit de reacuteception de sorte qursquoun reacutecepteur lent ne puisse ecirctre satureacute par unexpeacutediteur rapide La speacutecification initiale de TCP a eacuteteacute conccedilue sans prendre en compteles ressources du reacuteseau Cet oubli a eacuteteacute agrave la source de dysfonctionnements seacutevegraveres du reacute-seau comme lrsquoeffondrement ducirc agrave la congestion (congestion collapse) [Afanasyev2010] Lafonction de controcircle de congestion vise agrave une prise en compte des ressources disponiblesdu reacuteseau et agrave leurs utilisations efficaces Le controcircle de congestion a susciteacute un travail derecherche intensif et ce sujet reste encore drsquoactualiteacute comme lrsquoindique le [RFC6077]

111 Controcircle de congestion de TCP

Drsquoapregraves [Jain1990] la congestion srsquoexprime par lrsquoeacutequation matheacutematique 11

10

sumDemande gt Ressources (11)

Du point de vue drsquoun reacuteseau par commutation de paquets les ressources sont princi-palement les meacutemoires tampon des nœuds de commutation et la capaciteacute de transmissiondes artegraveres de communication La congestion apparaicirct au niveau des nœuds de commu-tation et plus particuliegraverement sur leurs interfaces de sortie La condition pour voir ap-paraicirctre une congestion est laquo si la somme des deacutebits des flux arrivant sur lrsquointerface desortie est supeacuterieure agrave la capaciteacute de transmission du lien en sortie raquo Dans cette situationune file drsquoattente se constitue et quand elle deacuteborde les effets neacutefastes de la congestionse concreacutetisent A savoir que le taux de pertes des paquets augmente dans le reacuteseau cequi se traduit au niveau du service par un deacutebit eacutecouleacute qui chute et un deacutelai de trans-fert qui augmente Dans [Chiu1989] les auteurs montrent que la performance du reacuteseauest lieacutee agrave la charge appliqueacutee au reacuteseau Formellement la charge srsquoexprime comme tauxdrsquoarriveacutee sur le taux de service Informellement la charge repreacutesente la proportion de lademande autrement dit du trafic eacutemis par rapport agrave la capaciteacute de transfert La figure11 illustre lrsquoeacutevolution du deacutebit eacutecouleacute (throughput) et du RTT en fonction de la chargeappliqueacutee au reacuteseau (load) Au deacutebut le deacutebit eacutecouleacute srsquoaccroicirct avec la charge alors queles deacutelais nrsquoaugmentent presque pas On est dans une phase de remplissage des liensLorsque la charge srsquoapproche du taux de remplissage maximum des liens du reacuteseau Ledeacutebit eacutecouleacute nrsquoaugmente presque plus alors que les deacutelais augmentent fortement Crsquoestla phase de remplissage des files drsquoattente Ces deux phases sont seacutepareacutees par un pointcaracteacuteristique qui srsquoappelle le point drsquoinflexion (knee) Lorsque les files drsquoattente sontpleines et que la charge du reacuteseau continue de srsquoaccroicirctre les files drsquoattente vont deacutebor-der Agrave partir de ce point appeleacute le point de retournement (cliff ) le reacuteseau rentre dans lrsquoeacutetatdit drsquoeffondrement ducirc agrave la congestion (congestion collapse)

FIGURE 11 ndash Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989])

Lrsquoeffondrement ducirc agrave la congestion est rapporteacute par [Nagle1984] Dans cet eacutetat le reacute-seau enregistre des retransmissions abusives effectue des transferts avec des deacutelais ten-dant vers lrsquoinfini et rend un service avec un deacutebit eacutecouleacute proche de zeacutero Lrsquoeffondrementducirc agrave la congestion srsquoexplique par le gaspillage des ressources utiliseacutees en amont du point

11

de perte du paquet La solution agrave lrsquoeffondrement ducirc agrave la congestion reacuteside en lrsquoalignementdu deacutebit de lrsquoeacutemetteur agrave la capaciteacute drsquoeacutecoulement du canal de communication offert parle reacuteseau afin de ne produire aucune perte Ainsi les objectifs assigneacutes au controcircle decongestion de TCP sont drsquoeacuteviter lrsquoeacutetat drsquoeffondrement ducirc agrave la congestion drsquoallouer eacutequi-tablement les ressources du reacuteseau entres les flux concurrents et drsquooptimiser les perfor-mances obtenues par chaque flux [RFC2914]

Le controcircle de congestion de TCP fonctionne sur le principe de la boucle fermeacutee avecle reacuteseau vu comme une boicircte noire ainsi preacutesenteacute par la figure 12 Apregraves une stimu-lation sous la forme de lrsquoenvoi de paquets lrsquoobservation du comportement de la boicirctenoire agrave ce stimulus sera analyseacute par le controcircleur situeacute dans lrsquoeacutemetteur Le controcircleur rap-proche lrsquoobservation faite en retour du stimulus (feedback) par rapport agrave lrsquoobjectif affecteacuteau controcircleur Celui-ci par reacutetro-action ajustera le nombre des paquets suivants envoyeacutesCet ajustement est le reacutesultat drsquoune fonction de controcircle qui se base sur une perceptionbinaire des retours agrave savoir absence ou preacutesence de congestion

FIGURE 12 ndash Boucle fermeacutee du CC de TCP

Dans [Gevros2001] lrsquoauteur liste les moyens pour effectuer les observations que lrsquoonnomme en fait des notifications dans le contexte des reacuteseaux Les notifications de lacongestion dans le reacuteseau peuvent ecirctre implicites ou explicites Dans le premier caselles sont deacuteduites par lrsquoabsence drsquoACK Lrsquoaugmentation des deacutelais et les pertes des don-neacutees sont des causes possibles pour la non-reacuteception de lrsquoACK A lrsquoinverse lrsquoabsence decongestion est deacuteduite par la reacuteception drsquoun ACK Cette reacuteception autorise lrsquoenvoi drsquounnouveau paquet comme le montre [Jacobson1988-1] Les notifications peuvent ecirctre ex-plicites si les paquets veacutehiculent une marque mise par lrsquoeacuteleacutement congestionneacute commecrsquoest le cas avec la proposition Explicit Congestion Notification (ECN) [RFC3168] Nous re-viendrons sur cette proposition dans la sous-section 113 Lorsque le controcircleur deacuteduitla preacutesence de congestion il reacuteduit le deacutebit drsquoeacutemission de la source Le deacutebit est controcircleacuteagrave lrsquoaide drsquoune fenecirctre appeleacutee la fenecirctre de congestion (Congestion Window (CWND) ω)Elle indique la quantiteacute de donneacutees qui peut ecirctre eacutemise sur un RTT Autrement dit elleindique combien de donneacutees non acquitteacutees peut recevoir le canal de communicationSa taille eacutevolue dans le temps en fonction de lrsquoeacutetat du reacuteseau et selon une fonction decontrocircle Additive Increase and Multiplicative Decrease (AIMD) La fenecirctre drsquoeacutemission uti-liseacutee par un eacutemetteur TCP est le minimum entre la fenecirctre de congestion et la fenecirctreglissante du controcircle de flux Le controcircle de congestion comporte deux phases distinctes[Gevros2001]

mdash La premiegravere phase se nomme eacutevitement de la congestion (congestion avoidance) et sesitue autour du point drsquoinflexion de la figure 11

mdash La seconde phase se nomme reacutesolution de la congestion (congestion recovery) Ellese deacuteclenche quand lrsquoeacutetat du reacuteseau se situe au delagrave du point drsquoinflexion

Dans la phase de congestion avoidance le controcircle de congestion de TCP utilise deux al-gorithmes le deacutemarrage en douceur (slow-start (SS)) et lrsquoeacutevitement de congestion (conges-tion avoidance (CA)) Au deacutebut de la connexion TCP nrsquoa aucune connaissance de lrsquoeacutetat dureacuteseau autrement dit de lrsquoeacutetat du canal de communication entre lrsquoeacutemetteur et le reacutecep-teur TCP utilise lrsquoalgorithme du deacutemarrage en douceur pour sonder le canal Lrsquoobjectif

12

est drsquoatteindre le point drsquoinflexion rapidement et sans risquer de congestionner le canalpar des rafales Pour cela lrsquoalgorithme du deacutemarrage en douceur va eacutetaler sur plusieursRTT la croissance de la taille fenecirctre de congestion jusqursquoagrave atteindre une estimation dupoint drsquoinflexion Ainsi lrsquoeacutemetteur commence avec une fenecirctre de congestion assez pe-tite et lrsquoouvre au fur et agrave mesure et de plus en plus vite avec lrsquoarriveacutee des acquittementsPlus preacuteciseacutement le rythme de croissance de la taille de la fenecirctre de congestion est surle doublement tous les RTT Quant la fenecirctre de congestion atteint un certain seuil noteacuteslow-start threshold (ssthresh) le deacutemarrage en douceur srsquoarrecircte et lrsquoalgorithme drsquoeacutevite-ment de congestion est maintenant utiliseacute Cet algorithme augmente lineacuteairement et pluslentement que le deacutemarrage en douceur la taille de la fenecirctre de congestion En lrsquoabsencedrsquoindication explicite par le reacuteseau du deacutebit disponible sur le canal de communicationlrsquoeacutemetteur TCP continue de faire le sondage du canal et veacuterifie si le deacutebit eacutecouleacute peut ecirctreencore augmenteacute Pour lrsquoauteur de [Sallantin2014] lorsque la connexion TCP utilise lrsquoal-gorithme drsquoeacutevitement de congestion elle entre alors dans un eacutetat stable Dans cet eacutetat laconnexion doit se deacuterouler avec un deacutebit eacutecouleacute eacuteleveacute Crsquoest une indication que le pointdrsquoinflexion est atteint

La figure 13 donne une repreacutesentation simplifieacutee des eacutetats du controcircle de congestionde TCP Elle indique que lrsquoeacutetat stable peut ecirctre quitteacute si la connexion est libeacutereacutee ou si ily a un eacuteveacutenement de congestion TCP assimile les pertes implicitement agrave un eacuteveacutenementde congestion Lrsquoeacuteveacutenement de congestion fait basculer le controcircle de congestion de TCPdans la phase de reacutesolution de la congestion Dans cette phase la reprise de la perte oudes pertes est effectueacutee et la taille de la fenecirctre de congestion est diminueacutee et ceci afin dediminuer le deacutebit drsquoeacutemission

On distingue deux faccedilons de deacutetecter un eacuteveacutenement de congestion Une meacutethodesrsquoappuie sur la reprise de perte de TCP par retransmission des donneacutees perdues sur ex-piration drsquoun temporisateur (Retransmission TimeOut (RTO)) Une autre meacutethode utilisela caracteacuteristique de TCP qui consiste agrave ce que le reacutecepteur envoie un acquittement agravechaque segment de donneacutees reccedilu en seacutequence Ce segment porte le numeacutero des derniegraveresdonneacutees reccedilues seacutequentiellement Ainsi la reacuteception de donneacutees entraicircnant une rupturede la numeacuterotation en seacutequence geacutenegravere lrsquoeacutemission drsquoun acquittement dupliqueacute (Dupli-cate Acknowledgement (DupAck)) par le reacutecepteur Agrave la reacuteception de trois DupAck parlrsquoeacutemetteur les donneacutees indiqueacutees par la rupture de seacutequencement sont consideacutereacutees per-dues et retransmises sans attendre lrsquoexpiration du RTO Ce principe de retransmissionrapide porte le nom de fast retransmit (FR) Lrsquoalgorithme de reacutecupeacuteration rapide (fast reco-very (FR)) va maintenir la quantiteacute de donneacutees en transit dans le canal de communicationpour eacuteviter lrsquoeacutemission drsquoune rafale lorsqursquoun nouvel acquittement sera reccedilu En lrsquoabsencedu fast recovery agrave la reacuteception drsquoun nouvel acquittement la fenecirctre pourrait se vider parune rafale correspondant agrave des eacutemissions de paquets de donneacutees dos agrave dos sur un deacute-bit supeacuterieur agrave celui du deacutebit drsquoeacutecoulement du canal Ceci aurait pour effet de saturer lecanal et de renvoyer la connexion TCP dans une phase de reacutesolution de la congestion

Lorsque les eacutemissions de lrsquoeacutemetteur sont bloqueacutees par des donneacutees eacutemises et jamaisacquitteacutees le blocage est rompu par le RTO et ceci quel que soit lrsquoeacutetat Les deacutetails dela mise en œuvre des algorithmes du controcircle de congestion TCP sont deacutecrits par le[RFC5681]

Historiquement la version deacutenommeacutee TCP Tahoe incorporait la fonction de controcirclede congestion deacuteveloppeacutee en 1888 Elle comportait les algorithmes de slow-start conges-tion avoidance et de fast retransmit [Jacobson1988-1] La reprise de perte par fast retransmitsouffrait drsquoinefficaciteacute elle a eacuteteacute corrigeacutee avec lrsquoalgorithme du fast recovery Cette versionagrave quatre algorithmes est la version connue sous le nom de Reno et publieacutee la premiegraverefois en 1997 par le [RFC2001] Le couplage fast retransmit - fast recovery souffrait de deacutefauts

13

Deacutebut13

de13

connexion

Deacutemarrage13

en13

douceur

Etat13

stable

FRFR

Fin13

de13

connexion

3 Dupack

nouvel 13

ack

RTO

RTO

cwnd gt ss

tresh

SYN13

SYNACK

FIN-FINACK

FIGURE 13 ndash Etats du controcircle de congestion de TCP

lorsqursquoun eacuteveacutenement de congestion comportait plusieurs pertes Le [RFC2582] apportaitun correctif en 1999 On parla alors de version NewReno du controcircle de congestion En2005 une eacutetude montra que crsquoeacutetait la version du controcircle de congestion de TCP la plusutiliseacutee sur lrsquoInternet [Medina2005] Depuis de nouvelles versions ont eacuteteacute deacuteployeacutees dansles systegravemes drsquoexploitation tels que Windows et Linux appeleacutes respectivement C-TCP[Tan2006] et CUBIC [Ha2008] Dans la section 112 ces versions seront deacutetailleacutees

Le fonctionnement caracteacuteristique du controcircle de congestion de TCP est illustreacute parla figure 14 extraite de [Huston2000] Elle montre lrsquoeacutevolution de la fenecirctre de conges-tion dans le temps (exprimeacutee en terme de RTT) sur un canal de communication virtuelentre 2 stations Il srsquoagit ici drsquoun sceacutenario ideacutealiseacute dans lequel la connexion TCP nrsquoest pasen concurrence avec drsquoautres connexions La congestion se produit toujours agrave la mecircmevaleur de fenecirctre et pour laquelle la file drsquoattente deacuteborde Cette figure montre les deuxcaracteacuteristiques du controcircle de congestion de TCP qui deacutecoulent de la phase drsquoeacutevitementde congestion et de reacutesolution de la congestion et qui sont

mdash Lrsquoagressiviteacute elle provient du sondage du canal de communication LrsquoeacutemetteurTCP va chercher agrave accroicirctre le deacutebit eacutecouleacute en augmentant graduellement son deacutebitdrsquoeacutemission par lrsquoagrandissement de la taille de la fenecirctre de congestion

mdash La reacuteactiviteacute lorsque le canal de communication est plein et qursquoil deacuteborde quandcette perte est deacutetecteacutee lrsquoeacutemetteur TCP reacuteagit et diminue la taille de sa fenecirctre afinde diminuer son deacutebit drsquoeacutemission

Ces deux caracteacuteristiques donnent cette figure en dents de scie de la fenecirctre de conges-tion

112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de sto-ckage

Un reacuteseau agrave forte capaciteacute de stockage est un reacuteseau avec un produit deacutelai-bandepassante (Bandwidth Delay Product (BDP)) eacuteleveacute Dans lrsquoouvrage [Peterson2007] lrsquoauteureffectue une analogie du produit deacutelai-bande passante avec un tuyau Le deacutelai corres-pond agrave la longueur du tuyau et la bande passante au diamegravetre du tube Ainsi le BDPest le volume du tube Dans le cas drsquoun reacuteseau informatique le volume du tuyau srsquoex-prime en bits Ainsi lorsqursquoun canal de communication entre un eacutemetteur et un reacutecepteurpreacutesente un produit deacutelai-bande passante important un volume important de bits (autre-ment dit de donneacutees) peut ecirctre eacutemis avant de recevoir une notification Du point de vue

14

FIGURE 14 ndash Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP

de lrsquoeacutemetteur TCP ce volume de donneacutees injecteacute dans le reacuteseau sont des donneacutees nonencore acquitteacutees Les reacuteseaux qui offrent des canaux de communication avec un pro-duit deacutelai-bande passante important sont nommeacutes en anglais Long Fat Network (LFN) Le[RFC1072] preacutecise qursquoun LFN agrave un produit deacutelai-bande passante supeacuterieur agrave 12 5 Ko

Sachant que le controcircle de congestion de TCP srsquoappuie sur une reacutetro-action selon unepeacuteriode de RTT et que le deacutebit eacutecouleacute maximal est atteint lorsque la fenecirctre drsquoeacutemissionest au moins supeacuterieure au produit deacutelai(RTT)-bande passante du canal de communica-tion lrsquoutilisation de TCP sur un reacuteseau LFN a des conseacutequences neacutegatives sur la perfor-mance Les causes sont agrave chercher du cocircteacute du RTT et du produit deacutelai-bande passante quiprennent tous les deux des valeurs importantesDans le cas du RTT crsquoest le deacutelai de reacuteactiviteacute de TCP qui est impacteacute En effet quandle RTT est eacuteleveacute la dynamique de TCP est ralentie car lrsquoeacutemetteur TCP doit attendre pluslongtemps pour recevoir un ACK et savoir quoi faire par la suite

Pour ce qui concerne le produit deacutelai-bande passante crsquoest le deacutebit eacutecouleacute qui peutecirctre faible par rapport au deacutebit du canal de communication (sa bande passante) La fe-necirctre drsquoeacutemission de TCP nrsquoatteint pas la valeur du produit deacutelai-bande passante lrsquoeacutemet-teur se trouve alors bloqueacute en attente de lrsquoACK pour eacutemettre de nouvelles donneacutees Cespeacuteriodes de blocage concourent agrave faire chuter le taux drsquoutilisation du canal de communi-cation

Par la suite nous allons deacutetailler les conseacutequences de la faible reacuteactiviteacute et drsquoune fe-necirctre drsquoeacutemission importante agrave atteindre sur lrsquoefficaciteacute de TCP La probleacutematique se poseen terme de deacutemarrage de connexion et son implication pour le transfert des flots courtsde taille maximale possible de la fenecirctre de congestion et de reacutesolution de la congestion

Le deacutemarrage de connexion

Le deacutebut des connexions de TCP se fait agrave lrsquoaide de lrsquoalgorithme du deacutemarrage en dou-ceur Nous avons vu preacuteceacutedemment que ce meacutecanisme double la fenecirctre de congestionen un RTT Lorsque la fenecirctre de congestion atteint la valeur seuil ssthresh lrsquoalgorithmedrsquoeacutevitement de congestion est utiliseacute La valeur initiale du seuil est fixeacutee arbitrairementce qui soumet TCP agrave deux problegravemes Le doublement de la fenecirctre de congestion quandelle atteint des valeurs importantes constitue des increacutements avec une granulariteacute de plusen plus grosse Si la valeur de ssthresh est trop grande par rapport au BDP avec un grosincreacutement le deacutepassement du BDP peut conduire agrave eacutemettre trop de paquets causantdes pertes multiples induisant une augmentation de la latence et une reacuteduction du deacute-bit eacutecouleacute Dans le cas ougrave la valeur du ssthresh est trop basse par rapport au BDP la

15

connexion TCP va utiliser preacutematureacutement lrsquoalgorithme drsquoeacutevitement de congestion avecune increacutementation lineacuteaire Ce changement preacutematureacute aura pour conseacutequence une sous-utilisation de lrsquoalgorithme de deacutemarrage en douceur speacutecialement dans le cas ougrave le BDPest tregraves eacuteleveacute [Wang2004]

Le deacutemarrage de connexion est particuliegraverement important pour les flots courts TCP(short lived TCP flow) Un flot court TCP se deacutefinit comme un flot dont la taille est in-feacuterieure ou eacutegale agrave 10 segments TCP [Sallantin2014] La probleacutematique des flots courtsprovient du fait qursquoils nrsquoont pas assez de donneacutees pour quitter lrsquoeacutetape du deacutemarrage endouceur En effet la taille de la fenecirctre de congestion nrsquoa pas le temps drsquoatteindre la va-leur du produit deacutelai-bande passante que la totaliteacute des donneacutees ont eacuteteacute transmises Laconseacutequence est qursquoils ont fonctionneacute avec une fenecirctre de congestion qui est resteacutee rela-tivement petite Dans le cas drsquoun LFN le rapport de la taille de la fenecirctre de congestionsur le produit deacutelai-bande passante tend vers zeacutero et neacutecessite plusieurs RTT Il srsquoensuitque le deacutebit eacutecouleacute est extrecircmement faible De plus si le flot court souffre drsquoun eacuteveacutene-ment de congestion il sera particuliegraverement peacutenaliseacute Il a de fortes chances que la reprisesrsquoeffectue avec un RTO avec un deacutelai maximum de 1 agrave 3 secondes [RFC6298] Ce genrede flots nrsquoa pas toujours assez de donneacutees eacutemises apregraves la perte pour geacuteneacuterer trois Du-pAck et proceacuteder agrave une reprise par fast retransnmit Comme ces flots repreacutesentent drsquoapregraves[Ciullo2009] 90 des flux preacutesents dans lrsquoInternet leur sous-performance sur les LFN estprobleacutematique

La reacutesolution de la congestion

TCP deacutetecte une perte par lrsquoexpiration du RTO ou par la reacuteception de trois DupAckTCP va reacuteagir en deux temps en renvoyant le paquet perdu et en divisant par deux lafenecirctre de congestion Si la taille de la fenecirctre est importante la division par deux vaentraicircner une chute significative de la capaciteacute drsquoenvoi Par rapport au produit deacutelai-bande passante cette division par deux peut entraicircner une sur-reacuteaction de lrsquoeacutemetteur Ledeacutebit eacutecouleacute apregraves un eacuteveacutenement de congestion peut devenir faible et se pose le problegravemede la dynamique de sondage

Dynamique du sondage

TCP a un objectif de performance en terme de deacutebit eacutecouleacute et drsquoutilisation des capa-citeacutes de transmission du reacuteseau TCP possegravede un comportement conservateur Avec lafonction de controcircle AIMD TCP aura besoin drsquoun cycle eacutegal agrave ω2 RTT pour reacutecupeacutererune taille de fenecirctre eacutegale agrave celle avant reacuteduction Dans les reacuteseaux agrave forte capaciteacute destockage TCP tend agrave ecirctre trop prudent agrave ouvrir sa fenecirctre de congestion trop lentementLa capaciteacute de stockage importante demande un nombre de cycles important pour quela fenecirctre de congestion puisse couvrir le BDP Durant ce temps il est important de nepas avoir de pertes Lrsquoexemple donneacute par le [RFC3649] preacutesente un reacuteseau agrave une capa-citeacute de 10 Gbits un deacutelai de 100 ms et une taille de paquets drsquoun maximum de 1500octets Cela demanderait un eacutechange drsquoune dureacutee de deux heures environ De plus la to-taliteacute des paquets devront ecirctre transmis dans la dureacutee indiqueacutee preacuteceacutedemment Le tauxde perte maximal permettant lrsquousage de la totaliteacute de la bande passante est de lrsquoordrede 10minus10 Crsquoest un taux de perte irreacutealiste Il faut donc appliquer une autre fonction decontrocircle pour utiliser efficacement la capaciteacute des liens et pour reacutepondre rapidement auxchangements drsquoeacutetats du reacuteseau

16

113 Un controcircle de congestion de TCP adapteacute aux LFN

Pour rappel dans la partie 111 nous avons vu que le controcircle de congestion de TCPse deacutecoupait en deux phases La premiegravere phase de congestion avoidance comporte les al-gorithmes de sondage alors que la seconde phase dite de congestion recovery comporte lesalgorithmes de reacutesolution de la congestion Nous preacutesentons les propositions qui visentagrave changer le controcircle de congestion de TCP sur ces deux phases pour les adapter auxcontraintes des LFN et donc traiter les problegravemes que nous avons mis en eacutevidence dansla sous-section 112 Lrsquoutilisation de TCP sur des reacuteseaux agrave forte capaciteacute de stockage asusciteacute des propositions qui sont classeacutees dans le tableau 11 Ces propositions vont ecirctredeacutetailleacutees dans la suite de ce manuscrit

TABLE 11 ndash Tableau de synthegravese des propositions

Phase Problegraveme SolutionsCongestion avoidance Deacutemarrage de

connexionInitial Spreading Reacuteduc-tion du RTO Quick-startJump Start

Congestion recoveryReacutesolution decongestion

MulTCP

Dynamique dusondage

HighSpeed TCP C-TCPBIC CUBIC

Le deacutemarrage de connexion

Lrsquoideacutee de la premiegravere solution est de reacuteduire le nombre de cycles au deacutemarrage drsquounflot Le doublement de la taille lorsque la fenecirctre de congestion vaut 2 segments parexemple conduit agrave un increacutement qui reste faible sur un RTT Le principe de la premiegraveresolution est drsquoaugmenter la taille initiale de la fenecirctre de congestion (Initial Window (IW))[RFC6928] Avec une taille initiale de fenecirctre de congestion eacutequivalent agrave 10 Maximun Seg-ment Size (MSS) lrsquoeacutemetteur peut transmettre degraves le deacutebut de connexion une rafale de 10segments Parmi les avantages de cette solution on peut citer la reacuteduction de la latencedu transfert de donneacutees en consideacuterant que le canal ne sera pas congestionneacute Un des in-conveacutenients de cette solution est la possibiliteacute de congestionner la file drsquoattente du goulotdrsquoeacutetranglement Afin de reacutesoudre ce problegraveme [Sallantin2014] propose lrsquoInitial SpreadingCette proposition combine lrsquoaugmentation de la fenecirctre drsquoeacutemission et le meacutecanisme drsquoes-pacement meacutecanisme limitant la preacutesence de rafales Ces travaux ont fait lrsquoobjet drsquouneproposition aupregraves de lrsquoInternet Engineering Task Force (IETF) [Arnal2014]

La deacutetection drsquoune perte au deacutepart du deacutemarrage en douceur se fait agrave travers lrsquoex-piration du RTO soit trois secondes Pour ameacuteliorer la reprise sur erreur le [RFC6298]propose de reacuteduire la dureacutee du RTO agrave une seconde Cette reacuteduction du RTO autorise uneretransmission plus rapide des paquets perdus et apporte un gain relativement importantpour des flots qui ont une latence tregraves faible comme celle des flots courts

Une autre solution eacutevalueacutee par [Scharf2008-1] et deacutecrite par le [RFC4782] se nommeQuick-start Lrsquoeacutemetteur eacutemet une requecircte contenant le deacutebit drsquoeacutemission qursquoil souhaite uti-liser Chaque nœud traverseacute peut alors accepter rejeter ignorer ou modifier la requecircteen fonction de son deacutebit disponible Pour bien fonctionner ce meacutecanisme de neacutegociationneacutecessite que lrsquoensemble des routeurs traverseacutes aient reacutepondu agrave la requecircte La figure 15compare les performances du deacutemarrage en douceur (en rouge) et de Quick-start sur unteacuteleacutechargement vu depuis le serveur Le serveur a eacutemis deux requecirctes la premiegravere agrave undeacutebit de 8192 Mbits (en vert) et lrsquoautre pour un deacutebit drsquoune valeur de 512 Mbits (en

17

bleu) Lrsquoaxe des abscisses repreacutesente la latence (dureacutee de la connexion) depuis lrsquoeacutemissionde la demande drsquoeacutetablissement de connexion et en ordonneacutee le deacutebit drsquoeacutemission Les deacute-bits ont eacuteteacute calculeacutes agrave partir de la quantiteacute de donneacutees moyenne eacutemises en un RTT Les reacute-sultats montrent des performances supeacuterieures de Quick-start par rapport au deacutemarrageen douceur En effet une requecircte de Quick-start avec un deacutebit suffisamment eacuteleveacute per-met drsquoatteindre rapidement lrsquoutilisation maximale de la bande passante disponible Ledeacutemarrage en douceur limite la croissance du deacutebit drsquoeacutemission On remarque eacutegalementque si la valeur seuil du deacutemarrage est trop basse le deacutebit drsquoeacutemission croicirct beaucoupmoins rapidement (lien en pointilleacute sur la figure 15) Quick-start reste performant sur lesflots courts en appliquant un deacutebit drsquoeacutemission qui sera eacutequivalent agrave un flot long

FIGURE 15 ndash Principe de Quick-Start (Source [Scharf2008-1])

Dans lrsquoarticle [Liu2007] lrsquoauteur preacutesente Jump Start Cette proposition reacutealise uneestimation des donneacutees precirctes agrave ecirctre envoyeacutees ainsi que du RTT Lrsquoobjectif est drsquoeacutemettreles segments de faccedilon reacuteguliegravere en un RTT Ce meacutecanisme srsquoavegravere trop agressif dans lesenvironnements congestionneacutes Le nombre de segments envoyeacutes en un RTT peut ecirctreimportant et ainsi causer de seacutevegraveres deacutegradations de performance

La reacutesolution de la congestion

Quand TCP a atteint lrsquoeacutetat stable et qursquoune perte est deacutetecteacutee la fenecirctre de conges-tion va ecirctre diviseacutee par deux Cette reacuteduction diminuera le deacutebit eacutecouleacute Il est importantpour TCP drsquoecirctre reacuteactif vis agrave vis des pertes Pour cela de nouveaux algorithmes doiventecirctre mis en place dans la phase drsquoeacutevitement de congestion Ces algorithmes devront ecirctrereacuteactifs aux pertes mais sans sur-reacuteagir Ces nouveauteacutes doivent permettre de retrouverrapidement un deacutebit eacutecouleacute important

Lorsque plusieurs flux TCP empruntent une route congestionneacutee ils sont soumis aumecircme taux de pertes Le but eacutetant de reacutepartir eacutequitablement la bande passante dispo-nible Une approche de diminution moins agressive de la fenecirctre de congestion consistea reacutealiser des connexions TCP parallegraveles Lrsquoobjectif est drsquoavoir un flux TCP se comportantcomme lrsquoagreacutegation de plusieurs flux

Dans lrsquoarticle [Crowcroft1998] les auteurs proposent une version du controcircle de conges-tion de TCP qui se comporte drsquoune maniegravere eacutequivalente agrave N sessions TCP parallegraveles Ilsrsquoagit de MulTCP MulTCP geacutenegravere un flux TCP unique ougrave les sessions virtuelles sont reacute-parties uniformeacutement afin drsquoobtenir le reacutesultat maximal en terme de deacutebit Le controcircle decongestion de TCP change lorsqursquoil utilise lrsquoalgorithme drsquoeacutevitement de congestion et qursquoil

18

deacutetecte un eacuteveacutenement de congestion (par deacutetection drsquoau moins une perte drsquoun segmentdans une fenecirctre de congestion) Les eacutequations suivantes sont utiliseacutees dans chacun descas MulTCP

ACK ω larr ω +N

ω

DROP ω larr ω times (1minus 1

2N)

(12)

En eacutevitement de congestion lorsqursquoun ACK est reccedilu MulTCP augmente sa fenecirctre decongestion (ω) de N segments par RTT Lors de la perte de segments (DROP) MulTCPreacuteduit sa fenecirctre de ω(2N) plutocirct que la valeur par deacutefaut de ω2 La figure 16 montrelrsquoeacutevolution de la fenecirctre de congestion de MulTCP par rapport agrave TCP On voit sur la fi-gure 16 que MulTCP a de meilleures performances qursquoun flux TCP normal Lorsque lesperformances sont combineacutees le reacutesultat est supeacuterieur agrave un flux unique

FIGURE 16 ndash Simulation de MulTCP avec N=5 (Source [Huston2006])

Dynamique du sondage

Lrsquoobjectif de lrsquoeacutemetteur de TCP est drsquoenvoyer le plus de donneacutees le plus vite possibleMais agrave condition qursquoelles arrivent sans produire de la congestion sinon les donneacutees se-ront perdues et il faudra les reacute-eacutemettre Il faut eacutegalement tenir compte des autres flotsen partageant eacutequitablement les ressources du reacuteseau Une approche pour traiter le pro-blegraveme de la dynamique du sondage consiste agrave changer la fonction de controcircle de TCP

Lrsquoobjectif de HighSpeed-TCP (HS-TCP) est drsquoatteindre les hauts deacutebits en ayant desperformances comparables agrave TCP classique dans les environnements agrave faible BDP [RFC3649]La version du controcircle de congestion HighSpeed-TCP utilise le meacutecanisme drsquoAdditive In-crease and Multiplicative Decrease combineacute agrave un facteur calculeacute en fonction de la taille dela fenecirctre de congestion tel qursquoindiqueacute par les eacutequations 13 En deccedila drsquoun certain seuilde ω la reacuteponse de HighSpeed-TCP est eacutequivalente agrave TCP Reno HS-TCP est limiteacute durantla phase de deacutemarrage en douceur Durant cette phase HS-TCP peut normalement en-voyer un grand nombre de paquets Lrsquoenvoi drsquoun trop grand nombre de donneacutees risquedrsquooccasionner de la congestion Le [RFC3742] propose de limiter agrave 100 paquets la capaciteacutedrsquoenvoi drsquoHS-TCP durant la phase de deacutemarrage en douceur

ACK ω larr ω +α(ω)

ωDROP ω larr (1minus β(ω))times ω

(13)

19

La figure 17 illustre le comportement de la fenecirctre de congestion de HighSpeed-TCPLorsqursquoune perte est deacutetecteacutee la diminution de la fenecirctre est moins importante gracircceau facteur β Le retour a la valeur preacuteceacutedente se fait beaucoup plus rapidement qursquoavecReno ou NewReno (en gris clair sur la figure) gracircce au facteur α Ainsi HS-TCP offre unemeilleure utilisation de la capaciteacute disponible sur le lien

FIGURE 17 ndash Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source [Afanasyev2010])

Dans [Tan2006] lrsquoauteur propose une version de TCP alliant lrsquoapproche pro-activeet reacuteactive Une approche pro-active utilise les variations du RTT pour estimer lrsquoeacutetat dureacuteseau Alors qursquoune approche reacuteactive agit quand lrsquoeacuteveacutenement de congestion srsquoest pro-duit Lrsquoobjectif est de maintenir de bonnes performances sur reacuteseaux avec un haut deacutebitet un grand RTT Compound-TCP (C-TCP) maintient deux fenecirctres de congestion Lrsquounecroicirct de faccedilon lineacuteaire mais deacutecroicirct via un certain coefficient en cas de perte La secondefenecirctre est lieacutee agrave lrsquoapproche pro-active de TCP-Vegas [Brakmo1994] La taille de la fenecirctrede congestion reacuteellement utiliseacutee est la somme des deux fenecirctres Lrsquoeacutequation 14 illustrecette addition

ACK ω larr ωreno + ωfast (14)

Si le RTT est bas alors la fenecirctre ωfast va croicirctre rapidement Si C-TCP rencontre uneperte alors ωreno diminuera rapidement pour compenser lrsquoaugmentation preacuteceacutedente deωfast Ce systegraveme cherche agrave garder une valeur constante de la fenecirctre drsquoeacutemission C-TCPutilise efficacement des liens sur les reacuteseaux agrave forte capaciteacute de stockage C-TCP est sujetau mecircme deacutefaut que TCP-Vegas sur lrsquoexactitude des mesures RTT Si les flux en concur-rence les uns avec les autres dans le reacuteseau observent des valeurs RTT minimales diffeacute-rentes le flux se voyant un RTT plus eacuteleveacute sera beaucoup plus agressif et injuste pourlrsquoautre flux La figure 18 illustre le fonctionnement de la fenecirctre de congestion de C-TCPLa partie convexe de la courbe repreacutesente un fonctionnement plus proche de TCP RenoCela indique donc une valeur de ωfast faible Nous remarquons qursquoapregraves une perte TCPessaye de reacutecupeacuterer rapidement la valeur preacuteceacutedente Lors de pertes multiples la fenecirctrede congestion suit une forme proche agrave ce moment de la courbe de HighSpeed-TCP (voirfigure 17) Ce comportement est la conseacutequence drsquoune valeur eacuteleveacutee de ωfast C-TCP per-met ainsi drsquoatteindre le deacutebit maximum disponible sur le lien tout en lissant sa capaciteacutedrsquoenvoi en se basant sur le RTT C-TCP est la version de TCP installeacutee nativement sur lesystegraveme drsquoexploitation Windows de Microsoft

Lrsquoalgorithme de controcircle de congestion de TCP connu sous le nom Binary IncreaseCongestion control (BIC) vise agrave une convergence rapide [Xu2004] La fenecirctre doit atteindrela taille maximale possible sans qursquoil y ait de pertes Pour cela il met en œuvre une nou-velle fonction du controcircle de la taille de la fenecirctre de congestion La fonction de controcircle

20

FIGURE 18 ndash Comportement de la fenecirctre de congestion de Compound-TCP (Source [Afanasyev2010])

de BIC est structureacutee en trois phases (Additive Increase Binary Search Max Probing) tellesqursquoillustreacutees par la figure 19a Au deacutemarrage de la connexion BIC va increacutementer lineacuteai-rement la fenecirctre de congestion Crsquoest la phase drsquoAdditive Increase

Durant la phase Binary Search BIC va essayer de deacutecouvrir la taille optimale de lafenecirctre de congestion La taille optimale est la taille permettant drsquoeacutemettre le maximum dedonneacutees sans essuyer de pertes Elle se base sur lrsquoeacutetude entre la valeur minimale (ωmin)et la valeur maximale (ωmax) de la fenecirctre de congestion Ces variables vont permettredrsquoaffiner la valeur de la fenecirctre de congestion Au deacutebut de la connexion ωmin est mise agrave1 et ωmax est mis arbitrairement agrave une valeur eacuteleveacutee

Lorsqursquoune perte est deacutetecteacutee la fenecirctre de congestion va ecirctre reacuteduite et prendre pourvaleur la moyenne entre ωmin et ωmax ωmin prend alors pour valeur la taille de la fenecirctrede congestion apregraves reacuteduction et ωmax la valeur de la fenecirctre de congestion avant la perteSi lrsquoeacutecart entre la valeur de la fenecirctre de congestion avant et apregraves la perte est supeacuterieuragrave une constante Smax alors la fonction de controcircle de BIC entre en phase dite AdditiveIncrease Durant cette phase Smax va servir de valeur drsquoincreacutementation pour la fenecirctrede congestion agrave chaque RTT Par la suite et si aucune perte nrsquoest de nouveau deacutetecteacuteela fonction de controcircle de BIC retourne en phase de Binary Search Lrsquoobjectif est de stabi-liser la taille de la fenecirctre aux alentours de la valeur de ωmax rencontreacutee avant la pertepreacuteceacutedente

Lorsque cette valeur est deacutepasseacutee BIC entre dans la phase dite Max Probing Lrsquoaug-mentation de la fenecirctre de congestion est alors lineacuteaire Lrsquoobjectif eacutetant la recherche drsquounnouvel ωmax La figure 19b illustre le fonctionnement de la fenecirctre de congestion dansle temps Lors du deacutebut de connexion BIC se comporte comme Reno avec le meacutecanismedu deacutemarrage en douceur Degraves qursquoune perte est deacutetecteacutee la diminution de la fenecirctre estalors moins agressive qursquoavec Reno Au centre de la courbe nous remarquons la fonctiondrsquoaccroissement avec les trois phases

BIC est un controcircle de congestion performant dans les reacuteseaux agrave forte capaciteacute destockage Neacuteanmoins BIC peut ecirctre trop agressif pour les flux qui ont des courts deacutelaisCela a pour conseacutequence un partage ineacutequitable de la bande passante disponible avec lesflux qui ont des longs deacutelais

Afin de reacutesoudre le problegraveme drsquoiniquiteacute lieacute au RTT lrsquoalgorithme CUBIC propose dechanger la fonction de controcircle de la taille de la fenecirctre de congestion pour la rendreplus agressive La fonction retenue est cubique et son eacutevolution est repreacutesenteacutee par la fi-gure 110a Contrairement agrave la figure drsquoaccroissement de BIC (fig 19a) qui comporte troisphases la fonction drsquoaccroissement de CUBIC nrsquoen compte que deux (fig 110a) Sur lafigure 110b on constate que ces deux phases sont preacutesentes tout au long de lrsquoeacutevolutionde la fenecirctre de congestion de CUBIC Ces deux phases ne sont pas forceacutement conseacute-cutives lrsquoune de lrsquoautre Apregraves la deacutetection drsquoune perte CUBIC va essayer de croicirctre le

21

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez BIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deBIC-TCP (Source [Afanasyev2010])

FIGURE 19 ndash Fonctionnement de BIC TCP

plus rapidement possible jusqursquoagrave ωMax Lorsque ωMax est atteint la taille de la fenecirctre vasrsquoincreacutementer lentement Mais plus la valeur drsquoω est eacuteloigneacutee en taille de ωMax plus lacroissance va srsquoacceacuteleacuterer Lrsquoavantage de CUBIC sur BIC est le remplacement la fonction decontrocircle lineacuteaire par une fonction cubique pour plus drsquoagressiviteacute Lrsquoalgorithme CUBICest deacutecrit par le [RFC8312]

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez CUBIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deCUBIC-TCP (Source [Afanasyev2010])

FIGURE 110 ndash Fonctionnement de CUBIC

114 Controcircle de congestion avec implication des routeurs

Drsquoautres approches ont eacuteteacute eacutetudieacutees pour aider le controcircle de congestion de TCP Cesapproches impliquent les routeurs et ne reposent plus que sur le principe de bout-en-boutpropre agrave TCP

Explicit Congestion Notification (ECN) vise agrave renforcer lrsquoindication drsquoun eacuteveacutenement decongestion [RFC3168] Avec ECN la congestion est signaleacutee avant que la perte drsquoun pa-quet ne se produise Lors de la reacuteception drsquoun paquet indiquant une congestion lrsquoeacutemet-teur va alors reacuteduire sa fenecirctre de congestion et sa fenecirctre drsquoeacutemission La reacuteduction dela capaciteacute drsquoeacutemission de lrsquoeacutemetteur eacutevitera pertes et retransmissions et une reacuteductiondes deacutelais de reprise Lrsquousage de cette option neacutecessite que lrsquoeacutemetteur le reacutecepteur et lesrouteurs du chemin soient capables de geacuterer les notifications explicites Avec ECN lrsquoin-formation de congestion est transmise agrave lrsquoeacutemetteur Aucune indication sur le lieu preacutecisde la congestion est indiqueacutee

eXplicit Control Protocol (XCP) est un protocole de controcircle de congestion utilisantles notifications explicites de deacutebit [Katabi2002] En cela il reprend lrsquoideacutee de Quick-startCependant il se diffeacuterencie par le deacutecouplage opeacutereacute entre la probleacutematique du partageeacutequitable entre les flots et celle de lrsquoefficaciteacute du transfert Dans lrsquoarchitecture de proto-coles XCP se situe entre TCP et IP XCP repose sur un en-tecircte qui va servir aux routeurs

22

traverseacutes pour indiquer le deacutebit drsquoeacutemission pour le flot La valeur drsquoadaptation de la fe-necirctre de congestion est calculeacutee agrave partir des informations contenues dans lrsquoen-tecircte XCPXCP propose un controcircle de congestion qui fonctionne sur un reacuteseau 100 XCP Uneseconde limite est lrsquoiniquiteacute avec les autres protocoles de transport Les performancessont fortement deacutegradeacutees si diffeacuterents protocoles de bout en bout sont exeacutecuteacutes dans lemecircme reacuteseau tels que TCP XCP possegravede de mauvaises performances si des routeurs IPclassiques (non-XCP) se trouvent au niveau du goulot drsquoeacutetranglement

Afin de reacutesoudre le problegraveme drsquointeropeacuterabiliteacute Dans [Lopez2006] lrsquoauteur proposeXCP-interoperable (XCP-i) une version XCP qui garde les meacutecanismes de controcircle XCPsans ajouter drsquoeacutetat de flux Lrsquoobjectif drsquoXCP-i est de deacuteployer XCP sur un reacuteseau com-prenant des routeurs XCP et non-XCP Pour cela XCP-i va fonctionner en deux phasesDans une premiegravere phase il va deacutecouvrir les nuages non-XCP Un nuage non-XCP est unensemble de routeurs non capables de traiter XCP En comparant les champs Time-To-Live(TTL) drsquoIP et drsquoXCP le nombre de routeurs non-XCP preacutesents dans le reacuteseau peut ecirctredeacuteduit La seconde phase consiste agrave deacuteterminer les ressources du nuage non-XCP En ra-joutant un champ last_xcp_routeur XCP-i garde en meacutemoire lrsquoadresse du dernier routeurXCP traverseacute Agrave partir drsquoalgorithmes drsquoestimation de bande passante la bande passantedu nuage non-XCP sera estimeacutee entre les deux nœuds XCP La derniegravere phase pour reacutea-liser une inter-opeacuterabiliteacute complegravete entre routeurs classiques et routeurs XCP consiste agraveprendre en consideacuteration la bande passante estimeacutee dans les calculs du feedback de XCPLe protocole XCP-i va creacuteer un routeur XCP virtuel agrave la place du nuage non-XCP Gracirccea ces meacutecanismes un reacuteseau heacuteteacuterogegravene devient virtuellement homogegravene pour XCP Lesperformances de XCP-i sont comparables agrave celle de XCP [Lopez2006] XCP-i reacutesout leproblegraveme drsquointer-opeacuterabiliteacute de XCP sur des reacuteseaux non 100 XCP

Ces solutions preacutesentent le deacutesavantage de devoir ecirctre deacuteployeacutees eacutegalement au seindes routeurs Le principal avantage de ces solutions est une indeacutependance au deacutelai Lesprobleacutematiques lieacutees au deacutelai que lrsquoon a preacutesenteacutees preacuteceacutedemment sont alors inopeacute-rantes Dans le cadre de La Reacuteunion les deacutelais peuvent ecirctre importants

115 Caracteacuterisation de La Reacuteunion

Lrsquoaugmentation des deacutebits drsquoaccegraves srsquoaccompagne de lrsquoaugmentation de la capaciteacute desliens drsquointerconnexion comme celles des cacircbles sous-marins Malgreacute cette augmentationdes deacutebits le temps de propagation reste inchangeacute Dans cette partie nous deacuteterminonsagrave partir de quel deacutebit un accegraves Internet agrave La Reacuteunion peut ecirctre sujet aux problegravemes ren-contreacutes sur les LFN

Dans la section 21 nous avons vu que La Reacuteunion est raccordeacutee agrave Internet par deuxaccegraves reposant sur des cacircbles sous-marins le SAFE et le LION Le cacircble SAFE est prolongeacutepar le cacircble SAT-3WASC Le temps de propagation (tp) sur un cacircble peut ecirctre estimeacutepar la formule matheacutematique 15 dans laquelle d repreacutesente la distance et c la vitesse depropagation du signal sur le support

tp =d

c(15)

Si nous retenons la route directe entre La Reacuteunion et la France hexagonale qui passepar le plus long des accegraves constitueacute par les cacircbles SAFE et SAT-3WASC Sachant que lecacircble SAFE a une longueur totale de 13 500 km pour aller de lrsquoAfrique du Sud agrave lrsquoAsie Sion fait lrsquohypothegravese que lrsquoicircle de La Reacuteunion se situe agrave une distance eacutequivalente agrave la moitieacutedu cacircble SAFE La longueur du cacircble pour La Reacuteunion est de 6 750 Km La vitesse de

23

propagation du signal pour une fibre optique est eacutegale agrave la vitesse de la lumiegravere (299 792Kms) Lrsquoapplication de la formule 15 donne tp1 avec

tp1 = 12times dSAFEc = 22 52ms (16)

tp1 approxime le temps de propagation entre La Reacuteunion et le point de sortie du cacircbleSAFE en Afrique du Sud ou en Asie Pour obtenir le RTT ce temps est agrave doubler Onobtient alors la valeur RTT1 = 45 04 ms

La seconde partie du trajet de lrsquoAfrique du Sud jusqursquoen Europe emprunte le cacircbleSAT-3WASC Drsquoapregraves [Cablesmap] la longueur du cacircble est de 14 350 Km Le temps depropagation entre lrsquoAfrique du Sud et lrsquoEurope noteacute tp2 srsquoexprime comme

tp2 = (dSATminus3WASC)c = 47 87ms (17)

Le RTT sur ce cacircble est de RTT2 = 95 74 msAu total le RTT incompressible pour joindre lrsquoEurope en passant par les cacircbles SAFESAT-3WASC consiste agrave additionner le RTT de chaque cacircble agrave savoir RTT1 et RTT2 Le RTTincompressible est donc minimal de 140 78ms Ce deacutelai comme nous venons de le calcu-ler ne prend en compte que la propagation Il neacuteglige le temps de transmission du paquetainsi que les temps drsquoattente avant la transmission

Lrsquoeacutetude preacutesenteacutee dans[Anelli2012] a mesureacute un RTT minimal pour les paquets quit-tant lrsquoicircle de La Reacuteunion de 185 ms Ce reacutesultat a eacuteteacute obtenu par une eacutetude de mesuresdepuis les locaux de lrsquoUniversiteacute de La Reacuteunion La figure 111 repreacutesente la Probabi-lity Density Function (PDF) des RTT mesureacutes Cette fonction est compareacutee agrave celle qui estobtenue depuis la France hexagonale et de Paris en particulier On constate une forte si-militude sur la forme des courbes La courbe de La Reacuteunion enregistre un deacutecalage dansle temps de 185 ms par rapport agrave celle de Paris Ce deacutecalage repreacutesente le RTT minimummesureacute pour rejoindre la meacutetropole et acceacuteder agrave lrsquoInternet

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

FIGURE 111 ndash Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

Si lrsquoon considegravere la valeur de BDP de 12 5 Ko indiqueacutee par le [RFC1072] comme lalimite basse drsquoun LFN et si nous reprenons les diffeacuterentes TAI preacutesenteacutees dans la section21 nous pouvons calculer le produit deacutelai-bande passante drsquoun canal de communica-tion entre La Reacuteunion et la meacutetropole Il est fait lrsquohypothegravese pour ce calcul que le goulotdrsquoeacutetranglement est donneacute par lrsquoaccegraves agrave Internet Le tableau 12 preacutesente les reacutesultats ob-tenus

24

TABLE 12 ndash Approximation du produit deacutelai bande passante de la connectiviteacute de LaReacuteunion agrave lrsquoInternet

NomhhhhhhhhhhhhhhhhhhhBande passante

RTT (en secondes)Estimeacute 0141

Mesureacute 0185

Modem56 Kbits 987 o 130 Ko128 Kbits 226 Ko 296 Ko512 Kbits 902 Ko 118 Ko

ADSL1 Mbits 176 Ko 231 Ko8 Mbits 141 Ko 185 Ko20 Mbits 353 Ko 463 Ko

VDSL 50 Mbits 881 Ko 116 Mo

Fibre

35 Mbits 617 Ko 809 Ko100 Mbits 176 Mo 231 Mo200 Mbits 353 Mo 463 Mo

1 Gbits 176 Mo 231 Mo

Le tableau preacutesente en gras les produits deacutelai-bande passante deacutepassant la limite des12 5 Ko Ainsi les reacutesultats sont assez eacuteloquents Degraves que lrsquoon arrive sur un accegraves ADSLavec un deacutebit minimal drsquo1 Mbits nous avons un BDP supeacuterieur agrave la limite fixeacutee par le[RFC1072] Ainsi rapidement lrsquoeacutevolution des deacutebits proposeacutes sur lrsquoicircle et les capaciteacutes descacircbles sous-marins associeacutes agrave un deacutelai eacuteleveacute ont fait de lrsquoInternet reacuteunionnais un reacuteseauqui a les caracteacuteristiques drsquoun LFN

Nous avons vu que TCP est un protocole de transport dont la performance est deacutepen-dante du RTT et du BDP Les deacutelais sont une des caracteacuteristiques des LFN La Reacuteunionest un reacuteseau agrave forte capaciteacute de stockage due agrave des deacutelais importants Il est important demesurer pour comprendre lrsquoimpact de cette caracteacuterisation sur les performances de TCP

12 Meacutetrologie du trafic Internet

Avec lrsquoInternet qui devient de plus en plus gros et de plus en plus complexe la meacutetro-logie est une activiteacute qui vise agrave mieux comprendre le fonctionnement de lrsquoInternet Nousallons dans cette partie du manuscrit preacutesenter les techniques de meacutetrologie appliqueacuteesagrave lrsquoInternet

121 Deacutefinition

Meacutetrologie est un mot composeacute de deux termes grecs Le premier metron signifie lamesure tandis que logos fait reacutefeacuterence agrave la science Par deacutefinition la meacutetrologie deacutesignela science de la mesure Par la suite le terme meacutetrologie fera uniquement reacutefeacuterence agrave la meacute-trologie appliqueacutee aux reacuteseaux informatiquesLa meacutetrologie signifie donc la mesure des caracteacuteristiques drsquoun reacuteseau sous de nombreuxaspects Cette science est devenue un outil indispensable pour avoir une compreacutehensionde divers aspects de lrsquoInternet On peut citer la complexiteacute la qualiteacute de service et laqualiteacute utilisateur la performance du reacuteseau la performance des protocoles le fonction-nement ou encore la validation des modegravelesLa meacutetrologie Internet englobe deux types drsquoactiviteacutes La premiegravere est lrsquoeacutetude des para-megravetres physiques de la qualiteacute de service La seconde consiste a mettre en eacutevidence lesproblegravemes lieacutes agrave lrsquoInternet [Larrieu2010]

25

Dans [Paxson2001] lrsquoauteur preacutesente lrsquoapproche research driven et lrsquoapproche measure-ment driven pour deacutefinir les objectifs drsquoune eacutetude de meacutetrologie Le choix drsquoune approcheva aider une personne souhaitant faire de la meacutetrologie sur la bonne faccedilon drsquoaborderlrsquoeacutetude qursquoelle veut mettre en place

Lrsquoexpression research driven peut ecirctre traduite par axeacutee sur la recherche Elle consisteagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires de lancer les campagnes de mesures et drsquointerpreacuteter les reacute-sultats Une meacutetrique se deacutefinit comme une grandeur mesurable et speacutecifieacutee de maniegravererigoureuse Une bonne meacutetrique doit pouvoir se mesurer de faccedilon reproductible ecirctreutile en pratique pour les utilisateurs et les administrateurs du reacuteseau [RFC2330] Cetteapproche est celle geacuteneacuteralement utiliseacutee par les opeacuterateurs et les groupes de recherchesElle est deacuteveloppeacutee par le groupe de travail IP Performance Metrics (IPPM) de lrsquoIETF Cegroupe de travail a produit de nombreux documents pour deacutefinir les mesures de per-formances Lrsquoapproche research driven comporte un deacutefaut principal En laissant de cocircteacutecertaines meacutetriques des aspects du comportement du reacuteseau ne sont pas eacutetudieacutes Parexemple une eacutetude restreinte aux deacutelais ne peut indiquer les raisons de la variation desdeacutelais dans le temps

Lrsquoapproche measurement driven peut se traduire en la mesure pour la mesure Cettemeacutethode consiste agrave mettre en place une infrastructure de mesures afin de reacutecupeacuterer lemaximum drsquoinformations puis effectuer toutes les analyses possibles sur les traces col-lecteacutees et interpreacuteter les reacutesultats obtenus Une telle meacutethode peut srsquoutiliser lorsque lrsquoonsouhaite mettre en avant le comportement geacuteneacuteral drsquoun lien Cette approche permet agrave ladiffeacuterence de la preacuteceacutedente drsquoanalyser agrave plusieurs reprises une mecircme source de donneacuteesen fonction des reacutesultats obtenus

Le tableau 13 reacutesume les deux approches de conduite de projet en meacutetrologie

TABLE 13 ndash Comparatif entre les approches de meacutetrologie

Research Driven Measurement Driven1 - Meacutetriques deacutefinies preacutealablement2 - Utilisation drsquoun outil adapteacute

1 - Collecte des donneacutees2 - Analyse exhaustive

Ces deux approches sont compleacutementaires lrsquoune de lrsquoautre et srsquoappliquent dans lesdeux classes de techniques de mesures les techniques de mesures actives et les tech-niques de mesures passives

122 Meacutetrologie active

La meacutetrologie active consiste agrave injecter un trafic speacutecifique et agrave mesurer en reacuteceptionlrsquoeffet sur le reacuteseau agrave eacutetudier Lrsquohypothegravese faite par la meacutetrologie active est que la mesurefaite de bout en bout est reacuteveacutelatrice de la performance du service du reacuteseau telle qursquoellepeut ecirctre perccedilue par une application Les paquets eacutemis sont des sondes qui en emprun-tant la route entre la source et la destination expeacuterimentent la performance du canal decommunication Il convient de limiter le trafic des sondes afin qursquoil ne vienne pas pertur-ber le trafic et donc fausser la mesure Les meacutetriques mesureacutees par les mesures activessont geacuteneacuteralement des meacutetriques associeacutees agrave la topologie du reacuteseau ou au trafic commeles routes ou les deacutelais Dans le cas de la meacutetrologie active il se peut que lrsquoeacutemetteur soiteacutegalement le collecteur La figure 112 illustre ce principe

La meacutetrologie active est opeacutereacutee agrave lrsquoaide drsquooutils speacutecifiques de geacuteneacuteration et de collectede sondes Le tableau 14 indique les meacutetriques obtenues avec les outils de meacutetrologiepreacutesenteacutes par la suite

26

FIGURE 112 ndash Principe de la meacutetrologie active

TABLE 14 ndash Classement des outils

XXXXXXXXXXXOutilMeacutetriques

RTT Routes Deacutebits

Ping XTraceroute X XParis Traceroute X XReverse-traceroute X XTraceIXroute X XPathchar XClink XIperf X

La mesure du RTT est geacuteneacuteralement obtenue par lrsquooutil ping (Packet Internet Groper)Cet outil se preacutesente sous la forme drsquoune commande dans un systegraveme de type Unix Ellesert en premier lieu agrave veacuterifier la connectiviteacute agrave Internet et lrsquoaccessibiliteacute drsquoun nœud Ensecond lieu avec cette veacuterification le RTT et la longueur de la route exprimeacutee en nombrede sauts sont deacutetermineacutes Elle utilise le protocole Internet Control Message Protocol (ICMP)pour effectuer la mesure Un message ICMP Echo request est eacutemis Le destinataire renvoieagrave lrsquoeacutemetteur un message ICMP Echo reply La peacuteriode qui seacutepare lrsquoeacutemission de la reacuteceptiondu coteacute eacutemetteur est mesureacutee

Pour en savoir plus sur la connectiviteacute drsquoun nœud et notamment sur la route emprun-teacutee pour atteindre une destination donneacutee lrsquooutil traceroute offre le moyen de cette deacute-couverte [Jacobson1989-1] Cet outil se preacutesente comme pour ping sous la forme drsquounecommande de type Unix Son principe de fonctionnement est baseacute sur un envoi successifde messages avec un champ TTL du paquet IP qui va croissant Le routeur qui reccediloit unmessage dont le TTL du paquet a atteint la valeur zeacutero envoie un message ICMP TimeExceeded pour reporter lrsquoerreur agrave lrsquoeacutemetteur Par ce message il indique en adresse sourcelrsquoadresse IP de son interface qui a rejeteacute le paquet Ainsi si un paquet ayant un TTL posi-tionneacute agrave n est envoyeacute vers une destination donneacutee le routeur situeacute agrave n sauts de la sourceva faire connaicirctre son adresse IP et ceci tant que le chemin vers la destination est supeacute-rieur agrave n sauts [Crovella2006] Le reacutesultat est lrsquoensemble des nœuds traverseacutes reacutepondantau protocole ICMP De nouveaux outils utilisant le principe de traceroute furent deacutevelop-peacutes pour reacutepondre agrave drsquoautres probleacutematiques comme la preacutesence des points drsquoeacutechangeou encore lrsquoasymeacutetrie des liens

La reacuteponse afficheacutee par la commande traceroute nrsquoest pas la seule route existanteEn exeacutecutant agrave plusieurs reprises la mecircme commande traceroute les reacuteponses obtenuespeuvent ecirctre diffeacuterentes A cause de lrsquoeacutequilibrage de charge (load-balancing) la sortie drsquounrouteur ne sera pas toujours la mecircme Lrsquoeacutequilibrage des charges sert agrave reacutepartir le traficsur diffeacuterents liens Ainsi il est possible que deux paquets provenant de la mecircme sourcevers la mecircme destination nrsquoempruntent pas la mecircme route Sur la figure 113 les liensphysiques entre les diffeacuterents nœuds sont indiqueacutes en rouge Les traits en pointilleacute repreacute-sentent le chemin emprunteacute par les messages ICMP envoyeacutes par la source La figure 113amontre le reacutesultat trouveacute par traceroute La route emprunteacutee est SRC A D DST

27

Traceroute va envoyer 3 paquets avec un champ TTL eacutegal agrave 2 Dans le cas de cet exemplelrsquoensemble des paquets est dirigeacute vers B Ainsi malgreacute lrsquoabsence de liaison physique di-recte entre les nœuds A et D traceroute nous indique la preacutesence drsquoune route entre ceuxdeux eacutequipements Lrsquooutil Paris-traceroute vise agrave traiter ce problegraveme [Augustin2006]La figure 113b montre la route deacutecouverte par Paris-traceroute La route afficheacutee estSRC A C DST On remarque que la route obtenue existe physiquement Pour obte-nir ce reacutesultat Paris-traceroute change le numeacutero drsquoidentification du flux agrave lrsquoeacutemission despaquets ICMP Cette modification oblige les routeurs agrave suivre une seule et unique routeParis-traceroute autorise eacutegalement lrsquoaffichage des numeacuteros de voies logiques MPLS

(a) Traceroute

(b) Paris-traceroute

FIGURE 113 ndash Illustration du pheacutenomegravene drsquoeacutequilibrage des charges

MultiProtocol Label Switch (MPLS) est un meacutecanisme de commutation rapide de pa-quets fondeacute sur des adresses de format fixe et sans structure hieacuterarchique [RFC3031]Ces adresses sont des numeacuteros de voies logiques appeleacutees des eacutetiquettes ou labels (paranglicisme) Dans le cas de lrsquoutilisation de traceroute avec MPLS il faut que le routeurMPLS puisse envoyer un message ICMP Le [RFC4950] documente une simple extensionagrave ICMP pour retourner de lrsquoinformation speacutecifique agrave MPLS autrement dit pour qursquounrouteur MPLS puisse indiquer des informations speacutecifiques agrave MPLS dans le paquet ICMPeacutemis en cas de problegraveme [Donnet2012] a eacutetudieacute les possibiliteacutes offertes par des routeursMPLS

Dans les explicit tunnels la structure interne du tunnel est entiegraverement visible et chaquenœud dans le Label Switched Path (LSP) est marqueacute comme nœud MPLS Dans ce type detunnel le champ ttl-propagate qui est dans lrsquoen-tecircte MPLS des paquets et le [RFC4950] sontappliqueacutes Cela signifie que le champ TTL du datagramme IP est deacutecreacutementeacute agrave chaquerouteur rencontreacuteDans les implicit tunnels le LER drsquoentreacutee active lrsquooption ttl-propagate mais les LSR nrsquoim-pleacutementent pas le [RFC4950] La deacutecreacutementation du TTL est effective mais aucune infor-mation de routeur MPLS nrsquoest visibleDans les opaque tunnels crsquoest lrsquoinverse de lrsquoimplicit tunnels Les routeurs impleacutementent le[RFC4950] Le nœud drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Le TTL est alors deacutecreacute-menteacute agrave la sortie du tunnel MPLS Le paquet ICMP-reply indique quand mecircme lrsquoexistencedrsquoun tunnel MPLSPour les invisible tunnels le LER drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Dans ce casle TTL est deacutecreacutementeacute uniquement lors du dernier routeur du tunnel Le [RFC4950] nrsquoestpas impleacutementeacute par le dernier routeur du LSP Cela implique lrsquoabsence drsquoinformation

28

sur le meacutecanisme MPLS au sein des paquets ICMP On nrsquoa alors pas drsquoinformations surlrsquoexistence drsquoun tunnel ICMP sur la route emprunteacutee

Avec lrsquoacheminement avec MPLS des mauvaises valeurs de TTL peuvent ecirctre obte-nues agrave cause du type de tunnel mis en œuvre Il est donc important que le [RFC4950] soitimpleacutementeacute dans les routeurs

FIGURE 114 ndash Taxonomie des configurations de tunnels MPLS et des comportements detraceroute correspondants (Source [Donnet2012] )

Paris-traceroute propose lrsquoaffichage des informations MPLS lorsque celles-ci sont dis-ponibles [Augustin2007] La texte ci-dessous illustre les reacutesultats obtenus par Paris-traceroutesur un Explicit tunnel On y voit lrsquoaffichage des marques MPLS avec le TTL associeacute agravechaque nœud

traceroute [(412131413533456) -gt (818216615733457)]protocol icmp algo hopbyhop duration 3 s1 4121314133 23266 ms 2542 ms 3696 ms2 4121313397 6811 ms 5613 ms 4635 ms3 10322161 5779 ms 6841 ms 4073 msMPLS Label 16445 TTL=1 | 2129964 1032237 2223 ms 2249 ms 2264 msMPLS Label 16386 TTL=2 | 2129965 4121312850 2185 ms 2245 ms 2097 msMPLS Label 16442 TTL=3 | 2129966 10322193 3551 ms 9330 ms 7775 ms7 41213133158 2337 ms 3088 ms 2250 ms8 4121312854 195439 ms 195555 ms 195512 ms9 213242121233 211737 ms 211724 ms 212013 ms10 469148181 234190 ms 234271 ms 234323 ms11 4687222 236854 ms 236798 ms 237063 ms12 213224250110 237108 ms T0 236580 ms T0 236570 msT013 2132242502 237213 ms 236631 ms 236694 ms14 213224201252 239100 ms 239461 ms 238680 ms15 8182166157 250874 ms 249608 ms 248057 ms

Avec traIXroute lrsquoobjectif est de deacutecouvrir les diffeacuterents points de peering (IXP) sur unchemin vers une destination [Nomikos2016] Pour lrsquoidentification des nœuds drsquoeacutechangecette version de traceroute combine deux bases de donneacutees compleacutementaires qui sontPeeringDB [PeeringDB] et Packet Clearing House [PCH] Avec une geacuteolocalisation desadresses retourneacutees la liste des pays traverseacutes peut ecirctre eacutetablie

29

Drsquoapregraves [Steenbergen2009] laquo lrsquooutil de deacutepannage numeacutero 1 pour veacuterifier la connec-tiviteacute drsquoun nœud reste traceroute raquo pour les administrateurs reacuteseaux mais laquo les liens asy-meacutetriques sont les fleacuteaux numeacutero un de lrsquooutil raquo car laquo le chemin de retour est entiegraverementmasqueacute raquo Afin de corriger cela lrsquooutil reverse-traceroute propose drsquoobtenir une routenon pas entre la source et la destination mais entre la destination et la source [Katz2010]pour cela lrsquooutil va utiliser lrsquoenregistrement des adresses IP des routeurs sur le chemindu retour agrave lrsquoaide des options drsquoen-tecircte Record-Route et Timestamp drsquoIP

Pour deacuteterminer le deacutebit pathchar [Jacobson1997] vise agrave donner le deacutebit saut par sautvers une destination Aussi il reprend le principe de traceroute en eacutemettant des sondesavec le champ TTL avec une valeur croissante Lorsqursquoil injecte le trafic de sondes vers unnœud du chemin il le fait avec des paquets de taille variable Ainsi pathchar deacuteterminela bande passante disponible entre chaque nœud rencontreacute

Lrsquooutil Clink [Downey1999] est similaire agrave pathchar La diffeacuterence se fait au niveausur le nombre de paquets envoyeacutes Clink envoie un nombre de paquets plus importantque Pathchar Ainsi les mesures reacutealiseacutees par Clink auront une meilleure preacutecision

Iperf [Tirumala2005] est un outil pour mesurer la bande passante et la qualiteacute drsquounlien reacuteseau Ce dernier est deacutelimiteacute par deux machines sur lesquelles est installeacute IperfUne machine tient le rocircle de serveur tandis que la seconde machine sera parameacutetreacuteecomme client

Pour des mesures plus repreacutesentatives il est neacutecessaire drsquoaugmenter les points decollectes Des outils de meacutetrologie active ont eacuteteacute conccedilus pour ecirctre reacutepartis sur plusieursnœuds Ces outils se preacutesentent sous la forme de plates-formes de meacutetrologie active deacute-ployeacutees agrave travers le monde De nos jours on compte de nombreuses plates-formes demeacutetrologie active Comme chaque plate-forme a un objectif preacutecis et pour identifier laplate-forme approprieacutee pour reacutealiser une eacutetude preacutecise lrsquoauteur de [Bajpai2015-1] effec-tue une comparaison des diffeacuterentes plates-formes selon 5 critegraveres qui sont

1 lrsquoeacutechelle la couverture et la dureacutee de vie de la plate-forme

2 le mateacuteriel physique utiliseacute pour la sonde

3 les meacutetriques disponibles

4 lrsquoarchitecture de mesure de la plate-forme

5 lrsquoimpact de son utilisation pour la recherche

De cette comparaison nous avons gardeacute 4 plates-formes que sont Atlas RIPE NCC BIS-Mark DASU SamKnows Ces plates-formes ont eacuteteacute gardeacutees car elles autorisent lrsquoeacutetudedes performances des reacuteseaux drsquoaccegraves Nous y avons ajouteacute les plates-formes Archipe-lago et Planet-Lab Ces deux plates-formes ne font pas partie du document drsquoorigine maisfont lrsquoobjet drsquoune utilisation par de nombreux participants tel que lrsquoindique le nombrede sondes actives de ces deux plates-formes

En 2007 le CAIDA a deacuteployeacute sa propre plate-forme de mesures [Archipelago] Atravers le deployement de nœuds (des sondes dans le vocabulaire de Archipelago) surlrsquoensemble de la planegravete lrsquoobjectif est drsquooffrir des accegraves pour effectuer des mesures avecdes outils tels que ping et traceroute Archipelago est composeacutee agrave la date du 1er Mars2017 de 170 sondes reacuteparties dans 59 pays et sur tous les continents

Dans le courant de lrsquoanneacutee 2010 le Regional Internet Registry (RIR) europeacuteen RIPENCC a deacutemarreacute la distribution de sondes pour la creacuteation de la plate-forme Atlas [Ripe2010]Cette plate-forme vise agrave creacuteer un reacuteseau de sondes pour lrsquoeacutetude de la connectiviteacute de lrsquoIn-ternet Composeacutee actuellement de pregraves de 10 000 sondes reacuteparties agrave travers le monde elleest capable drsquoeffectuer des tests de meacutetrologie active autour des commandes ping DNSHTTP NTP traceroute et Paris-traceroute

30

Agrave lrsquoinitiative de Georgia Tech la plate-forme Broadband Internet Service Benchmark (BIS-Mark) a vu le jour en 2010 Lrsquoobjectif est la reacutealisation drsquoun eacutetat des lieux des performancesdes accegraves Internet [Sundaresan2011] La plate-forme est composeacutee de 405 routeurs instru-menteacutes avec OpenWrt laquo Le projet OpenWrt est un systegraveme drsquoexploitation Linux ciblantles appareils embarqueacutes OpenWrt fournit un systegraveme de fichiers entiegraverement inscriptibleavec gestion des modules drsquoinstallation de logiciels Cela libegravere la seacutelection et la configu-ration des applications fournies par le fournisseur et permet de personnaliser lrsquoappareilgracircce agrave lrsquoutilisation de progiciels adapteacutes agrave nrsquoimporte quelle application raquo [OpenWrt] Lessondes sont distribueacutees dans 34 pays agrave travers le monde

DASU est un utilitaire deacuteveloppeacute en 2010 agrave lrsquoUniversiteacute de Northwestern Le logicielcouple meacutetrologie active et passive avec pour objectif de caracteacuteriser les performancesdes utilisateurs Lrsquooutil fut deacuteveloppeacute comme une extension drsquoun logiciel peer-to-peer Bit-Torrent [Sanchez2013] Depuis Juillet 2010 plus de 90 000 personnes reacuteparties agrave travers147 pays utilisent DASU

En 2003 des chercheurs ameacutericains ont deacuteployeacute une plate-forme de test Planet-Lab[Chun2003] En 2008 une extension europeacuteenne [PlanetLabEurope] a vu le jour Planet-Lab deacutepasse le seul objectif de meacutetrologie elle vise aussi de tester des nouveaux servicesde communication en situation reacuteelle Les nœuds Planet-Lab ont pour Operating System(OS) Fedora Il est possible drsquoinstaller nrsquoimporte quel logiciel du moment qursquoil est com-patible avec cet OS Avec une certaine liberteacute il est possible drsquoeffectuer des tests et desmesures depuis 425 sites reacutepartis sur tous les continents

La plate-forme SamKnows a vu le jour en 2008 [SamKnows] SamKnows sert agrave lrsquoeacutetudedes performances des connexions des particuliers et des entreprises Elle est composeacuteede pregraves de 440 000 sondes Cette infrastructure est partenaire de 36 Fournisseurs drsquoAccegravesInternet (FAI) de tous les continents

Le tableau 15 reacutesume les possibiliteacutes offertes par les plates-formes La colonne Impactsur la recherche est deacutetermineacutee agrave partir du nombre de citations par des articles scientifiquessuivis par le site Google Scholar

La plate-forme de mesures Atlas RIPE NCC [Ripe2010] a eacuteteacute utiliseacutee dans le contexteinsulaire de Cuba Dans lrsquoarticle [Bischof2015] lrsquoauteur cherche agrave caracteacuteriser lrsquoaccegraves In-ternet cubain Dans ses reacutesultats lrsquoauteur a montreacute une forte asymeacutetrie des routes in-ternationales pour le trafic cubain Drsquoun point de vue de la topologie physique cette icirclepossegravede une connectiviteacute qui peut par certains aspects ressembler agrave de celle de lrsquoicircle de LaReacuteunion

Lrsquoicircle de La Reacuteunion bien que Franccedilaise est rattacheacutee administrativement au RIR dela zone Afrique (AfriNIC) LrsquoAfriNIC est le dernier RIR creacuteeacute et les eacutetudes de meacutetrolo-gie concernant cette zone sont peu nombreuses Nous pouvons citer [Gupta2014] qui sepenche sur lrsquointerconnexion des FAI sur le continent africain Cette eacutetude montre que leseacutechanges de paquets ne se font pas au sein du continent africain mais en Europe La rai-son avanceacutee par lrsquoauteur est un coucirct drsquointer-connexion infeacuterieur en Europe Ces regravegles deroutage on des conseacutequences sur les deacutelais et donc sur les performances sur le servicede transport rendu par TCP Ces reacutesultats ont eacuteteacute confirmeacutes par [Fanou2015] Cette eacutetudesrsquointeacuteresse en plus agrave la stabiliteacute des routes Les reacutesultats ont montreacute que les chemins afri-cains restent stables sur une longue dureacutee Pour les auteurs lrsquoeacutemergence de nouveauxpoints drsquoeacutechanges sur le continent doit aider agrave la reacuteduction des deacutelais agrave conditions queles coucircts drsquointerconnexion soient proches de ceux pratiqueacutes en Europe

Enfin lrsquoarticle [Chavula2017] publieacute en 2017 preacutesente la latence pour les transferts defichiers agrave partir de 53 pays africains diffeacuterents Ces mesures srsquoappuient sur la plate-formeRIPE Atlas [Ripe2010] et Speedchecker [Speechecker] Agrave partir des mesures reacutealiseacutees les

31

TABLE 15 ndash Tableau des plates-formes de mesures de meacutetrologie active

Nom Nombre desondes deacuteployeacutees

Meacutetriques dispo-nibles

Impact sur la re-cherche

Archipelago ~200 Longueur duchemin RTTDNS Autono-mous System(AS)

109

Atlas RIPE NCC ~12 000 RTT RouteHTTP GET etrequecirctes SSL

38

BISMark ~420 RTT taux depertes deacutebiteacutecouleacute tempsde chargementdrsquoune page web

304

DASU ~100 000 Informations surles flux TCP RTTroutes emprun-teacutees reacutesolutionDNS HTTP GETdeacutebit eacutecouleacute

84

PlanetLab ~400 1218SamKnows ~70 000 RTT deacutebit

eacutecouleacute deacutebitutile giguetaux de perteperformance decertains services

154

auteurs avancent que lrsquoAfrique est un continent ineacutegalitaire en terme de latence intra etinter pays Ils ont conclu que lrsquoexistence drsquoune faible latence entre deux FAI drsquoun mecircmepays provient drsquoaccord de peering au sein drsquoun IXP heacutebergeacute soit par le pays concerneacutesoit par un pays voisin

123 Meacutetrologie passive

La meacutetrologie passive a pour objectif la mesure des flots de paquets agrave partir drsquounpoint particulier du reacuteseau appeleacute le point de collecte Elle consiste agrave eacutecouter captureret analyser les paquets IP La figure 115 illustre le principe de la meacutetrologie passiveElle montre que le point de collecte nrsquoest pas forceacutement localiseacute du coteacute eacutemetteur oureacutecepteur Les paquets IP transitant par le point de collecte sont captureacutes et sauvegardeacutesOn appelle alors les fichiers contenant les paquets IP collecteacutes des traces Les mesurespassives peuvent ecirctre effectueacutees agrave diffeacuterents niveaux de granulariteacute

Au niveau microscopique les mesures passives tendent agrave eacutetudier les flots au niveaude la connexion de transport On peut par exemple eacutetudier le nombre de paquets per-dus durant une connexion TCP Au niveau macroscopique les mesures passives sonteffectueacutees sur des meacutetriques agreacutegeacutees comme le deacutebit eacutecouleacute total ou le nombre total deconnexions

32

FIGURE 115 ndash Principe de la meacutetrologie passive

La meilleure faccedilon de reacutealiser des mesures passives au niveau microscopique est decapturer tous les paquets traversant le point de collecte Mais comme il est difficile decapturer tous les paquets lorsque le deacutebit du lien est eacuteleveacute il faut avoir recours agrave lrsquoeacutechan-tillonnage du trafic Dans ce cas les mesures ne sont pas faites sur la totaliteacute des pa-quets traversant le point de collecte mais sur un sous-ensemble bien speacutecifique de cespaquets Le groupe de travail Packet Sampling (PSAMP) de lrsquoIETF travaille sur un algo-rithme drsquoeacutechantillonnage adapteacute au trafic Internet [PSAMP]

Une combinaison entre lrsquoanalyse des deux granulariteacutes est capable de donner uneeacutevaluation reacuteelle du trafic Les informations que lrsquoon peut obtenir par la meacutetrologie pas-sive sont nombreuses Elles reposent sur lrsquoeacutetude des informations contenues dans le da-tagramme IP que ccedila soit dans lrsquoen-tecircte du datagramme IP ou dans celle du message duprotocole de transport Les meacutetriques sont eacutegalement deacutependantes des outils utiliseacutes Onpeut classer les meacutetriques en deux cateacutegories que sont la supervision et la performance

La supervision donne des informations sur le fonctionnement du reacuteseau et la carac-teacuterisation du trafic On peut ainsi eacutetudier les diffeacuterents services et protocole de transportutiliseacutesLa performance se rapporte agrave celle du protocole de transport crsquoest-agrave-dire son fonction-nement ou sur lrsquoanalyse des flots par rapport soit agrave la composante temporelle ou soit agravela composante seacutemantique On peut alors comparer le deacutebit drsquoaccegraves theacuteorique et le deacutebitmesureacute Pour cela on va eacutetudier le taux de perte le RTT et la MSS

La meacutethode de capture peut reposer sur des eacutequipements mateacuteriels deacutedieacutes ou par unsystegraveme logiciel fonctionnant sur un eacutequipement standard Le logiciel srsquoappuie majori-tairement sur la bibliothegraveque Libpcap [Jacobson1989-2] Cette bibliothegraveque capture lespaquets reccedilus mais elle srsquoutilise eacutegalement en lisant des traces de paquets preacutealablementcaptureacutes Le problegraveme principal des solutions logicielles viennent de la vitesse des liensPlus le lien a un deacutebit eacuteleveacute plus la capture au niveau logiciel devient difficile Il fautalors se tourner vers des solutions de mateacuteriels deacutedieacutes La carte DAG [Graham1997] deacute-veloppeacutee par lrsquoeacutequipe [WAND] de lrsquoUniversiteacute de Waikato en Nouvelle Zeacutelande en est unparfait exemple Cette carte de capture est capable de capter les paquets sur des liens detregraves haut deacutebit Ce mateacuteriel se charge drsquoextraire les entecirctes des paquets de les estampillersuivant une horloge synchroniseacutee et de les stocker sur un disque dur

Lrsquoanalyse des donneacutees est reacutealiseacutee selon deux techniques temps reacuteels ou Batch Leprincipe du temps reacuteel est de pouvoir reacutecupeacuterer extraire et restituer de lrsquoinformation entemps reacuteel sur des flux continus de donneacutees Le mode Batch va englober tous les traite-ments de donneacutees neacutecessitant un temps de calcul plus conseacutequent Le premier proceacutedeacutese propose drsquoanalyser agrave la voleacutee ce qui se passe dans le reacuteseau par le branchement drsquouneacutequipement drsquoeacutecoute sur le reacuteseau On se concentre alors sur la performance du lien Desoutils comme Tstat [Mellia2005] ou Netflow [Claise2004] reacutealisent ce genre drsquoanalyse La

33

seconde technique se deacutecompose en deux phases distinctes que sont la capture et lrsquoana-lyse La premiegravere eacutetape est de reacutealiser la capture du trafic appeleacutee des traces Des outilscomme TCPDump [Jacobson1989-1] ou Wireshark [Chappell2010] peuvent enregistrerdes traces sous format DUMP ou PCAP La seconde phase consiste agrave analyser les tracescollecteacutees Les formats de sortie des donneacutees analyseacutees sont deacutependants des outils Lesinformations peuvent ecirctre retranscrites au format texte ou graphique Des outils commeTCPTrace [Ostermann2000] ou TCPStat [Herman2001] peuvent effectuer ce genre drsquoana-lyse de donneacutees Crsquoest avec cette technique qursquoil est possible drsquoeacutetudier les performancesdrsquoun protocole

Il nrsquoexiste pas de plate-forme drsquoaccegraves publique reacutealisant des captures de trafic au ni-veau international Malgreacute cela des traces collecteacutees sont disponibles sur Internet agrave desfins de recherche Dans [Allman2007] les auteurs preacutesentent les regravegles agrave respecter avantde publier des traces Un point est agrave souligner et concerne les adresses IP des paquets Lanon-anonymisation des adresses IP constitue une violation de la vie priveacutee de plus ellepreacutesente un risque drsquoinseacutecuriteacute pour les machines impliqueacutees par les paquets captureacutesCAIDA gegravere un deacutepocirct de partage et propose drsquoacceacuteder agrave des traces collecteacutees agrave traversplusieurs points drsquoeacutechange ameacutericains Pour y acceacuteder il faut indiquer la finaliteacute de lrsquouti-lisation des traces demandeacutees Drsquoautres plates-formes deacutedieacutees agrave des projets ont eacuteteacute misesen place agrave travers le monde

Le projet IPMon de lrsquoopeacuterateur ameacutericain SPRINT consiste agrave identifier les problegravemesdrsquoun reacuteseau deacutejagrave deacuteployeacute afin de pouvoir anticiper son eacutevolution future[IPMon] Danslrsquoarticle [Fraleigh2001] lrsquoauteur preacutesente lrsquoinfrastructure de mesure qui est deacuteployeacutee endivers points du reacuteseau de lrsquoopeacuterateur Les premiers reacutesultats publieacutes dans [Fraleigh2003]ont montreacute une utilisation de plus en plus importante par du trafic multimeacutedia sur le pro-tocole TCP De plus les flots TCP preacutesentent des performances eacuteleveacutees avec des taux dedeacute-seacutequencement faibles et un deacutelai minimal proche du temps de propagation

Le projet METROPOLIS srsquoest inspireacute du projet IPMon Il srsquoagit drsquoun projet franccedilaisavec des points de mesures sur deux types de reacuteseaux Internet diffeacuterents RENATER etle reacuteseau ADSL de France Teacuteleacutecom laquo Lrsquoobjectif de METROPOLIS eacutetait de concevoir denouvelles meacutethodologies pour la meacutetrologie des reacuteseaux IP raquo [METROPOLIS] Dans lecadre de ce projet un outil de caracteacuterisation et drsquoanalyse des traces fut deacuteveloppeacute Cenouvel outil srsquointitule ZOO Une preacutesentation de lrsquooutil sera reacutealiseacutee dans la sous-section322 Les reacutesultats ont mis une eacutevidence lrsquousage preacutedominant du protocole de transportTCP Les applications de type peer-to-peer repreacutesentaient plus de 80 du trafic eacutetudieacute

La position geacuteographique de La Reacuteunion et son rattachement au RIR AfriNIC attirentnotre attention sur les travaux de meacutetrologie passive africains La carte [AfterFibre] preacute-sente les reacuteseaux fibres terrestres et maritimes lieacutes au continent africain On voit ainsi queles reacuteseaux sont ineacutegalement reacutepartis sur le territoire La grandeur du continent et les in-terconnections preacutesentes font du territoire un espace drsquoeacutetude inteacuteressant Crsquoest pourquoide nombreux chercheurs privileacutegient lrsquoeacutetude de la connectiviteacute et des performances delrsquoInternet africain

Dans lrsquoarticle [Johnson2011] une eacutetude sur une zone rurale connecteacutee par satelliteest reacutealiseacutee Les reacutesultats ont montreacute que le trafic est principalement composeacute de fluxweb dont une forte proportion pourrait ecirctre mise en cache Au niveau des deacutelais le RTTmoyen sur la peacuteriode de mesure varie entre 3 et 10 secondes Ce deacutelai rend lrsquoutilisationdes applications temps-reacuteel difficile Le dernier reacutesultat notable de cette analyse est lapreacutesence de trafic geacuteneacutereacute par des logiciels malveillants (malware) Des attaques pour listerles ports UDP et TCP ouverts ont eacuteteacute remarqueacutees

En 2015 les auteurs de [Zheleva2015] ont eacutetudieacute les performances du reacuteseau et le com-portement des usagers apregraves une augmentation de la bande passante en Zambie Lrsquoun des

34

premiers reacutesultats indique une augmentation de plus de 58 de la quantiteacute des donneacuteeseacutechangeacutees Au niveau des performances ils ont pu eacutegalement remarquer une tregraves leacutegegraveredeacutegradation du canal de communication avec un taux de retransmission en hausse Cepourcentage est passeacute de 1 12 agrave 1 16 Le dernier reacutesultat noteacute porte sur lrsquoaugmenta-tion du RTT moyen de plus de 100 passant de 0 1436 s agrave 0 3190 s Lrsquoaugmentation dela bande passante a permis lrsquoaccegraves agrave de nouveaux services entraicircnant des changementspour les usagers

Dans [Fanou2016] lrsquoauteur srsquointeacuteresse aux services proposeacutes et compare la localisa-tion des serveurs Le premier reacutesultat montre lrsquoexternalisation continentale de nombreuxserveurs Ceci a pour conseacutequence drsquoaugmenter les deacutelais et de deacutegrader la performancedu service de communication Il faut pour lrsquoauteur arrecircter de raisonner en terme drsquoin-frastructure mais plus en terme de service et mettre lrsquoutilisateur au centre du systegravemePour cela il propose de rapatrier les services sur le territoire et drsquoaugmenter les accordsdrsquoeacutechanges entre les opeacuterateurs continentaux

Enfin dans [Johnson2016] les auteurs srsquointerrogent sur les faibles performances deTCP en Afrique La preacutesence de zone reculeacutees avec des accegraves satellitaires poussent lesdeacutelais vers des valeurs allant au delagrave des 400 ms Ces longs deacutelais sont agrave rapprocher desdeacutebits faibles De plus une expeacuterimentation sur les performances de TCP en fonction dusystegraveme drsquoexploitation a eacuteteacute meneacutee Les reacutesultats ont mis en eacutevidence que le systegraveme Li-nux avec la version TCP CUBIC est moins sensible au long deacutelais La solution proposeacutee auproblegraveme de la diffeacuterence de connectiviteacute agrave travers le continent est la creacuteation drsquoune ingeacute-nierie reacuteseau (liaison physique protocole de transport nouveau service) tenant comptedu contexte Africain

124 Comparatif entre mesures actives et mesures passives

La meacutetrologie active et la meacutetrologie passive preacutesentent des points communs et despoints de divergences Une fois des objectifs fixeacutes et au moment du choix de la meacutethodeil est important de connaicirctre les avantages et les inconveacutenients lieacutes agrave chaque type demesure Le tableau 16 reacutecapitule syntheacutetiquement ce qui vient drsquoecirctre preacutesenteacute

TABLE 16 ndash Comparatif entre mesures actives et mesures passives

Meacutetrologie Active Meacutetrologie Passive

Avantages

1 - Pour la mesure directe des pa-ramegravetres de QoS principalementle deacutelai le taux de pertes et lagigue

1 - Non intrusives2 - Permettent une mesure directedes paramegravetres utiliseacutes dans lrsquoin-geacutenierie des reacuteseaux

Inconveacutenients

1 - Intrusives le trafic de mesurepeut dans certains cas fausser lesmesures elles-mecircmes2 - Le fait que certains adminis-trateurs et entreprises bloquentou limitent le trafic ICMP peutfausser les reacutesultats obtenus parles techniques actives car ces der-niegraveres font souvent usage de ceprotocole

1 - Elles sont locales (relatives agraveun lien) et il est difficile de leseacutetendre agrave la globaliteacute du reacuteseau2 - Elles ne permettent pas la me-sure directe des paramegravetres deQoS3 - Elles neacutecessitent des ressourcesdisque et meacutemoire vive impor-tantes

35

13 Synthegravese

Ce chapitre a rappeleacute le fonctionnement du controcircle de congestion de TCP Le controcirclede congestion de TCP vise agrave maximiser lrsquoutilisation des ressources et agrave maximiser le deacute-bit utile eacutecouleacute de la connexion Ce controcircle est reacutegi par une boucle fermeacutee caracteacuteriseacuteepar un RTT Plus le deacutelai est eacuteleveacute moins TCP est susceptible de reacuteagir dynamiquementaux eacuteveacutenements de congestion Lorsque le produit du RTT et de la capaciteacute du canalde communication est trop important TCP peine agrave atteindre les objectifs preacuteceacutedemmentpreacutesenteacutes Lrsquoaugmentation progressive de la bande passante sans diminution des deacutelais apour effet lrsquoaugmentation de la capaciteacute de stockage des liens Cet accroissement a uneffet neacutegatif sur les performances de TCP Cet effet neacutegatif impacte le deacutemarrage deconnexion les flots courts la reacutesolution de la congestion et la dynamique du sondagePour diminuer lrsquoeffet de la capaciteacute de stockage des liens sur les performances de TCPde nouveaux controcircles de congestion furent deacuteveloppeacutes Chaque nouvelle version ducontrocircle de congestion ambitionne de reacutesoudre une agrave plusieurs probleacutematiques des reacute-seaux agrave forte capaciteacute de stockage Le deacutemarrage de connexion et les flots courts ont dessolutions communes comme une augmentation de la capaciteacute drsquoeacutemission de TCP agrave lrsquoini-tialisation de la connexion ou la reacuteduction du RTO Les probleacutematiques de reacutesolution decongestion et de dynamique de sondage ont permis la creacuteation de nouvelles versions ducontrocircle de congestion de TCP Ces versions de TCP sont des solutions de bout-en-boutDrsquoautres solutions neacutecessitent un changement de paradigme et lrsquointeraction avec les rou-teurs Ces solutions ont lrsquoavantage drsquoecirctre reacuteactives mais neacutecessitent la mise agrave jour deseacutequipements intermeacutediaires du reacuteseau

Le localisation geacuteographique de La Reacuteunion au milieu de lrsquooceacutean indien place lrsquoicircledans une situation ougrave la capaciteacute de stockage du reacuteseau peut ecirctre importante Nous avonsainsi estimeacute cette capaciteacute agrave lrsquoaide des deacutebits theacuteoriques des accegraves et les deacutelais de propa-gation estimeacutes et mesureacutes Les reacutesultats obtenus ont mis en eacutevidence une capaciteacute destockage autorisant la caracteacuterisation de lrsquoInternet reacuteunionnais comme un reacuteseau agrave fortecapaciteacute de stockage Lrsquoimpact de cette capaciteacute de meacutemorisation nrsquoa pas encore eacuteteacute me-sureacute Crsquoest pourquoi nous nous sommes concentreacutes sur la meacutetrologie Internet

La meacutetrologie active est une science invasive en injectant des paquets dans le reacuteseauLa meacutetrologie active mesure directement des paramegravetres de qualiteacute de service comme lesdeacutelais les routes le taux perte et la gigue Nous avons vu que des outils sont en capa-citeacute de mesurer deux meacutetriques simultaneacutement Certains outils peuvent ecirctre distribueacuteset ainsi former des plates-formes de mesure Ces plates-formes offrent la possibiliteacute auxpersonnes inteacuteresseacutees du monde entier de geacuteneacuterer des donneacutees de mesure agrave travers lemonde Les performances de TCP sont deacutependantes du deacutelai Les deacutelais sont eux-mecircmedeacutependants des routes physiques et logiques emprunteacutees Il est donc important drsquoeacutetudierces deux paramegravetres Connaissant nos besoins nous utiliserons lrsquoapproche research drivenpour lrsquoeacutetude de meacutetrologie active Lrsquoapproche research driven est une approche consistantagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires agrave lrsquoeacutetude Notre eacutetude de meacutetrologie active est preacutesenteacutee dansle chapitre 2

La meacutetrologie passive permet une mesure directe des paramegravetres utiliseacutes Cette classede meacutetrologie est centreacutee sur un lien de mesure Elle utilise lrsquoeacutecoute et la capture desdatagrammes IP La meacutetrologie passive eacutetudie la caracteacuterisation du trafic et la perfor-mance des protocoles Nous avons vu que des outils sont en capaciteacute de reacutealiser les deuxeacutetudes en parallegravele Ne pouvant reacutealiser des eacutetudes de meacutetrologie passive agrave distance denombreux chercheurs ont mis agrave disposition de la communauteacute scientifique des donneacuteespubliques La litteacuterature scientifique propose un grand nombre de meacutetriques pour lrsquoeacutetudedes performances du protocole de transport TCP et de la supervision du trafic Afin de

36

ne pas nous concentrer sur une meacutetrique en particulier nous faisons le choix de ne pasdresser une liste de meacutetriques Notre eacutetude de meacutetrologie passive que nous preacutesente-rons dans le chapitre 3 utilisera lrsquoapproche measurement driven Cette approche consiste agravemettre en place une infrastructure de mesures afin de reacutecupeacuterer le maximum drsquoinforma-tions puis drsquoeffectuer toutes les analyses possibles sur les donneacutees collecteacutees Neacuteanmoinsla meacutetrologie passive souffre de deux faiblesses essentielles (1) elle reste locale et il estdifficile drsquoeacutetendre les reacutesultats agrave la globaliteacute du reacuteseau (2) au niveau microscopique lescaptures aboutissent tregraves rapidement agrave des volumes de traces colossaux

37

38

Chapitre 2

Caracteacuterisation de la connectiviteacute deLa Reacuteunion

Le rapport [Mediametrie2018-2] sur lrsquoaccegraves Internet agrave La Reacuteunion a montreacute que 856de la population reacuteunionnaise de plus de 13 ans srsquoest deacutejagrave connecteacutee agrave Internet 747 deces personnes sont des usagers reacuteguliers En comparaison le rapport [Mediametrie2018-1]montre qursquoaux alentours de 68 de la population franccedilaise meacutetropolitaine se connectequotidiennement Ces sondages montrent lrsquointeacuterecirct pris par lrsquoInternet pour la populationreacuteunionnaise

En 2013 une eacutetude de meacutetrologie reacutealiseacutee par BinarySec vise a effectuer un classementdes fournisseurs drsquoaccegraves Internet de La Reacuteunion Dans le rapport associeacute [Vergoz2013] 9meacutetriques sont preacutesenteacutees Parmi elles le deacutebit descendant moyen est mesureacute agrave 9 36MbsEn comparaison le deacutebit descendant moyen en France meacutetropolitaine mesureacute par[Akamai2015] srsquoeacutelegraveve agrave 8 2 Mbits Akamai utilise la plate-forme Intelligent PlatformTM

pour reacutecolter des donneacutees dont le deacutebit reacuteel La Reacuteunion posseacutedait ainsi un meilleurdeacutebit descendant que la France meacutetropolitaine Le deacutebit moyen franccedilais preacutesenteacute par[Akamai2017] est de 10 75 Mbits Le deacutebit descendant minimum reacuteunionnais mesureacutepar [nPerf2017] est de 18 63 Mbits Ainsi lrsquoeacutecart entre les deacutebits franccedilais et reacuteunionnaissrsquoest accentueacute Malgreacute un deacutebit plus eacuteleveacute La Reacuteunion preacutesente des deacutelais plus eacuteleveacutesque la France

Lrsquoeacutevolution des deacutebits pose la question sur lrsquoeacutevolution des deacutelais depuis la derniegraverecampagne de mesure La figure 111 montre des deacutelais plus importants agrave La Reacuteunion qursquoagraveParis Lrsquoobjectif de ce chapitre est drsquoeacutetudier lrsquoeacutevolution des deacutelais depuis 2012 On srsquointeacute-resse eacutegalement agrave la connectiviteacute de La Reacuteunion en terme de deacutelai et de routes Lrsquoasymeacute-trie des liens est une chose courante dans lrsquoInternet Les questions que lrsquoon se pose de-puis La Reacuteunion doivent eacutegalement ecirctre poseacutees lorsque lrsquoon essaye de joindre lrsquoicircle Dansce chapitre nous allons explorer la connectiviteacute de La Reacuteunion Pour cela nous avonsmis en place un protocole de mesures se basant sur notre propre plate-forme de mesuresrespectant la reacutepartition des destinations Notre plate-forme a pour objectif lrsquoeacutetude desroutes et des deacutelais speacutecifiques de lrsquoicircle par rapport agrave son accegraves Internet via les cacircblessous-marins

Une seconde question est alors apparue Est-ce que ces speacutecificiteacutes sont uniquementcelles de La Reacuteunion ou alors communes aux icircles de la Zone Oceacutean Indien

Dans la section 21 nous preacutesentons les objectifs de notre eacutetude de meacutetrologie et lescontraintes associeacutees Afin de reacutepondre agrave ces contraintes un cahier des charges est preacute-senteacute dans la section 22 Le protocole drsquoeacutetude est deacutecrit dans la section 23 Les reacutesultatsobtenus pour La Reacuteunion suivis de ceux des icircles de lrsquoOceacutean Indien sont preacutesenteacutes dansla section 24

39

21 Objectifs

En 2012 [Anelli2012] a reacutealiseacute une campagne de mesure des deacutelais depuis La Reacuteunionet Paris Cette campagne de meacutetrologie active baseacutee sur la commande ping a pour ob-jectif de deacutemontrer la diffeacuterence de deacutelai et de deacutebit entre La Reacuteunion et Paris Le premierobjectif de nos travaux consiste agrave la mise jour des donneacutees par une nouvelle eacutetude desdeacutelais Nous ferons par la suite reacutefeacuterence agrave cet objectif par le titre Evolution

Le second objectif est lrsquoanalyse de la connectiviteacute Internet de La Reacuteunion Pour arri-ver agrave obtenir une analyse preacutecise de la connectiviteacute Internet reacuteunionnaise une eacutetude surles routes emprunteacutees par les paquets IP en provenance et agrave destination de La Reacuteunionsera reacutealiseacutee Pour cela on utilisera un outil de type traceroute On utilisera les donneacuteesreacutecolteacutees pour lrsquoidentification des portes de lrsquoInternet reacuteunionnais La reacutefeacuterence utiliseacuteepour cet objectif dans le suite du manuscrit est Connectiviteacute

Ayant cibleacute les meacutetriques nous avons fait le choix de la meacutethode research-driven Cettemeacutethode preacutesenteacutee dans la section 121 a lrsquoavantage de se concentrer uniquement surdes meacutetriques deacutecideacutees preacutealablement Dans le cas de notre eacutetude ce sont les deacutelais et lesroutes

22 Cahier des charges

Deux paramegravetres doivent ecirctre pris en consideacuteration lors de la reacutedaction du cahier descharges lrsquooutil de mesure et lrsquooutil drsquoanalyse

221 Evolution

Pour reacutepondre agrave lrsquoobjectif nous allons effectuer une reprise de lrsquoexistant Lrsquooutil demesure sera la commande ping associeacutee agrave la plate-forme Planet-Lab [PlanetLabEurope]Lrsquooutil drsquoanalyse sera identique agrave celui utiliseacute par [Anelli2012]

222 Connectiviteacute

Identification des besoins

Dans le tableau 14 nous avons vu que diffeacuterents outils sont capables de mesurer lesroutes et les deacutelais Lrsquooutil retenu devra limiter les erreurs lieacutees aux meacutecanismes de lrsquoeacutequi-librage de charge et de MPLS Cet outil devra reacutealiser des mesures depuis des nœudsreacutepartis sur lrsquoensemble de lrsquoicircle Pour cela il est neacutecessaire drsquoeffectuer un choix de plate-forme de meacutetrologie active Ce choix se fera sur 2 points la distribution geacuteographiquedes nœuds de mesure et la couverture des diffeacuterents fournisseurs drsquoaccegraves internet

Lrsquooutil drsquoanalyse devra ecirctre en capaciteacute drsquoidentifier les portes de lrsquoInternet reacuteunion-nais agrave travers la geacuteolocalisation des adresses IP drsquoidentifier les marques MPLS preacutesentesdans les donneacutees pour une meilleure compreacutehension des regravegles de routage geacuteneacuterer unecarte des relations entre pays agrave travers les eacutechanges de paquets envoyeacutes et reacutealiser desstatistiques sur les diffeacuterents nœuds emprunteacutes

Mise en œuvre drsquoune infrastructure de meacutetrologie active

Dans la section preacuteceacutedente nous avons vu que notre cahier des charges devra respec-ter 3 principaux critegraveres outil de mesure plate-forme de mesure et outil drsquoanalyse

40

Paris-traceroute

Nous avons vu dans la partie 122 que lrsquoeacutetude des routes et des deacutelais peut se faire agravelrsquoaide drsquoun seul outil traceroute Or cet outil est sujet agrave des impreacutecisions lieacutees agrave lrsquoeacutequili-brage des charges par exemple Souhaitant limiter lrsquoimpact de ces aleacuteas dans nos donneacuteesnous faisons le choix de Paris-traceroute Pour rappel une preacutesentation de lrsquooutil et deses meacutecanismes est faite agrave la section 122

La plate-forme RunPL

Les plates-formes disponibles Similairement dans la section 122 nous avons preacute-senteacute des plates-formes de meacutetrologie active La plate-forme seacutelectionneacutee devra respecterles critegraveres preacutesenteacutes preacuteceacutedemment

Parmi les plates-formes seules Atlas et Planet-Lab ont des sondes preacutesentes sur lrsquoicirclerespectivement 21 et 2 Ces sondes sont reacuteparties de maniegravere ineacutequitable sur lrsquoicircle Lareacutegion Est de lrsquoicircle ne compte qursquoune sonde quand le minimum est de 6 dans les autresreacutegions De plus certains des Fournisseurs drsquoAccegraves Internet (FAI) nrsquoheacutebergent pas de sondede mesure Le reacutesumeacute de notre comparaison est indiqueacute dans le tableau 21

TABLE 21 ndash Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet

Archipelago Atlas BISMark DASU Planet-Lab SamKnowsParis-traceroute

Oui Oui Oui Non Oui Non

Disponibiliteacutesur lrsquoicircle

Non Oui Non Non Oui Non

Couverturede lrsquoicircle

Non Oui Non Non Non Non

Reacutepartitionfournis-seurs

Non Non Non Non Non Non

On constate ainsi qursquoaucune des plates-formes preacutesenteacutees ne remplit la totaliteacute descritegraveres de seacutelection Nous avons souhaiteacute deacuteployer notre propre infrastructure Cettenouvelle plate-forme reacutepondra agrave nos critegraveres en offrant une meilleure couverture de lrsquoicirclesur les aspects geacuteographiques FAI et Technologies drsquoAccegraves agrave Internet (TAI) Lrsquoeacutechantillon depopulation est repreacutesenteacute par un ensemble drsquoeacutetudiants Notre plate-forme nous autoriseeacutegalement agrave ecirctre maicirctre de lrsquoinfrastructure de mesures que lrsquoon souhaite mettre en placeAfin de seacutelectionner les outils (physiques et logiciels) les plus adapteacutes agrave nos objectifsnous avons deacutecideacute des speacutecificiteacutes de notre plate-forme

Creacuteation et deacuteploiement de la plate-forme RunPL La plate-forme que lrsquoon souhaitedeacuteployer devra respecter un scheacutema de connectiviteacute bien preacutecis repreacutesenteacute par la figure21 La Sonde de mesure est le cœur de la plate-forme La Destination correspond agrave uneadresse IP ou un nom de domaine agrave joindre pour obtenir des informations sur les routesemprunteacutees et les deacutelais associeacutes Le Serveur de stockage est preacutesent pour deacutelester la sondede mesure LrsquoOrdinateur distant repreacutesente lrsquoadministrateur de la plate-forme Ne pouvantse deacuteplacer pour configurer la sonde un accegraves distant doit ecirctre reacutealiseacute Il est illustreacute parle train en pointilleacute sur la figure Le trait plein entre la sonde et la destination correspondagrave lrsquointeraction entre la sonde et la destination Cette interaction repreacutesente les mesuresque lrsquoon obtiendra sur les performances des liens Les sondes de mesure devront pou-voir effectuer les mesures sans limitation de destinations Elles devront afin de limiter

41

le stockage effectuer un deacutelestage des mesures collecteacutees sur un serveur de stockage Ceserveur de stockage tout comme la sonde de mesure devra pouvoir ecirctre joint par lrsquoordi-nateur distant Cette communication a un double objectif Le premier est la reacutecupeacuterationdes donneacutees pour les analyses Le second est la mise agrave jour du protocole de mesure sineacutecessaire Une interaction seacutecuriseacutee est eacutetablie entre lrsquoordinateur distant la sonde et leserveur de stockage Cette liaison est caracteacuteriseacutee par les pointilleacutes sur la figure 21

FIGURE 21 ndash Scheacutema drsquointerconnexion de la plate-forme

Les speacutecificiteacutes de notre plate-forme se deacutecomposent en deux grandes parties quesont la partie mateacuterielle et la partie systegraveme

Mateacuterielle Un cahier des charges speacutecifique agrave notre plate-forme de mesure doit ecirctrereacutealiseacute La premiegravere partie concerne le choix du mateacuteriel physique

La partie mateacuterielle de la plate-forme de mesure est formeacutee de deux composants lasonde de mesure et le serveur de stockage des donneacutees Le serveur de stockage serafourni par le Laboratoire drsquoInformatique et de Matheacutematiques (LIM) Seule la sonde de me-sure sera indiqueacutee dans le cahier des charges Le mateacuteriel seacutelectionneacute devra respecter lescritegraveres preacutecis Ces critegraveres ont eacuteteacute deacutecideacutes en eacutetudiant les solutions proposeacutees par lesplates-formes preacuteceacutedemment eacutetudieacutees

mdash Peu encombrant de nombreuses sondes proposeacutees par les diffeacuterentes plates-formessont tregraves discregravetes Notre sonde devra eacutegalement ecirctre peu visible Nous souhaitonsque la sonde soit directement connecteacutee sur le routeur de lrsquousager

mdash Peu coucircteux le coucirct unitaire de chaque kit ne devait pas deacutepasser 50D afin que lrsquoonpuisse avoir un nombre de nœuds conseacutequent Un kit sera composeacute de la sonde deson cacircble alimentation drsquoune carte meacutemoire et drsquoun cacircble reacuteseau

mdash Peu eacutenergivore la facture drsquoeacutelectriciteacute eacutetant agrave la charge de lrsquousager nous souhai-tions une solution agrave faible consommation drsquoeacutenergie

mdash Diversiteacute du systegraveme drsquoexploitation (OS) Le systegraveme drsquoexploitation choisi devrasupporter lrsquoinstallation de Paris-traceroute

La seconde partie du cahier des charges de notre plate-forme se concentre sur le choixdu systegraveme drsquoexploitation

Pour rappel sur la figure 21 nous avons repreacutesenteacute en pointilleacute des interactions seacute-curiseacutees Ces eacutechanges concernent lrsquoaccegraves distant agrave la sonde au serveur de stockage et agravela sauvegarde des donneacutees de mesures sur le serveur Le systegraveme drsquoexploitation devracorrespondre aux critegraveres de seacutelection suivants

42

mdash Paris-traceroute Le systegraveme drsquoexploitation devra inteacutegrer Paris-traceroute dans seslibrairies drsquoinstallations ou supporter lrsquoinstallation du code source

mdash Licence GNU-GPL Des modifications du systegraveme seront potentiellement neacuteces-saires

mdash Accegraves distant Le mateacuteriel devant ecirctre geacutereacute agrave distance Un accegraves Secure SHell (SSH)devra donc ecirctre configureacute Le protocole SSH [RFC4250] fut deacuteveloppeacute pour per-mettre lrsquoaccegraves agrave distance de terminaux

mdash Transmission seacutecuriseacutee Lrsquoaccegraves au diffeacuterents composants de la plate-forme devrase faire drsquoune faccedilon seacutecuriseacutee La restriction se fera agrave travers un systegraveme drsquoidentifi-cation

Seacutelection du mateacuteriel [Maksimovic2014] reacutealise une comparaison de diffeacuterents micro-ordinateurs tels que Arduino [Arduino] BeagleBone [Beaglebone] Phidgets [Phidgets]Udoo [Udoo] et RaspberryPi [RaspberryPi] Dans ce comparatif les critegraveres utiliseacutes sontproches de ceux que lrsquoon a seacutelectionneacutes Le tableau 22 reacutesume lrsquoensemble des critegraveres deseacutelection du mateacuteriel Il provient directement de lrsquoarticle [Maksimovic2014]

TABLE 22 ndash Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

Critegraveres Arduino BeagleBone Phidegts Raspberry Pi UdooEncombrement(en mm)

7553 863533 813533 8565398 11085

Coucirct (en $ parnœud

30 45 50-200 25-35 99-135

Eacutenergie (en V) 7-12 5 6-15 5 6-15

Systegraveme

drsquoexploitation

Linux ang-strom

Linux

RaspbianUbuntuAndroidArchLinuxFreeBSDFedoraRISC OS

UbuntuAn-droidLinuxArchLi-nux

Nous avons mis en eacutevidence les valeurs respectant les critegraveres Nous faisons le choixdu Raspberry Pi car il possegravede le plus de critegraveres respecteacutes

Seacutelection du systegraveme drsquoexploitation Le premier critegravere de seacutelection est lrsquoinstalla-tion de Paris-traceroute Drsquoapregraves [Paris-traceroute] lrsquooutil est disponible sur les systegravemesRaspbian Ubuntu ArchLinux et FreeBSDConcernant les licences lrsquoensemble des OS ne sont pas eacutequivalents Ainsi seul RaspbianUbuntu et ArchLinux proposent une licence General Public Licence (GPL) RISC OS est as-socieacute agrave une licence proprieacutetaire Android FreeBSD et Fedora sont sous licence de logiciellibre et open source Les licences de distribution open source vont nous autoriser agrave ajou-ter modifier voire supprimer des parties du code pour qursquoil corresponde plus facilementagrave nos besoinsDe nombreux OS proposent nativement la version cliente du protocole SSH La versionserveur peut ecirctre activeacutee lors de lrsquoinstallation du systegraveme drsquoexploitation Lrsquoaccegraves distantnous permettra eacutegalement la mise agrave jour des outils et des OS pour des raisons de seacutecu-riteacuteLa seacutecurisation des eacutechanges se fera au travers drsquoun Virtal Private Network (VPN) Un

43

VPN est un systegraveme permettant de creacuteer un lien direct entre des ordinateurs distants[Coonjah2015] reacutealise une comparaison entre deux outils permettant la creacuteation de VPNOpenSSH et OpenVPN OpenSSH propose de meilleures performances qursquoOpenVPN auniveau de lrsquoutilisation de la bande passante et des temps de transferts de fichiers Malgreacutecela nous avons pris le parti drsquoutiliser OpenVPN car crsquoest un outil majoritairement uti-liseacute par les entreprises [Coonjah2015] Cet utilitaire nous propose la mise en place drsquouneconnexion seacutecuriseacutee baseacutee sur lrsquoidentification agrave travers un certificat drsquoauthentificationLe VPN permet de joindre agrave travers un adressage priveacute les diffeacuterentes sondes qui se-ront distribueacutees sur lrsquoicircle de La Reacuteunion Drsquoapregraves le site officiel drsquo[OpenVPN] lrsquooutil peutsrsquoinstaller facilement sur les distributions Rapsbian Ubuntu et Fedora

Le choix du systegraveme drsquoexploitation va deacutependre des critegraveres de seacutelection Nous reacuteca-pitulons les critegraveres preacutesenteacutes preacuteceacutedemment dans le tableau 23

TABLE 23 ndash Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur RaspberryPi

Critegraveres Raspbian Ubuntu Android ArchLinux FreeBSD Fedora RISC OSParis-traceroute

Oui Oui Non Oui Oui Non Non

Licence GPL GPL ASL GNULinux

BSD CreativeCom-mons

CastleTechno-logiesLtdLicence

Accegraves dis-tant (SSH)

Oui Oui Oui Oui Oui Oui Oui

OpenVPN Oui Oui Non Non Non Oui Non

Deux systegravemes disponibles pour Raspberry Pi reacutepondent agrave nos critegraveres Raspbian etUbuntu Nous faisons le choix du systegraveme Raspbian Cet OS est une distribution Linuxentiegraverement revue pour des performances optimales sur la carte Raspberry Pi Fortementinspireacutee par la distribution Linux Debian elle propose les mecircmes caracteacuteristiques que ladistribution dite de Bureau Les sondes nrsquoeacutetant pas eacutequipeacutees drsquoun systegraveme drsquoaffichagenous optons pour lrsquoinstallation la plus leacutegegravere possible avec uniquement les paquets neacute-cessaires agrave notre eacutetude

Lrsquooutil drsquoanalyse rTraceroute

Dans la section 21 nous avons preacutesenteacute les contraintes lieacutees agrave la seacutelection drsquoun outildrsquoanalyse des donneacutees de type traceroute Pour rappel ces contraintes sont les suivantes la geacuteolocalisation des adresses IP lrsquoidentification des liens MPLS la geacuteneacuteration drsquounecarte des liens logiques et la geacuteneacuteration drsquoun fichier comportant des statistiques sur lesdiffeacuterents nœuds rencontreacutes

Les outils disponibles Il existe diffeacuterents outils drsquoanalyse des routes que lrsquoon peut ran-ger en trois cateacutegories les geacuteneacuterateurs de donneacutees brutes les plates-formes de mesures etles outils drsquoanalyse graphiques Lrsquooutil que lrsquoon souhaite utiliser entre dans la troisiegravemecateacutegorie La litteacuterature autour drsquooutils graphiques pour lrsquoanalyse des routes nrsquoest pasaussi complegravete que lrsquoon pourrait croire

Gtrace est un outil creacuteeacute par [Periakaruppan1999] Cet outil reproduit graphiquementles reacutesultats obtenus par Traceroute Le logiciel geacutenegravere ses propres donneacutees avant de les

44

repreacutesenter sous forme graphique La geacuteolocalisation ne se fait pas sur les adresses IPmais sur le nom Domain Name System (DNS) des nœuds rencontreacutes La localisation drsquounnœud nrsquoest valideacutee qursquoapregraves croisement des informations entre les abreacuteviations des villeset aeacuteroports drsquoinformations contenues dans deux bases de donneacutees Une derniegravere veacuteri-fication est reacutealiseacutee agrave lrsquoaide de la commande nslookup Actuellement cet outil nrsquoest plusmaintenu Il nrsquoimpleacutemente pas le [RFC4950] permettant lrsquoidentification des nœuds MPLSdans les routes

[Aben2015] preacutesente un outil drsquoanalyse des routes inteacutegreacute agrave Atlas RIPE NCC Cet outildrsquoanalyse se nomme OpenIPMap Il utilise la base de donneacutees de RIPE pour effectuer lageacuteolocalisation des donneacutees Les routes sont ensuite traceacutees sur une carte interactive Lesmesures geacuteneacutereacutees par Atlas sont directement visibles et peuvent srsquointeacutegrer dans OpenIP-Map Lrsquoidentification des nœuds MPLS ainsi que la partie statistique ne sont pas inclusesdans les sorties proposeacutees par OpenIPMap

Dans [Yang2016] lrsquoauteur preacutesente un outil drsquoanalyse des routes centreacute sur le conti-nent africain African Visual Route Le design de lrsquooutil srsquoinspire largement du projetOpenIPMap [Aben2015] Lrsquooutil possegravede un deacutefaut important Il lit uniquement les fi-chiers provenant de la plate-forme Atlas

Le tableau 24 preacutesente les possibiliteacutes offertes par chaque outil preacutesenteacute preacuteceacutedem-ment

TABLE 24 ndash Fonctions disponibles dans les outils graphiques drsquoanalyse des routes

African Visual Route Gtrace OpenIPMapGeacuteolocalisation Oui Oui OuiIdentificationdes liens MPLS

Non Non Non

Cartographie Oui Oui OuiStatistiques Non Non Non

On peut constater que par rapport agrave nos besoins les outils listeacutes preacutesentent des la-cunes Les critegraveres drsquoaffichage des liens MPLS et la partie statistique sur les nœuds inter-meacutediaires nrsquoont pu ecirctre remplis Pour ces raisons nous avons deacuteveloppeacute un outil drsquoana-lyse rTraceroute

Deacuteveloppement de rTraceroute

Geacuteolocalisation Dans le cadre de nos travaux la geacuteolocalisation drsquoadresse IP consi-degravere la position geacuteographique de lrsquoadresse les informations sur le deacutetenteur de lrsquoadresseet lrsquoAutonomous System (AS) associeacutes Un AS est un ensemble drsquoeacutequipements et de reacuteseauxsous une mecircme autoriteacute rTraceroute geacuteolocalise les adresses IP rencontreacutees agrave travers unebase de donneacutees impleacutementeacutee au sein du LIM Cette base de donneacutees est remplie au furet agrave mesure que de nouvelles adresses IP sont remonteacutees par les mesures Lrsquoidentificationdes nouvelles adresses se fait par un script deacuteveloppeacute en python sous ma direction parun eacutetudiant de Licence 3eme anneacutee [LanYanFock2015] Cet outil nommeacute rgeoloc utiliseles commandes de lrsquoApplication Programming Interface (API) de RIPE NCC En interro-geant une base de donneacutees drsquoun RIR nous espeacuterons limiter les erreurs lieacutees agrave la geacuteoloca-lisation Pour nos besoins nous limitons les informations lieacutees agrave la localisation et au FAICes informations sont Pays Latitude Longitude Nom du FAI Numeacutero de lrsquoASLes informations (pays longitude latitude) seront utiliseacutees par la suite pour effectuer

45

des calculs de distance entre deux adresses IP Le nom du FAI autorise le suivi des ac-cords drsquoeacutechanges de paquets sur les routes Le numeacutero de lrsquoAS nous offre la possibiliteacutede suivre les diffeacuterents chemins emprunteacutes en termes drsquoAS diffeacuterents

rgeoloc est capable drsquoextraire les informations de deacutelais et de longueurs de routesdrsquoun fichier traceroute Il peut eacutegalement deacutecouper un fichier contenant plusieurs don-neacutees traceroute en fichier unitaire

La geacuteolocalisation des adresses associeacutees agrave lrsquoidentification des liens MPLS va aider agravela compreacutehension des routes de lrsquoInternet dans le monde

Identification des liens MPLS Paris-traceroute indique dans ses sorties les liensMPLS rencontreacutes [Augustin2007] indique que lrsquoidentification des liens se fait par la lec-ture des informations contenues dans les paquets reccedilus par lrsquooutil rTraceroute va identi-fier les marques MPLS et les repreacutesenter en un coloris diffeacuterent sur les cartes

Cartographie Lors de la geacuteolocalisation des adresses IP lrsquoinformation neacutecessaire agravela cartographie est le pays Lors de cette identification deux nouvelles informations sontassocieacutees agrave lrsquoIP Ce sont les coordonneacutees du pays pour la carte passeacutee en paramegravetre Agravepartir de ces nouvelles coordonneacutees rTraceroute va geacuteneacuterer une nouvelle carte affichantlrsquoensemble des liens logiques (entre pays) preacutesents dans les traces analyseacutees

Statistique rTraceroute geacutenegravere des statistiques sur chaque nœud rencontreacute La cleacutedrsquoidentification drsquoun nœud est son adresse IP et sa position sur la route analyseacutee Les sta-tistiques geacuteneacutereacutees sont lrsquooccurrence de la paire drsquoidentification le deacutelai minimal obtenupour joindre ce nœud agrave cette position et le pays rattacheacute agrave lrsquoadresse IP

Notre outil est actuellement disponible sur le site du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrrtraceroute [rtraceroute] Cet outil est distribueacute sous licencelibre pour une large diffusion dans la communauteacute scientifique

23 Protocole de mesure

La connectiviteacute particuliegravere de lrsquoicircle par les deux cacircbles sous-marins provoque un in-teacuterecirct de lrsquoeacutetude des routes emprunteacutees Lrsquoun des objectifs de nos mesures est drsquoeacutetudierlrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012 et 2016 Le second objec-tif est lrsquoeacutetude de la connectiviteacute en terme de routes de deacutelais et des accegraves logiques delrsquoInternet reacuteunionnais

Notre protocole de mesure se divise en 3 parties La premiegravere partie preacutesente lespoints communs entre les deux objectifs La seconde consiste agrave effectuer une comparai-son de lrsquoeacutetat actuel avec le travail effectueacute preacuteceacutedemment par [Anelli2012] Le troisiegravemepoint concerne les mesures drsquoidentification des portes de lrsquoaccegraves Internet de La Reacuteunion

231 Eacutechantillon de mesure

Lrsquoeacutechantillon drsquoadresses IP que lrsquoon va utiliser dans nos eacutetudes se doit drsquoecirctre repreacute-sentatif et preacutecis La preacutecision srsquoobtient par la taille drsquoun eacutechantillon La repreacutesentativiteacutepar le respect de la distribution des adresses IP dans lrsquoInternet

Il existe 232 adresses IPv4 avec une reacutepartition bien speacutecifique Drsquoapregraves les [RFC3232RFC5735 RFC6761] 592 708 865 adresses sont reacuteserveacutees On peut citer en exemple lesadresses de type 1921680016 Ce bloc est reacuteserveacute aux reacuteseaux priveacutes Son utilisationpreacutevue est documenteacutee dans le [RFC1918] Telles que deacutecrites dans ce standard les adresses

46

de ce bloc nrsquoapparaissent pas leacutegitimement sur lrsquoInternet publicApregraves soustraction il ne reste que 3 702 258 431 adresses agrave reacutepartir dans les diffeacuterentspays et FAI Ces IP sont distribueacutees par preacutefixes par les RIR dont RIPE NCC pour lrsquoEu-rope et AfriNIC pour le continent africain Afin drsquoavoir un eacutechantillon preacutecis nous avonsgeacuteneacutereacute aleacuteatoirement 1 000 000 drsquoadresses non reacuteserveacutees Ces adresses ont eacuteteacute testeacutees parle protocole ICMP Ce test nous assure que les adresses IP sont des adresses que nouspourrons utiliser par la suite Nous avons ainsi valideacute 84 000 adresses Neacuteanmoins nousnrsquoavons aucune garantie sur la modification des attributions des adresses IP au fil dutemps

Pour que notre jeu de destinations soit repreacutesentatif nous avons geacuteolocaliseacute les adressesvalides Nous avons regroupeacute les reacutesultats par continent pour une meilleure lisibiliteacute Lereacutesultat obtenu est illustreacute par la figure 22a

Nous pouvons constater une forte dispariteacute entre les diffeacuterents continents LrsquoOceacuteanieet lrsquoAfrique ont moins de 1 de preacutesence dans notre jeu On constate eacutegalement une fortepreacutesence drsquoadresse de type BOGONS Ces adresses font parti de blocs encore non alloueacutespar les RIR ou alors reacuteserveacutees par lrsquoInternet Assigned Numbers Authority (IANA) maispreacutesentes au sein de lrsquoInternet On peut citer lrsquoadresse 10012016100 en exemple Cetteadresse est marqueacutee comme reacuteserveacutee par lrsquoIANA par RIPE NCC Ce nombre drsquoadressesest en diminution avec lrsquoattribution des blocs restant aux diffeacuterents FAI Pour validerce reacutesultat nous lrsquoavons compareacute agrave la distribution datant de Mai 2016 du site CountryIP-Blocks 1 Le regroupement est illustreacute par la figure 22b On remarque un certain eacutequilibreentre lrsquoEurope et lrsquoAsie et une domination de lrsquoAmeacuterique du Nord

Notre reacutepartition est diffeacuterente en de trop nombreux points agrave celle de CountryIP-Blocks Les donneacutees communiqueacutees par CountryIPBlocks proviennent des RIR Cettedistribution est donc plus proche de la reacutepartition reacuteelle Crsquoest pourquoi agrave partir de notreensemble drsquoadresses initales nous seacutelectionnerons un sous ensemble en respectant la dis-tribution preacutesenteacutee par la figure 22b

232 Eacutevolution

En 2012 [Anelli2012] a effectueacute une campagne de ping depuis Paris et La ReacuteunionCette campagne reacutealiseacutee sur le FAI RENATER avait pour objectif la mise en eacutevidence dela diffeacuterence des deacutelais entre Paris et La Reacuteunion Afin drsquoeacutetudier lrsquoeacutevolution des deacutelaiset de la longueur des routes depuis lrsquoeacutetude preacuteceacutedente nous avons reacutealiseacute une nouvellecampagne de ping depuis Paris et La Reacuteunion Cette campagne a mis a contribution lesnœuds [PlanetLabEurope] de lrsquoUniversiteacute de La Reacuteunion et de lrsquoUniversiteacute Pierre et Ma-rie Curie

Agrave partir du jeu drsquoadresses preacutepareacute preacutesenteacute preacuteceacutedemment nous avons tireacute le maxi-mum drsquoadresses IP possibles tout en respectant la reacutepartition geacuteographique de la figure22b Nous avons obtenu un jeu de 40 000 adresses Nous avons fait le choix drsquoutiliserun eacutechantillon drsquoadresses diffeacuterentes par rapport agrave la premiegravere eacutetude Cette deacutecision pro-vient de notre volonteacute drsquoobtenir des donneacutees repreacutesentatives de lrsquoeacutetat actuel de lrsquoInterneten terme de reacutepartition des adresses Chaque mesure sera indeacutependante lrsquoune de lrsquoautreEn effet pour qursquoune mesure se lance il faut que la preacuteceacutedente soit finie

Lrsquoanalyse se deacuteroulera agrave lrsquoidentique de ce qui srsquoest fait pour lrsquoeacutetude preacuteceacutedente agravelrsquoexception drsquoune modification Nous y ajouterons la comparaison de la longueur desroutes Les reacutesultats associeacutes agrave cette eacutetude seront preacutesenteacutes dans la section 241

1 Source httpswww countryipblocks net

47

(a) IP seacutelectionneacutee au hasard (b) CountryIPBlocks

FIGURE 22 ndash Distribution geacuteographique des adresses IPv4 publiques

233 Connectiviteacute

La seconde eacutetude de meacutetrologie active concerne lrsquoeacutetude de la connectiviteacute de La ReacuteunionPour reacutepondre agrave notre objectif nous mettons en place deux protocoles de mesure Unprotocole eacutetudiant la connectiviteacute Depuis La Reacuteunion et un protocole dans le sens Vers LaReacuteunion

Depuis La Reacuteunion

Notre eacutetude de meacutetrologie se compose de plusieurs phases

1 la preacuteparation du jeu de destinations

2 la reacutealisation des mesures par les sondes

3 la quantification des perturbations de nos mesures sur lrsquoaccegraves des usagers

4 la collecte des reacutesultats obtenus par les sondes

5 lrsquoanalyse des reacutesultats

Preacuteparation La reacutepartition geacuteographique preacutesenteacutee dans la figure 22b ne peut pas srsquoap-pliquer agrave lrsquointeacutegraliteacute de notre ensemble de deacutepart Afin de pouvoir garder cette reacutepar-tition nous avons reacuteduit notre jeu de destinations agrave 10 000 adresses Cette reacuteduction estneacutecessaire afin que lrsquoensemble de nos mesures puissent ecirctre reacutealiseacutees en un deacutelai de 24heures Bien que le nombre drsquoadresses seacutelectionneacutees repreacutesente moins de 1 des adressesIP publiques de lrsquoInternet il est neacuteanmoins suffisant pour que notre jeu reste preacutecis

48

Reacutealisation Chaque sonde eacutetant indeacutependante lrsquoautomatisation du lancement des me-sures degraves le deacutemarrage est neacutecessaire De fait une proceacutedure a eacuteteacute implanteacutee au seinde lrsquoOS Cette proceacutedure va autoriser le deacutemarrage des mesures degraves la fin de la phasedrsquoinitialisation de lrsquoensemble des services de Raspbian La mise en place des mesures estdiviseacutee en 2 eacutetapes

La premiegravere consiste pour chaque sonde agrave creacuteer ses propres sceacutenarios de mesuresUn sceacutenario est un fichier contenant deux colonnes destination et intervalle de temps Lapremiegravere colonne contient les 10 000 adresses IP de destination La seconde colonne re-groupe des valeurs qui serviront drsquoeacutecart entre deux mesures Ces valeurs ont eacuteteacute geacuteneacutereacuteessuivant une loi exponentielle de taux 864 Ce taux provient de lrsquoeacutequation 21 ci-dessous

taux = nombre de secondes par journombre dprimeadresses IP = 8640010000 = 8 64(21)

Les valeurs obtenues seront identiques sur lrsquoensemble des sondes de mesures Chaquesceacutenario sera creacuteeacute en tirant aleacuteatoirement une adresse IP et un eacutecart Une fois que lrsquoen-semble des sceacutenarios est eacutecrit et numeacuteroteacute de 1 agrave 28 la sonde va programmeacute dans le tempslrsquoexeacutecution de la seconde eacutetape gracircce agrave la commande at

La seconde eacutetape consiste agrave lire le sceacutenario du jour et agrave joindre la destination par lrsquooutilde mesure La commande exacte exeacutecuteacutee par chaque test est

Paris-traceroute -m 255 -n -p icmp ip

Dans laquelle les options indiquent

mdash -m 255 la valeur du champ TTL du paquet est mise agrave sa valeur maximale (255)Nous faisons le choix drsquoautoriser lrsquooutil agrave essayer de joindre la destination jusqursquoagraveeacutepuisement de la valeur maximale autoriseacutee par le protocole pour identifier certainsproblegravemes de routage

mdash -n pas de reacutesolution de DNS Afin drsquooptimiser les mesures nous avons eacutelimineacute lareacutesolution des noms des routeurs Seules les adresses IP seront afficheacutees

mdash -p icmp le protocole utiliseacute pour la mesure [Wenwei2006] effectue une eacutetude com-parative entre les protocoles ICMP et TCP pour les mesures de deacutelai Ils ont montreacuteque dans certaines conditions les reacutesultats sont similaires Quand le ratio α calculeacuteentre le RTT moyen et le RTT minimal tend agrave ecirctre important (supeacuterieur agrave 20) TCPest moins stable que son concurrent Crsquoest pour cette raison que nous avons fait lechoix de lrsquoICMP

mdash ip adresse IP de destination que la commande va essayer de joindre

Veacuterification La sonde va consommer de la bande passante de chaque connexion Inter-net Lrsquoestimation du deacutebit de la mesure deacutepend du nombre moyen de paquets eacutemis parmesure et de la dureacutee moyenne drsquoune mesure Agrave lrsquoaide drsquoune peacuteriode de test nous avonspu calculer divers paramegravetres drsquoune mesure reacutealiseacutee avec Paris-traceroute Les informa-tions obtenues concernent la dureacutee drsquoune mesure et le nombre de paquets eacutechangeacutes Lesreacutesultats obtenus montrent qursquoune mesure dure en moyenne 28 secondes et se composede 54 paquets de 64 octets Une mesure geacutenegravere donc un deacutebit drsquoeacutemission de 987 bitss agravelrsquoentreacutee de lrsquointerface reacuteseau Le deacutebit geacuteneacutereacute effectif (au niveau du support) est de 1265bitss Le deacutebit geacuteneacutereacute par rapport au deacutebit drsquoaccegraves drsquoun accegraves ADSL est alors neacutegli-geable

49

Drsquoapregraves le rapport [Vergoz2013] le deacutebit montant le plus faible mesureacute est de 128 33KbsLa charge calculeacutee repreacutesente pregraves de 1 de la capaciteacute du lien drsquoaccegraves Comme il yaura en moyenne 4 mesures simultaneacutees la capaciteacute consommeacutee correspond donc agrave 4Cette situation correspond au pire cas Dans la situation courante drsquoun accegraves theacuteorique enMbits nous pouvons avancer que la sonde nrsquoaura aucun impact sensible sur la connec-tiviteacute du participant

Collecte Une phase de collecte des donneacutees de mesures est reacutealiseacutee Le but de cetteeacutetape est de libeacuterer de lrsquoespace disque sur la sonde Chaque jour agrave minuit un nouveausceacutenario est lanceacute Une fois que 7 sceacutenarios ont eacuteteacute lus la sonde va creacuteer une archive Lenom de lrsquoarchive sera composeacute de la date de creacuteation de lrsquoarchive du nom de la sonde etde la TAI Le nom propose un classement rapide des donneacutees que ccedila soit par TAI ou pardate Lrsquoarchive contiendra les mesures des 7 jours preacuteceacutedents Lrsquoarchive est envoyeacutee sur leserveur de stockage localiseacute au sein du laboratoire Une comparaison de lrsquoempreinte MD5de lrsquoarchive preacutesente sur le serveur et sur la sonde de mesure sera reacutealiseacutee Si les deuxempreintes sont identiques alors la suppression de lrsquoarchive heacutebergeacutee sur le RaspberryPi est reacutealiseacutee Le jour drsquoenvoi des donneacutees sur le serveur aucune mesure nrsquoest effectueacuteeafin de ne pas geacuteneacuterer de bruit suppleacutementaire sur le lien Le lendemain de la copiedes donneacutees la sonde va amorcer 7 nouveaux jours de mesures Un cycle de mesuresest composeacute de 7 jours de mesures conseacutecutifs et drsquoun jour drsquoenvoi des donneacutees versle serveur de stockage Ce cycle est reacutepeacuteteacute 4 fois par mois La figure 23 scheacutematise lefonctionnement drsquoune sonde de mesure sur une dureacutee de 32 jours soit 4 cycles de mesureet de collecte

La plate-forme reacutealise des mesures en continue jusqursquoagrave lrsquoarrecirct complet de lrsquoappareil demesures Nous nrsquoavons pour lrsquoinstant pas programmeacute drsquoarrecirct des mesures Dans le cadrede lrsquoanalyse reacutealiseacutee dans ce manuscrit nous avons pris un cycle complet de mesure soit32 jours Nous nrsquoeffectuons pas drsquoanalyse comparative temporelle de nos mesures

Analyse La plate-forme reacutealise les mesures par cycle de 7 jours Lrsquoanalyse des tracesreacutecolteacutees se fait en plusieurs eacutetapes Le processus drsquoanalyse commence par la deacutecoupedu fichier de donneacutees en fichiers atomiques Chaque fichier atomique contiendra uni-quement le reacutesultat drsquoune mesure Chaque fichier de donneacutees reacutecolteacutees par jour va doncecirctre deacutecouper en 10 000 fichiers atomiques Cette deacutecoupe est reacutealiseacutee par lrsquooutil rgeolocLrsquoanalyse des fichiers atomiques diffegravere selon lrsquoobjectif

Lrsquoextraction des deacutelais srsquoeffectue agrave lrsquoaide de rgeoloc Lors de lrsquoextraction les informa-tions sur les deacutelais sont accompagneacutees de la longueur du chemin et des adresses IP sourceet destination

Nous souhaitons deacuteterminer si les routes Internet provenant de La Reacuteunion sont sy-meacutetriques ou non Pour cela une eacutetude des deacutelais et des routes vers La Reacuteunion est effec-tueacutee

Vers La Reacuteunion

Les routes asymeacutetriques sont freacutequentes et principalement dues agrave des politiques deroutage et agrave lrsquoingeacutenierie de trafic Des meacutecanismes comme lrsquoeacutequilibrage de charge (load-balancing) Hot Potato Routing ou encore BGP (Border Gate Protocol) peuvent eacutegalementgeacuteneacuterer un pheacutenomegravene drsquoasymeacutetrie des liensHot Potato Routing est un pheacutenomegravene lieacute au routage sans regraveglement Le routeur transfegraverele paquet aussi vite que possible vers un routeur situeacute en aval sur la route [Feige1992Wang2018]

50

FIGURE 23 ndash Fonctionnement de la sonde

BGP est protocole de routage inter-AS deacutefini dans le [RFC1105] En fonction des informa-tions eacutechangeacutees deux paquets peuvent ne pas suivre la mecircme chemin IP mais suivre unchemin AS identique

Afin de veacuterifier la preacutesence des liens asymeacutetriques nous avons mis en place le proto-cole suivant en utilisant la plate-forme Atlas RIPE NCC [Ripe2010]

Preacuteparation Pour notre eacutetude et en accord avec les Conditions Geacuteneacuterales drsquoUtilisation(CGU) drsquoAtlas nous avons seacutelectionneacute le nombre maximal de sondes autoriseacutees soit1 000 Ces sondes serviront de sources pour nos mesures La seacutelection des sondes srsquoestfaite selon deux critegraveresLe premier est le fait que la sonde soit active En effet mecircme si la sonde nrsquoest pas joi-gnable Atlas continue drsquoindiquer la sonde dans ses donneacuteesLa seconde indication neacutecessaire agrave la seacutelection drsquoune sonde est son pays drsquoheacutebergementIl est neacutecessaire de garder la mecircme reacutepartition geacuteographique que les destinations seacutelec-tionneacutees pour lrsquoeacutetude preacuteceacutedente (voir Figure 22b)

La seacutelection des destinations srsquoest effectueacutee sur les critegraveres drsquoidentification des FAI etdes TAI disponibles sur lrsquoicircle Tout comme notre plate-forme de mesure de la section 233

51

il est pour nous important que nos destinations respectent une pariteacute sur ces critegraveres deseacutelection Afin de nous assurer que nos destinations soient physiquement heacutebergeacutees surlrsquoicircle nous avons pris la deacutecision de seacutelectionner des sondes de mesure de lrsquoeacutetude preacuteceacute-dente Lrsquoutilisation drsquoAtlas eacutetant reacutegi par un systegraveme drsquoutilisation et de creacuteation de creacuteditnous avons ducirc limiter le nombre de nos destinations agrave 10 IP publiques de la plate-formeRunPL Nous avons pleinement conscience que ce nombre nrsquoest pas forceacutement repreacute-sentatif du nombre drsquoadresse IP disponibles sur lrsquoIcircle de La Reacuteunion mais nous sommesrestreint par les CGU drsquoAtlas

Reacutealisation Atlas propose deux possibiliteacutes de programmation des sondes La premiegraveresrsquoeffectue agrave travers son interface graphique Le second choix est drsquoutiliser une API Commeil est fastidieux de programmer un nombre important de mesures agrave travers lrsquointerfacegraphique nous faisons le choix drsquoutiliser lrsquoAPI Pour effectuer 10 000 mesures par journous avons fait le choix de garder le taux de la loi exponentielle de lrsquoeacutetude preacuteceacutedentesoit 8 64 secondes Afin de limiter les pheacutenomegravenes de synchronisation le calendrier demesures a eacuteteacute geacuteneacutereacute aleacuteatoirement Nous nous sommes assureacutes que chaque sonde demesures allait effectivement joindre lrsquoensemble des destinations par jour

Veacuterification La veacuterification des perturbations se fait sur la bande passante descendanteEn effet ce sont les sondes de la plate-forme RunPL qui geacutenegraverent du trafic en continu Ilne faut pas que les mesures de la section 233 soient impacteacutees par lrsquoarriveacutee des paquetsentrants Le nombre maximal de paquets arrivant jusqursquoau routeur de lrsquoheacutebergeur estde 3 Un paquet possegravede un poids maximal de 64 octets Un poids total de 1536 bitsest envoyeacute agrave la destination Une mesure eacutetant programmeacutee toutes les 8 secondes nousutilisons cette valeur comme variable pour calculer le deacutebit Nous avons donc un deacutebitde 192 bits

Drsquoapregraves le rapport [Vergoz2013] le deacutebit descendant le plus faible mesureacute est de 1 58Mbits Notre mesure impact repreacutesente donc approximativement 0 12 de la capaciteacutedu lien Cet impact est neacutegligeable agrave un instant donneacute

Collecte La plate-forme Atlas stocke automatiquement les reacutesultats lieacutes agrave ses expeacuteri-mentations sur son propre serveur Une fois lrsquoensemble des mesures reacutealiseacutees nous avonsreacutecupeacutereacute les reacutesultats Un total de 300 000 fichiers correspondant aux 300 000 mesuresont eacuteteacute teacuteleacutechargeacutes du serveur drsquoAtlas

Analyse Cette partie de lrsquoeacutetude est fortement similaire agrave lrsquoanalyse effectueacutee pour lrsquoeacutetudedes routes et deacutelais depuis La Reacuteunion Une seule partie diffegravere En effet comme indiqueacutedans la section preacuteceacutedente chaque fichier collecteacute repreacutesente une mesure Nous nrsquoavonsdonc pas la neacutecessiteacute drsquoeffectuer une phase de deacutecoupage de nos donneacutees en fichiersatomiques

Reacutecapitulatif

Afin de pouvoir effectuer une comparaison entre les deux protocoles de mesures surlrsquoeacutetude des routes et des deacutelais associeacutes le tableau 25 reacutesume les deux protocoles sur lemois de mesure analyseacute

Nous constatons une diffeacuterence notable en terme de sources et de destinations Cettediffeacuterence impacte le nombre de fichiers atomiques que lrsquoon a obtenus Le nombre defichiers atomiques provient de la multiplication entre le nombre de sources le nombre dedestinations et le nombre de jours de mesures Cela correspond au nombre maximal de

52

TABLE 25 ndash Reacutesumeacute des caracteacuteristiques du jeu de donneacutees

Depuis VersSondes de mesures Raspberry Pi Atlas RIPE NCC

Nombres de Destinations 10 000 IP 10 raspberry-piNombres de sources 27 1 000

Nombres de jours de mesures 28 30Outil de mesure Paris-traceroute

Nombres de fichiers atomiques 7 560 000 300 000

Nombres de fichiers analyseacutes 1 015 180 38 714

fichiers que lrsquoon peut obtenir La derniegravere ligne du tableau indique le nombre de fichiersque lrsquoon a pu analyser apregraves veacuterification des mesures et nettoyage des fichiers erroneacutesCe nettoyage se fait par lrsquooutil drsquoanalyse rTraceroute Dans la section 233 nous avons puanalyser 13 43 des donneacutees De la section 233 12 91 des donneacutees ont eacuteteacute exploiteacutesNous avons dans les deux cas un taux de pertes de donneacutees important

24 Reacutesultats

Dans la suite de notre manuscrit et pour des raisons pratiques nous avons reacuteduit lenom des continents agrave deux lettres La correspondance entre lrsquoacronyme et le nom completest indiqueacutee dans le tableau 26

TABLE 26 ndash Correspondance entre acronymes et noms des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

Cette correspondance provient de lrsquoutilisation des deux premiegraveres lettres de chaquecontinent en version anglophone

241 Eacutevolution

La comparaison avec lrsquoexistant fut diviseacutee en deux Dans un premier temps nousavons compareacute les deacutelais Par la suite nous avons utiliseacute une partie des donneacutees nonencore exploiteacutees pour reacutealiser une comparaison de la longueur des routes

Distribution du RTT

Les mesures obtenues ont permis drsquoeffectuer une comparaison avec les donneacutees reacute-colteacutees en 2012 par [Anelli2012] Nous avons effectueacute une campagne de ping en 2016 afindrsquoeacutetudier lrsquoeacutevolution des deacutelais depuis Paris et La Reacuteunion La figure 24 illustre lrsquoeacutevolu-tion de la distribution du RTT en 4 ans

Entre 2012 et 2016 le jeu drsquoadresses IP de destination fut diffeacuterent En 2012 aucunereacutepartition geacuteographique ne fut eacutetablie En 2016 la distribution des adresses est cellepreacutesenteacutee dans la partie 231 Malgreacute ces diffeacuterences nous remarquons que les courbesont les mecircmes tendances en 2012 et en 2016 Des pics sont preacutesents aux environs desvaleurs 005 01 et 03 secondes pour Paris en 2012 Des pics sont identifieacutes aux valeurs02 035 et 05 secondes pour La Reacuteunion en 2012 Les pics sont preacutesents aux alentours desmecircmes valeurs sur les deux campagnes de mesure Nous eacutemettons lrsquohypothegravese que ces

53

pics correspondent aux 3 continents les plus repreacutesenteacutes dans nos eacutechantillons agrave savoirlrsquoAmeacuterique du Nord lrsquoAsie et lrsquoEurope Nous veacuterifierons cela par la suite

Malgreacute un eacutecart de 4 ans entre les deux campagnes de mesures on constate une sta-biliteacute du deacutelai minimal aux alentours de 02 secondes La stabiliteacute du deacutelai srsquoest elle ac-compagneacutee drsquoune stabiliteacute de la longueur des routes

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(a) 2012

0

0002

0004

0006

0008

001

0012

0014

0016

01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(b) 2016

FIGURE 24 ndash Comparaison des deacutelais entre Paris et La Reacuteunion

Longueur du chemin

Dans le section preacuteceacutedente nous avons constateacute que le deacutelai minimal pour quitter lrsquoicircleest resteacute stable en 4 ans Nous allons essayer de corroborer cette stabiliteacute du deacutelai par unestabiliteacute de la longueur des routes sur la mecircme peacuteriode

La longueur des routes fut obtenue par lrsquoanalyse inverse du TTL Le [RFC1700] preacute-conise une valeur de deacutepart de 64 Or le site Wikipeacutedia [WikiPing] indique que le TTLinitial peut varier Les valeurs les plus communes sont 64 128 voire 255 dans certains casNous avons donc en fonction de la valeur du TTL soustrait une valeur de deacutepart agrave la va-leur indiqueacutee pour obtenir la longueur de la route Dans les donneacutees datant de 2012 leslongueurs de certaines routes sont eacutegales agrave 127 Ne pouvant deacutecider de la valeur de TTLde deacutepart nous avons fait le choix de ne garder que les reacutesultats dont le TTL afficheacute parping est supeacuterieur ou eacutegal agrave 128 Pour les donneacutees de 2016 nous nrsquoavons pas reacutepertorieacutede valeurs comprises dans lrsquointervalle [ 120 208] De fait nous avons gardeacute lrsquoensembledes valeurs obtenues

La figure 25 illustre lrsquoeacutevolution des routes entre les deux jeux de reacutesultats En 2012la longueur des routes eacutevolue entre 10 et 40 nœuds avec un pic agrave 24 nœuds En 2016les routes ont une longueur qui varie entre 5 et 30 sauts avec un pic agrave 17 Un eacutecart de 7nœuds repreacutesenteacute sur notre figure

Les deacutelais entre La Reacuteunion et Paris sont resteacutes stables entre 2012 et 2016 Sur la mecircmepeacuteriode la longueur des routes depuis La Reacuteunion a diminueacute

242 Connectiviteacute de La Reacuteunion

La section 241 a montreacute lrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012et 2016 Malgreacute ces eacutetudes aucune caracteacuterisation de la connectiviteacute de La Reacuteunion nrsquoaeacuteteacute reacutealiseacutee Dans cette section nous allons effectuer cette caracteacuterisation en termes dedeacutelais et des routes emprunteacutees

54

FIGURE 25 ndash Eacutevolution de la longueur des routes entre 2012 et 2016

Geacuteneacuteraliteacutes

Nous avons en plus des informations sur les deacutelais et la longueur des routes desinformations sur les adresses IP rencontreacutees tout au long des mesures Ainsi nous avonsdeacutecideacute de reacutepartir notre analyse sur 4 principales meacutetriques que sont

mdash La longueur du chemin est deacutetermineacutee par le nombre de nœuds rencontreacute par Paris-traceroute

mdash Le deacutelai analyseacute est le RTT Il est associeacute agrave la destination jointe

mdash La localisation des adresses IP avant (resp apregraves) le passage par les cacircbles sous-marins quand nos donneacutees arrivent (resp quittent) agrave La Reacuteunion

mdash La distance geacuteographique correspond agrave la distance reacuteelle (en Km) entre la source etla destination Pour cela on utilise lrsquoeacutequation (22) Ils srsquoagit de lrsquoeacutequation de calculde distance entre deux points sur une sphegravere

d = arccos[cos(x)times cos(y)times cos(m)times cos(n) ++ cos(x)times sin(y)times cos(m)times sin(n) ++ sin(x)times sin(m)]times 6371 1 [km]

(22)

ougrave

mdash (xy) (mn) sont respectivement la latitude et la longitude de la source et de la des-tination (en radians)

mdash 63711 km est la reacutefeacuterence en radius de la Terre

Les coordonneacutees geacuteographiques des adresses IP ont eacuteteacute obtenues par notre outil degeacuteolocalisation Nous avons ainsi pu calculer la distance geacuteographique entre deux adressesIP Si nous prenons lrsquoexemple de la reacutepartition geacuteographique des adresses IP des sondesatlas et des destinations seacutelectionneacutees nous obtenons la figure 26 Les deux courbes sontsimilaires en terme de reacutepartition des distances La diffeacuterence des valeurs de lrsquoaxe des

55

ordonneacutees provient du nombre plus important drsquoeacutechantillons pour la figure 26a Surcette figure il est difficile de visualiser la distance des adresses relatives au continentoceacuteanique La faible eacutepaisseur de la probabiliteacute des adresses oceacuteaniques est eacutegalementpreacutesente sur la figure 26b On constate sur cette figure une preacutesence plus importantedrsquoadresses IP africaines et asiatiques

(a) Depuis (b) Vers

FIGURE 26 ndash Distribution de la distance geacuteographique par continent

La reacutepartition des adresses IP dans le monde et leur distance geacuteographique ont-ellesun impact sur la distribution des deacutelais Crsquoest agrave cette question que nous allons essayerde reacutepondre dans la section suivante

Distribution du RTT par continent

La figure 27 repreacutesente la distribution des deacutelais obtenus par nos mesures incluantla reacutepartition par continent Nous avons utiliseacute un regroupement des deacutelais par eacutecart de10 ms On constate rapidement que les deux figures nrsquoont pas la mecircme tendance Dans lasection 241 nous avions eacutemis lrsquohypothegravese que les pics preacutesents sur les courbes des deacutelaiseacutetaient associeacutes aux continents les plus preacutesents dans la geacuteolocalisation des adresses IP

La comparaison que lrsquoon peut effectuer avec les donneacutees de lrsquoexistant est celle delrsquoeacutetude Depuis Ainsi on remarque que la figure garde la mecircme forme avec la preacutesencedes 3 pics Sur la figure 27a nous pouvons identifier ces pics Ces pics repreacutesentent lrsquoEu-rope lrsquoAmeacuterique du Nord et lrsquoAsie On constate que le deacutelai minimal est stable avec unevaleur proche des 200 ms

Dans lrsquoexpeacuterimentation Vers La Reacuteunion nous constatons la preacutesence de non pas 3mais de 2 pics Le pic relatif au continent asiatique a disparu De plus les deacutelais associeacutesagrave ce continent sont moins concentreacutes Pour les autres continents la distribution des deacute-lais est relativement identique agrave lrsquoexpeacuterimentation preacuteceacutedente Nous pouvons remarquerla preacutesence de deacutelais africains vers La Reacuteunion aux alentours des 100 ms Les deacutelais de-puis lrsquoEurope sont sensiblement eacutequivalents agrave ceux de lrsquoeacutetude Depuis avec des deacutelaiscompris entre 180 et 190ms

Agrave la lecture des reacutesultats nous pouvons confirmer que lrsquohypothegravese avanceacutee preacuteceacute-demment est juste

Nous avons connaissance drsquoune relation entre la distance et le temps mis pour parcou-rir cette distance Ayant constateacute lrsquoeacutevolution des deacutelais nous allons maintenant eacutetudierlrsquoeacutevolution de la distance parcourue

56

(a) Depuis (b) Vers

FIGURE 27 ndash Distribution du RTT par continent

Longueur du chemin par continent

Nous avons pu dans la section 241 constater une diminution des routes entre 2012et 2016 Les figures 28 indiquent la reacutepartition de la longueur des routes obtenues enfonction des continents La premiegravere constatation est la forte similitude entre les deuxcourbes

Sur la figure 28a on remarque la preacutesence drsquoun pic pour une longueur de 18 nœudsCela indique que peu importe le continent de destination la probabiliteacute drsquoavoir une routedrsquoune longueur de 18 sauts est importante

Dans le sens Vers le pic est quasiment identique selon le continent de deacutepart Lavaleur geacuteneacuterale se situe agrave une valeur de 15 nœuds pour lrsquoAmeacuterique du Nord lrsquoOceacuteanieet lrsquoAmeacuterique du Sud et agrave une valeur de 16 sauts pour les autres continents

Avec un eacutecart de 2 agrave 3 sauts selon le sens on peut donc consideacuterer que la longueur duchemin reste identique pour lrsquoInternet reacuteunionnais

(a) Depuis (b) Vers

FIGURE 28 ndash Distribution de la longueur des routes par continent

Longueur du chemin et distance geacuteographique

Le premier reacutesultat analyseacute concerne la distance logique par rapport agrave la distancephysique Dans lrsquoarticle [Leguay2004] lrsquoauteur a calculeacute la moyenne des chemins dans

57

lrsquoInternet agrave partir drsquoun jeu incluant plus de 7 000 000 de donneacutees La valeur obtenue estde 15 57 sauts

Dans nos reacutesultats la valeur moyenne calculeacutee est de 17 11 eacutequipements traverseacutesavant de joindre la destination Cette valeur regroupe lrsquoensemble de nos donneacutees sansaucune distinction de la localisation de la source drsquoeacutemission En eacutetudiant uniquementles donneacutees Depuis les routes ont une longueur moyenne de 17 37 sauts Si on analysela longueur des routes des donneacutees entrant sur lrsquoicircle on obtient une moyenne de 16 85eacutequipements On observe deacutejagrave une premiegravere asymeacutetrie des routes selon que lrsquoon quitteou que lrsquoon joint lrsquoicircle de La Reacuteunion

Les figures 29a et 29b illustrent les reacutesultats obtenus Chaque figure est diviseacutee endeux On a inseacutereacute en bas de chaque figure la PDF de la longueur du chemin en fonctionde la distance entre sources et destinations Tandis qursquoen haut les aires dessineacutees parles ellipses contiennent 95 des eacutechantillons rattacheacutes agrave chaque continent Les barresdrsquoerreurs repreacutesentent quant agrave elles la moyenne et lrsquoeacutecart-type de la longueur du cheminassocieacutes agrave chaque continent

Nous remarquons que depuis La Reacuteunion la majoriteacute des distance sont situeacutees danstrois grandes reacutegions Le premier regroupement se situe entre 8 000 et 12 000 km Cebloc inclus lrsquoAsie lrsquoOceacuteanie lrsquoEurope et lrsquoAmeacuterique du sud Le second bloc comporteque lrsquoAmeacuterique du Nord et se situe au delagrave des 14 000 km Reste le cas africain Ce conti-nent est tregraves proche de La Reacuteunion Les destinations et sources africaines sont toutesinfeacuterieures agrave 10 000 km

Lrsquoanalyse geacuteneacuterale des reacutesultats obtenus montre que le nombre de sauts nrsquoest pas deacute-pendant de la distance geacuteographique Sur la figure 29a on constate des chemins aussilongs sur la boucle locale que pour joindre certaines destinations lointaines On a eacutegale-ment repreacutesenteacute sur les figures PL(d) = α times d + β qui est la fonction lineacuteaire de la lon-gueur du chemin comme fonction de la distance geacuteographique Le tableau 27 regroupeles eacutequations obtenues selon lrsquoexpeacuterimentation

TABLE 27 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

Expeacuterimentation Eacutequation PL(d)Depuis La Reacuteunion 1 58 lowast 10minus5 timesD + 16 65

Vers La Reacuteunion 7 50 lowast 10minus5 timesD + 18 32

La valeur obtenue pour α qui est le coefficient directeur de la droite possegravede unmultiplicateur eacutegal agrave 10minus5 Cette valeur indique le nombre de sauts suppleacutementaires pourchaque kilomegravetre Les valeurs de α proches de zeacutero indiquent clairement que la distancegeacuteographique nrsquoimpacte pas la longueur du chemin quelle que soit lrsquoexpeacuterimentation

Impact de la longueur du chemin sur le RTT

Les figures 210a et 210b repreacutesentent la distribution du RTT comme fonction dunombre de sauts ainsi que la meacutediane et les PDF Est eacutegalement preacutesente en bas dechacune des figures la probabiliteacute de densiteacute de la longueur du chemin

Les figures montrent une croissance du deacutelai avec lrsquoaugmentation du nombre denœuds jusqursquoagrave une certaine limite Sur la figure 210a repreacutesentant lrsquoeacutetude Depuis nousremarquons des deacutelais importants deacutepassant les 3 secondes Cette valeur des 3 secondespeut ecirctre atteinte degraves que lrsquoon deacutepasse le 9eme saut Agrave lrsquoinverse sur lrsquoeacutetude Vers illustreacuteepar la figure 210b nous constatons une certaine stabiliteacute du deacutelai Les valeurs restent

58

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 29 ndash Relation entre la longueur de la route et la distance geacuteographique

majoritairement infeacuterieures agrave 2 secondes Lrsquoeacutetude de la meacutediane nous indique des routesplus courtes lorsque lrsquoon essaye de joindre La Reacuteunion Il y a une forte variation de lameacutediane agrave la fin de la figure due au nombre drsquoeacutechantillons pour chaque valeur de lalongueur des routes Afin drsquoidentifier le deacutelai associeacute agrave chaque nouveau nœud la fonc-tion lineacuteaire D(d) = α times d + β du deacutelai comme fonction de la longueur du chemin esteacutegalement repreacutesenteacutee

Le tableau 28 indique les eacutequations obtenues lors de lrsquoanalyse des donneacuteesLa variable drsquoajustement β ne sera pas analyseacutee bien qursquoelle repreacutesente un deacutelai mi-

nimal Nous avons vu dans la partie preacuteceacutedente que ce deacutelai eacutetait eacutequivalent peu importe

59

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 210 ndash Relation entre la longueur de la route et les deacutelais

TABLE 28 ndash Formule de correacutelation du deacutelai en fonction de la longueur du chemin

Expeacuterimentation Eacutequation D(PL)Depuis La Reacuteunion 11 11times PL+ 204 92

Vers La Reacuteunion 6 22times PL+ 249 66

lrsquoexpeacuterimentation La pente de la droite repreacutesenteacutee par le coefficient α indique la valeurassocieacutee agrave chaque nouvel eacutequipement Cette valeur diffegravere fortement selon lrsquoexpeacuterimen-tation mise en place Ainsi le temps accordeacute agrave chaque eacutequipement est beaucoup pluslong lorsque nos donneacutees quittent La Reacuteunion que dans le sens inverse avec un coef-ficient proche du double Cela signifie que pour chaque saut suppleacutementaire un deacutelaiadditionnel de 6 22ms (resp 11 11ms) doit ecirctre pris en compte lorsque lrsquoon joint (resp

60

quitte) La Reacuteunion On passe quasiment du simple au double

Nous avons preacuteceacutedemment analyseacute les Cumulative Density Function (CDF) des lon-gueurs des routes logiques par continent Nous avions constateacute pour certains continentsune forte similitude entre les diffeacuterentes courbes Cette observation est de nouveau preacute-sente ici Les deux PDF sur la longueur des chemins emprunteacutes sont similaires Neacutean-moins le fait drsquoavoir un plus grand nombre drsquoeacutechantillons sur lrsquoexpeacuterimentation Depuisa permis un lissage de la courbe

Correacutelation entre deacutelai et distance geacuteographique

Dans [Krajsa2011] les auteurs se sont inteacuteresseacutes agrave lrsquoimpact de la distance sur le RTTLes reacutesultats ont eacuteteacute obtenus a partir drsquoune eacutetude de meacutetrologie active reacutealiseacutee dans despays agrave forte connectiviteacute en terme de liaisons sous-marines Les auteurs ont deacutetermineacuteune fonction lineacuteaire repreacutesenteacutee par lrsquoeacutequation suivante

y = 0 0128times x (23)

Cette eacutequation preacutedit le deacutelai en fonction drsquoune distance geacuteographique donneacutee Nousallons eacutetudier la pertinence de ce modegravele dans le cas de lrsquoicircle de La Reacuteunion On se reacutefegravereagrave ce modegravele par la notation Expected Internet RTT for a given geographical Distance (EIRD)

La figure 211 est composeacuteee de trois parties En haut nous avons repreacutesenteacute les dis-tances couvertes par chaque continent La figure 211a (resp fig 211b) graphe la fonctionExpected RTT (ER) pour le cas Depuis (resp Vers) et le modegravele EIRD Le modegravele ER(d) vientde la repreacutesentation sous forme lineacuteaire de lrsquoimpact de la distance geacuteographique sur lesdeacutelais obtenus Nous avons eacutegalement repreacutesenteacute les 5eme 10eme 25eme 75eme 90eme et95eme percentiles Les points preacutesents agrave lrsquointeacuterieur des barres drsquoerreurs indiquent le 50eme

percentile Au bas de chaque figure la PDF de la distance geacuteographique est repreacutesenteacutee

Lrsquoeacutetude de la reacutepartition de nos destinations (resp sources) pour notre eacutetude montreque les distances vont drsquoune valeur infeacuterieure agrave 10 km jusqursquoagrave pregraves de 20 000 km Nousconstatons un regroupement des continents entre 5 000 et 10 000 km pour lrsquoeacutetude DepuisLe regroupement se fait agrave une distance plus grande (comprise en 7 500 et 14 000 km)pour Vers Ces valeurs sont remarqueacutees dans la PDF de chaque eacutetude Malgreacute la preacutesenceseule du continent Nord Ameacutericain apregraves 15 000 km la densiteacute de probabiliteacute drsquoavoir unedestination prise dans cet ensemble est importante

Les figures montrent une complegravete opposition entre le modegravele EIRD et nos reacutesul-tats Afin drsquoeffectuer une meilleure comparaison nous avons traduit nos reacutesultats sousla forme ER(d) = αtimes d+ β fonction lineacuteaire du deacutelai en fonction de la distance geacuteogra-phique Une repreacutesentation graphique de ER(d) est indiqueacutee sur les figures Les eacutequa-tions obtenues sont indiqueacutees dans le tableau 29

TABLE 29 ndash Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique

Expeacuterimentation Eacutequation d(t) R2

EIRD y = 0 0128times t 0 9794

ER(d) (Depuis La Reacuteunion) y = minus62 92 lowast 10minus4 times t+ 477 6 16 80 lowast 10minus3ER(d) (Vers La Reacuteunion) y = minus29 4 lowast 10minus5 times t+ 358 1 14 81 lowast 10minus5

Les coefficients de deacutetermination (R2) entre les fonctions lineacuteaires et nos donneacutees in-diquent que nous nrsquoavons pas pu trouver de modegravele de preacutediction suffisamment preacuteciscontrairement au modegravele EIRD Nous constatons eacutegalement que les pentes de nos mo-degraveles ER(d) sont toutes deux neacutegatives Cela signifie que le deacutelai sera plus court pour

61

(a) Depuis La Reacuteunion

(b) Vers La Reacuteunion

FIGURE 211 ndash Relation entre les deacutelais et la distance geacuteographique

joindre une distance eacuteloigneacutee physiquement degraves que lrsquoon emprunte les cacircbles sous-marins La preacutesence du GIX Reunix sur lrsquoicircle permet drsquoavoir des deacutelais courts du mo-ment que lrsquoon reste sur la boucle locale Gazelle (cf section 21) Par exemple le deacutelai pourjoindre un pays europeacuteen est plus court que le deacutelai pour joindre les pays de la ZOI Cereacutesultat est contraire agrave lrsquoanalyse EIRD Il peut srsquoexpliquer en partie par le fait lrsquoeacutetude preacute-senteacute dans [Krajsa2011] est reacutealiseacutee dans des lieux ougrave la connectiviteacute (en terme de liaisonssous-marines) est importante

La partie drsquoanalyse des routes emprunteacutees va nous aider agrave valider ou infirmer lrsquohy-pothegravese suivante Les coefficients α obtenus sur nos eacutequations ER(d) proviennent du routage

Analyse des routes

Dans la section 22 nous avons montreacute lrsquoexistence de liens physiques reliant lrsquoen-semble des icircles de la ZOI Nous cherchons agrave caracteacuteriser lrsquoefficaciteacute des routes emprunteacutees

62

drsquoun point de vue geacuteographique La figure 212 repreacutesente les diffeacuterents points drsquoentreacuteeset de sorties logiques de lrsquoInternet reacuteunionnais que nous avons extraits de nos donneacutees

Des donneacutees obtenues de lrsquoeacutetude Depuis nous avons extrait le pays du premier nœudbaseacute agrave lrsquoexteacuterieur de lrsquoicircle Cette information nous permet drsquoeacutetudier les sorties logiques delrsquoInternet reacuteunionnais Le reacutesultat obtenu est indiqueacute par la figure 212a La taille du lienest proportionnelle au nombre drsquoeacutechantillons passant par ce pays Nous deacutenombrons4 sorties dont 3 en Europe Malgreacute lrsquoabsence de lien direct avec lrsquoAmeacuterique du Norddepuis La Reacuteunion nous avons identifieacute une sortie dans la moitieacute ouest des Eacutetats-UnisLes sorties physiques directes de La Reacuteunion qui sont baseacutees en Afrique Asie et sur lesicircles de la ZOI ne sont pas utiliseacutees La majoriteacute du routage de nos donneacutees avec pregraves de97 srsquoeffectue en France

Dans la figure 212b nous indiquons le dernier eacutequipement localiseacute en dehors deLa Reacuteunion pour une destination finale localiseacutee sur lrsquoicircle Ce sont les entreacutees logiquesde lrsquoInternet reacuteunionnais que nous avons pu obtenir des donneacutees provenant de lrsquoeacutetudeVers Le nombre drsquoentreacutees est double par rapport au nombre de sorties et plus reacuteparti enterme de continent Quatre continents sont directement relieacutes agrave notre icircle lrsquoAfrique lrsquoAsielrsquoEurope et lrsquoAmeacuterique du Sud Le continent europeacuteen est largement repreacutesenteacute dans nosdonneacutees avec 99 51 transitant sur ce territoire La France hexagonale capte 99 33 desdonneacutees soit la quasi-totaliteacute de nos donneacutees Nous avons tout de mecircme pu identifier desliaisons minimales avec lrsquoAfrique du Sud lrsquoInde le Sri Lanka et le Paraguay Ce dernierest le seul agrave ne pas ecirctre directement relieacute agrave lrsquoicircle par un cacircble sous-marin

Le tableau 210 reacutesume les informations contenues dans les figures 212a et 212b Leslignes sont rangeacutees par taux drsquoutilisation deacutecroissant

TABLE 210 ndash Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunionnais

Depuis La Reacuteunion Vers La Reacuteunion

France (9699) 18101 msAllemagne (1 03) 299 26 msEacutetat-Unis (1 03) 293 15 msItalie (1 03) 289 46 ms

France (9933) 18330 msAfrique du Sud (0 45) 66 42 msBelgique (0 1) 197 48 msItalie (0 04) 202 59 msSloveacutenie (0 04) 205 50msInde (0 01) 161 45 msParaguay (0 01) 454 36 msSri Lanka (0 01) 207 88 ms

La preacutesence de liens directs entre La Reacuteunion et des pays beaucoup plus eacuteloigneacutestels que les Eacutetats-Unis ou le Paraguay sans cacircbles physiques directs est symptomatiquede lrsquoabsence drsquoinformations ou drsquoerreurs de geacuteolocalisation Nous pouvons preacutesenter etexpliquer quelques points preacutesents dans nos reacutesultats

1 Les erreurs de geacuteolocalisation Les erreurs de geacuteolocalisation sont principalementdues agrave une mauvaise utilisation des blocs drsquoadresses IP par les opeacuterateurs Ils preacute-fegraverent utiliser des adresses qui leur ont deacutejagrave eacuteteacute attribueacutees que drsquoeffectuer une de-mande drsquoadresse IP aupregraves drsquoun RIR Un exemple est lrsquoadresse IP rsquo19416714221rsquoCette adresse est attribueacutee agrave lrsquoopeacuterateur franccedilais RENATER Comme RENATERpossegravede la nationaliteacute franccedilaise le pays de localisation de lrsquoadresse est rsquoFRANCErsquoOr il srsquoavegravere que cette adresse est utiliseacutee comme adresse publique de lrsquoUniversiteacutede La Reacuteunion Elle est donc localiseacutee sur lrsquoicircle Un raisonnement similaire peut srsquoef-fectuer sur les autres reacutegions drsquooutre-mer posseacutedant des relations avec lrsquoopeacuterateurRENATER Les filiales drsquoopeacuterateur meacutetropolitain comme Orange peuvent eacutegale-ment utiliser ce systegraveme sur lrsquoensemble de leur reacuteseau Pour reacutesoudre ce problegraveme

63

(a) Sorties

(b) Entreacutees

FIGURE 212 ndash Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais

nous avons effectueacute une analyse du deacutelai Si le deacutelai associeacute agrave certaines adresses IPcorrespond au deacutelai theacuteorique associeacute au continent nous avons consideacutereacute que lageacuteolocalisation est correcte Dans les cas contraires nous nrsquoavons pas la possibiliteacutedrsquoecirctre sucircrs agrave 100 de la bonne localisation

2 Les accords de peering se font dans un pays avant que le paquet nrsquoemprunte le cacircblesous-marin Lrsquoexemple illustreacute par la figure 213 montre que les eacutechanges entre deuxadresses IP srsquoeffectuent au sein drsquoun IXP Ces eacutechanges peuvent se faire entre deuxpays distants au sein drsquoun troisiegraveme pays Dans notre exemple lrsquoeacutechange entre LaReacuteunion et les USA se fait en France

3 Lrsquoencapsulation des donneacutees au sein du systegraveme MPLS geacutenegravere eacutegalement des in-coheacuterences au sein de nos analyses Lrsquoexemple que lrsquoon peut indiquer est lrsquoanalysede la mesure numeacuteroteacutee 4178740 2 chez Atlas RIPE NCC Cette trace est composeacuteede 5 sauts entre le Paraguay et La Reacuteunion avec un lien direct Or il nrsquoexiste aucuncacircble physique entre ces deux points du monde Une encapsulation au niveau In-

2 httpsatlasripenetmeasurements4178740

64

Internet InternetUtilisateur DestinationIXP (FR)

RE US

FIGURE 213 ndash Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dansun pays tiers

visible des donneacutees nrsquoindique pas le parcours preacutecis des donneacutees tel que lrsquoindiquelrsquoauteur de lrsquoarticle [Donnet2012]

Ces explications ne sont pas les seules mais potentiellement les plus freacutequemmentrencontreacutees Dans notre cas les points 2 et 3 semblent ecirctre les raisons preacutedominantesLes marques du systegraveme MPLS sont dues agrave la division de la capaciteacute des cacircbles pour lesdiffeacuterents opeacuterateurs et agrave la connexion en diffeacuterents points pour reacutegeacuteneacuterer le signal

Des reacutesultats de nos eacutetudes nous deacuteplorons lrsquoabsence de peering reacutegional Cette ano-malie est la principale cause de la tendance des courbes obtenues dans le tableau 29 Eneacutetudiant les diffeacuterents IXP nous constatons lrsquoabsence drsquoopeacuterateurs communs entre les 3icircles comme lrsquoillustre la figure 214 Ces informations proviennent directement des sitesinternet officiels des IXP [MIXP2017 MGIX2017 REUNIX2017] On peut neacuteanmoins no-ter la preacutesence des filiales de lrsquoopeacuterateur Orange agrave Madagascar et agrave La Reacuteunion Il srsquoagitdans le cas drsquoOrange Madagascar de lrsquoexploitation du nom sans ecirctre dirigeacutee par lrsquoen-treprise Orange De cette figure on peut deacuteduire que les eacutechanges drsquoinformations et dedonneacutees se font dans une reacutegion eacuteloigneacutee de la ZOI et agrave un niveau plus eacuteleveacute On peutsupposer que ce sont des Tiers-1 qui se chargent du peering de cette zone Afin de vali-der cette hypothegravese nous avons deacuteployeacute des sondes de mesures de RunPL sur les icirclesvoisines

FIGURE 214 ndash FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien

243 Connectiviteacute des icircles de la Zone Oceacutean Indien

Nous avons vu dans la section 22 que les icircles de la ZOI partagent des routes phy-siques en commun Nous avons constateacute dans la section 242 que La Reacuteunion possegravede

65

une connectiviteacute Internet particuliegravere Nous sommes donc en droit de nous demander sicette connectiviteacute est commune agrave lrsquoensemble des icircles de la ZOI ou non Nous avons pu deacute-ployer un minimum de deux sondes par pays eacutetudieacute Le protocole de mesure et drsquoanalysemis en place est en tout point identique agrave celui utiliseacute pour lrsquoeacutetude de la connectiviteacute deLa Reacuteunion Ainsi nous avons utiliseacute les mecircmes meacutetriques pour valider la comparaison

Distribution du RTT par pays eacutetudieacute

La figure 215 illustre la reacutepartition des deacutelais des icircles de la ZOI selon le pays drsquooriginedes mesures (215a) et du continent de destination (215b) Comme pour La Reacuteunion nousremarquons la preacutesence des trois pics

Drsquoapregraves la figure 215b ces pics ont la mecircme signification que dans la situation preacute-ceacutedente crsquoest-agrave-dire la preacutesence des deacutelais pour joindre lrsquoEurope lrsquoAmeacuterique du Nord etlrsquoAsie

Sur la figure 215a on remarque eacutegalement des valeurs minimales et maximales dif-feacuterentes selon le pays Ainsi les Seychelles ont les deacutelais les plus courts de la ZOI Agravelrsquoinverse crsquoest La Reacuteunion qui possegravede le plus de deacutelais au delagrave des 800 ms

Le comportement des deacutelais eacutetant communs agrave lrsquoensemble de la ZOI nous allons main-tenant eacutetudier la longueur des routes pour chaque icircle eacutetudieacutee

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 215 ndash Distribution des deacutelais des icircles de la ZOI

Longueur des routes par pays eacutetudieacute

La figure 216 repreacutesente la densiteacute de probabiliteacute de la longueur des routes En confon-dant les destinations nous pouvons eacutetudier la reacutepartition de la distance en fonction delrsquoicircle source (216a) Nous avons appliqueacute le mecircme raisonnement en meacutelangeant les icirclessources pour se concentrer sur la destination (216b) Les figures eacutetudieacutees nrsquoont pas lamecircme forme que celles uniquement deacutedieacutees agrave La Reacuteunion En effet la courbe 216 pos-segravede 2 pics

Sur la figure 216a on remarque que cette diffeacuterence est fortement accentueacutee par lapreacutesence des donneacutees reacuteunionnaises

Sur la figure 216b on voit une diffeacuterence de comportement en fonction du contientjoint Ainsi lrsquoAfrique lrsquoAsie et lrsquoEurope ont la preacutesence drsquoun seul pic Cela signifie queces continents seront majoritairement joints par des routes comprises entre 10 en 20 sautsPour les Ameacuteriques et lrsquoOceacuteanie il y a deux pics Cela sous-entend la preacutesence de deuxgrandes routes avec lrsquoune plus courte que lrsquoautre La plus petite est composeacutee de 13sauts La seconde route est quant agrave elle drsquoune longueur de 16 sauts

66

Cette diffeacuterence peut srsquoexpliquer par la preacutesence de routes emprunteacutees diffeacuterentes enfonction des pays de destinations Pour corroborer cela nous allons poursuivre lrsquoeacutetudeen fonction des meacutetriques preacutesenteacutees dans la section 242

0

003

006

009

012

0 5 10 15 20 25 30 35 40

P [

X=

x]

Longueur du chemin (en noeuds)

Mayotte

Seychelles

Reunion

Maurice

Madagascar

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 216 ndash Longueur des routes emprunteacutees

Longueur du chemin et distance geacuteographique

Dans cette section on va eacutetudier la relation entre la longueur du chemin et la distancegeacuteographique On a vu agrave travers le reacutesultat preacuteceacutedent que le choix du continent avaitun impact sur la longueur du chemin Pour plus de lisibiliteacute nous avons repreacutesenteacute lesreacutesultats sous la forme drsquoeacutequations lineacuteaires repreacutesenteacutes par lrsquoeacutequation 24

PL(d) = αtimes d+ β (24)

Les eacutequations obtenues sont indiqueacutees dans le tableau 211 et repreacutesenteacutees graphique-ment par la figure 217

TABLE 211 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation PL(d)Madagascar y = minus0 000303631times d+ 26 1771

Maurice y = minus0 000183807times d+ 18 4231

Reacuteunion y = minus9 18819 lowast 10minus5 times d+ 17 1201

Seychelles y = minus0 000183362times d+ 18 9892

Mayotte y = minus7 15288 lowast 10minus5 times d+ 18 4781

Nous pouvons seacuteparer nos reacutesultats en 3 groupes Drsquoun cocircteacute les deacutepartements fran-ccedilais avec La Reacuteunion et Mayotte Dans un second groupe lrsquoicircle Maurice et les SeychellesEt dans un troisiegraveme groupe Madagascar Les reacutesultats de La Reacuteunion et de Mayotte sontsimilaires La pente α est quasi-nulle et lrsquoeacutecart sur le coefficient β est de 1 saut Ce reacutesul-tat est similaire agrave celui obtenu preacuteceacutedemment Maurice et les Seychelles ont eacutegalementdes coefficients proches Les pentes sont leacutegegraverement neacutegatives Cela implique une petitedeacutependance du nombre de sauts en fonction de la distance geacuteographique Le cas le plusinteacuteressant est Madagascar Nous allons nous inteacuteresser plus en deacutetail agrave son comporte-ment

Madagascar possegravede les coefficients α et β les plus eacuteleveacutes Cela signifie que le payspossegravede une route minimale plus longue que les autres icircles Son coefficient α neacutegatif

67

10

20

30

0 5000 10000 15000 20000

Pat

h L

ength

PL

(N

um

ber

of

hops)

Distance d (Km)

MGMURESCYT

FIGURE 217 ndash Relation entre la longueur de la route et la distance geacuteographique

est presque deux fois plus eacuteleveacute que pour Maurice et les Seychelles Lrsquoimpact de la dis-tance sur le nombre de sauts est donc plus fort La figure 218 a eacuteteacute reacutealiseacutee selon le mecircmescheacutema que les figures 28 La repreacutesentation de la PDF de la distance des destinations parrapport aux sondes deacuteployeacutees agrave Madagascar montre deux grands groupes Le premiersitueacute entre 5 000 et 10 000 kilomegravetres Ce groupe regroupe Asie Europe Oceacuteanie et Ameacute-rique du Sud Le second groupe eacutevoluant aux alentours des 15 000 kilomegravetres englobe latotaliteacute des adresses IP geacuteolocaliseacutees en Ameacuterique du Nord Le nombre drsquoadresses prove-nant du continent africain est compris entre 0 et 10 000 La pente neacutegative suggegravere doncque les routes vers les continents eacuteloigneacutes sont plus courtes que les routes vers des desti-nations proches geacuteographiquement Neacuteanmoins la lecture des cercles montre des routesglobalement aussi longues quel que soit le continent

Impact de la longueur du chemin sur le RTT

Tout comme la section preacuteceacutedente nous avons repreacutesenteacute les reacutesultats sous formedrsquoeacutequations lineacuteaires Le tableau 212 regroupe les eacutequations obtenues tandis que la fi-gure 219 les repreacutesente graphiquement

TABLE 212 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation D(PL)Madagascar y = 13 5709times t+ 119 717

Maurice y = 14 296times t+ 171 69

Reacuteunion y = 14 2259times t+ 166 84

Seychelles y = 17 3953times t+ 35 3596

Mayotte y = 16 3138times t+ 90 9087

Comme on pouvait srsquoy attendre le deacutelai srsquoaccroicirct avec le nombre de sauts Les coef-ficients α obtenus sont proches les uns des autres La diffeacuterence se fait plus sur la valeurdrsquoajustement β Cette valeur correspond au deacutelai minimal Les Seychelles ont la pente

68

FIGURE 218 ndash Relation entre la longueur de la route et la distance geacuteographique pourMadagascar

la plus eacuteleveacutee et la valeur drsquoajustement la plus basse Cela signifie que malgreacute un deacute-lai minimal faible le temps mis par un paquet dans chaque routeur est plus importantque pour les autres icircles Mayotte est sensiblement dans le mecircme cas Pour Maurice et LaReacuteunion les pentes sont proches et la valeur de β eacutegalement Ces deux icircles auraient doncun comportement similaire

0

50

100

150

200

250

300

350

400

10 20 30

RT

T D

elay

(m

s)

Path Length PL (Number of hops)

MGMURESCYT

FIGURE 219 ndash Relation entre la longueur de la route et les deacutelais

69

Correacutelation entre deacutelai et distance geacuteographique

Nous avions vu que pour La Reacuteunion il y avait une incoheacuterence sur la relation entrele deacutelai et la distance geacuteographique En effet nous avions comme reacutesultat le fait que ledeacutelai deacutecroissait avec la distance Ce scheacutema se reproduit eacutegalement pour les autres icirclesde la ZOI tel qursquoillustreacute par la figure 220 Les eacutequations associeacutees agrave chaque pays sontpreacutesenteacutees dans le tableau 213

TABLE 213 ndash Formule de correacutelation de la distance geacuteographique et du RTT

icircle de deacutepart Eacutequation PL(t)Madagascar y = minus0 0053913times t+ 476 626

Maurice y = minus0 00418997times t+ 438 177

Reacuteunion y = minus0 00370839times t+ 440 249

Seychelles y = minus0 00344991times t+ 368 501

Mayotte y = minus0 0015904times t+ 397 1

On constate des pentes fortement diffeacuterentes en fonction des pays Ainsi Mayotte aune pente beaucoup plus douce que les autres icircles Malgreacute un β proche on voit que lrsquoeacutecartdes deacutelais entre La Reacuteunion et Maurice srsquoaccroicirct avec la distance La pente de Madagascarest tregraves importante Ccedila indique une forte deacutecroissance du deacutelai avec la distance Ainsi ledeacutelai pour joindre lrsquoicircle Maurice sera beaucoup plus important que pour joindre les paysdrsquoAmeacuterique du Nord

Lrsquoune des conseacutequences de ces reacutesultats est la preacutesence drsquoun deacutelai plus eacuteleveacute pourjoindre les icircles de la ZOI que pour joindre des destinations plus lointaines Et cela malgreacutedes routes toutes aussi longues Cela montre une contradiction agrave travers nos reacutesultatsPour comprendre cela il est neacutecessaire drsquoeacutetudier les portes de sorties de lrsquoInternet desicircles de la ZOI

300

350

400

450

500

0 5000 10000 15000 20000

RT

T D

elay

(m

s)

Distance d (Km)

MGMURESCYT

FIGURE 220 ndash Relation entre les deacutelais et la distance geacuteographique

Analyse des portes de sortie

Chaque icircle de la ZOI possegravede ses propres routes avec ses propres regravegles et ses propressorties Agrave la fin de la section 242 nous avons eacutemis lrsquohypothegravese suivante les eacutechanges de

70

paquets entre les FAI des icircles de la ZOI ne se font pas au sein de la ZOILa figure 221 indique le nombre de sorties que lrsquoon a pu relever durant nos mesures

(221a) et le pourcentage de leur reacutepartition geacuteographique (221b)

En analysant la figure 221b on constate que la majoriteacute des pays de sortie est situeacuteeen Europe avec 9463 On remarque lrsquoabsence de sortie au niveau Africain et drsquointer-connexion directe entre les icircles de la ZOI

Sur la figure 221a on remarque qursquoagrave lrsquoexception de Mayotte chaque pays a plus de20 sorties diffeacuterentes Pour La Reacuteunion crsquoest un reacutesultat fortement diffeacuterent de celui ob-tenu dans la section 242 Cela peut srsquoexpliquer par les mecircmes raisons que lors de lrsquoeacutetudepreacuteceacutedente pour rappel les raisons invoqueacutees sont potentiellement des erreurs de geacuteolo-calisation des accords de peering direct dans un pays tiers ou encore de lrsquoencapsulationMPLS

0

5

10

15

20

25

30

35

40

45

50

MG

MU

RE

SC YT

Num

ber

of

links

(a) Nombre de points de sorties pour chaqueicircle de la ZOI

0

20

40

60

80

100

AS

EU NA

Use

d l

inks

()

(b) En fonction du continent

FIGURE 221 ndash Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI

La figure 222 montre la reacutepartition des sorties en pourcentage selon les pays (fig222a) et les continents (222b) pour La Reacuteunion En comparaison avec les reacutesultats ob-tenus preacuteceacutedemment on constate une forte diminution du pourcentage de sorties geacuteo-localiseacutees en France hexagonale (FR) Nous sommes passeacutes de 9699 agrave une valeur de55408 Neacuteanmoins le pourcentage par continent reste extrecircmement eacuteleveacute avec 951636de sorties localiseacutees en Europe

Agrave travers lrsquoanalyse des points de sorties de lrsquoInternet des icircles de la ZOI nous validonslrsquohypothegravese preacutesenteacutee selon laquelle les accords drsquoeacutechanges entre opeacuterateurs des icircles dela ZOI se font agrave travers un Tiers-1

244 Synthegravese des reacutesultats

Lrsquoeacutetude des routes et des deacutelais meneacutee durant nos travaux de thegravese a eacuteteacute diviseacutee entrois grandes parties La premiegravere consistait agrave comparer lrsquoeacutetat actuel avec une eacutetude reacutea-liseacutee quatre ans auparavant La seconde phase de meacutetrologie active a mis en avant uneanalyse plus fine de la connectiviteacute Internet de La Reacuteunion avec lrsquoeacutetude des routes Laderniegravere partie avait pour objectif de comparer la connectiviteacute Internet de La Reacuteunionavec les autres icircles de la ZOI

La campagne de ping meneacutee agrave lrsquoUniversiteacute de La Reacuteunion au sein du LIM a montreacuteune reacuteduction de la longueur des routes depuis La Reacuteunion En deacutepit de la reacuteduction desroutes nous avons constateacute une stabiliteacute des deacutelais aux alentours des 200 ms

71

0

20

40

60

80

100

US-C

O

US

GB

FR

Use

d l

inks

()

(a) par pays

0

20

40

60

80

100

EU NA

Use

d l

inks

()

(b) par continent

FIGURE 222 ndash Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion

Notre seconde eacutetude faite agrave partir de donneacutees de type traceroute meneacutee depuis dif-feacuterents points de mesures reacutepartis sur lrsquoicircle a montreacute des reacutesultats inteacuteressants Le pre-mier reacutesultat est la correacutelation des deacutelais et de la localisation des destinations jointesdepuis lrsquoicircle de La reacuteunion Nous avions constateacute des pics sur la PDF des deacutelais Cespics correspondaient bien agrave la reacutepartition des continents dans notre jeu de destinationsLa longueur des routes est quant agrave elle moins impacteacutee par cette reacutepartition des des-tinations Nous avons tout de mecircme trouveacute une forte symeacutetrie aux courbes peu im-porte le sens de lrsquoeacutetude Agrave partir de ces donneacutees nous avons eacutetudieacute les relations sui-vantes Longueur du chemin Distance geographique Longueur du chemin RTTet RTT Distance geographique La premiegravere concordance a montreacute que la longueurdu chemin nrsquoest pas deacutependante de la distance geacuteographique La seconde correacutelation amontreacute une premiegravere asymeacutetrie des liens En effet le temps associeacute agrave chaque nœud dutrajet est tregraves diffeacuterent selon que lrsquoon quitte ou que lrsquoon essaye de joindre La Reacuteunion Ledernier rapport a mis en eacutevidence une particulariteacute de lrsquoaccegraves Internet de La Reacuteunion Agravelrsquoinverse de tout sens commun les deacutelais provenant et agrave destination de La Reacuteunion vonten deacutecroissant en fonction de la distance geacuteographique Lrsquoanalyse des routes et plus par-ticuliegraverement les points drsquoentreacutees et de sorties logiques de lrsquoInternet reacuteunionnais a permisdrsquoexpliquer ce comportement

Notre derniegravere eacutetude utilise le mecircme protocole et la mecircme plate-forme que lrsquoeacutetudepreacuteceacutedente Nous avons reacuteussi agrave distribuer des sondes sur les icircles de la ZOI Agrave traverscette eacutetude nous avons pu constater un comportement proche pour lrsquoensemble des icircleseacutetudieacutees Ainsi nous avons pu trouver des speacutecificiteacutes de lrsquoInternet de la ZOI La dis-tance geacuteographique a un impact sur la longueur de la route le deacutelai associeacute agrave chaquenœud de la route est similaire Mais surtout le deacutelai pour toute destination baseacutee agrave lrsquoex-teacuterieur drsquoune icircle est plus long pour les distances geacuteographiques courtes Ce comporte-ment srsquoexplique par une inter-connexion des FAI reacutegionaux agrave travers des Tiers-1 situeacutesmajoritairement en Europe

25 Conclusion

Dans ce chapitre nous avons eacutetudieacute la connectiviteacute de La Reacuteunion en terme de deacutelaiset de routes emprunteacutees

Lors de la premiegravere section nous avons vu que La Reacuteunion ne propose pas drsquoinfra-structure permettant la mise en place de notre eacutetude La premiegravere eacutetape fut le deacuteploie-ment de raspberry-pi sur lrsquoensemble de lrsquoicircle Ces sondes connecteacutees agrave lrsquoensemble des FAI

72

et TAI utilisent lrsquooutil Paris-traceroute pour reacutealiser des mesures de deacutelais et de routesCet outil est moins sensible au pheacutenomegravene drsquoeacutequilibrage de charges que le traceroutetraditionnel

Une fois notre plate-forme deacuteployeacutee nous avons reacutealiseacute des mesures durant plusieursmois Ces mesures actives eacutetudient la connectiviteacute depuis et vers La Reacuteunion Cette vo-lonteacute drsquoeffectuer les mesures dans les deux sens provient de la forte preacutesence de routesasymeacutetriques dans lrsquoInternet

Nos donneacutees ont montreacute que La Reacuteunion est confronteacutee agrave ce pheacutenomegravene Nous avonseffectueacute une analyse selon 4 paramegravetres le deacutelai la distance geacuteographique la longueurdu chemin et les routes emprunteacutees La litteacuterature ne proposant pas drsquooutil respectantnos critegraveres de seacutelection nous avons deacuteveloppeacute notre propre outil drsquoanalyse rTrace-route Nous avons souhaiteacute partager notre outil drsquoanalyse agrave travers une publicationDans lrsquoattente drsquoune publication scientifique un site internet deacutedieacute agrave lrsquooutil est dispo-nible [rtraceroute]

Le premier reacutesultat concerne la longueur des routes Les routes reacuteunionnaises sontplus longues que la moyenne mondiale On constate eacutegalement une diffeacuterence selon lesens de communication En eacutetudiant lrsquoimpact de la distance kilomeacutetrique sur la longueuron voit qursquoaucune correacutelation nrsquoexiste entre les deux paramegravetres Les routes Internet dela boucle locale sont aussi longues que les routes reliant des points situeacutes agrave plus de 15 000kmLorsqursquoun paquet traverse un nœud un deacutelai associeacute au traitement agrave lrsquoeacutemission et agrave lapropagation des donneacutees vers le saut suivant peut ecirctre calculeacute Cette valeur diffegravere eacutenor-meacutement selon que lrsquoon quitte ou que lrsquoon joint La Reacuteunion On a un coefficient de 1 79entre les deux valeurs Cela corrobore lrsquoasymeacutetrie des liens mais aucunement un com-portement speacutecifique agrave la connectiviteacute reacuteunionnaiseLrsquoun des reacutesultats les plus inteacuteressants concerne la relation entre la distance geacuteogra-phique et les deacutelais associeacutes Contrairement agrave ce que lrsquoon pouvait attendre la connectiviteacutereacuteunionnaise deacutecroicirct les deacutelais avec lrsquoincreacutementation de la distance lorsque le trafic em-prunte les cacircbles sous-marinsDans lrsquoanalyse des routes nous avons constateacute que lrsquointer-connexion reacutegionale se faitnon pas au sein de la ZOI mais dans une zone eacuteloigneacutee La Reacuteunion possegravede 3 sortiesphysiques que sont lrsquoAsie lrsquoAfrique et lrsquoEurope Pour autant seule la France hexagonalesemble ecirctre inteacuteressante pour les FAI locaux Plus de 97 de nos donneacutees sortent agrave traversce pays localiseacute agrave plus de 10 000 km

Nous avons confirmeacute le fait que lrsquointer-connexion se fait dans une zone eacuteloigneacutee agravetravers lrsquoeacutetude de la connectiviteacute de la ZOI Cette eacutetude a deacutemontreacute un comportementsimilaire entre La Reacuteunion et les icircles de la zone La seule diffeacuterence notable provient dunombre de portes de sorties pour les icircles Neacuteanmoins elles sont agrave une tregraves forte majoriteacutegeacuteolocaliseacutees en Europe

Le deacutelai minimal mesureacute pour La Reacuteunion et la configuration actuelle de la connec-tiviteacute Internet reacuteunionnaise peuvent avoir des conseacutequences sur les performances desprotocoles de transport comme TCP Pour veacuterifier cela une eacutetude de meacutetrologie passivea eacuteteacute reacutealiseacutee Cette eacutetude est preacutesenteacutee dans le chapitre 3

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors dela confeacuterence Asian INTernet Engineering Conference (AINTEC) en 2016 [Noordally2016]Cette publication a eacuteteacute axeacutee sur les reacutesultats reacuteunionnais Une seconde contribution deacute-dieacutee agrave la connectiviteacute des icircles de la ZOI a eacuteteacute publieacutee lors de la confeacuterence Global Informa-tion Infrastructure and Networking Symposium (GIIS) en 2017 [Nicolay2017-2]

73

74

Chapitre 3

Meacutetrologie sur le service de transportagrave La Reacuteunion

TCP est un protocole de transport dont la performance est deacutependante du RTT etdu taux de perte des segments Plus exactement ces deux paramegravetres entrent en comptepour deacuteterminer le deacutelai pris par la fenecirctre de congestion pour qursquoelle atteigne une taillequi couvre le produit deacutelai-bande passante du canal virtuel qui relie la source agrave la desti-nation Aussi TCP voit ses performances reacuteduites lorsque ce produit augmente et changede facteur drsquoeacutechelle Les reacutesultats obtenus par lrsquoeacutetude de la connectiviteacute de lrsquoicircle de LaReacuteunion ont montreacute un RTT minimal de 180 ms pour le trafic quittant lrsquoicircle de La Reacuteunion(cf tableau 210) Avec les technologies drsquoaccegraves agrave haut deacutebit il devient techniquementpossible que des connexions TCP depuis ou vers La Reacuteunion souffrent des symptocircmesque lrsquoon retrouve avec lrsquoutilisation drsquoun LFN

Dans ce chapitre nous allons eacutetudier quel peut ecirctre lrsquoimpact de la capaciteacute de stockagedes canaux de communication depuis et vers lrsquoicircle La Reacuteunion sur les performances deTCP Pour cela nous allons nous appuyer sur de la meacutetrologie passive afin de pouvoirfaire des observations sur la performance de TCP Dans ce chapitre nous preacutesentonsla meacutethode que nous avons appliqueacutee afin drsquoestimer par la meacutetrologie le service quenous obtenons agrave La Reacuteunion Lrsquoobjectif ici nrsquoest pas drsquoobtenir des reacutesultats repreacutesentatifsde lrsquoInternet applicables agrave La Reacuteunion dans sa globaliteacute mais de mener une premiegravereexpeacuterience pour valider la meacutethode et les outils que nous pourrions ensuite appliqueraupregraves des diffeacuterents opeacuterateurs locaux

Ce chapitre se compose de quatre sections La premiegravere section 31 fixe les objectifs delrsquoeacutetude de meacutetrologie Elle preacutesente les meacutetriques agrave deacuteterminer pour pouvoir atteindreces objectifs La partie 32 preacutesente la meacutethode de mise en œuvre de la plate-forme demeacutetrologie Le protocole de mesure mis en place pour la reacutealisation drsquoune eacutetude est preacute-senteacute dans la section 33 Enfin cette section est suivie par la partie 34 qui preacutesente lesreacutesultats que lrsquoon peut obtenir et lrsquointerpreacutetation qui peut en ecirctre faite

31 Objectifs

Lrsquoeacutetude des deacutelais aller-retour (RTT) et des routes Internet de lrsquoicircle de La Reacuteunion quenous avons preacutesenteacutee dans le chapitre preacuteceacutedent a mis en eacutevidence une connectiviteacute speacute-cifique Lrsquoaccegraves agrave lrsquoInternet passe principalement par la meacutetropole avec un RTT minimalde 180 ms Ce RTT multiplieacute par un deacutebit drsquoaccegraves de 1 Mbits deacutebit theacuteorique minimalproposeacute dans les diffeacuterentes offres par les FAI donne une quantiteacute de donneacutees eacutemisespar anticipation de 22 5 Ko Ce calcul prend comme hypothegravese que le goulot drsquoeacutetran-glement est le lien drsquoaccegraves de lrsquohocircte Ce produit deacutelai bande passante repreacutesente la taille

75

de la fenecirctre drsquoeacutemission agrave partir de laquelle une transmission continue de lrsquoeacutemetteur de-vient possible Avec une valeur de 22 5 Ko cela place le canal de communication de LaReacuteunion dans la cateacutegorie des reacuteseaux agrave forte capaciteacute de stockage (LFN) Dans la section21 nous avons vu que La Reacuteunion est pleinement inteacutegreacutee au plan tregraves haut deacutebit delrsquoeacutetat franccedilais Ce plan a pour objectif de deacuteployer une infrastructure de distribution enfibre optique (Fiber To The Home (FTTH)) sur lrsquoensemble du territoire franccedilais Cela aurapour conseacutequence si les deacutelais ne sont pas en diminution drsquoaugmenter la capaciteacute destockage du canal de communication

311 Les objectifs de lrsquoeacutetude

Le lien drsquoaccegraves de La Reacuteunion conduit agrave consideacuterer lrsquoInternet avec les caracteacuteristiquesdrsquoun reacuteseau agrave forte capaciteacute de stockage Ceci est ducirc agrave un deacutelai minimal eacuteleveacute Avec cedeacutelai des deacutegradations potentielles des performances de TCP sont envisageables La miseen place drsquoune eacutetude de meacutetrologie passive agrave lrsquoeacutechelle reacutegionale nrsquoa pas encore eacuteteacute reacuteali-seacutee Les opeacuterateurs ont une connaissance partielle de la situation de lrsquoicircle Afin drsquoobtenirune vision globale de lrsquousage de lrsquoInternet sur lrsquoicircle de La Reacuteunion il nous faut reacutepondreaux diffeacuterentes questions suivantes

mdash Quel est lrsquoimpact de lrsquoaugmentation de la capaciteacute de stockage sur les performancesdu protocole TCP

mdash Est-ce que lrsquoaugmentation des deacutebits theacuteoriques est reacutecupeacutereacutee dans les deacutebits me-sureacutes par TCP

Dans la section 123 nous avons preacutesenteacute lrsquoarticle [Zheleva2015] Pour rappel dans cettepublication les auteurs ont mis en avant un changement drsquoutilisation des services Internetapregraves une augmentation de la bande passante Nous allons eacutegalement reacutepondre agrave desquestions orienteacutees vers la supervision du trafic Ces questions sont les suivantes

mdash Quels sont les protocoles de transport utiliseacutes

mdash Quels sont les services les plus freacutequents

mdash Quelle est la distribution geacuteographique des services joints

Les reacuteponses agrave ces questions impliqueront lrsquoapparition drsquoautres questions

312 Les meacutetriques de lrsquoeacutetude

Le tableau 31 indique les meacutetriques que lrsquoon va eacutetudier Chaque meacutetrique eacutetudieacuteesera mise en relation avec une des questions poseacutees preacuteceacutedemment

Meacutetriques de supervision

La supervision du trafic consiste agrave analyser le flux geacuteneacuteral de paquets qui transite ausein drsquoun eacutequipement comme un routeur ou un commutateur On parle drsquoeacutetude macro-scopique telle qursquoindiqueacutee dans le rapport [Owezarski2003-1] Les informations analy-seacutees par la supervision sont geacuteneacuteralement les informations analyseacutees par un adminis-trateur Reacuteseau ou encore un FAI En reacuteponse aux questions sur la supervision nousavons seacutelectionneacute dans un premier temps lrsquoidentification des protocoles de transportLe champ protocole de lrsquoen-tecircte IP indique le protocole de niveau suivant utiliseacute dans lapartie des donneacutees du datagramme Internet [RFC760] Les valeurs des diffeacuterents proto-coles sont speacutecifieacutees en reacutefeacuterence [RFC3232 IANA-port]

76

TABLE 31 ndash Les meacutetriques de meacutetrologie passive

Meacutetriques En-tecircte Champs

Supervisiondu trafic

Caracteacuterisation des destinationsIP

Adressessources etdestinations

Protocole de transport employeacute ProtocoleService utiliseacute

TCP

Numeacutero deport

Performanceprotocolaire

Performance deTCP

Eacuteveacutenement de congestion ECNNS+ CWRNumeacutero deseacutequence

RTT TimestampPertes Numeacutero de

seacutequencedeacute-seacutequencementsRetransmissions

Deacutebits binaires

EacutecouleacuteTimestampNumeacutero deseacutequencefenecirctre

DescendantMontant

UtileCaracteacuterisationdes flots

DeacutebitDureacutee Timestamp

Longueur Nombrede paquetseacutechangeacutes

Nous avons vu preacuteceacutedemment que les services eacutevoluent dans le temps et selon lesdeacutebits [Zheleva2015] Lrsquoanalyse du champ numeacutero de port de lrsquoen-tecircte TCP aide agrave lrsquoidenti-fication du Service utiliseacute Chaque numeacutero de port est associeacute agrave un service preacutecis deacutefinidans le [RFC776]

En regravegle geacuteneacuterale le trafic Internet est diviseacute en trois cateacutegories en fonction de ladestination par rapport agrave la source Crsquoest le groupe de travail 802 de lrsquoIETF qui est encharge des caracteacuterisations

mdash Local Area Network (LAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir une zonede quelques kilomegravetres carreacutes ou moins Parce que le reacuteseau est connu pour necouvrir qursquoune petite zone des optimisations peuvent ecirctre faites dans les protocolesde signal de reacuteseau qui permettent des deacutebits de donneacutees jusqursquoagrave 100 Mbits raquo[RFC1983]

mdash Metropolitan Area Network (MAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir unezone proche de celle drsquoune grande ville Ces reacuteseaux sont mis en œuvre par destechniques innovantes comme le passage de cacircbles agrave fibres optiques dans les tun-nels du meacutetro raquo [RFC1983]

mdash Wide Area Network (WAN) laquo Un reacuteseau geacuteneacuteralement construit avec des lignesseacuteries qui couvrent une large zone geacuteographique raquo [RFC1983]

La reacutepartition des adresses IP de destination va permettre drsquoidentifier le pays ougrave se si-tue lrsquoinformation Cette information peut permettre de connaicirctre la pertinence du lieudrsquoheacutebergement de lrsquoinformation par rapport au service et agrave lrsquoapplication utiliseacutee Nousutilisons pour cela la base de donneacutees associeacutee agrave lrsquooutil rTraceroute outil drsquoanalyse gra-phique des traces preacutesenteacute dans la section 222 Dans le cas ougrave une adresse IP nrsquoest pas

77

reacutepertorieacutee dans notre base de donneacutees lrsquoinformation sera extraite de la base de donneacuteesde RIPE NCC avec lrsquooutil rgeoloc [LanYanFock2015]

Meacutetriques de performance

Le groupe de travail IPPM de lrsquoIETF a deacutefini dans diffeacuterents documents des meacutetriquesde bases comme la mesure de connectiviteacute [RFC2678] le deacutelai unidirectionnel [RFC2679]le taux de perte unidirectionnel [RFC2680] Ces deux derniegraveres meacutetriques sont eacutegalementdeacutefinies dans le sens aller-retour avec le [RFC2681]

Nous avons comme objectif la comparaison du deacutebit theacuteorique et le deacutebit mesureacute Lecalcul du deacutebit mesureacute par TCP se fait agrave travers 3 meacutetriques le RTT la taille de la fe-necirctre drsquoeacutemission et la probabiliteacute de perte de paquets Le RTT est le deacutelai entre la misedu premier bit de la question sur le cacircble et la reacuteception du dernier bit de la reacuteponse[RFC2681] Il est calculeacute par la diffeacuterence de temps entre lrsquoeacutemission du paquet et la reacute-ception de lrsquoACK correspondant Si le RTT est trop important TCP peut consideacuterer unpaquet comme perdu

Une perte est deacutefinie comme laquo lrsquoeacutemission drsquoun paquet par la source mais non reccedilupar la destination raquo [RFC2680] Si le paquet est perdu alors TCP va reacuteduire la fenecirctredrsquoeacutemission

La fenecirctre drsquoeacutemission est calculeacutee agrave partir du champ Fenecirctre des segments TCP Cechamp est deacutefini dans le [RFC6528] comme le nombre drsquooctets de donneacutees commenccedilantpar celui indiqueacute dans le champ drsquoaccuseacute de reacuteception que lrsquoexpeacutediteur de ce segment estprecirct agrave accepter

Agrave lrsquoaide de la formule indiqueacutee par lrsquoeacutequation 31 il est possible de calculer le deacutebitmesureacute par TCP

Debit =FenetreRTTradic

Probabilite perte(31)

Les deacutebits mesureacutes pourront ecirctre classeacutes selon qursquoils soient montants descendantsconfondus ou utiles Cette diffeacuterenciation srsquoexplique par le fait que la comparaison avecle deacutebit theacuteorique est montant et descendant Le deacutebit eacutecouleacute (throughput) correspond laquo aunombre de paquets ou de bits par seconde raquo [RFC6201] Le deacutebit utile (goodput) corres-pond laquo au nombre de paquets ou de bits utiles (non retransmis) par seconde raquo[RFC5166]

Lrsquoeacutetude des performances du protocole TCP passe dans un premier temps par lrsquoeacutetudedes pertes et des retransmissions

Une retransmission est deacutefinie par le [RFC6298] comme eacutetant le laquo segment le plusancien qui nrsquoa pas eacuteteacute acquitteacute par le reacutecepteur TCP raquo Pour obtenir le nombre de re-transmissions on regarde les numeacuteros de seacutequences des segments TCP Si dans un flotIP un numeacutero de seacutequence apparaicirct plusieurs fois alors cela implique la retransmissiondu paquet Les retransmissions seront seacutepareacutees selon la raison de la retransmission (fastretransmit) ou retransmissions abusives (spurious retransmit)Le [RFC5681] explique le pheacutenomegravene pouvant provoquer une retransmission par le meacute-canisme de fast retransmit La retransmission drsquoun paquet due au meacutecanisme de fast re-transmit est calculeacutee en fonction du nombre drsquoacquittements dupliqueacutes et de la diffeacuterencetemporelle entre le paquet de donneacutees observeacutees et le preacuteceacutedent acquittementLes paquets spurious retransmit sont des paquets subissant des fausses retransmissions Sile numeacutero de seacutequence du paquet attendu est infeacuterieur ou eacutegal au numeacutero drsquoacquittementdu preacuteceacutedent ACK alors le paquet observeacute est un paquet retransmis abusivement

78

Lorsque le paquet est reacute-eacutemis il va se produire du deacute-seacutequencement Le deacute-seacutequencementse deacutefinit dans le [RFC6248] laquo Lrsquoarriveacutee ordonneacutee est une proprieacuteteacute que lrsquoon trouve dansles paquets qui transitent par leur chemin ougrave le numeacutero de seacutequence des paquets aug-mente avec chaque nouvelle arriveacutee et il nrsquoy a pas de reacutegression La deacutetection du reacute-ordonnancement agrave destination est baseacutee sur lrsquoordre drsquoarriveacutee des paquets par rapport agraveune valeur de reacutefeacuterence non inverseacutee raquo

Les paquets retransmis peuvent eacutegalement servir agrave lrsquoidentification des eacuteveacutenementsde congestion Pour identifier ces eacuteveacutenements deux techniques peuvent ecirctre mises enplaceLa premiegravere consiste a eacutetudier la preacutesence des drapeaux ECN et Congestion Window Re-duce (CWR) dans les en-tecirctes des paquets TCP [RFC8311]La seconde technique se propose drsquoeacutetudier les variations de la fenecirctre drsquoeacutemission de TCPCette eacutetude doit ecirctre coupleacutee avec lrsquoanalyse des pheacutenomegravenes de pertes et de retransmis-sion autour de cet eacuteveacutenement

Dans la section 112 nous avons constateacute que la capaciteacute de stockage drsquoun lien estprobleacutematique pour les flots courts Afin de poursuivre lrsquoeacutetude de lrsquoimpact de la capa-citeacute de stockage des liens de lrsquoInternet reacuteunionnais nous allons caracteacuteriser les flux Lacaracteacuterisation drsquoun flot peut se faire selon la dureacutee (temps eacutecouleacute entre le premier etle dernier paquet) la taille (nombre de paquets eacutechangeacutes) et le ratio entre la dureacutee et lataille Drsquoapregraves les travaux reacutealiseacutes par [Lan2006] un flot se caracteacuterise par la deacutefinitionsuivante laquo a flow is an unidirectional series of IP packets with same source and destinationaddresses port numbers and protocol numbers raquo Ce qui peut se traduire par la deacutefinition sui-vante laquo un flot est une seacuterie de paquets IP avec le mecircme tuple suivant (adresse IP sourceport source adresse IP destination port destination protocole IP) raquo Dans ce cas preacutecisune connexion TCP de par son coteacute bi-directionnel est constitueacutee de deux flots

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie

La mise en place drsquoune eacutetude de meacutetrologie passive au sein du territoire reacuteunionnaissoulegraveve trois contraintes

La premiegravere est la mise en place drsquoun accord de partenariat avec un ou plusieurs FAILrsquoobjectif de ce partenariat est la mise en place drsquoun systegraveme drsquoeacutecoute et de capture dedonneacutees au sein de leur infrastructure tout en garantissant une confidentialiteacute maximaleagrave leur clients et agrave lrsquoentreprise

Une seconde contrainte est la seacutelection drsquoun outil de mesure Cet outil sera capablenon seulement drsquoeacutecouter les donneacutees circulant sur une interface mais eacutegalement de cap-turer les donneacutees sous diverses extensions

La derniegravere contrainte est lieacutee agrave la seacutelection drsquoun outil drsquoanalyse Cet outil sera ca-pable drsquoapporter un support de reacuteponses aux questions poseacutees preacuteceacutedemment Il devrareacutepondre agrave des critegraveres que lrsquoon deacutetaillera par la suite

Le trafic eacutetant variable drsquoun instant t agrave lrsquoinstant t+1 nous allons mettre en place un sys-tegraveme de capture de donneacutees Ce systegraveme permettra lrsquoanalyse a posteriori des meacutetriquesEn fonction des reacutesultats drsquoautres meacutetriques pourront ecirctre extraites des donneacutees Deplus la capture nous autorise apregraves quelques deacutemarches administratives de partagerles traces aupregraves de la communauteacute scientifique

321 Pour la capture du trafic

Nous avons vu dans le chapitre 1 que les outils neacutecessaires agrave la reacutealisation drsquoeacutetudes demeacutetrologie passive sont nombreux Notre analyse sera la plus large possible en terme de

79

meacutetriques Nous devrons en fonction des reacutesultats obtenus eacutetudier drsquoautres meacutetriquesque celles choisies en premier lieu Pour ces raisons nous faisons le choix de reacutealiser descaptures du trafic Dans la section 123 nous avons preacutesenteacute les outils disponibles pourla capture de trafic Nous allons dans un premier temps utiliser une solution logicielleDans le cas ougrave les deacutebits sur les liens seraient trop eacuteleveacutes nous basculerons alors vers unesolution mateacuterielle

322 Pour analyser les traces

De nombreux outils drsquoanalyse de traces existent dans la litteacuterature Afin drsquoen choi-sir un nous allons deacutetailler des critegraveres de seacutelection Nous preacutesenterons quelques outilsdrsquoanalyse existants en mettant en avant leurs reacuteponses aux critegraveres preacutesenteacutes Nous fini-rons par la preacutesentation drsquoun outil drsquoanalyse de traces deacuteveloppeacute au sein du LIM

Deacutefinition des critegraveres

Lrsquooutil drsquoanalyse pour la plate-forme de meacutetrologie passive devra reacutepondre aux cri-tegraveres de seacutelection suivants

1 Protection de la vie priveacutee des utilisateurs Pour respecter ce critegravere une fonctiondrsquoanonymisation des traces doit ecirctre appliqueacutee La loi Informatique et Liberteacute de1978 reacuteglemente le traitement des donneacutees personnelles [LIL1978] Une trace estune eacutecoute drsquoun trafic initieacute par un utilisateur Les donneacutees transporteacutees nrsquoont pasagrave ecirctre lues En plus des donneacutees ce sont aussi les adresses IP qui ne doivent pasapparaitre en clair

2 traiter une volumeacutetrie importante Le volume des traces eacutetant variable il est neacuteces-saire que lrsquooutil soit capable de traiter des traces de grande taille Potentiellementce sont des fichiers de traces de plusieurs dizaines de Go (Giga-octets) qui peuventecirctre ameneacutes agrave ecirctre traiteacutes

3 proposer des meacutetriques adapteacutees Pour reacutealiser une analyse approfondie il fautque la liste des meacutetriques proposeacutees par lrsquooutil drsquoanalyse soit la plus large possibleAgrave ce titre nous avons preacutesenteacute dans le tableau 31 une base de meacutetriques a analyser

Les outils drsquoanalyse disponibles

Il existe de nombreux outils drsquoanalyse de donneacutees de meacutetrologie passive Nous pro-posons une classification selon les possibiliteacutes offertes par chaque outil CAIDA pro-pose sur son site internet une partie deacutedieacutee aux diffeacuterents outils de meacutetrologie passive[CAIDA-Tools]

BRO est un outil pour la deacutetection drsquointrus sur le reacuteseau en temps-reacuteel agrave partir demeacutetrologie passive Il est preacutesenteacute pour la premiegravere fois dans lrsquoarticle [Paxson1999] Agravepartir drsquoun systegraveme de script il accepte en entreacutee des fichiers de taille importante Leprincipal deacutefaut de Bro par rapport agrave nos critegraveres de seacutelection est le non-respect de la viepriveacutee

CoralReef [Moore2001] est une suite logicielle deacuteveloppeacutee par CAIDA en 1999 Cetoutil reacutealise des analyses de donneacutees que ccedila soit en temps reacuteel ou sur des traces Le critegraverede respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pas respecteacuteLrsquooutil est plus adapteacute agrave lrsquoeacutetude des caracteacuteristique du trafic qursquoau performance de TCPAinsi les meacutetriques lieacutees agrave lrsquoeacutetude des performances ne sont pas incluses dans le code delrsquooutil

Netflow est un outil proprieacutetaire Il neacutecessite lrsquoutilisation drsquoun mateacuteriel de la marqueCISCO plus la licence du logiciel Lrsquooutil reacutealise principalement la supervision du trafic

80

transitant sur le mateacuteriel Le respect de la vie priveacutee est ici respecteacute mais les meacutetriques deperformance protocolaire ne sont pas inclues

TCPStat [Herman2001] rapporte certaines statistiques du trafic transitant agrave traversune interface reacuteseau Crsquoest un outil qui peut travailler sur un flot en temps reacuteel ou enanalysant un fichier de trace Cet outil ne permet pas lrsquoanonymisation des adresses IPPeu de meacutetriques sont ainsi renseigneacutees On pourrait obtenir les deacutebits et la volumeacutetriedes paquets IPv4 eacutechangeacutes

TCPTrace [Ostermann2000] est un logiciel qui permet le traitement de traces drsquoeacutecouteOutil tregraves complet il a deacutejagrave fait ses preuves sur drsquoautres projets de meacutetrologie passive Lecritegravere de respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pasrempli La meacutetrique de caracteacuterisation des destinations et la reacutepartition geacuteographique nesont pas incluses dans les meacutetriques proposeacutees par lrsquooutil

Tstat [Mellia2003-1] est un outil qui peut reacutealiser la collecte et lrsquoanalyse du trafic Cetteanalyse se fait sur diffeacuterents niveaux passant des paquets agrave la couche applicative Cetteanalyse reacutealise une anonymisation des adresses IP Les meacutetriques de caracteacuterisations desdestinations et de reacutepartitions geacuteographiques ne sont pas inteacutegreacutees dans lrsquooutil

Wireshark [Orebaugh2006] est un outil graphique drsquoanalyse reacuteseau tregraves reacutepandu Cetoutil permet de filtrer et drsquoanalyser des donneacutees entrantes et sortantes drsquoun point entemps reacuteel ou sur des traces collecteacutees Il autorise eacutegalement la capture et la lecture detraces Lrsquooutil preacutesente des lacunes sur les trois critegraveres preacutesenteacutes

ZOO est un outil deacuteveloppeacute dans le cadre du projet Metropolis Creacuteeacute par le Labora-toire drsquoAnalyse et drsquoArchitecture des Systegravemes (LAAS) le logiciel essaie de trouver un moyende mesurer la qualiteacute du service de trouver des paramegravetres pour deacutefinir le processus detrafic et drsquoaider agrave eacutemettre un modegravele adapteacute pour le trafic [Owezarski2004] Au niveaudes meacutetriques preacutesenteacutees ce sont principalement des statistiques et des informations desupervision qui sont disponibles Lrsquoanonymisation des adresses IP nrsquoest pas incluse dansles caracteacuteristiques de lrsquooutil

Le tableau 31 sert de base pour la reacuteponse aux critegraveres deacutedieacutes des meacutetriques Netflowpossegravede un catalogue de meacutetriques restreint agrave la supervision du trafic TCPTrace et Tstatsont des outils qui auraient pu correspondre agrave nos besoins mais les meacutetriques de caracteacute-risation des destinations et la reacutepartition geacuteographiques sont absentes Nrsquoayant pu faireun choix sur un outil pouvant reacutepondre agrave la totaliteacute des critegraveres nous nous orientons versle deacuteveloppement drsquoun analyseur de traces

Deacuteveloppement de Xanalyse

Lrsquoanalyse des traces de meacutetrologie passive peut srsquoeffectuer avec de nombreux outilsDans la section preacuteceacutedente nous avons preacutesenteacute les critegraveres de diffeacuterenciation de cesoutils Tstat et TCPTrace sont des outils tregraves complets Ces deux outils auraient pu nousconvenir Neacuteanmoins le temps de traitement des fichiers de volumeacutetrie importante estbeaucoup trop important Ducirc agrave cela nous avons pris le parti de deacutevelopper un nouveloutil drsquoanalyse de traces Xanalyse

Le premier critegravere concerne le respect de la vie priveacutee Une approche simple pouranonymiser une adresse IP est de la faire correspondre avec une adresse IP aleacuteatoireUne telle meacutethode rend la trace inutilisable dans des situations utilisant la logique desadressages IP Lrsquoanonymisation drsquoadresse est performante si elle preacuteserve le mecircme preacute-fixe Autrement dit si deux adresses IP partagent k-bits de preacutefixes leurs eacutequivalencesanonymiseacutees conserveront ces k-bits de preacutefixes en commun La meacutethode crypto-pan deacute-crite dans lrsquoarticle [Xu2002] sert de base agrave la fonction drsquoanonymisation mise en œuvreLrsquoanonymisation srsquoappliquera que lors de lrsquoaffichage des reacutesultats Nous avons besoin de

81

lrsquoadresse pour deux meacutetriques de supervision que sont la reacutepartition du trafic et la geacuteo-localisation Concernant le champ Donneacutees des paquets TCP il nrsquoest pas utiliseacute Lrsquoeacutetudene recommande que les en-tecirctes

Sur lrsquoaspect du traitement drsquoune volumeacutetrie importante Xanalyse fut deacuteveloppeacute avecla volonteacute de maximiser lrsquoutilisation des ressources de la machine hocircte Pour cela nousavons eu lrsquoideacutee drsquoutiliser la programmation parallegravele (thread) La paralleacutelisation permetlrsquoexeacutecution de plusieurs instructions simultaneacutement

Le calcul des meacutetriques fut directement reacutealiseacute en consideacuterant leurs deacutefinitions dansles diffeacuterents RFC tel que nous lrsquoavons deacutecrit dans la section 312 Une partie statistiquefut eacutegalement inteacutegreacutee agrave notre outil Des calculs de moyenne de variance et drsquoeacutecart-typefurent inteacutegreacutes Ces calculs se font agrave la toute fin du programme Durant le deacuteveloppe-ment nous avons corroboreacute lrsquoensemble de nos reacutesultats avec les reacutesultats de TCPTraceCette comparaison a eacuteteacute mise en place pour veacuterifier lrsquoexactitude de nos reacutesultats Le deacuteve-loppement de lrsquooutil fut reacutealiseacute sous ma direction dans le cadre drsquoun stage de fin drsquoeacutetudede Master 2 [Ravoavahy2017]

Pour finir nous avons reacutealiseacute une validation par comparaison entre Xanalyse et TCP-Trace Le tableau 32 montre le bilan de cette comparaison

TABLE 32 ndash Comparaison de performances

TCPTrace XanalyseTemps drsquoanalyse sur une trace de 20 Go 10 jours 7 joursTemps drsquoanalyse sur une trace de 1 Go 1 Heure 3 Min

Xanalyse se reacutevegravele ecirctre un outil beaucoup plus rapide que TCPTrace avec des reacutesul-tats identiques sur le calcul des meacutetriques Cet outil est actuellement disponible sur lesite du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrxanalyse

33 Protocole de mesure

Le protocole de mesure preacutesente les diffeacuterentes phases que lrsquoon souhaite mettre enplace durant lrsquoeacutetude Elles sont ainsi au nombre de cinq les contraintes reacuteglementairesla veacuterification des perturbations la capture du trafic la collecte et lrsquoanalyse Ce protocolefut reacutedigeacute en prenant en consideacuteration les conseils indiqueacutes dans [John2010] Dans cetarticle les auteurs deacutelivrent diffeacuterents conseils et indications baseacutes sur lrsquoexpeacuterience deplusieurs acteurs de meacutetrologie passive

Notre protocole a eacuteteacute mis en place dans le but de rassurer lrsquoensemble des acteurs Ceprotocole fut testeacute dans le cadre drsquoune eacutetude de meacutetrologie passive du LIM

Contraintes reacuteglementaires Avant toute eacutetude de meacutetrologie Internet passive au seinde lrsquoUniversiteacute de La Reacuteunion il faut obtenir lrsquoautorisation du preacutesident de lrsquoeacutetablisse-ment Le preacutesident consultera le Correspondant Informatique et Liberteacutes (CIL) et le Respon-sable Seacutecuriteacute et Systegravemes drsquoInformation (RSSI) de lrsquouniversiteacute Ces personnes deacutefiniront enfonction des objectifs de lrsquoeacutetude les limites de notre eacutetude en accord avec les lois fran-ccedilaises Les limites imposeacutees par la preacutesidence de lrsquoUniversiteacute indiqueacutees par le CIL et leRSSI furent celles autour de la vie priveacutee Agrave ce titre nous nrsquoavions pas le droit drsquoeacutetudierle trafic en temps reacuteel nrsquoy drsquoeacutetudier le champ Donneacutees des paquets TCP Nous avionseacutegalement lrsquoobligation drsquoanonymiser lrsquoensemble des adresses IP priveacutees rencontreacutees Laderniegravere obligation fut la restriction de nos eacutecoutes au LIM Ces obligations furent res-pecteacutees dans le deacuteveloppement de lrsquooutil drsquoanalyse

82

Afin de ne capturer que le trafic du Laboratoire nous avons travailleacute en collaborationavec la Direction des Services Informatiques (DSI) de lrsquoUniversiteacute Ce partenariat a pourobjectif drsquoisoler le trafic du LIM dans un Virtual Local Area Network (VLAN) speacutecifique UnVLAN est laquo un meacutecanisme par lequel les hocirctes qui reacutesident dans la mecircme infrastructurephysique commuteacutee mais des domaines de diffusion virtuelle seacutepareacutes sont adresseacutes agravepartir du mecircme sous-reacuteseau IPv4 et partagent une adresse IP de passerelle par deacutefautcommune supprimant ainsi lrsquoexigence drsquoun sous-reacuteseau IP deacutedieacute pour chaque reacuteseaulocal virtuel (Local Area Network (LAN) ou MAN) raquo [RFC3069] Les VLAN seacuteparent lesusagers selon leur autorisations et les types de connexion Par exemple un enseignant-chercheur a plus de droits qursquoun eacutetudiant Une personne connecteacutee par connexion filairea des droits diffeacuterents drsquoune personne connecteacutee par agrave un reacuteseau sans fil Le RSSI delrsquoUniversiteacute ne souhaitant pas obliger les membres du LIM agrave participer agrave cette eacutetudeune campagne de preacutevention fut organiseacutee Les personnes ayant explicitement eacutemis lesouhait de ne pas participer agrave notre eacutetude seraient de facto connecteacutees agrave un autre VLANpar la DSI Au sein du laboratoire tout le personnel a accepteacute de participer agrave notre eacutetude

Veacuterification des perturbations La figure 31 illustre lrsquointer-connectiviteacute mise en placepour lrsquoeacutecoute du LIMChaque ordinateur du laboratoire geacutenegravere un trafic Internet qui passe par le VLAN dulaboratoire Par le systegraveme de port-mirroring le routeur va creacuteer une copie des paquetstransitant par le port du VLAN laboratoire Le paquet copieacute sera alors redirigeacute vers lasonde de capture La sonde de capture aura deux interfaces reacuteseaux La premiegravere (Eth0)sera deacutedieacutee agrave la capture des paquets provenant de la technique de port-mirroring La se-conde carte reacuteseau (Eth1) servira pour lrsquoaccegraves distant agrave la sonde de captureLrsquoordinateur drsquoaccegraves possegravede une cleacute priveacutee permettant lrsquoaccegraves agrave distance agrave la sonde decapture Cette porte drsquoentreacutee seacutecuriseacutee permet une gestion agrave distance de la sonde Lestraces collecteacutees seront transfeacutereacutees sur un serveur de stockage deacutedieacute au sein du LIM Letransfert se fera agrave lrsquoaide de la commande SCP et lrsquoaccegraves seacutecuriseacute preacutesenteacute preacuteceacutedemmentLrsquoaccegraves distant et le transfert des traces font partie inteacutegrante du trafic geacuteneacutereacute par lesmembres du laboratoire Les perturbations peuvent survenir agrave deux niveaux au routeuret agrave la sonde Au niveau de la sonde drsquoeacutecoute le deacutebit affecteacute en entreacutee-sortie du VLANdu laboratoire est eacutegal agrave 1 000 Mbits Ce deacutebit est devenu freacutequent sur les cartes reacuteseauxvendues sur les ordinateurs grand public Les caracteacuteristiques de la carte reacuteseau deacutedieacuteeagrave la capture accepte un deacutebit maximum eacutegal au deacutebit du VLAN du LIM On considegraverealors que le taux de pertes occasionneacute par la carte de capture peut ecirctre neacutegligeableAu niveau du routeur la fonction port-mirroring copie lrsquointeacutegraliteacute des segments IP en-trant sur un port Le paquet original est redirigeacute vers lrsquoadresse de destination incluse dansle champ destination de lrsquoen-tecircte IP Le paquet forgeacute au sein du routeur est dirigeacute versun port deacuteclareacute lors de la programmation de lrsquoeacutequipement La fonction de port-mirroringfait partie des techniques deacuteveloppeacutees dans le but drsquoeacutetudier le comportement drsquoun reacute-seau [Zhang2007] a eacutetudieacute les deacuterives lieacutes agrave la fonction port-mirroring Cette fonctionneacutecessite la mise en meacutemoire tampon des paquets provenant du lien eacutetudieacute jusqursquoagrave ceqursquoils puissent ecirctre transmis sur le lien miroir Cette mise en meacutemoire tampon joue sur lasynchronisation des paquets entre le lien eacutetudieacute et le lien miroir Lors de la transmissiondes paquets sur le lien miroir est-ce que la transmission srsquoest faite dans lrsquoordre drsquoarriveacuteesur le port eacutetudieacute Il y a donc une question drsquoordonnancement des paquets agrave eacutetudier Lameacutemoire tampon du routeur nrsquoest pas infinie Il existe donc des cas ougrave la meacutemoire estremplie occasionnant agrave ce moment lagrave des pertes Les reacutesultats de [Zhang2007] ont misen avant une diffeacuterence de synchronisation entre les paquets du lien eacutetudieacute et les paquetsdu lien miroir La diffeacuterence de synchronisation implique eacutegalement des erreurs dans lereacute-ordonnancement des paquets Ces erreurs auront pour conseacutequences des erreurs dans

83

lrsquoanalyse des performances de TCP Pour reacutesoudre ces problegravemes les auteurs preacuteconisentlrsquousage drsquoune carte physique speacutecifique agrave lrsquoeacutetude passive comme les cartes DAG

FIGURE 31 ndash Scheacutema de distribution de la plate-forme de mesure

Capture du trafic La mise en place des mesures se fait degraves la mise sous tension de lasonde et la fin du chargement du systegraveme drsquoexploitation La capture des donneacutees auraune dureacutee comprise entre 1 et 23 heures Elle srsquoeffectue agrave lrsquoaide de la commande

tcpdump -i eth0 -w trace-$timestamptrace amp

Dans laquelle les options indiquent

mdash -i eth0 indique lrsquointerface de capture Nous avons preacutevu une seconde interfacereacuteseau pour lrsquoaccegraves distant seacutecuriseacute

mdash -w trace-$timestamptrace cette option deacutesigne le fichier drsquoeacutecriture Les fichiers sontnommeacutes par le timestamp de deacutebut

Une fois la capture finie la sonde va deacutecider du temps avant la prochaine eacutecouteCette dureacutee nrsquoexceacutedera pas 24 heures Lrsquoobjectif est drsquoavoir des mesures quotidiennesmais programmeacutees de maniegravere aleacuteatoire sur la dureacutee drsquoeacutecoute et sur lrsquoeacutecart entre deuxmesures

Le paragraphe de veacuterifications des perturbations a deacutemontreacute qursquoil est difficile demettre en place une capture de la totaliteacute des paquets Une solution de capture est lrsquoeacutechan-tillonnage Dans notre cas nous avons reacutealiseacute un eacutechantillonnage indeacutependant du contenu[RFC5475] Cet eacutechantillonnage est reacutealiseacute sans prendre en consideacuteration le contenu dupaquet Ayant une volonteacute drsquoobtenir un grand nombre de donneacutees nous avons mis enplace une dureacutee de capture maximale de 23 heures et un eacutecart entre deux captures de 24heures

Collecte Une phase de collecte des traces est reacuteguliegraverement reacutealiseacutee Lrsquoobjectif est delibeacuterer de lrsquoespace disque au niveau de la sonde de capture Lorsque la sonde a fini dereacutealiser sa capture elle va envoyer le fichier de capture vers un serveur de stockage ausein du LIM Nous avons vu que le fichier de capture est nommeacute selon une nomenclaturespeacutecifique Pour rappel cette nomenclature comporte la date (au format timestamp) dudeacutebut de lrsquoeacutecoute La deacutenomination du fichier autorise un classement des traces par datede capture Ce classement peut permettre une eacutetude temporelle du trafic

Lrsquoenvoi du fichier se fait agrave travers lrsquointerface eth1 La technique utiliseacutee pour le trans-fert est la commande SCP Lrsquoutilisation de lrsquoempreinte MD5 du fichier nous assure que letransfert des donneacutees srsquoest reacutealiseacute correctement En cas de diffeacuterence entre les empreintes

84

le transfert srsquoeffectue agrave nouveau Lrsquoobjectif est de veacuterifier lrsquointeacutegriteacute des donneacutees transfeacute-reacutes

Le scheacutema 32 scheacutematise le fonctionnement de notre sonde de mesure Nous consi-deacuterons que la fonction de port-mirroring est deacutejagrave programmeacutee sur le routeur DSI

Degraves que la sonde est alimenteacutee eacutelectriquement et que lrsquoOS est chargeacute la sonde vaveacuterifier qursquoune capture est programmeacutee Si aucune capture de trace nrsquoest programmeacuteela sonde va en planifier une dans les prochaines 24 heures Si la sonde a connaissancedrsquoune programmation elle va alors reacutealiser la capture La sonde va enregistrer le traficsur une dureacutee allant entre 1 et 23 heures Lorsque la capture est finie la sonde va alorsprogrammer le prochain enregistrement La sonde va eacutegalement envoyer la trace vers leserveur de stockage

Capture

Alimentation

eacutelectrique

Veacuterification

dune capture

Programmation

dune capture

Collecte

PreacutesenteAbsente

24 heures maximum

1 - 23 heures maximum

FIGURE 32 ndash Scheacutema de fonctionnement de la plateforme de mesure

Analyse Lrsquoanalyse des donneacutees obtenues se fait en deux eacutetapes La premiegravere consiste agraveutiliser lrsquooutil Xanalyse pour obtenir les reacutesultats bruts La seconde eacutetape est lrsquoextractiondes donneacutees pour les repreacutesenter sous forme graphique

34 Reacutesultats

Notre eacutetude se cantonne agrave mesurer les performances du trafic au sein du LIM Le LIMfait partie inteacutegrante de lrsquoUniversiteacute de La Reacuteunion et agrave ce titre les usages de lrsquoInternetau sein de lrsquoeacutetablissement sont reacuteglementeacutes Ainsi lrsquoeacutetude des meacutetriques de supervisionpourraient ne pas correspondre agrave un usage plus libeacuteral de lrsquoInternet Pour rappel lesmeacutetriques eacutetudieacutees sont indiqueacutees dans le tableau 31

Nous avons fait le choix de seacuteparer notre eacutetude en deux La partie supervision donneun aperccedilu de lrsquousage du reacuteseau Internet au sein du LIM Nous essaierons dans la mesuredu possible de faire des extrapolations avec lrsquousage de lrsquoInternet agrave La Reacuteunion La sectionperformance est celle qui est la plus inteacuteressante Crsquoest elle qui va nous indiquer les deacutegra-dations occasionneacutees par les longs deacutelais pour La Reacuteunion

85

341 Supervision du trafic

Le tableau 33 montre la distribution des 4 protocoles de transport rencontreacutes

TABLE 33 ndash Distribution des protocoles encapsuleacutes dans IP

Protocole ICMP IGMP TCP UDPPourcentage 572 001 9249 178

La preacutesence du protocole ICMP agrave plus de 5 srsquoexplique par la preacutesence des sondesde mesures de RunPL Pour rappel lrsquoobjectif de cette plate-forme est drsquoeacutetudier la connec-tiviteacute de La Reacuteunion et des icircles de la Zone Oceacutean Indien agrave travers de la meacutetrologie activeNous avons dans le chapitre 2 preacutesenteacute des reacutesultats lieacutes agrave ces eacutetudes Lrsquousage du pro-tocole ICMP est freacutequent au sein de lrsquoInternet Une eacutetude du trafic reacuteunionnais mettraiteacutegalement lrsquousage de ce protocole

Le protocole Internet Group Management Protocol (IGMP) deacutefini dans le [RFC3376] estun protocole utiliseacute par les systegravemes IPv4 (hocirctes et routeurs) pour signaler leur appar-tenance agrave un groupe de multidiffusion IP agrave tout routeur multicast voisin Son usage estrestreint au sein drsquoun reacuteseau priveacute

Le protocole User Datagram Protocol (UDP) a une preacutesence infeacuterieure agrave 2 Son rocircleest la transmission de donneacutees simples sans fiabiliteacute Son usage est geacuteneacuteralement li-miteacute au service DNS Reacutecemment lrsquoentreprise Google a deacuteveloppeacute lrsquooption QUIC QUICpermet au navigateur Google Chrome drsquoeffectuer des requecirctes HyperText Transfer Protocol(HTTP)HyperText Transfer Protocol Secured (HTTPS) sur le protocole UDP [Carlucci2015]a eacutetudieacute les performances de ce systegraveme Les reacutesultats obtenus ont montreacute un meilleurgoodput que TCP-CUBIC malgreacute un taux de perte plus important Lrsquousage de QUIC estlimiteacute au navigateur Google Chrome navigateur le plus reacutepandu agrave La Reacuteunion drsquoapregraves[GSCounter] Neacuteanmoins cette option est deacutesactiveacutee par deacutefaut

Les reacutesultats de TCP sont en accord avec lrsquoeacutetude reacutealiseacutee par [EQUINIX] Avec unpourcentage de 92 49 TCP est majoritaire Les services proposeacutes par TCP sont plusnombreux que ceux offerts par les autres protocoles de transport

Le tableau 34 indique les services utiliseacutes Les services ont eacuteteacute rangeacutes par pourcentagereleveacute

TABLE 34 ndash Reacutepartition des services utiliseacutes par TCP

Service SSH DNS Mail Non identi-fieacutes

Autres HTTPS HTTP

Percent 002 163 491 721 945 3297 4379

La preacutesence du service Secure SHell (SSH) srsquoexplique par les accegraves distants agrave diffeacuterentsoutils propres au laboratoire On peut citer les nœuds Planet-Lab [PlanetLab] agrave traversle monde les sondes de la plate-forme RunPL lrsquoaccegraves agrave la sonde de capture pour cetteeacutetude lrsquoaccegraves agrave des serveurs distants etc

163 des paquets eacutechangeacutes dans nos traces sont des requecirctes de DNS Ces paquetspermettent de convertir un nom de domaine en adresse IP Lrsquoutilisation du DNS avec leprotocole TCP a eacuteteacute restreint aux transferts de zone et aux reacuteponses dont la taille est tropimportante pour UDP [RFC5936 RFC6691 RFC7766]

Le service intituleacute Mail regroupe les services identifieacutes par les ports numeacuteroteacutes 25110 143 465 995 et 993 Ces ports correspondent respectivement agrave Simple Mail TransfertProtocol (SMTP) Post Office Protocol (POP) Internet Message Access Protocol (IMAP) et leursversions seacutecuriseacutees SMTPs POPs IMAPs Lrsquoutilisation de ces ports est faite par les agents

86

de messagerie comme Windows Live Mail Mozilla Thunderbird ou Mail Lrsquoeacutechange decourriel repreacutesente 4 91 des paquets eacutechangeacutes Ce pourcentage est fausseacute par lrsquoutilisa-tion des interfaces web des messageries Par exemple on peut utiliser la page web duservice de message Gmail de Google pour envoyer directement des mails Le service uti-liseacute est alors un service web HTTP ou HTTPS

Le service nommeacute Non identifieacutes est une connexion dont le numeacutero de port nrsquoest pasrattacheacute agrave un service en particulier Ce sont geacuteneacuteralement des numeacuteros supeacuterieurs agrave 1 000

La partie Autres regroupe plusieurs services Ces services sont assez divers On peutainsi y retrouver lrsquoutilisation du port numeacuteroteacute 139 correspondant agrave netbios-ssn Ce servicede NetBIOS autorise lrsquoeacutechange de message en mode connecteacute On peut eacutegalement citerlrsquousage du service Hyper Text Caching Protocol (HTCP) [RFC2756] Ce service est utiliseacutepour partager et deacutecouvrir les contenus des caches (anteacutemeacutemoires) HTTP entre serveursmandataires

Nous avons deacutecideacute de garder la seacuteparation entre les services HTTP et HTTPS HTTPSest lrsquousage de HTTP avec un chiffrement Ce chiffrement permet au visiteur de veacuterifierlrsquoidentiteacute du site web gracircce agrave un certificat Ces services sont preacute-dominants au sein duLIM

Lrsquousage de ces services peut ecirctre deacutegradeacute si lrsquoon quitte La Reacuteunion Le tableau 35 in-dique la reacutepartition du trafic selon le type drsquoadresse de destination

TABLE 35 ndash Distribution du trafic

Trafic LAN MAN WANPourcentage 2165 0 7835

La reacutepartition srsquoest faite selon la geacuteolocalisation des adresses IP Le trafic LAN cor-respond agrave des eacutechanges entre adresses priveacutees Le trafic identifieacute MAN correspond agrave deseacutechanges entre adresses geacuteolocaliseacutees agrave La Reacuteunion On constate ainsi qursquoaucune infor-mation chercheacutee par les utilisateurs nrsquoest geacuteolocaliseacutee agrave La Reacuteunion Le trafic Wide AreaNetwork (WAN) repreacutesente le trafic transitant par les cacircbles sous-marins Ce deacutecoupageest rendu possible par lrsquointer-connexion des opeacuterateurs au sein du GIX Reunix Ce deacutecou-page ne serait pas le mecircme si on eacutetudiait la totaliteacute du trafic de La Reacuteunion Ainsi onconstate qursquoil nrsquoy a aucun service dont la destination finale serait La Reacuteunion

Le tableau 37 indique la reacutepartition des destinations de type WAN Le tableau 36rappelle la correspondance entre lrsquoacronyme et le nom complet de chaque continent

TABLE 36 ndash Correspondance entre acronymes et nom des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

TABLE 37 ndash Distribution geacuteographique des destinations WAN

Continent AF AS EU NA OC SAPourcentage 019 168 4850 4867 064 032

On constate que la reacutepartition des continents est fortement ineacutegale LrsquoEurope et lrsquoAmeacute-rique du Nord concentrent plus de 97 des destinations reacuteunies Lrsquoeacutetude reacutealiseacutee par[Fanou2016] a montreacute une incoheacuterence dans lrsquoaccegraves aux contenus Les reacutesultats ont ainsiprouveacute que malgreacute la preacutesence drsquoune infrastructure web deacuteveloppeacutee sur le continent afri-cain la majoriteacute du contenu eacutetait stockeacute sur les continents europeacuteen et nord-ameacutericain

87

Dans le cadre de La Reacuteunion les regravegles de routage vues dans le chapitre preacuteceacutedent sonten coheacuterence avec la reacutepartition des continents

342 Performance de TCP

Un flot peut ecirctre caracteacuteriseacute selon sa longueur (nombre de paquets ou octets eacutechan-geacutes) sa dureacutee (dureacutee des eacutechanges entre le premier et le dernier paquet captureacute) et sonratio Chaque caracteacuterisation est associeacutee agrave deacutenomination selon que le flux est court oulong Il existe plusieurs deacutefinitions de limites de chaque caracteacuterisation Dans le tableau38 nous indiquons le nom associeacute agrave chaque flux selon sa caracteacuterisation ainsi que desexemples de limites

Pour rappel nous avons deacutefini un flot comme laquo une seacuterie de paquets IP avec le mecircmetuple suivant ldquoadresse IP source port source adresse IP destination port destinationprotocole IPrdquo raquo Dans notre eacutetude nous consideacutererons un flot TCP sans tenir compte desmeacutecanismes drsquoeacutetablissement et de fermeture de connexion Ainsi un flot pourra conteniruniquement des paquets de donneacutees et drsquoacquittement

TABLE 38 ndash Tableau de deacutenomination des flux selon [Lan2006]`````````````Meacutetrique

Taille des fluxCourts Longs limites

Longueur Souris Eacuteleacutephant 10 paquets [Sallantin2014]1 de lrsquoutilisation du lien[Estan2001] 100 Ko[Lan2006]

Dureacutee Libellule Tortue 2 secondes[Brownlee2002] 15 mi-nutes [Lan2006]

Deacutebit Gueacutepard Escargot 100 Kos [Lan2006]

Les limites varient selon les eacutetudes Pour notre eacutetude les limites seront choisies enfonction des reacutesultats Nous comparerons nos limites avec celles indiqueacutees dans le ta-bleau ci-dessus Dans notre preacutesentation la caracteacuterisation des flux confond flux montantet flux descendant Drsquoapregraves la loi de Pareto environ 80 des effets sont le produit de 20des causes Dans lrsquoInternet 80 du trafic est reacutealiseacute par seulement 20 de flux eacuteleacutephants[Paxson1995] Nous regarderons si cette loi est respecteacutee par les limites proposeacutees

Dans la figure 33 nous avons repreacutesenteacute les CDF de la longueur des flux selon lespaquets (33a) et le nombre drsquooctets (33b) Les traits verticaux repreacutesentent les limitesindiqueacutees dans le tableau 38 Sur la figure 33a le trait vertical repreacutesente la limite des10 paquets de [Sallantin2014] Sur la figure 33b le trait vertical drsquoune valeur de 10 000octets repreacutesente la limite indiqueacutee par [Lan2006] Le trait de droite repreacutesente les 1 dela capaciteacute du lien drsquoaccegraves soit 107 octets (100 Ko)

Sur la figure 33a plus de 50 des flux sont des flux mono-paquet Les flux infeacuterieursagrave la limite proposeacutee par [Sallantin2014] de 10 paquets ont une probabiliteacute de 0 67 Notretrafic est donc constitueacute drsquoune majoriteacute de flots courts sur les paquets La seacuteparation de80 du trafic se fait agrave partir de 18 paquets

Lrsquoaxe des abscisses de la figure 33b deacutemarre agrave 500 octets avec une probabiliteacute de 0 28La valeur de deacutepart de lrsquoaxe des abscisses repreacutesente le pas utiliseacute pour le calcul de laCDF Le premier axe vertical repreacutesenteacute agrave 10 000 octets seacutepare 79 27 des flux sont desflux courts La limite proposeacutee par [Estan2001] est repreacutesenteacutee agrave 107 octets Cette seacutepara-tion indique que 99 des flux sont des flux courts Aucune des deux limites proposeacutees

88

ne permet une eacutetude fine de la seacuteparation des flux La limite proposeacutee par [Lan2006]approche la reacutepartition de Pareto

(a) Paquets (b) Octets

FIGURE 33 ndash Longueur des flux

La dureacutee drsquoun flot TCP correspond au deacutelai qui seacutepare la capture du premier et dudernier paquets du flot La figure 34 repreacutesente la PDF pour la dureacutee des flots en se-condes Le pas utiliseacute pour effectuer le traceacute est de 1 seconde Ce pas srsquoexplique par lavaleur minimale que peut prendre le RTO comme deacutefini dans le [RFC6298] La ligne ver-ticale repreacutesente la limite de [Brownlee2002] eacutegale agrave 2 secondes

La dureacutee maximale enregistreacutee pour un flot est de 61 192 secondes soit plus de 10heures drsquoeacutechange Au delagrave des 60 secondes la probabiliteacute drsquoavoir un flot supeacuterieur agravecette dureacutee est eacutegale agrave 0 081 Nous consideacuterons cette probabiliteacute neacutegligeable Plus de 59de nos flux sont infeacuterieurs agrave la limite repreacutesenteacutee par lrsquoexpiration du RTO (1 seconde) Lalimite des deux secondes indique que 64 des flux eacutechangeacutes sont des flux courts Pouratteindre la reacutepartition indiqueacutee par la loi de Pareto la seacuteparation devrait atteindre les 10secondes

Les figures 35 repreacutesentent la reacutepartition du deacutebit utile moyen de chaque flux selonle nombre de paquets par seconde (35a) et le nombre drsquooctets par seconde (35b) Laligne verticale sur la figure 35a repreacutesente la limite seacuteparant les flux courts et les fluxlongs Drsquoune valeur de 10 paquetsseconde elle est deacuteduite de la limite de 10 paquetsde la longueur des flux preacutesenteacutes preacuteceacutedemment La limite de 100 Ko de [Lan2006] suitle mecircme raisonnement Ils sont partis de la limite de la longueur des flux pour choisir lalimite de caracteacuterisation des flux sur les deacutebits

La figure 35a deacutemarre avec des deacutebits peu eacuteleveacutes mais nombreux Ainsi les flux infeacute-rieurs agrave la limite des 10 paquetsseconde repreacutesentent plus de 90 des flux rencontreacutesOn peut donc en deacuteduire que le trafic analyseacute a tregraves forte majoriteacute de flux agrave tregraves bas deacutebit

La figure 35b est calculeacutee avec le mecircme pas que pour la longueur des flux soit 500 oc-tets En analysant la figure on remarque ainsi que les flux infeacuterieurs ou eacutegaux agrave 500 octetsont une probabiliteacute drsquoexister proche de 09 La limite preacutesenteacutee par [Lan2006] autorise unecaracteacuterisation de 99 de nos flux en tant que flux courts

Tout comme lrsquoindiquaient [Paxson1995 Ciullo2009] le trafic est constitueacute en majoriteacutede flots courts Dans les trois caracteacuterisations effectueacutees (longueur dureacutee deacutebit) le traficeacutetudieacute est constitueacute agrave plus 50 voire 90 comme pour les deacutebits de flots courts

TCP est un protocole srsquoappuyant sur les deacutelais et le systegraveme drsquoacquittement pouradapter ses eacutemissions On a vu dans le chapitre 2 que lrsquoicircle de La Reacuteunion possegravede un

89

FIGURE 34 ndash Flux TCP - Densiteacute de la dureacutee de communication

(a) Paquetsseconde (b) Octetsseconde

FIGURE 35 ndash Deacutebits des flux

comportement particulier vis-agrave-vis de ce paramegravetre Nous faisons lrsquohypothegravese qursquoune desconseacutequences de ce fonctionnement est que La Reacuteunion possegravede une forte sensibiliteacute auxeacuteveacutenements de congestions Nous avons deux outils permettant de confirmer ce postulat

1 Le premier est lrsquoidentification des diffeacuterentes options preacutesentes dans lrsquoen-tecircte TCPplus particuliegraverement les options ECN Echo (ECE) Explicit Congestion Notification(ECN)Nonce Sum (NS) et CWR Le passage du bit de ces options agrave 1 indique unegestion des eacuteveacutenements de congestion

2 La seconde possibiliteacute est de repeacuterer les reacuteductions de la fenecirctre de TCP et les typesde retransmissions qui ont lieu aux alentours de cette diminution

Avec la premiegravere meacutethode nous nrsquoavons trouveacute aucun paquet avec une option degestion de la congestion (ECN) agrave 1 Cela indique que les eacuteveacutenements de congestion nepeuvent ecirctre identifieacutes par la lecture des drapeaux Les auteurs de [Trammell2015] ontmontreacute que le nombre de serveurs reacutepondant agrave la neacutegociation de lrsquooption ECE agrave traversle monde a augmenteacute ces derniegraveres anneacutees Lrsquoabsence de paquets deacutebutant la neacutegociation

90

donc provenant des utilisateurs du reacuteseau du laboratoire peut srsquoexpliquer par 3 hypo-thegravesesLa premiegravere est lrsquoobsolescence des ordinateurs du Laboratoire drsquoInformatique et de Ma-theacutematiques En effet il faut un systegraveme drsquoexploitation reacutecent pour que la version de TCPpuisse marquer les paquets avec lrsquooption Cette hypothegravese est vite abandonneacutee sachantque plusieurs participants agrave notre eacutetude possegravedent des ordinateurs acheteacutes agrave partir delrsquoanneacutee 2014La seconde hypothegravese est la suppression de lrsquooption par un eacutequipement reacuteseau traverseacute agravelrsquoUniversiteacute de La Reacuteunion Cette piste fut abandonneacutee apregraves un test de mesures Ce testconsistait agrave envoyer des paquets avec lrsquooption ECN agrave 1 et agrave regarder leurs options agrave leurarriveacutee au point de capture Les reacutesultats obtenus ont montreacute que lrsquooption eacutetait inchan-geacuteeLa derniegravere possibiliteacute est que le systegraveme drsquoexploitation ne marque pas lrsquoensemble despaquets avec le drapeau de neacutegociation Certains routeurs ou pare-feux incompatiblespeuvent bloquer le trafic entre deux hocirctes impleacutementant ECN [Bauer2011] Crsquoest pourcette raison qursquoelle est deacutesactiveacutee implicitement sur la plupart des systegravemes drsquoexploita-tion contemporains Nous avons confirmeacute cette hypothegravese agrave travers une demande drsquouti-lisation de la commande sysctl et des options de TCP des systegravemes drsquoexploitation DebianUbuntu et Mac OS X Les reacutesultats ont ainsi montreacute que les systegravemes drsquoexploitation eacutetu-dieacutes nrsquoactivaient pas cette option de TCP

Dans tous les cas lrsquoabsence des options ECE ECNNS et CWR est neacutefaste pour lesperformances de TCP Les travaux reacutealiseacutes par [Mellia2003-2] ont montreacute que les per-formances de TCP sont accrues lorsque les paquets sont marqueacutes avec ces options Sanselles les eacuteveacutenements de congestion sont plus difficiles agrave identifier

La seconde faccedilon drsquoidentifier les eacuteveacutenements de congestion est plus compliqueacutee agravemettre en place Il srsquoagit drsquoidentifier les reacuteductions de fenecirctre et drsquoeacutetudier des pertes etoudes retransmissions de paquets Elle provoque des incertitudes Sur un total de 42 386 540paquets nous avons identifieacute 21 022 400 paquets indiquant une diminution de fenecirctreSoit pregraves drsquoun paquet sur deux

Le tableau 39 indique les pourcentages des paquets retransmis etou perdus

TABLE 39 ndash Reacutepartition des paquets

fast retrans-mit

spurious retrans-mit

Paquetsperdus

Non retransmiset non perdus

Pourcentage 5 2times 10minus3 7 8times 10minus3 14times10minus3 99 97

On constate que le pourcentage des paquets retransmis ou perdus sont ridicules avecmoins de 1 des paquets eacutechangeacutes Ces pourcentages sont en deccedilagrave des valeurs que TCPpeut produire dans certaines zones Aux Eacutetat-Unis [Gettys2011] a eacutetudieacute le taux de pertesur un lien montant agrave 2 Mbits lors drsquoun transfert de fichiers drsquoun poids de 20 Go Letaux de perte est tregraves eacuteleveacute avec 33 de moyenne En comparaison avec ces eacutetudes reacuteali-seacutees lrsquoicircle de La Reacuteunion possegravede des performances de TCP que lrsquoon pourrait qualifier denormales

343 Synthegravese des reacutesultats

Lrsquoanalyse mise en place a pour objectif de tester en conditions reacuteelles notre plate-forme de mesure et la chaicircne drsquoanalyse

Lrsquoeacutetude du trafic du LIM a eacuteteacute deacutecoupeacutee en deux parties La premiegravere concerne lasupervision du trafic et traite de la composition La seconde partie se concentre sur les

91

performances du protocole de transport TCP sur le trafic agrave destination de lrsquoexteacuterieur delrsquoicircle de La ReacuteunionLrsquoeacutetude des donneacutees collecteacutees a mis en avant la preacutedominance drsquoun trafic empruntantles cacircbles sous-marins agrave destination de lrsquoEurope et de lrsquoAmeacuterique du Nord Ces deuxdestinations heacutebergent de nombreux serveurs de donneacutees scientifiquesLrsquointerrogation de ces serveurs se fait agrave partir du protocole TCP en utilisant les servicesHTTP ou HTTPS Le protocole TCP est majoritaire dans les protocoles rencontreacutes toutcomme les services preacutesenteacutes

Sur lrsquoeacutetude des performance du protocole TCP nous avons effectueacute une caracteacuteri-sation des flots en terme de longueur (paquets eacutechangeacutes) de dureacutee et de vitesse Lamajoriteacute de nos flots sont des flots courts contenant peu de donneacutees

35 Conclusion

Dans ce chapitre nous avons preacutesenteacute la meacutethode mise en place pour la reacutealisationdrsquoune eacutetude de meacutetrologie passive sur lrsquoicircle de La Reacuteunion

La Reacuteunion est une icircle dont la connectiviteacute en terme de deacutelais et de routes est par-ticuliegravere telle que le chapitre 2 preacutesente Lrsquoaugmentation progressive des deacutebits drsquoaccegravesa pour conseacutequence lrsquoaugmentation de la capaciteacute de stockage des liens On considegravereqursquoun lien possegravede une forte capaciteacute de stockage quand le produit deacutelai bande passante(BDP) associeacute agrave ce lien deacutepasse la limite de 12 5 Ko Pour La Reacuteunion la capaciteacute destockage minimale calculeacutee est de 22 5 ko Cette capaciteacute de stockage entraicircne des deacutegra-dations sur les performances du protocole TCP Nous avons souhaiteacute eacutetudier lrsquoimpact dela capaciteacute de stockage des liens sur les performances du protocole TCP agrave La ReacuteunionLrsquoaugmentation de la capaciteacute des liens entraicircne eacutegalement un changement des usagesNous souhaitons eacutegalement eacutetudier les diffeacuterents services utiliseacutes dans lrsquoInternet agrave LaReacuteunion

Le cahier des charges fut preacutesenteacute dans la section 31 Le cahier mis en place preacutesenteles meacutetriques de lrsquoeacutetude Ces meacutetriques ont eacuteteacute seacutelectionneacutees afin de reacutepondre aux objec-tifs preacutesenteacutes ci-dessus Elles couvriront un aspect supervision du trafic pour lrsquoeacutetude desservices et la reacutepartition geacuteographique Lrsquoaspect des performances du protocole TCP seraanalyseacute agrave travers les deacutebits les deacutelais les pertes les retransmissions et la preacutesence deseacuteveacutenements de congestion

Pour obtenir ces meacutetriques il est neacutecessaire de mettre en place une infrastructure demesure et une chaicircne drsquoanalyse La section 32 preacutesente lrsquoinfrastructure mise en place Lavariabiliteacute du trafic dans le temps nous a encourageacutes agrave mettre en place une plate-formede capture de trafic Le choix de lrsquooutil de capture nrsquoest pas deacutefinitif Il est deacutependant dudeacutebit associeacute au lien de capture Diffeacuterents outils drsquoanalyses de donneacutees passives existentDans le paragraphe 322 nous avons reacutealiseacute une comparaison des diffeacuterents outils selondes critegraveres de seacutelection Ces critegraveres sont au nombre de 3 protection de la vie priveacutee trai-tement drsquoune volumeacutetrie de donneacutees importante et le calcul des meacutetriques seacutelectionneacuteesAucun des outils preacutesenteacutes ne reacutepondait agrave la totaliteacute des critegraveres A la suite de ce constatnous avons fait le choix de deacutevelopper un outil reacutepondant agrave ces 3 critegraveres Lrsquoavantage decet outil est qursquoil pourra eacutevoluer en parallegravele agrave lrsquoeacutevolution de lrsquoeacutetude

Ces outils furent mis en place au sein du Laboratoire drsquoInformatique et de Matheacutematiquesdans le cadre drsquoune phase de test Les reacutesultats obtenus ont eacuteteacute compareacutes avec les reacutesultatsobtenus par TCPTrace afin de nous assurer de lrsquoexactitude de nos reacutesultats Le protocolede mesure mis en place pour cette eacutetude est deacutecrit dans la section 33 Dans ce protocolenous avons preacutesenteacute les contraintes reacuteglementaires imposeacutees par lrsquoUniversiteacute Nous nous

92

sommes ensuite assureacutes que le systegraveme mis en place pour la capture du trafic nrsquoeacutetaitsoumis agrave aucune perturbation Le systegraveme choisi pour eacutecouter le lien fut celui de port-mirroring Cette fonction des routeurs permet de copier lrsquoensemble des paquets entrantsur un lien vers un second lien Cette recopie est soumise agrave la limitation de la capaciteacutede meacutemoire des eacutequipements Elle peut entraicircner des erreurs au niveau de la datationdes paquets et dans lrsquoordre de reacute-eacutemission des paquets vers le lien miroir Dans cetteeacutetude la capture du trafic srsquoest faite agrave lrsquoaide du logiciel TCPDump Reacuteguliegraverement unephase de deacutelestage de la meacutemoire de la sonde de capture vers un serveur de stockage dulaboratoire a eacuteteacute mise en place

Les reacutesultats preacutesenteacutes dans la section 34 nous donnent une vision biaiseacutee du com-portement de lrsquoInternet reacuteunionnais Ces reacutesultats ne peuvent correspondre au compor-tement de TCP pour lrsquoensemble de lrsquoInternet de La Reacuteunion Ces reacutesultats nous donnentdes indications sur le comportement de TCP dans le cadre drsquoune connexion agrave forte capa-citeacute de meacutemorisation

Dans la partie supervision on a vu la preacutedominance du protocole TCP des servicesHTTP et HTTPS Ces usages srsquoaccompagnent drsquoune reacutepartition geacuteographique tregraves in-eacutegale LrsquoEurope et lrsquoAmeacuterique du Nord sont les deux continents avec lesquels les interac-tions sont les plus nombreuses (plus de 48 du trafic pour chaque continent)

Au niveau des performances de TCP nous avons pu voir que la majoriteacute des flotseacutetudieacutes sont des flots courts que ccedila soit en longueurs en dureacutees et en deacutebits Aucun eacuteveacute-nement de congestion ne fut releveacute Cela indique que la capaciteacute drsquoenvoi des eacutemetteursnrsquoa pas couvert le BDP du lien Cela srsquoest ressenti au niveau de la reacutepartition des paquetsRetransmissions et pertes nrsquoont repreacutesenteacute pregraves de 0 03 des paquets eacutechangeacutes

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors de laconfeacuterence Next Generation Computing Applications (NextComp) en 2017 [Noordally2017]

93

94

Conclusion amp Perspectives

1 Synthegravese des travaux

Les travaux de cette thegravese sont placeacutes dans le cadre reacutegional de lrsquoaccegraves de lrsquoicircle de LaReacuteunion agrave lrsquoInternet Ils visent agrave identifier les caracteacuteristiques qui ont une influence sur lesperformances de lrsquoInternet agrave La Reacuteunion La Reacuteunion est un deacutepartement drsquooutre-mer si-tueacute dans lrsquoOceacutean Indien Lrsquoicircle est connecteacutee agrave Internet agrave travers deux cacircbles sous-marins le SAFE et le LION Le SAFE relie lrsquoAfrique agrave lrsquoAsie Le LION interconnecte Madagascarlrsquoicircle Maurice et La Reacuteunion Lrsquoarriveacutee de ces cacircbles sur lrsquoicircle a permis le deacuteveloppement duhaut deacutebit et du tregraves haut deacutebit sur lrsquoicircle avec lrsquoarriveacutee des technologies ADSL VDSL etFTTH Des extensions agrave ces cacircbles permettent de remonter jusqursquoen Europe La Reacuteunionpossegravede REUNIX un point drsquointer-connexion (IXP) pour les opeacuterateurs locaux Ce typedrsquoaccegraves agrave Internet est speacutecifique aux icircles de la zone oceacutean indien Dans un premier tempsnous avons eacutetudieacute la connectiviteacute de lrsquoicircle sous lrsquoangle des deacutelais et des routes Dans unsecond temps lrsquoeacutetude a porteacute sur les flots TCP

TCP est le protocole de transport majoritaire dans lrsquoInternet qui rend un service detransport fiable et efficace de donneacutees Lrsquoefficaciteacute srsquoappreacutecie en terme de deacutebit eacutecouleacutepour le service rendu et drsquoutilisation des capaciteacutes de transmission du reacuteseau Lrsquoobjectifdrsquoefficaciteacute est du ressort du controcircle de flux et du controcircle de congestion Ces fonctionsagissent selon une peacuteriode correspondant au RTT de la connexion On voit alors que laperformance de TCP est deacutependante du deacutelai que va expeacuterimenter la connexion TCP

Nous avons dans un premier temps eacutetudieacute lrsquoeacutevolution du deacutelai et de la longueur desroutes entre 2012 et 2016 Cette eacutetude a mis en eacutevidence une stabiliteacute des deacutelais malgreacuteune reacuteduction de la longueur des routes Cette eacutetude a eacuteteacute reacutealiseacutee depuis un seul pointde mesure Afin drsquoeacutetudier en deacutetail la connectiviteacute de La Reacuteunion nous avons deacuteployeacuteune plate-forme de meacutetrologie active speacutecifique agrave lrsquoeacutetude Durant plusieurs mois nousavons mesureacute les deacutelais et les routes depuis et vers La Reacuteunion agrave lrsquoaide de lrsquooutil Paris-traceroute Lrsquoanalyse des reacutesultats a eacuteteacute reacutealiseacutee agrave partir de deux outils deacuteveloppeacutes pourle besoin de lrsquoeacutetude rgeoloc et rtraceroute rgeoloc sert agrave la geacuteolocalisation des adressesIP et agrave lrsquoextraction des deacutelais et de la longueur des routes depuis un fichier de sortiede traceroute rtraceroute est un outil drsquoanalyse graphique des routes Il va utiliser lesdonneacutees obtenues depuis rgeoloc pour placer sur une carte les diffeacuterents pays traverseacutespar les donneacutees collecteacutees

Les reacutesultats ont eacuteteacute eacutetudieacutes selon quatre critegraveres les deacutelais la longueur des routesla distance geacuteographique entre la source et la destination et lrsquoidentification des portesde lrsquoInternet reacuteunionnais Nous avons ainsi pu mettre en eacutevidence lrsquoindeacutependance de lalongueur de la route en fonction de la distance geacuteographique Nous avons calculeacute le deacutelaineacutecessaire agrave chaque noeud traverseacute Cette valeur est fortement deacutependante du sens decirculation de lrsquoinformation La relation entre le deacutelai et la distance geacuteographique a misen eacutevidence une incoheacuterence Le deacutelai neacutecessaire pour joindre une destination ou ecirctrejoint depuis lrsquoexteacuterieur de lrsquoicircle est inversement proportionnel agrave la distance geacuteographiqueCela signifie donc que plus la distance est importante moins le deacutelai est eacuteleveacute Nous

95

avons eacutetudieacute ce comportement vis agrave vis des portes de lrsquoInternet reacuteunionnais et mis enavant le fait que plus de 97 du trafic reacuteunionnais passe par la France hexagonale sanstenir compte si crsquoest du trafic montant ou descendant Ce comportement a eacutegalement eacuteteacuteeacutetudieacute pour les icircles de la ZOI dans le sens montant Le deacutelai minimal mesureacute accompagneacutedu routage analyseacute peut avoir des conseacutequences sur les performances drsquoun protocole detransport deacutependant au deacutelai comme lrsquoest TCP

Lrsquoaugmentation de la bande passante sur le reacuteseau de distribution de lrsquoicircle et sur lesliens reliant lrsquoIle agrave lrsquoInternet nrsquoont pas permis la reacuteduction des deacutelais Cela a pour conseacute-quence lrsquoaugmentation de la capaciteacute de stockage des canaux de communication La ca-paciteacute de stockage est calculeacutee agrave partir de la bande passante et du RTT On parle de Pro-duit Deacutelai-Bande passante (BDP) Si le BDP deacutepasse la valeur seuil de 12 5 Ko alors lecanal est consideacutereacute comme un reacuteseau agrave forte capaciteacute de stockage (LFN) Si on considegravereque le deacutebit drsquoaccegraves theacuteorique fourni par les FAI est le goulot drsquoeacutetranglement alors uncanal de communication sur lrsquoInternet depuis La Reacuteunion possegravede un BDP minimal eacutegalagrave 22 5 Ko Lorsque le transport des donneacutees srsquoeffectue avec TCP en passant par un LFNceci agrave des implications sur les performances du service rendu par TCP Lrsquoobjectif a eacuteteacute deconcevoir un systegraveme meacutetrologique pour pouvoir eacutetudier le service et analyser le fonc-tionnement du protocole Nous avons mis en place et expeacuterimenteacute une infrastructure demeacutetrologie passive interne au laboratoire En parallegravele nous avons conccedilu un outil drsquoana-lyse de traces drsquoeacutecoute speacutecifiques agrave notre eacutetude Lrsquoensemble de la chaicircne de mesure etdrsquoanalyse a eacuteteacute testeacute durant un mois au sein du LIM Les reacutesultats obtenus ont eacuteteacute valideacutespar comparaison agrave ceux fournis par drsquoautres outils

2 Perspectives

icircle de La Reacuteunion

La mise en place drsquoune eacutetude de meacutetrologie passive en collaboration avec les diffeacute-rents FAI permettrait drsquoeacutetudier le reacuteel impact de lrsquoeacuteloignement de La Reacuteunion sur lesperformances du protocole de transport TCP De plus lrsquoanalyse de supervision permet-trait drsquoidentifier des leviers pour limiter le rapatriement de trafic commun par les cacircblessous-marins

Zone Oceacutean Indien

Cette thegravese a mis en eacutevidence une connectiviteacute particuliegravere en terme de deacutelais et deroutes depuis lrsquoicircle de La Reacuteunion et les icircles de la Zone Oceacutean Indien dans le sens De-puis Lrsquoasymeacutetrie des routes est freacutequente dans lrsquoInternet Crsquoest pourquoi une eacutetude desdeacutelais et des routes depuis le monde agrave destination des sondes de la plate-forme RunPLbaseacutees sur les icircles de la ZOI peut ecirctre pertinente

Par la suite une eacutetude de meacutetrologie passive similaire agrave celle que lrsquoon veut mettreen place sur le territoire reacuteunionnais pourrait ecirctre reacutealiseacutee Lrsquoobjectif est de mettre eneacutevidence un comportement speacutecifique en terme drsquousage et de performance protocolairepour lrsquoensemble des usagers de la zone Cette eacutetude aura eacutegalement comme but le calculde la volumeacutetrie eacutechangeacutee et des services utiliseacutes entre les diffeacuterents territoires Si lesreacutesultats montrent une preacutedominance des trafics de consultation (accegraves agrave un serveur)la technique drsquooffloading pourrait ecirctre envisageacutee Cette meacutethode inspireacutee des travaux de[Baron2016] impliquerait lrsquousage des transports aeacuteriens pour charger des caches locauxDrsquoautres solutions seront eacutegalement eacutetudieacutees comme lrsquoimpleacutementation de serveurs departage de contenus localiseacutes sur lrsquoicircle

96

Territoires ultra-marins franccedilais

La Reacuteunion et Mayotte sont deux territoires franccedilais localiseacutes dans la ZOI Mais drsquoautresreacutegions ultra-marines peuvent ecirctre soumises agrave des comportements similaires Pour veacuteri-fier cette hypothegravese des eacutetudes de meacutetrologie active et passive pourraient venir validerou non cette hypothegravese Pour reacutepondre agrave cela nous privileacutegierons lrsquoenvoi de sondes dela plate-forme RunPL

Zone Isoleacutee

La derniegravere perspective que lrsquoon souhaite mettre en avant est le concept de ZoneIsoleacutee Si plusieurs reacutesultats des perspectives preacuteceacutedentes sont en adeacutequation avec lesreacutesultats obtenus et preacutesenteacutes dans cette thegravese nous aimerions deacutefinir ce concept Unepremiegravere deacutefinition serait axeacutee sur les trois points suivants

mdash Un routage limiteacute Un maillage important est un standard dans les zones bienconnecteacutees Les routes et les possibiliteacutes de trouver le plus court chemin sont nom-breuses Une faible valeur signifie de faibles alternatives ce qui sous-entend que laroute prise nrsquoest pas forceacutement la plus courte mais celle par deacutefaut

mdash Peering reacutegional et trafic interne Lrsquoensemble du trafic drsquoune zone va vers un GIXdrsquoautres pays pour des raisons de coucirct Lrsquoabsence drsquoaccords de peering entre lesFAI drsquoun mecircme pays ou ceux drsquoune mecircme zone geacuteographique ne permet pas ladiversiteacute des routes et augmente ainsi le deacutelai [Obar2012]

mdash Forts deacutelais Le deacutelai est un paramegravetre important de lrsquoaccegraves Internet Les forteslatences peuvent impacter les autres paramegravetres des connexions TCP [RITE2014-1]

97

98

Table des figures

1 Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000]) 2

2 Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000]) 33 Carte des deacutebits agrave La Reacuteunion 44 Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion 55 Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source

[Cablesmap]) 76 Carte des points drsquoeacutechange preacutesents actuellement et dans un futur proche

dans la ZOI 7

11 Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989]) 11

12 Boucle fermeacutee du CC de TCP 1213 Etats du controcircle de congestion de TCP 1414 Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP 1515 Principe de Quick-Start (Source [Scharf2008-1]) 1816 Simulation de MulTCP avec N=5 (Source [Huston2006]) 1917 Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source

[Afanasyev2010]) 2018 Comportement de la fenecirctre de congestion de Compound-TCP (Source

[Afanasyev2010]) 2119 Fonctionnement de BIC TCP 22110 Fonctionnement de CUBIC 22111 Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

24112 Principe de la meacutetrologie active 27113 Illustration du pheacutenomegravene drsquoeacutequilibrage des charges 28114 Taxonomie des configurations de tunnels MPLS et des comportements de

traceroute correspondants (Source [Donnet2012] ) 29115 Principe de la meacutetrologie passive 33

21 Scheacutema drsquointerconnexion de la plate-forme 4222 Distribution geacuteographique des adresses IPv4 publiques 4823 Fonctionnement de la sonde 5124 Comparaison des deacutelais entre Paris et La Reacuteunion 5425 Eacutevolution de la longueur des routes entre 2012 et 2016 5526 Distribution de la distance geacuteographique par continent 5627 Distribution du RTT par continent 5728 Distribution de la longueur des routes par continent 5729 Relation entre la longueur de la route et la distance geacuteographique 59210 Relation entre la longueur de la route et les deacutelais 60211 Relation entre les deacutelais et la distance geacuteographique 62

99

212 Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais 64213 Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dans

un pays tiers 65214 FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien 65215 Distribution des deacutelais des icircles de la ZOI 66216 Longueur des routes emprunteacutees 67217 Relation entre la longueur de la route et la distance geacuteographique 68218 Relation entre la longueur de la route et la distance geacuteographique pour

Madagascar 69219 Relation entre la longueur de la route et les deacutelais 69220 Relation entre les deacutelais et la distance geacuteographique 70221 Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI 71222 Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion 72

31 Scheacutema de distribution de la plate-forme de mesure 8432 Scheacutema de fonctionnement de la plateforme de mesure 8533 Longueur des flux 8934 Flux TCP - Densiteacute de la dureacutee de communication 9035 Deacutebits des flux 90

100

Liste des tableaux

11 Tableau de synthegravese des propositions 1712 Approximation du produit deacutelai bande passante de la connectiviteacute de La

Reacuteunion agrave lrsquoInternet 2513 Comparatif entre les approches de meacutetrologie 2614 Classement des outils 2715 Tableau des plates-formes de mesures de meacutetrologie active 3216 Comparatif entre mesures actives et mesures passives 35

21 Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet 4122 Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

4323 Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur Raspberry

Pi 4424 Fonctions disponibles dans les outils graphiques drsquoanalyse des routes 4525 Reacutesumeacute des caracteacuteristiques du jeu de donneacutees 5326 Correspondance entre acronymes et noms des continents 5327 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 5828 Formule de correacutelation du deacutelai en fonction de la longueur du chemin 6029 Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique 61210 Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunion-

nais 63211 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 67212 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 68213 Formule de correacutelation de la distance geacuteographique et du RTT 70

31 Les meacutetriques de meacutetrologie passive 7732 Comparaison de performances 8233 Distribution des protocoles encapsuleacutes dans IP 8634 Reacutepartition des services utiliseacutes par TCP 8635 Distribution du trafic 8736 Correspondance entre acronymes et nom des continents 8737 Distribution geacuteographique des destinations WAN 8738 Tableau de deacutenomination des flux selon [Lan2006] 8839 Reacutepartition des paquets 91

101

102

Bibliographie

[ANRTIC2016] ANRTIC Autoriteacute Nationale de Reacutegulation des TIC 2016

[ARCEP2004] Autoriteacute de Reacutegulation des Teacuteleacutecommunications Deacutecision n04-375 delrsquoautoriteacute de reacutegulations des teacuteleacutecommunications en date du 4 mai 2004 seprononccedilant sur un diffeacuterent opposant mobius agrave france teacuteleacutecom 2004

[ARTEC2016] Autoriteacute de Reacutegulation des TEchnologies de Communication Artec 2016

[AXIS] African internet exchange system project 2016

[Aben2015] Emile Aben Infrastructure geolocation - plan of action 2015

[Afanasyev2010] A Afanasyev N Tilley P Reiher and L Kleinrock Host-to-hostcongestion control for tcp IEEE Communications Surveys amp Tutorials 12(3)Third quarter 2010

[Africa1] Telegeography Submarine Cable Submarine cable map 2018

[AfterFibre] Steve Song African undersea and terrestrial fibre optic cables Last visit 09262017

[Akamai2015] Akamai Akamairsquos [state of the internet] 2015

[Akamai2017] Akamai Akamairsquos [state of the internet] 2017

[Allman2007] Mark Alllman and Vern Paxson Issues and etiquette concerning use ofshared measurement data In Proceedings of the 7th ACM SIGCOMM confe-rence on Internet measurement pages 135ndash140 ACM 2007

[Anelli2012] Pascal Anelli Des aleacuteas de la communication de la transmission au trans-port Habilitation agrave diriger des recherches en informatique Universiteacute deLa Reacuteunion 2012

[Archipelago] Kimberly Claffy Young Hyun Ken Keys Marina Fomenkov and DmitriKrioukov Internet mapping from art to science In Conference For Home-land Security 2009 CATCHrsquo09 Cybersecurity Applications amp Technology pages205ndash211 IEEE 2009

[Arduino] Arduino AG Arduino home

[Arnal2014] F Arnal E Dubois E Chaput and A Beylot Internet-draft r sallantin in-tended status Proposed standard e bouttier expires April 30 2015 cnes-tastesa c baudoin 2014

[Augustin2006] Brice Augustin Xavier Cuvellier Benjamin Orgogozo Fabien Viger Ti-mur Friedman Matthieu Latapy Cleacutemence Magnien and Renata TeixeiraAvoiding traceroute anomalies with paris traceroute In Proceedings of the 6thACM SIGCOMM conference on Internet measurement pages 153ndash158 ACM2006

[Augustin2007] Brice Augustin Timur Friedman and Renata Teixeira Multipath tracingwith paris traceroute In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

103

[Bajpai2015-1] Vaibhav Bajpai and Juumlrgen Schoumlnwaumllder A survey on internet perfor-mance measurement platforms and related standardization efforts IEEECommunications Surveys amp Tutorials 17(3) 1313ndash1341 2015

[Baron2016] Benjamin Baron Transport intermodal de donneacutees massives pour le deacutelestage desreacuteseaux drsquoinfrastructure PhD thesis Paris 6 2016

[Bauer2011] Steven Bauer Robert Beverly and Arthur Berger Measuring the state of ecnreadiness in servers clients and routers In Proceedings of the 2011 ACM SIG-COMM conference on Internet measurement conference pages 171ndash180 ACM2011

[Beaglebone] BeagleBoardorg Foundation Beagleboardorg - community supportedopen hardware computers for making

[Bischof2015] Zachary S Bischof John P Rula and Fabiaacuten E Bustamante In and out ofCuba Characterizing Cubarsquos connectivity In Proceedings of the 2015 ACMConference on Internet Measurement Conference pages 487ndash493 ACM 2015

[Brakmo1994] Lawrence S Brakmo Sean W OrsquoMalley and Larry L Peterson TCP Vegas New techniques for congestion detection and avoidance volume 24 ACM 1994

[Brownlee2002] Nevil Brownlee and KC Claffy Understanding internet traffic streams dragonflies and tortoises Communications Magazine IEEE 40(10) 110ndash1172002

[CAIDA-Tools] Center for Applied Internet Data Analysis Caida tools - overview

[Cablesmap] Telegeography Submarine cable map

[Carlucci2015] Gaetano Carlucci Luca De Cicco and Saverio Mascolo Http over udp An experimental investigation of quic In Proceedings of the 30th Annual ACMSymposium on Applied Computing SAC rsquo15 pages 609ndash614 New York NYUSA 2015 ACM

[Chappell2010] Laura Chappell and G Combs Wireshark network analysis the officialWireshark certified network analyst study guide Protocol Analysis InstituteChappell University 2010

[Chavula2017] Josiah Chavula Amreesh Phokeer Agustin Formoso and Nick FeamsterInsight into africarsquos country-level latencies In AFRICON 2017 IEEE pages938ndash944 IEEE 2017

[Chiu1989] Dah-Ming Chiu and Raj Jain Analysis of the increase and decrease algo-rithms for congestion avoidance in computer networks Computer Networksand ISDN systems 17(1) 1ndash14 1989

[Chun2003] Brent Chun David Culler Timothy Roscoe Andy Bavier Larry PetersonMike Wawrzoniak and Mic Bowman PlanetLab An overlay testbed forbroad-coverage services SIGCOMM Comput Commun Rev 33(3) 3ndash12July 2003

[Ciullo2009] D Ciullo M Mellia and M Meo Two schemes to reduce latency in shortlived TCP flows IEEE Communications Letters 13(10) October 2009

[Claise2004] Benoit Claise Cisco systems netflow services export 2004

[Comores2002] Mwezinet Lrsquoarriveacutee drsquointernet aux comores Last Seen 09062017

[Coonjah2015] Irfaan Coonjah Pierre Clarel Catherine and KMS Soyjaudah Perfor-mance evaluation and analysis of layer 3 tunneling between openssh andopenvpn in a wide area network environment In Computing Communica-tion and Security (ICCCS) 2015 International Conference on pages 1ndash4 IEEE2015

104

[Crovella2006] Mark Crovella and Balachander Krishnamurthy Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc New YorkNY USA 2006

[Crowcroft1998] Jon Crowcroft and Philippe Oechslin Differentiated end-to-end in-ternet services using a weighted proportional fair sharing tcp ACM SIG-COMM Computer Communication Review 28(3) 53ndash69 1998

[DICT2017] Government of Seychelles Office of the president Department of informa-tion communication technology 2016

[Donnet2012] Benoit Donnet Matthew Luckie Pascal Meacuterindol and Jean-Jacques Pan-siot Revealing mpls tunnels obscured from traceroute ACM SIGCOMMComputer Communication Review 42(2) 87ndash93 2012

[Downey1999] Allen B Downey Using pathchar to estimate internet link characteristicsIn ACM SIGCOMM Computer Communication Review volume 29 pages 241ndash250 ACM 1999

[EQUINIX] CAIDA Chicago passive network monitor Last visit 12012018

[Estan2001] Cristian Estan and George Varghese New directions in traffic measurementand accounting volume 32 ACM 2002

[Fanou2015] Rodeacuterick Fanou Pierre Francois and Emile Aben On the diversity of in-terdomain routing in africa In Passive and Active Measurement pages 41ndash54Springer 2015

[Fanou2016] Rodeacuterick Fanou Gareth Tyson Pierre Francois and Arjuna SathiaseelanPushing the frontier Exploring the african web ecosystem In Proceedingsof the 25th International Conference on World Wide Web pages 435ndash445 Inter-national World Wide Web Conferences Steering Committee 2016

[Feige1992] Uriel Feige and Prabhakar Raghavan Exact analysis of hot-potato routingIn Foundations of Computer Science 1992 Proceedings 33rd Annual Symposiumon pages 553ndash562 IEEE 1992

[Fraleigh2001] Chuck Fraleigh Christophe Diot Bryan Lyles Sue Moon Philippe Owe-zarski Dina Papagiannaki and Fouad Tobagi Design and deployment ofa passive monitoring infrastructure In Thyrrhenian Internatinal Workshop onDigital Communications pages 556ndash575 Springer 2001

[Fraleigh2003] Chuck Fraleigh Sue Moon Bryan Lyles Chase Cotton Mujahid KhanDeb Moll Rob Rockell Ted Seely and SC Diot Packet-level traffic measu-rements from the sprint IP backbone Network IEEE 17(6) 6ndash16 2003

[France2017] Mission Tregraves Haut Deacutebit Plan france tregraves haut deacutebit Last seen 09062017

[GOTICOM2011] Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de laCommunication Goticom Last Seen 09062017

[GSCounter] StatCounter Statcounter global stats - browser os search engine includingmobile usage share Last visit 13102017

[Gettys2011] Jim Gettys and Kathleen Nichols Bufferbloat Dark buffers in the InternetQueue 9(11) 40 2011

[Gevros2001] Panos Gevros Jon Crowcroft Peter Kirstein and Saleem Bhatti Conges-tion control mechanisms and the best effort service model IEEE network15(3) 16ndash26 2001

[Graham1997] Ian Graham Murray Pearson Jed Martens and Stephen Donnelly DAG- a cell capture board for ATMmeasurement systems 1997

105

[Gupta2014] Arpit Gupta Matt Calder Nick Feamster Marshini Chetty Enrico Calan-dro and Ethan Katz-Bassett Peering at the internetrsquos frontier A first lookat isp interconnectivity in africa In Passive and Active Measurement pages204ndash213 Springer 2014

[Ha2008] Sangtae Ha Injong Rhee and Lisong Xu Cubic A new tcp-friendly high-speed tcp variant SIGOPS Oper Syst Rev 42(5) 64ndash74 July 2008

[Herman2001] Paul Herman The tcpstat tool Publicly available at http wwwfrenchfriesnetpaultcpstat 2001

[Huston2000] Geoff Hutson Tcp performance The Internet Protocol Journal 3 2000

[Huston2006] Geoff Huston Gigabit tcp Internet Protocol Journal 9 2006

[IANA-port] IANA Service Name and Transport Protocol Port Number Registry Lastvisit 06202018

[ICTA2017] Information and Communication Technologies Authority of Mauritius IctaLast Seen 09062017

[IOX] Government Information Service Iox submarine cable to drive the newdigital economy of mauritius 2018

[IPMon] ATL Sprint Ipmon project

[Jacobson1988-1] V Jacobson Congestion avoidance and control ACM Computer Com-munications Review 18(4) 314ndash329 August 1988

[Jacobson1989-1] Van Jacobson Craig Leres and S McCanne The tcpdump manualpage Lawrence Berkeley Laboratory Berkeley CA 1989

[Jacobson1989-2] Van Jacobson Craig Leres and Steven McCanne pcap-packet capturelibrary UNIX man page 2001

[Jacobson1997] Van Jacobson Pathchar A tool to infer characteristics of internet paths1997

[Jain1990] Raj Jain Congestion Control in Computer Networks Issues and TrendsIEEE Network Magazine May 1990

[John2010] Wolfgang John Sven Tafvelin and Tomas Olovsson Passive internet mea-surement Overview and guidelines based on experiences Computer Com-munications 33(5) 533ndash550 2010

[Johnson2011] David L Johnson Veljko Pejovic Elizabeth M Belding and Gertjan vanStam Traffic characterization and internet usage in rural Africa In Pro-ceedings of the 20th International Conference Companion on World Wide WebWWW rsquo11 pages 493ndash502 New York NY USA 2011 ACM

[Johnson2016] David L Johnson and Gertjan van Stam The shortcomings of globalisedinternet technology in southern africa 2016

[Katabi2002] Dina Katabi Mark Handley and Charlie Rohrs Congestion control for highbandwidth-delay product networks In Proceedings of the 2002 Conference onApplications Technologies Architectures and Protocols for Computer Communi-cations SIGCOMM rsquo02 pages 89ndash102 New York NY USA 2002 ACM

[Katz2010] Ethan Katz-Bassett Harsha V Madhyastha Vijay Kumar Adhikari ColinScott Justine Sherry Peter Van Wesep Thomas E Anderson and ArvindKrishnamurthy Reverse traceroute In NSDI volume 10 pages 219ndash2342010

[Krajsa2011] Ondrej Krajsa and Lucie Fojtova RTT measurement and its dependence onthe real geographical distance In Telecommunications and Signal Processing(TSP) 2011 34th International Conference on pages 231ndash234 IEEE 2011

106

[LIL1978] Loi numeacutero 78-17 du 6 janvier 1978 relative agrave lrsquoinformatique aux fichiers etaux liberteacutes Last modification on 19 March 2014

[Lan2006] Kun-chan Lan and John Heidemann A measurement study of correlationsof internet flow characteristics Computer Networks 50(1) 46ndash62 2006

[LanYanFock2015] Jean-Christophe Lan-Yan-Fock Geacuteolocalisation drsquoadresses IP 2015

[Larrieu2010] Nicolas Larrieu and Philippe Owezarski Metrology of internet networksDigital Cognitive Technologies Epistemology and the Knowledge Economy pages101ndash117 2010

[Leguay2004] Jeremie Leguay Matthieu Latapy Timur Friedman and Kaveacute SalamatianDescribing and simulating internet routes CoRR csNI0411051 2004

[Leiner1997] Barry M Leiner Vinton G Cerf David D Clark Robert E Kahn LeonardKleinrock Daniel C Lynch Jon Postel Lawrence G Roberts and Stephen SWolff The past and future history of the Internet Communications of theACM 40(2) 102ndash108 1997

[Lemauricien] Le Mauricien Projet cacircble metiss le contrat deacutecrocheacute par alcatel subma-rine networks et electra tlc spa 2018

[Liu2007] Dan Liu Mark Allman Shudong Jin and Limin Wang Congestion controlwithout a startup phase In Workshop on Protocols for Fast Long-Distance Net-works (PFLDnet) 2007

[Lopez2006] Dino Martin Loacutepez-Pacheco Congduc Pham and Laurent Lefevre Nxg03-4 Xcp-i explicit control protocol for heterogeneous inter-networking ofhigh-speed networks In Global Telecommunications Conference 2006 GLO-BECOMrsquo06 IEEE pages 1ndash6 IEEE 2006

[METROPOLIS] Philippe Owezarski Metropolis meacutetrologie pour lrsquointernet et les ser-vices

[MGIX2017] Madagascar Internet Exchange Point Mgix Mauritius internet exchangepoint 2017

[MIXP2017] Mauritius Internet Exchange Point Mixp Mauritius internet exchangepoint 2017

[Maksimovic2014] Mirjana Maksimovic Vladimir Vujovic Nikola Davidovic VladimirMiloševic and Branko Perišic Raspberry pi as internet of things hardware performances and constraints design issues 3 8 2014

[Mediametrie2018-1] Benoit David Lrsquoanneacutee Internet 2017 Internet meacuteta-meacutedia Lastvisit 20042018

[Mediametrie2018-2] Benoit David Lrsquoobservatoire des Usages Digitaux Antilles-Guyane et Reacuteunion - Panorama 2017 Last visit 20042018

[Medina2005] Alberto Medina Mark Allman and Sally Floyd Measuring the evolutionof transport protocols in the internet ACM SIGCOMM Computer Communi-cation Review 35(2) 37ndash52 2005

[Mellia2003-1] Marco Mellia Andrea Carpani and Renato Lo Cigno Tstat Tcp statisticand analysis tool In International Workshop on Quality of Service in Multiser-vice IP Networks pages 145ndash157 Springer 2003

[Mellia2003-2] M Mellia I Stoica and H Zhang TCP-aware packet marking in net-works with diffserv support Elsevier Computer Networks 42(1) 81ndash100 2003

[Mellia2005] Marco Mellia R Lo Cigno and Fabio Neri Measuring ip and tcp behavioron edge nodes with tstat Computer Networks 47(1) 1ndash21 2005

107

[Moore2001] David Moore Ken Keys Ryan Koga Edouard Lagache and K C ClaffyThe coralreef software suite as a tool for system and network administra-tors In Proceedings of the 15th USENIX Conference on System AdministrationLISA rsquo01 pages 133ndash144 Berkeley CA USA 2001 USENIX Association

[NCSUNRL] North Caroline State University - Networking Research Lab Last seen 27022018

[Nagle1984] John Nagle Congestion control in iptcp internetworks 1984

[Nicolay2017-2] Xavier Nicolay Reacutehan Noordally Pascal Anelli Nour Mohammad Mu-rad and Tahiry Razafindralambo Where is my next hop the case of indianocean islands In 2017 Global Information Infrastructure and Networking Sym-posium (GIIS) (GIISrsquo17) St Denis Reunion October 2017

[Nomikos2016] George Nomikos and Xenofontas Dimitropoulos traixroute Detectingixps in traceroute paths In International Conference on Passive and ActiveNetwork Measurement pages 346ndash358 Springer 2016

[Noordally2016] Reacutehan Noordally Xavier Nicolay Pascal Anelli Richard Lorion andPierre Ugo Tournoux Analysis of internet latency The reunion island caseIn Proceedings of the 12th Asian Internet Engineering Conference AINTEC rsquo16pages 49ndash56 New York NY USA 2016 ACM

[Noordally2017] Reacutehan Noordally Yassine Gangat Arnaud Ravoavahy Pascal Anelliand Xavier Nicolay How long delays impact tcp performance for a connec-tivity from reunion island In Next Generation Computing Applications (Next-Comp) 2017 1st International Conference on page 103ndash108 IEEE 07 2017

[ONU2013] ONU The millennium development goals report 2013 Technical reportOrganisation Nations United 2013

[Obar2012] Jonathan A Obar and Andrew Clement Internet surveillance and boome-rang routing A call for Canadian network sovereignty In TEM 2013 Pro-ceedings of the Technology amp Emerging Media Track-Annual Conference of theCanadian Communication Association (Victoria) 2012

[OpenVPN] OpenVPN Openvpn - open source vpn Last visit 09102017

[OpenWrt] OpenWrt Openwrt project Welcome to the openwrt project Last visit 12062018

[Orebaugh2006] Angela Orebaugh Gilbert Ramirez and Jay Beale Wireshark amp Etherealnetwork protocol analyzer toolkit Syngress 2006

[Ostermann2000] Shawn Ostermann Tcptrace A TCP connection analysis tool URL http www tcptrace org 2000

[Owezarski2003-1] Philippe Owezarski Meacutetrologie de la qualiteacute de service Ecole drsquoeacuteteacutetemps reacuteel (ETR2003)-Systemes Reacuteseauxet Applications 2003

[Owezarski2004] Philippe Owezarski and Nicolas Larrieu Internet trafficcharacterizationndashan analysis of traffic oscillations High Speed Networks andMultimedia Communications pages 96ndash107 2004

[PCH] Packet Clearing House Internet exchange directory 2014

[PSAMP] The Internet Engineering Task Force Packet sampling (psamp) 2017

[Paris-traceroute] Paris Traceroute Team Paris traceroute Last visit 09292017

[Paxson1995] Vern Paxson and Sally Floyd Wide area traffic the failure of poissonmodeling IEEEACM Transactions on Networking (ToN) 3(3) 226ndash244 1995

[Paxson1999] Vern Paxson Bro a system for detecting network intruders in real-timeComputer networks 31(23) 2435ndash2463 1999

108

[Paxson2001] Vern Paxson Some not-so-pretty admissions about dealing with internetmeasurements In Workshop on Network-Related Data Management (NRDM2001) 2001

[PeeringDB] Peering DB Peeringdb facilitates the exchange of information related topeering

[Periakaruppan1999] Ram Periakaruppan Evi Nemeth et al GTrace A graphical trace-route tool In LISA volume 99 pages 69ndash78 1999

[Peterson2007] Larry L Peterson and Bruce S Davie Computer networks a systems ap-proach Elsevier 2007

[Phidgets] Phidgets Phidgets products for usb sensing and control

[PlanetLab] PlanetLab an open platform for developing deploying and accessingplanetary-scale services

[PlanetLabEurope] PlanetLab PlanetLab europe an open platform for developing de-ploying and accessing planetary-scale services last visit 09102017

[Pretet2000] Thierry Prete and Olivier Mas Avancement du projet SAFE Technicalreport 16 Janvier 2000

[REUNIX2017] RENATER RENATER Connecteur de savoirs - reunix Last visit 09102017

[RFC1072] V Jacobson and R Braden TCP extensions for long-delay paths RFC 1072October 1988

[RFC1105] K Lougheed and Y Rekhter Border Gateway Protocol (BGP) RFC 1105June 1989

[RFC1700] J Reynolds and J Postel Assigned numbers RFC 1700 October 1994

[RFC1918] Y Rekhter B Moskowitz D Karrenberg G J de Groot and E Lear Ad-dress Allocation for Private Internets RFC 1918 February 1996

[RFC1983] G Malkin (Ed) Internet Usersrsquo Glossary RFC 1983 (Informational) August1996

[RFC2001] W Richard Stevens TCP Slow Start Congestion Avoidance Fast Retrans-mit and Fast Recovery Algorithms RFC 2001 January 1997

[RFC2330] Dr Guy T Almes Jamshid Mahdavi Matt Mathis and Dr Vern PaxsonFramework for IP Performance Metrics RFC 2330 May 1998

[RFC2582] Tom Henderson and Sally Floyd The NewReno Modification to TCPrsquos FastRecovery Algorithm RFC 2582 April 1999

[RFC2678] J Mahdavi and V Paxson IPPM Metrics for Measuring Connectivity RFC2678 (Proposed Standard) September 1999

[RFC2679] G Almes S Kalidindi and M Zekauskas A One-way Delay Metric forIPPM RFC 2679 (Proposed Standard) September 1999 Obsoleted by RFC7679

[RFC2680] G Almes S Kalidindi and M Zekauskas A One-way Packet Loss Metricfor IPPM RFC 2680 (Proposed Standard) September 1999 Obsoleted byRFC 7680

[RFC2681] G Almes S Kalidindi and M Zekauskas A Round-trip Delay Metric forIPPM RFC 2681 (Proposed Standard) September 1999

[RFC2756] P Vixie and D Wessels Hyper Text Caching Protocol (HTCP00) RFC2756 (Experimental) January 2000

109

[RFC2914] Sally Floyd Congestion Control Principles RFC 2914 September 2000

[RFC3031] E Rosen Viswanathan A and R Callon Multiprotocol Label SwitchingArchitecture RFC 3031 January 2001

[RFC3069] D McPherson and B Dykes VLAN Aggregation for Efficient IP AddressAllocation RFC 3069 (Informational) February 2001

[RFC3168] Sally Floyd Dr K K Ramakrishnan and David L Black The Addition ofExplicit Congestion Notification (ECN) to IP RFC 3168 September 2001

[RFC3232] J Reynolds Assigned Numbers RFC 1700 is Replaced by an On-line Da-tabase RFC 3232 January 2002

[RFC3376] B Cain S Deering I Kouvelas B Fenner and A Thyagarajan InternetGroup Management Protocol Version 3 RFC 3376 (Proposed Standard)October 2002 Updated by RFC 4604

[RFC3649] Sally Floyd HighSpeed TCP for Large Congestion Windows RFC 3649December 2003

[RFC3742] S Floyd Limited Slow-Start for TCP with Large Congestion Windows RFC3742 (Experimental) March 2004

[RFC4250] Chris M Lonvick and Sami Lehtinen The Secure Shell (SSH) Protocol As-signed Numbers RFC 4250 January 2006

[RFC4782] Pasi Sarolahti Amit Jain Sally Floyd and Mark Allman Quick-Start forTCP and IP RFC 4782 January 2007

[RFC4950] R Bonica D Gan D Tappan and C Pignataro ICMP extensions for mul-tiprotocol label switching RFC 4950 August 2007

[RFC5166] S Floyd (Ed) Metrics for the Evaluation of Congestion Control Mecha-nisms RFC 5166 (Informational) March 2008

[RFC5475] T Zseby M Molina N Duffield S Niccolini and F Raspall Sampling andFiltering Techniques for IP Packet Selection RFC 5475 (Proposed Standard)March 2009

[RFC5681] Ethan Blanton Dr Vern Paxson and Mark Allman TCP CongestionControl RFC 5681 September 2009

[RFC5735] Michelle S Cotton and Leo Vegoda Special Use IPv4 Addresses RFC 5735January 2010

[RFC5936] E Lewis and A Hoenes (Ed) DNS Zone Transfer Protocol (AXFR) RFC5936 (Proposed Standard) June 2010

[RFC6077] Ed D Papadimitriou M Welzl M Scharf and Bob J Briscoe Open Re-search Issues in Internet Congestion Control RFC 6077 February 2011

[RFC6201] R Asati C Pignataro F Calabria and C Olvera Device Reset Characteri-zation RFC 6201 (Informational) March 2011

[RFC6248] A Morton RFC 4148 and the IP Performance Metrics (IPPM) Registry ofMetrics Are Obsolete RFC 6248 (Informational) April 2011

[RFC6298] Vern Paxson Mark Allman Jerry Chu and Matt Sargent Computing TCPrsquosretransmission timer RFC 6298 June 2011

[RFC6528] F Gont and S Bellovin Defending against Sequence Number Attacks RFC6528 February 2012

[RFC6691] D Borman TCP Options and Maximum Segment Size (MSS) RFC 6691(Informational) July 2012

110

[RFC6761] Marc Krochmal and Stuart Cheshire Special-Use Domain Names RFC6761 February 2013

[RFC6928] J Chu N Dukkipati Y Cheng and M Mathis Increasing TCPrsquos InitialWindow RFC 6928 (Experimental) April 2013

[RFC7414] M Duke R Braden W Eddy and E Blanton and TCP Extensions for HighPerformance RFC 7414 February 2015

[RFC760] DoD standard Internet Protocol RFC 760 January 1980

[RFC776] J Postel Assigned numbers RFC 776 (Historic) January 1981 Obsoletedby RFC 790

[RFC7766] J Dickinson S Dickinson R Bellis A Mankin and D Wessels DNS Trans-port over TCP - Implementation Requirements RFC 7766 (Proposed Stan-dard) March 2016

[RFC793] Information Sciences Institute Transmission Control Protocol RFC 793September 1981

[RFC8311] D Black Relaxing Restrictions on Explicit Congestion Notification (ECN)Experimentation RFC 8311 (Proposed Standard) January 2018

[RFC8312] I Rhee L Xu S Ha A Zimmermann and L Eggert CUBIC for Fast Long-Distance Networks RFC 8312 February 2018

[RITE2014-1] Bob Briscoe Anna Brunstrom Andreas Petlund David Hayes David RosIng-Jyh Tsang Stein Gjessing Gorry Fairhurst Carsten Griwodz and Mi-chael Welz Reducing internet latency A survey of techniques and theirmerits In IEEE Communications Surveys amp Tutorials IEEE 2014 (To appear)

[RITE2014-2] RITE | Reducing Internet Transport Latency Slow internet -more band-with is not the answer 2014

[RaspberryPi] RASPBERRY PI FOUNDATION Raspberry Pi official website Last visit 09102017

[Ravoavahy2017] Arnaud Ravoavahy Meacutetrologie Reacuteseaux 2017

[Ripe2010] RIPE NCC RIPE atlas 2010

[Ros2005] David Ros Protocole de Transport TCP Ed Techniques Ingeacutenieur 2005

[SDTAN2013] Reacutegion Reunion Sphegravere Public and TACTIS Schema directeur drsquoamena-gement numerique du territoire de la reunion Technical report 2013

[Sallantin2014] Renaud Sallantin Optimisation de bout-en-bout du deacutemarrage des connexionsTCP PhD thesis 2014

[SamKnows] SamKnows Ltd Samknowscom 2017

[Sanchez2013] Mario A Saacutenchez John S Otto Zachary S Bischof David R ChoffnesFabiaacuten E Bustamante Balachander Krishnamurthy and Walter WillingerDasu Pushing experiments to the internetrsquos edge In NSDI pages 487ndash4992013

[Scharf2008-1] Michael Scharf Simon Hauger and Jochen Koumlgel Quick-start tcp Fromtheory to practice In Proc 6th Intern Workshop on Protocols for FAST Long-Distance Networks (PFLDnet) Manchester 2008

[Speechecker] Speedchecker Ltd Internet Performance Monitoring | Speedchecker LtdLast visit 29032018

[Steenbergen2009] Richard A Steenbergen A practical guide to (correctly) troubleshoo-ting with traceroute North American Network Operators Group pages 1ndash492009

111

[Sundaresan2011] Srikanth Sundaresan Walter De Donato Nick Feamster RenataTeixeira Sam Crawford and Antonio Pescapegrave Broadband internet perfor-mance a view from the gateway In ACM SIGCOMM computer communica-tion review volume 41 pages 134ndash145 ACM 2011

[Tan2006] Kun Tan Jingmin Song Qian Zhang and Murad Sridharan A compoundtcp approach for high-speed and long distance networks In Proceedings-IEEE INFOCOM 2006

[Tirumala2005] Ajay Tirumala Feng Qin Jon Dugan Jim Ferguson and Kevin GibbsIperf The tcpudp bandwidth measurement tool htt p dast nlanr net-Projects 2005

[Trammell2015] Brian Trammell Mirja Kuumlhlewind Damiano Boppart Iain LearmonthGorry Fairhurst and Richard Scheffenegger Enabling internet-wide de-ployment of explicit congestion notification In International Conference onPassive and Active Network Measurement pages 193ndash205 Springer 2015

[Udoo] UDOO All you need mini pc android + linux + arduino | udoo

[Vergoz2013] Michael Vergoz Classement des opeacuterateurs Internet reacuteunionnais Techni-cal report BinarySec 2013

[WAND] WAND Wand network research group Last visit 09252017

[Wang2004] Ren Wang Giovanni Pau Kenshin Yamada MY Sanadidi and Mario GerlaTcp startup performance in large bandwidth networks In INFOCOM 2004Twenty-third AnnualJoint Conference of the IEEE Computer and CommunicationsSocieties volume 2 pages 796ndash805 IEEE 2004

[Wang2018] Jessie Hui Wang and Changqing An A study on geographic properties ofinternet routing Computer Networks 133 183ndash194 2018

[Wenwei2006] Li Wenwei Zhang Dafang Yang Jinmin and Xie Gaogang On evalua-ting the differences of TCP and ICMP in network measurement ComputerCommunications 30(2) 428ndash439 2007

[WikiPing] Wikipedia ping (logiciel) Last visit 06102017

[Xu2002] Jun Xu Jinliang Fan Mostafa H Ammar and Sue B Moon Prefix-preservingIP address anonymization Measurement-based security evaluation and anew cryptography-based scheme In Network Protocols 2002 Proceedings10th IEEE International Conferenceon pages 280ndash289 IEEE 2002

[Xu2004] Lisong Xu Khaled Harfoush and Injong Rhee Binary increase congestioncontrol (bic) for fast long-distance networks In INFOCOM 2004 Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Socie-ties volume 4 pages 2514ndash2524 IEEE 2004

[Yang2016] Chantal Yang Hussein Suleman and Josiah Chavula A topology visuali-sation tool for national research and education networks in Africa In IST-Africa Week Conference 2016 pages 1ndash11 IIMC 2016

[Zhang2007] Jian Zhang and Andrew Moore Traffic trace artifacts due to monitoringvia port mirroring In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

[Zheleva2015] Mariya Zheleva Paul Schmitt Morgan Vigil and Elizabeth Belding In-ternet bandwidth upgrade implications on performance and usage in ru-ral zambia Information Technologies amp International Development 11(2) ppndash12015

[nPerf2017] nperf awards broadband reunion 2017

112

[rtraceroute] Reacutehan Noordally Arnaud Ravohavay and Xavier Nicolay rtraceroute Lastvisit 18102017

113

Pocircle Recherche Ecoles doctorales

LETTRE DrsquoENGAGEMENT DE NON-PLAGIAT

Je soussigneacute(e) NOORDALLY Reacutehan

en ma qualiteacute de doctorant(e) de

lrsquoUniversiteacute de La Reacuteunion deacuteclare ecirctre conscient(e) que le plagiat est un acte deacutelictueux

passible de sanctions disciplinaires Aussi dans le respect de la proprieacuteteacute intellectuelle et du

droit drsquoauteur je mrsquoengage agrave systeacutematiquement citer mes sources quelle qursquoen soit la forme

(textes images audiovisuel internet) dans le cadre de la reacutedaction de ma thegravese et de toute

autre production scientifique sachant que lrsquoeacutetablissement est susceptible de soumettre le texte

de ma thegravese agrave un logiciel anti-plagiat

Fait agrave Saint-Denis le 06072018

Signature

Extrait du Regraveglement inteacuterieur de lUniversiteacute de La Reacuteunion (valideacute par le Conseil drsquoAdministration en date du 11 deacutecembre 2014)

Article 9 Protection de la proprieacuteteacute intellectuelle ndash Faux et usage de faux contrefaccedilon plagiat

Lrsquoutilisation des ressources informatiques de lrsquoUniversiteacute implique le respect de ses droits de proprieacuteteacute intellectuelle ainsi que ceux de ses partenaires et plus geacuteneacuteralement de tous tiers titulaires de tes droits En conseacutequence chaque utilisateur doit - utiliser les logiciels dans les conditions de licences souscrites - ne pas reproduire copier diffuser modifier ou utiliser des logiciels bases de donneacutees pages Web textes images photographies ou autres creacuteations proteacutegeacutees par le droit drsquoauteur ou un droit privatif sans avoir obtenu preacutealablement lrsquoautorisation des titulaires de ces droits

La contrefaccedilon et le faux Conformeacutement aux dispositions du code de la proprieacuteteacute intellectuelle toute repreacutesentation ou reproduction inteacutegrale ou partielle drsquoune œuvre de lrsquoesprit faite ans le consentement de son auteur est illicite et constitue un deacutelit peacutenal Lrsquoarticle 444-1 du code peacutenal dispose laquo Constitue un faux toute alteacuteration frauduleuse de la veacuteriteacute de nature agrave cause un preacutejudice et accomplie par quelque moyen que ce soit dans un eacutecrit ou tout autre support drsquoexpression de la penseacutee qui a pour objet ou qui peut avoir pour effet drsquoeacutetablir la preuve drsquoun droit ou drsquoun fait ayant des conseacutequences juridiques raquo Lrsquoarticle L335_3 du code de la proprieacuteteacute intellectuelle preacutecise que laquo Est eacutegalement un deacutelit de contrefaccedilon toute reproduction repreacutesentation ou diffusion par quelque moyen que ce soit drsquoune œuvre de lrsquoesprit en violation des droits de lrsquoauteur tels qursquoils sont deacutefinis et reacuteglementeacutes par la loi Est eacutegalement un deacutelit de contrefaccedilon la violation de lrsquoun des droits de lrsquoauteur drsquoun logiciel (hellip) raquo

Le plagiat est constitueacute par la copie totale ou partielle drsquoun travail reacutealiseacute par autrui lorsque la source emprunteacutee nrsquoest pas citeacutee quel que soit le moyen utiliseacute Le plagiat constitue une violation du droit drsquoauteur (au sens des articles L 335-2 et L 335- 3 du code de la proprieacuteteacute intellectuelle) Il peut ecirctre assimileacute agrave un deacutelit de contrefaccedilon Crsquoest aussi une faute disciplinaire susceptible drsquoentraicircner une sanction Les sources et les reacutefeacuterences utiliseacutees dans le cadre des travaux (preacuteparations devoirs meacutemoires thegraveses rapports de stagehellip) doivent ecirctre clairement citeacutees Des citations inteacutegrales peuvent figurer dans les documents rendus si elles sont assorties de leur reacutefeacuterence (nom drsquoauteur publication date eacutediteurhellip) et identifieacutees comme telles par des guillemets ou des italiques

Les deacutelits de contrefaccedilon de plagiat et drsquousage de faux peuvent donner lieu agrave une sanction disciplinaire indeacutependante de la mise en œuvre de poursuites peacutenales

  • Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion
  • Remerciements
  • Reacutesumeacute
  • Abstract
  • Table des matiegraveres
  • Liste des acronymes
  • Introduction
    • Contexte geacuteneacuteral
    • Contexte reacutegional
      • LInternet agrave La Reacuteunion
      • LInternet dans la Zone de lOceacutean Indien
        • Probleacutematique
        • Organisation de la thegravese
          • Eacutetat de lart
            • Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage
              • Controcircle de congestion de TCP
              • La probleacutematique de lutilisation dun reacuteseau agrave grande capaciteacute de stockage
              • Un controcircle de congestion de TCP adapteacute aux LFN
              • Controcircle de congestion avec implication des routeurs
              • Caracteacuterisation de La Reacuteunion
                • Meacutetrologie du trafic Internet
                  • Deacutefinition
                  • Meacutetrologie active
                  • Meacutetrologie passive
                  • Comparatif entre mesures actives et mesures passives
                    • Synthegravese
                      • Caracteacuterisation de la connectiviteacute de La Reacuteunion
                        • Objectifs
                        • Cahier des charges
                          • Evolution
                          • Connectiviteacute
                            • Protocole de mesure
                              • Eacutechantillon de mesure
                              • Eacutevolution
                              • Connectiviteacute
                                • Reacutesultats
                                  • Eacutevolution
                                  • Connectiviteacute de La Reacuteunion
                                  • Connectiviteacute des icircles de la Zone Oceacutean Indien
                                  • Synthegravese des reacutesultats
                                    • Conclusion
                                      • Meacutetrologie sur le service de transport agrave La Reacuteunion
                                        • Objectifs
                                          • Les objectifs de leacutetude
                                          • Les meacutetriques de leacutetude
                                            • Mise en oeuvre dune plate-forme de meacutetrologie
                                              • Pour la capture du trafic
                                              • Pour analyser les traces
                                                • Protocole de mesure
                                                • Reacutesultats
                                                  • Supervision du trafic
                                                  • Performance de TCP
                                                  • Synthegravese des reacutesultats
                                                    • Conclusion
                                                      • Conclusion amp perspectives
                                                        • Synthegravese des travaux
                                                          • Perspectives
                                                            • Table des figures
                                                            • Liste des tableaux
                                                              • Bibliographie
                                                                  • Table des figures
                                                                  • Liste des tableaux
                                                                  • Bibliographie
Page 5: Étude de la connectivité Internet de l'île de la Réunion

Remerciements

Mes premiers remerciements vont agrave lrsquoendroit de Monsieur Pascal Anelli Maicirctre deconfeacuterences HDR agrave lrsquoUniversiteacute de La Reacuteunion qui a accepteacute drsquoencadrer cette thegravese Jele remercie drsquoavoir mis toute son eacutenergie pour que je puisse mener ces travaux dans lesmeilleures conditions Je le remercie eacutegalement pour la confiance et la patience sans failleqursquoil mrsquoa teacutemoigneacutees durant ces anneacutees

Je remercie Monsieur Richard Lorion Maicirctre de Confeacuterences agrave lrsquoUniversiteacute de LaReacuteunion Malgreacute un emploi du temps surchargeacute il a su me consacrer du temps pouraiguiller mes travaux

Je tiens agrave remercier tout particuliegraverement Madame Laure Petrucci Professeur agrave lrsquoUni-versiteacute Paris 13 et Monsieur Emmanuel Lochin Professeur agrave lrsquoISAE SUPAERO qui mrsquoontfait lrsquohonneur drsquoaccepter de juger ces travaux et drsquoen ecirctre rapporteurs

Je remercie le Professeur Reacutemy Courdier qui a accepteacute de preacutesider mon jury de thegraveseDe par cette acceptation je boucle mon cursus universitaire agrave lrsquoUniversiteacute de La ReacuteunionMes remerciements vont agrave lrsquoattention de Monsieur Promeacutetheacutee Spathis qui consacre deson temps agrave la participation de mon jury de thegravese en tant qursquoexaminateur

Je tiens agrave remercier Messieurs Pierre-Ugo Tournoux et Xavier Nicolay pour les dis-cussions que lrsquoon a eues Cela mrsquoa permis de me remettre dans le droit chemin quand jemrsquoeacutegarais

Je remercie eacutegalement Monsieur Bruno Baynat Maicirctre de confeacuterences agrave lrsquoUniversiteacutede Paris 6 qui a su donner un nouveau souffle agrave ces travaux agrave travers ses conseils lors deson passage

Je remercie eacutegalement Monsieur Denis Fabregravegue Responsable du pocircle TIC agrave La ReacuteunionMonsieur Thierry Pretet travaillant agrave la cellule Investissements publics de la ReacutegionReacuteunion Monsieur Thomas Silverston Chercheur au NICT drsquoavoir accepteacute de faire par-tie de mon comiteacute de suivi de thegravese

Je remercie eacutegalement le Laboratoire drsquoInformatique et de Matheacutematiques dirigeacute parMonsieur Jean Diatta Professeur agrave lrsquoUniversiteacute de La Reacuteunion ainsi que lrsquoensemble desmembres pour lrsquoaccueil et les moyens qui mrsquoont eacuteteacute mis agrave disposition pour le bon deacuterou-lement de cette thegravese

Je remercie eacutegalement la Reacutegion Reacuteunion qui a soutenu financiegraverement ces travaux dethegravese

Je remercie eacutegalement Messieurs Jean-Christophe Lan-Yan-Fock et Arnaud Ravoa-vahy pour les travaux reacutealiseacutes durant leurs stages

Je remercie eacutegalement mes collegravegues mes amis et mes proches pour leurs contribu-tions et leurs encouragements

Je remercie particuliegraverement Aureacutelie Miora Florence et Anne-Claire qui ont eacuteteacute dansla mecircme galegravere que moi

Je tiens agrave remercier du fond du coeur lrsquoensemble des membres de ma famille qui mrsquoonttoujours apporteacute leur soutien et leur encouragement Merci agrave vous

Enfin je tiens agrave remercier toutes les personnes qui ont contribueacute de pregraves ou de loin agravela reacutealisation de ces travaux

III

IV

Reacutesumeacute

Lrsquoaccegraves agrave Internet des icircles de la Zone Oceacutean Indien a la particulariteacute drsquoutiliser deuxlongs cacircbles sous-marins Les routes ont en commun de passer par un de ces liens etdrsquointroduire une composante de deacutelai qui peut ecirctre significative La performance de TCPest lieacutee agrave lrsquoeacutetat des routes et au deacutelai Dans la situation de lrsquoicircle de la Reacuteunion comment secomporte un protocole ayant une deacutependance au deacutelai tel que TCP

Dans cette thegravese nous proposons une eacutetude de lrsquoInternet agrave la Reacuteunion Les travauxvisent agrave pouvoir dresser un bilan de la connectiviteacute Internet Ils srsquoorientent drsquoune partagrave caracteacuteriser la connectiviteacute au niveau du reacuteseau et drsquoautre part agrave traduire ses caracteacute-ristiques au niveau de la couche de transport Ainsi les travaux preacutesenteacutes reposent surdeux eacutetudes de meacutetrologie sur le reacuteseau reacuteunionnais

Le premier examen a pour objectif la caracteacuterisation des deacutelais et des routes emprun-teacutees depuis et en direction de lrsquoicircle Ces travaux reposent sur une plate-forme de mesuresmise en place agrave cet effet Un outil drsquoidentification des routes a eacuteteacute deacuteveloppeacute afin drsquoana-lyser les chemins depuis et vers la Reacuteunion Cet outil utilise une base de donneacutees degeacuteolocalisation construite agrave partir des adresses IP rencontreacutees des deacutelais associeacutes et drsquoin-formations provenant des Registres Internet Reacutegionaux Lrsquoanalyse des reacutesultats montredes caracteacuteristiques propres agrave la reacutegion Reacuteunion

La seconde eacutetude de meacutetrologie vise lrsquoanalyse des flux TCP Des meacutetriques associeacuteesagrave lrsquoobservation des captures de trafic sont identifieacutees afin drsquoeacutetablir les performances deTCP mais eacutegalement les types de trafic entrant et sortant de lrsquoicircle Le volume des eacutecouteseacutetant important un outil drsquoanalyse pour des traitements efficaces et rapides a eacutegalementeacuteteacute deacuteveloppeacute

Les contributions de cette thegravese sont drsquoabord rattacheacutees au contexte reacuteunionnais etsont extrapoleacutees vers lrsquointernet de la Zone Oceacutean Indien Cette thegravese se veut ecirctre un eacuteleacute-ment pour une reacuteflexion avec lrsquoensemble des acteurs de lrsquoInternet agrave la Reacuteunion

Mots cleacutes

Meacutetrologie active Deacutelais Routage Meacutetrologie passive Performance TCP Zone OceacuteanIndien Reacuteunion

V

Abstract

The access to the Internet of the Islands of the Indian Ocean Area has the particularityof using two long submarines cables The routes have in common to go through one ofthese links and introduce a delay component that can be significant The performance ofTCP is linked to the state of the route and the delay In the situation of Reunion Islandhow does a protocol having a dependence on delay such as TCP behaves

In this thesis we propose a study of the Internet in Reunion Island The work aimsto be able to take stock of Internet connectivity They are oriented on the one hand tocharacterize the connectivity at the level of the network and on the other hand to translatethese characteristics at the level of the transport layer Thus the works presented arebased on two metrology studies on the Reunion network

The first review aims to characterize the delays and the routes taken from and to theisland This work is based on a platform of measures put in place for this purpose A roadidentification tool has been developed to analyze roads to and from Reunion Island Thistool uses a geolocation database built from IP addresses encountered associated delaysand information from the Regional Internet Registries The analysis of the results showscharacteristics specific to the Reacuteunion region

The second metrology study aims to analyze TCP flows Metrics associated with theobservation of the catches of traffic are identified in order to establish the performancesof TCP but also the types of traffic entering and leaving the island Since the volume ofthe intercepts is important an analysis tool for efficient and rapid treatments has beendeveloped

The contributions of this thesis are first of all related to the Reunionese context andare extrapolated to the Internet of the Indian Ocean Zone This thesis is meant to be anelement for a reflection with all the actors of the Internet in Reunion Island

Keywords

Active Metrology Delay Routage Passive metrology Performance TCP Indian OceanArea Reunion Island

VI

Table des matiegraveres

Remerciements III

Reacutesumeacute V

Abstract VI

Liste des acronymes IX

Introduction 11 Contexte geacuteneacuteral 12 Contexte reacutegional 1

21 LrsquoInternet agrave La Reacuteunion 122 LrsquoInternet dans la Zone de lrsquoOceacutean Indien 5

3 Probleacutematique 84 Organisation de la thegravese 8

1 Eacutetat de lrsquoart 911 Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage 10

111 Controcircle de congestion de TCP 10112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de

stockage 14113 Un controcircle de congestion de TCP adapteacute aux LFN 17114 Controcircle de congestion avec implication des routeurs 22115 Caracteacuterisation de La Reacuteunion 23

12 Meacutetrologie du trafic Internet 25121 Deacutefinition 25122 Meacutetrologie active 26123 Meacutetrologie passive 32124 Comparatif entre mesures actives et mesures passives 35

13 Synthegravese 36

2 Caracteacuterisation de la connectiviteacute de La Reacuteunion 3921 Objectifs 4022 Cahier des charges 40

221 Evolution 40222 Connectiviteacute 40

23 Protocole de mesure 46231 Eacutechantillon de mesure 46232 Eacutevolution 47233 Connectiviteacute 48

24 Reacutesultats 53241 Eacutevolution 53

VII

242 Connectiviteacute de La Reacuteunion 54243 Connectiviteacute des icircles de la Zone Oceacutean Indien 65244 Synthegravese des reacutesultats 71

25 Conclusion 72

3 Meacutetrologie sur le service de transport agrave La Reacuteunion 7531 Objectifs 75

311 Les objectifs de lrsquoeacutetude 76312 Les meacutetriques de lrsquoeacutetude 76

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie 79321 Pour la capture du trafic 79322 Pour analyser les traces 80

33 Protocole de mesure 8234 Reacutesultats 85

341 Supervision du trafic 86342 Performance de TCP 88343 Synthegravese des reacutesultats 91

35 Conclusion 92

Conclusion amp perspectives 951 Synthegravese des travaux 952 Perspectives 96

Table des figures 100

Liste des tableaux 101

Bibliographie 103

VIII

Liste des acronymes

ACK Acknowledgement

ADSL Asymmetric Digital Subscriber Line

AIMD Additive Increase and Multiplicative Decrease

API Application Programming Interface

ARCEP Autoriteacute de Reacutegulation des Communications Electroniques et des Postes

AS Autonomous System

BDP Bandwidth Delay Product

CAIDA Center for Applied Internet Data Analysis

CDCS Comoros Domestic Cable Sytem

CDF Cumulative Density Function

CIL Correspondant Informatique et Liberteacutes

CWND Congestion Window

CWR Congestion Window Reduce

DNS Domain Name System

DSI Direction des Services Informatiques

DupAck Duplicate Acknowledgement

EASSY Eastern Arfrica Submarine SYstem

ECE ECN Echo

ECN Explicit Congestion Notification

FAI Fournisseurs drsquoAccegraves Internet

FTTH Fiber To The Home

GIX Global Internet eXchange

GNU GNUrsquos Not Unix

GPL General Public Licence

HTTP HyperText Transfer Protocol

HTTPS HyperText Transfer Protocol Secured

IANA Internet Assigned Numbers Authority

ICMP Internet Control Message Protocol

IETF Internet Engineering Task Force

IX

IGMP Internet Group Management Protocol

IMAP Internet Message Access Protocol

IP Internet Protocol

IPPM IP Performance Metrics

IW Initial Window

IXP Internet eXchange Point

LAN Local Area Network

LER Label Edge Router

LFN Long Fat Network

LIM Laboratoire drsquoInformatique et de Matheacutematiques

LION Lower Indian Ocean Network

LSP Label Switched Path

LSR Label Switch Router

MAN Metropolitan Area Network

MPLS MultiProtocol Label Switch

MSS Maximun Segment Size

NRA Noeud de Raccordement drsquoAbonneacutes

NS Nonce Sum

OS Operating System

PDF Probability Density Function

POP Post Office Protocol

PSAMP Packet Sampling

RENATER REseau NAtional de communication eacutelectroniques pour la Technologie lrsquoEnseigne-ment et la Recherche

RIR Regional Internet Registry

RITE Reducing Internet Transport Latency

RSSI Responsable Seacutecuriteacute et Systegravemes drsquoInformation

RTO Retransmission TimeOut

RTT Round-Trip delay Time

SAFE South-Africa Far East

SAT-3 South Africa Transit-3

SCP Ssh CoPy

SEAS Seychelles to East Africa System

SMTP Simple Mail Transfert Protocol

SSH Secure SHell

ssthresh slow-start threshold

TAI Technologies drsquoAccegraves agrave Internet

X

TCP Transmission Control Protocol

TTL Time-To-Live

UDP User Datagram Protocol

VDSL Very-high-bit-rate Digital Subscriber Line

VLAN Virtual Local Area Network

VOD Video on demand

VPN Virtal Private Network

WAN Wide Area Network

WASC West Africa Submarine Cable

ZOI Zone Oceacutean Indien

XI

XII

Introduction

1 Contexte geacuteneacuteral

Depuis sa premiegravere deacutemonstration publique en 1972 Internet a fortement eacutevolueacute[Leiner1997] Dans une premiegravere phase nous avons les changements de services Les uti-lisateurs ont basculeacute des services historiques que sont lrsquoeacutechange drsquoe-mail et la navigationweb vers une utilisation interactive de lrsquoInternet Ces nouveaux services tels que la Voixsur IP les Jeux en ligne le Streaming etc sont maintenant possibles peu importe lrsquoendroitougrave lrsquoon se situe Cela gracircce agrave la seconde phase des innovations de lrsquoInternet lrsquoeacutevolu-tion des technologies logicielles et mateacuterielles Les technologies sont devenues de plusen plus mobiles et proposent des deacutebits drsquoaccegraves agrave lrsquoInternet de plus en plus importantsAinsi nous sommes passeacutes drsquoun accegraves physique de chez soi connecteacutes agrave un ordinateurfixe et une liaison 56 kbits (kilo-bitsseconde) agrave des smartphones et des connexions mo-biles avec un deacutebit theacuteorique minimal descendant de 20 Gbits (Giga-bitsseconde) dansun futur proche pour la technologie 5G En parallegravele lrsquoaccegraves agrave Internet srsquoest deacutemocra-tiseacute Drsquoapregraves une eacutetude de lrsquoOrganisation des Nations Unies le nombre de teacuteleacutephonesmobiles est devenu supeacuterieur au nombre drsquohabitants sur la planegravete [ONU2013] Ces eacutevo-lutions parallegraveles ont bouleverseacute lrsquousage de lrsquoInternet Est-ce que ces eacutevolutions ont eu unimpact sur lrsquoInternet reacuteunionnais

2 Contexte reacutegional

21 LrsquoInternet agrave La Reacuteunion

Pour comprendre la situation de lrsquoInternet agrave La Reacuteunion il est neacutecessaire de relaterlrsquohistoire de la connectiviteacute Internet et de dresser un bilan de lrsquoeacutetat actuel Cet historiqueest effectueacute agrave partir du document [Pretet2000] qui preacutesente lrsquoavancement du projet deconnexion de lrsquoicircle de La Reacuteunion au cacircble sous-marin South-Africa Far East (SAFE)

La premiegravere connexion de La Reacuteunion agrave lrsquoInternet date de 1992 avec la mise en servicedu projet Telecom-2 Agrave cette eacutepoque la seule liaison connectant La Reacuteunion agrave Interneteacutetait une connexion satellitaire Jusqursquoen 2001 et lrsquoarriveacutee du cacircble SAT-3WASCSAFEles deacutebits drsquoaccegraves reacutesidentiels ne deacutepassaient pas les 56 kbits La bande passante totalede lrsquoaccegraves Internet de lrsquoicircle par ce canal satellite eacutetait de 400 Mbits (Meacutega-bitsseconde)tous opeacuterateurs confondus Le coucirct drsquoutilisation de la liaison satellite avoisinait les17 000DMbmois et par opeacuterateur La technologie drsquoaccegraves et le tarif eacuteleveacute limitaient lesusages de lrsquoInternet priveacute agrave des services basiques comme lrsquoeacutechange drsquoe-mail Lrsquoarriveacuteedes cacircbles South Africa Transit-3 (SAT-3)West Africa Submarine Cable (WASC)SAFE en2001 visaient agrave deacutesenclaver numeacuteriquement lrsquoicircle

Ce cacircble drsquoune longueur totale de 28 000 Km (Kilo-megravetres) connecte lrsquoEurope (Es-pagne et Portugal) agrave lrsquoAsie (Inde et Malaisie) en longeant la cocircte Ouest africaine telqursquoillustreacutee par la carte figure 1 Le lien est composeacute de deux paires de fibres optiquesavec une capaciteacute globale de 135 Gbits La reacutepartition des capaciteacutes fut faite en fonction

1

du montant investi par les opeacuterateurs France Teacuteleacutecom fut seacutelectionneacutee pour la Franceavec un deacutebit total de 13 6 Gbits dont 155 Mbits furent alloueacutes agrave la connexion de LaReacuteunion Ce deacutebit eacutetait eacutequivalent agrave la capaciteacute maximale theacuteorique du lien satellite deFrance Teacuteleacutecom Outre la seacutecuriteacute apporteacutee par la fibre optique crsquoest la qualiteacute de la trans-mission qui a eacuteteacute ameacutelioreacutee avec ce support Ce cacircble a eacuteteacute une premiegravere eacutetape dans lamise en place drsquoune autoroute de lrsquoinformation entre lrsquoEurope lrsquoAsie et lrsquoAfrique PourLa Reacuteunion cette autoroute a eacuteteacute un facteur pour la baisse des coucircts de communication eten parallegravele le deacuteploiement de la technologie Asymmetric Digital Subscriber Line (ADSL)Les tarifs de consommation de la bande passante du lien ont connu une baisse impor-tante suite agrave une deacutecision de lrsquoAutoriteacute de Reacutegulation des Communications Electroniques etdes Postes (ARCEP) en 2004 [ARCEP2004] Les tarifs sont passeacutes de 17 000 DMbmois agrave1 550 DMbmois

FIGURE 1 ndash Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000])

Malgreacute la baisse des tarifs lrsquoADSL nrsquoeacutetait preacutesent que dans 6 villes agrave forte densiteacutede population Afin drsquoaugmenter la couverture de lrsquoaccegraves Internet de lrsquoicircle une dorsalefaisant le tour de lrsquoicircle est installeacutee Crsquoest le reacuteseau nommeacute Gazelle dont le deacutebut du deacute-ploiement fut effectueacute dans le courant de lrsquoanneacutee 2003 [SDTAN2013] Cette fibre est ins-talleacutee en hauteur en suivant le reacuteseau Haute Tension drsquoEDF selon le plan de la figure 2(en trait bleu ou fonceacute) Le but de ce reacuteseau est de raccorder lrsquoensemble des Noeud de Rac-cordement drsquoAbonneacutes (NRA) Un NRA est un local heacutebergeant un central teacuteleacutephonique delrsquoopeacuterateur historique France Teacuteleacutecom dans lequel aboutissent les lignes teacuteleacutephoniquesdes abonneacutes communeacutement appeleacutees boucles locales Au delagrave de ces locaux les boucleslocales forment le reacuteseau capillaire Lrsquointerconnexion entre le reacuteseau Gazelle et les NRAest repreacutesenteacutee en vert sur la figure 2

En 2004 La Reacuteunion srsquoest doteacutee drsquoun point drsquoeacutechange (Global Internet eXchange (GIX)ou Internet eXchange Point (IXP)) nommeacute Reunix Il fut pendant pregraves de 10 ans le seul IXPpreacutesent dans la Zone Oceacutean Indien (ZOI) Geacutereacute par le REseau NAtional de communicationeacutelectroniques pour la Technologie lrsquoEnseignement et la Recherche (RENATER) il vise agrave inter-connecter les fournisseurs drsquoaccegraves Internet de La Reacuteunion afin drsquoeacuteviter que le trafic localne sorte de lrsquoicircle et consomme des capaciteacutes sur le cacircble sous-marin En plus de cet eacutequi-pement des technologies de cache ont eacuteteacute deacuteployeacutees sur le territoire LrsquoUniversiteacute de LaReacuteunion a eacuteteacute un des acteurs de ce deacuteploiement

2

FIGURE 2 ndash Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000])

Depuis la deacutecision de lrsquoARCEP en 2004 chaque anneacutee une baisse de 20 agrave 40 duprix du Meacutegabit sur le cacircble sous-marin est enregistreacutee En 2006 pour 50D un abonneacutenrsquoavait droit qursquoagrave la connexion ADSL de 1 Mbits sans aucun service additionnel Lrsquoan-neacutee suivante pour le mecircme tarif la teacuteleacutephonie illimiteacutee vers certains pays a eacuteteacute ajouteacuteeau forfait Dans le courant de lrsquoanneacutee 2010 le forfait est resteacute le mecircme mais le deacutebit alloueacuteest augmenteacute pour atteindre 8 Mbits La Reacuteunion nrsquoa vu lrsquoarriveacutee du triple play (Teacuteleacutevi-sion Teacuteleacutephone Internet) qursquoagrave partir des anneacutees 20112012 avec lrsquoarriveacutee drsquoun nouveaucacircble Lower Indian Ocean Network (LION) Le LION est un cacircble sous-marin reliant LaReacuteunion Maurice et Madagascar depuis 2009 En 2012 une extension est rajouteacutee sousle nom de LION-2 connectant le LION agrave Mayotte et au Kenya Ce nouveau cacircble proposedegraves sa mise en service une capaciteacute deacutepassant le 1 Tbs (Teacuterabitseconde)

Lrsquoaugmentation continue des deacutebits et de la capaciteacute disponible sur le cacircble SAT-3WASCSAFE actuellement agrave 900 Gbits a acceacuteleacutereacute le deacuteploiement de nouveaux ser-vices et de nouvelles technologies drsquoaccegraves agrave Internet pour les abonneacutes Lrsquoicircle de La Reacuteuniondispose actuellement en dehors des connexions mobiles de trois Technologies drsquoAccegraves agrave In-ternet (TAI) La premiegravere est la technologie ADSL preacutesente depuis 2001 Elle propose desdeacutebits asymeacutetriques allant jusqursquoagrave 20 Mbitss en descente Crsquoest le deacutebit qursquoaura lrsquoutilisa-teur en teacuteleacutechargement Depuis 2014 lrsquoopeacuterateur historique Orange (ex-France Teacuteleacutecom)propose la technologie Very-high-bit-rate Digital Subscriber Line (VDSL) 2 avec des deacutebitsallant jusqursquoagrave 100 Mbits descendant La limite physique de cette TAI impose une dis-tance entre lrsquoabonneacute et le distributeur infeacuterieure agrave 1 Km La derniegravere technologie preacutesentesur lrsquoicircle est la fibre optique Deacuteployeacutee depuis 2007 par lrsquoopeacuterateur priveacute ZEOP elle eacutetaitjusqursquoagrave peu principalement deacuteployeacutee dans les villes du Port Sainte Marie et Saint Pierre

Chaque opeacuterateur dispose drsquoune ou plusieurs technologies drsquoaccegraves Chaque technolo-

3

gie est associeacutee agrave un deacutebit maximal theacuteorique La carte 3 1 preacutesente les deacutebits theacuteoriquesqui sont preacutesents sur lrsquoicircle [France2017]

Cette carte montre une dispariteacute des deacutebits selon les zones geacuteographiques de lrsquoicircleLe Plan France Tregraves Haut Deacutebit a pour objectif drsquouniformiser sur lrsquoensemble du territoirefranccedilais les deacutebits avec le deacuteploiement de la technologie drsquoaccegraves fibre optique

FIGURE 3 ndash Carte des deacutebits agrave La Reacuteunion

Reacutecapitulatif

La connexion agrave Internet donne agrave La Reacuteunion des capaciteacutes importantes La preacutesencedrsquoun GIX sur le territoire a limiteacute le trafic reacuteunionnais sur les cacircbles sous-marins La figure4 montre lrsquoensemble des eacuteveacutenements qui ont marqueacute le deacuteveloppement de lrsquoInternet agrave LaReacuteunion jusqursquoagrave nos jours

Depuis la deacutecision de lrsquoARCEP en 2004 [ARCEP2004] et lrsquoarriveacutee du cacircble LION lesopeacuterateurs ont fait le choix drsquoaugmenter les services proposeacutes avec un prix reacutesidentielstable Les derniers services ajouteacutes sont ceux de la Video on demand (VOD) et de la rediffu-sion (Replay) En 2014 le prix moyen du MeacutegabitMois sur le cacircble SAT-3WASCSAFEavoisinait les 25 D En pregraves de 15 ans on note la baisse du coucirct moyen du Meacutegabitmoisde 17 000 D agrave 25 D

Lrsquoeacutevolution de la connectiviteacute Internet agrave La Reacuteunion est lieacutee au deacuteveloppement de laconnectiviteacute des diffeacuterents pays preacutesents dans la Zone Oceacutean Indien

1 Source Observatoire France Tregraves Haut Deacutebit

4

FIGURE 4 ndash Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion

22 LrsquoInternet dans la Zone de lrsquoOceacutean Indien

Les acteurs du deacuteveloppement du numeacuterique dans la Zone Oceacutean Indien

Dans le cadre de nos eacutetudes nous restreignons la ZOI agrave 6 icircles ou archipels suivants(rangeacutes par ordre alphabeacutetique) les Comores Madagascar Maurice Mayotte La Reacuteunionet les Seychelles Agrave lrsquoexception de Mayotte et de La Reacuteunion qui sont des reacutegions fran-ccedilaises les autres icircles et archipels citeacutes sont des pays indeacutependants Nous allons dansun premier temps faire une preacutesentation des principaux acteurs du deacuteveloppement nu-meacuterique dans chaque territoire Le deacuteveloppement de lrsquoInternet dans la ZOI se fait encollaboration avec lrsquoensemble des pays Nous poursuivrons avec les futures installationsdes cacircbles sous-marins dans la ZOI

LrsquoUnion des Comores est une reacutepublique feacutedeacuterale drsquoAfrique Lrsquoarchipel est connecteacuteagrave Internet depuis le 19 Janvier 1998 via une connexion satellite En 2010 le gouverne-ment deacuteploie le Comoros Domestic Cable Sytem (CDCS) qui relie lrsquoensemble des icircles delrsquoarchipel entre elles avec en parallegravele le raccordement au cacircble Eastern Arfrica SubmarineSYstem (EASSY) [Comores2002] Ce cacircble relie lrsquoAfrique du Sud au Soudan en longeantla cocircte Est du continent En 2009 lrsquoAutoriteacute Nationale de Reacutegulation des TIC (ANRTIC) voitle jour De nombreuses missions sont donneacutees agrave cette autoriteacute comme appliquer et fairerespecter la loi des Technologies de lrsquoInformation et de la Communication (TIC) reacuteguler lesecteur des TIC favoriser la coopeacuteration entre les acteurs et geacuterer les diffeacuterends garan-tir une concurrence saine et loyale entre les opeacuterateurs et de deacutevelopper la recherche laformation et les innovations technologiques [ANRTIC2016] En deacutecembre 2016 un troi-siegraveme cacircble connecte lrsquoarchipel agrave Mayotte Actuellement un Vice-Preacutesident chargeacute desTIC travaille en collaboration avec un Conseiller du preacutesident en matiegravere de transports etteacuteleacutecommunications

La Reacutepublique de Madagascar est relieacutee agrave Internet par deux cacircbles sous-marins Lepremier est lrsquoEASSY Le second cacircble est le LION Au niveau des prises de deacutecisions 3 or-ganismes principaux existent Le plus important est le ministegravere des Teacuteleacutecommunicationset des Nouvelles Technologies Il a mis en place le Projet drsquoInfrastructure de Communicationpour Madagascar (PICOM) Lrsquoobjectif est la reacuteduction des coucircts drsquoaccegraves aux services deteacuteleacutecommunications Le second est lrsquoAutoriteacute de Reacutegulation des TEchnologies de Communica-tion (ARTEC) Cet administration octroie les licences aux proprieacutetaires des reacuteseaux arbitreles diffeacuterends entre opeacuterateurs et assure la gestion des spectres [ARTEC2016] Le dernierorganisme est le Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de la Commu-nication (GOTICOM) Il a pour objectif drsquoaccompagner et drsquoameacuteliorer les infrastructuresde teacuteleacutecommunication et de favoriser lrsquointeacutegration des TIC [GOTICOM2011] Depuis2016 un GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Africaine [MGIX2017]

5

La Reacutepublique de Maurice regroupe les icircles Rodrigues et Maurice Sous lrsquoimpulsiondu gouvernement anglais la premiegravere ligne teacuteleacutephonique fut installeacutee en 1883 Actuel-lement en plus drsquoune connexion satellitaire reliant les deux icircles le SAFE et le LIONconnectent Maurice agrave Internet Un ministegravere des Technologies de lrsquoInnovation et desCommunications existe au sein du gouvernement Crsquoest ce mecircme gouvernement quinomme le directeur de lrsquoInformation and Communication Technologies Authority (ICTA) Crsquoestlrsquoautoriteacute de reacutegulation des Teacuteleacutecoms et des Postes Il existe 2 principaux opeacuterateurs quesont Mauritius Telecom et Emtel Une dizaine drsquoopeacuterateurs cohabitent sur lrsquoicircle [ICTA2017]Depuis 2016 un nouveau GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Afri-caine [MIXP2017]

Mayotte est un deacutepartement franccedilais depuis Mars 2011 Le raccordement au cacircbleLION-2 extension du cacircble LION en avril 2012 rend possible lrsquoarriveacutee du haut deacutebit surce territoire En 2013 un GIX geacutereacute par RENATER est installeacute au sein du Rectorat Il senomme Mayotix

Les Seychelles ont vu leur premiegravere connexion Internet introduite dans lrsquoarchipel parAtlas Seychelles Ltd en septembre 1996 En 2012 les Seychelles sont connecteacutes agrave une fibreen provenance de Tanzanie Crsquoest le cacircble Seychelles to East Africa System (SEAS) Crsquoestlrsquounique cacircble sous-marin connectant lrsquoarchipel Le Ministegravere des Technologie de lrsquoInforma-tion et des Communications (MITC) fait office drsquoautoriteacute de Reacutegulation des Teacuteleacutecommuni-cations dans le pays [DICT2017]

Chaque autoriteacute de reacutegulation agrave un impact sur le deacuteveloppement de lrsquoInternet dansson pays Ce deacuteveloppement se reacutepercute sur lrsquoameacutelioration de lrsquoaccegraves Internet dans laZOI

Deacuteveloppement de lrsquointerconnexion de la Zone Oceacutean Indien

Cette reacutegion a connu un premier bouleversement de sa connectiviteacute agrave Internet avecle deacuteploiement du cacircble sous-marin SAT-3WASCSAFE en 2001 pour La Reacuteunion etMaurice Lrsquoarriveacutee du LION en 2009 a connecteacute Madagascar aux deux icircles En 2010 lesComores et Madagascar se sont ouverts une voie vers lrsquoAfrique avec le cacircble EASSY Lrsquoin-terconnexion du LION 2 a deacuteveloppeacute lrsquoInternet agrave Mayotte tandis que le deacuteploiement ducacircble SEAS a ouvert les Seychelles agrave lrsquoInternet haut deacutebit La carte 5 indique les diffeacuterentscacircbles sous-marins preacutesents dans la ZOI

La ZOI srsquoengage dans le deacuteploiement de nouveaux liensLe cacircble MElting poT Indianoceanic Submarine System (METISS) drsquoune longueur de

3 500 kilomegravetres reliera Madagascar Maurice et La Reacuteunion agrave lrsquoAfrique du Sud La bandepassante du cacircble sera de 24 Tbs Sa mise en service est preacutevue pour le courant de lrsquoan-neacutee 2019 [Lemauricien]

Africa-1 est un cacircble reliant lrsquoAfrique du Sud le Moyen Orient et lrsquoAsie centrale Cecacircble de plus de 12 0000 kilomegravetres passera le long de la cocircte Est africaine avant de relierlrsquoArabie Saoudite lrsquoEacutegypte et le Pakistan La mise en service du cacircble est preacutevue pour lecourant de lrsquoanneacutee 2020 [Africa1]

En 2019 sera mis en service le cacircble IOX IOX est un cacircble sous-marin deacutedieacute agrave lrsquoicircleMaurice Il a pour but drsquooffrir une nouvelle liaison agrave Maurice en reliant lrsquoicircle agrave lrsquoAfrique etau reste du monde Il sera doteacute drsquoune capaciteacute de 54 Tbs [IOX]

La carte 6 repreacutesente lrsquoensemble des IXP preacutesents dans la Zone Oceacutean Indien En vertce sont les points drsquoeacutechanges deacutejagrave en service La France a degraves lrsquoanneacutee 2004 mis en placele point drsquoeacutechange agrave La Reacuteunion et en 2012 celui de Mayotte Ceux de Maurice et de

6

FIGURE 5 ndash Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source [Cablesmap])

Madagascar ont eacuteteacute mis en service en 2016 avec lrsquoaide de lrsquoUnion Africaine de lrsquoInter-net Society et du projet AXIS [AXIS] Les points bleus repreacutesentent les points drsquoeacutechangequi sont preacutevus drsquoecirctre deacuteployeacutes dans la zone oceacutean indien par le projet AXIS dans le fu-tur Drsquoici quelques anneacutees lrsquoensemble des territoires de la zone sera eacutequipeacute drsquoun pointdrsquoeacutechange Cet eacutequipement vise a maintenir le trafic de type Metropolitan Area Network(MAN) du pays ougrave il est installeacute Il facilite les eacutechanges entre les opeacuterateurs locaux enreacuteduisant la latence et en augmentant la qualiteacute de service

FIGURE 6 ndash Carte des points drsquoeacutechange preacutesents actuellement et dans un futur prochedans la ZOI

7

3 Probleacutematique

LrsquoInternet et ses applications ont eacuteteacute deacuteveloppeacutes dans des territoires ougrave les routes sontnombreuses Lrsquoicircle de La Reacuteunion comme beaucoup de territoires insulaires ne beacuteneacuteficiepas drsquoun nombre de liaisons physiques directes important Lrsquoeacutevolution de lrsquoInternet al-lant des applications toleacuterantes aux deacutelais vers des applications temps-reacuteel neacutecessite unerobustesse et une qualiteacute de service deacutependantes drsquoun maillage fort et de deacutelais courts

Lrsquoeacutetude drsquo[Anelli2012] a deacutemontreacute que les deacutelais agrave destination drsquoadresses aleacuteatoiressont sensiblement plus longs depuis La Reacuteunion que depuis Paris avec un eacutecart drsquoenvi-ron 180 ms Suite agrave ce constat lrsquoauteur a reacutealiseacute des simulations estimant les deacutebits asso-cieacutes avec un taux de pertes de 10 Ces simulations ont mis en avant des deacutebits eacutecouleacutesplus faibles pour un usager situeacute agrave La Reacuteunion qursquoun usager baseacute agrave Paris Une augmen-tation de la bande passante nrsquoentraicircnerait pas une diminution des deacutelais Le groupe detravail europeacuteen Reducing Internet Transport Latency (RITE) a reacutealiseacute une videacuteo explicativede ce pheacutenomegravene [RITE2014-2]

Cette thegravese vise agrave mettre en lumiegravere les principaux freins des deacutebits eacutecouleacutes

Dans une premiegravere eacutetape nous eacutetudierons lrsquoeacutevolution des deacutelais depuis La Reacuteunionen prenant comme base lrsquoeacutetude reacutealiseacutee par [Anelli2012]

Dans un second temps nous eacutetudierons les routes logiques de lrsquoInternet reacuteunionnais

Dans un dernier temps nous reacutealiserons une proposition drsquoeacutetude de meacutetrologie Cetteeacutetude vise agrave identifier la correacutelation des eacuteveacutenements de congestion entre les flots lrsquoimpor-tance des anomalies affectant Transmission Control Protocol (TCP) (pertes initiales fauxeacuteveacutenements de congestion) la reacutepartition des flots (en taille en protocole en application)et les paramegravetres de performances (taux de pertesRTT deacutebit eacutecouleacute)

4 Organisation de la thegravese

Suite agrave lrsquoexposition de notre probleacutematique le chapitre 1 preacutesente le contexte scienti-fique de nos travaux Dans un premier temps nous allons preacutesenter les caracteacuteristiquesde TCP et sa probleacutematique lieacutee aux reacuteseaux agrave forte capaciteacute de stockage Nous continue-rons avec une preacutesentation de quelques solutions Nous deacuteterminerons si lrsquoaccegraves Internetde La Reacuteunion doit ecirctre consideacutereacute comme un reacuteseau agrave forte capaciteacute de meacutemorisation Lasuite du chapitre inclura la deacutefinition de la meacutetrologie dans les reacuteseaux et une preacutesenta-tion des techniques de mesures active et passive

La premiegravere eacutetude est deacutecrite dans le chapitre 2 et deacutebute par la preacutesentation des ob-jectifs Un cahier des charges permettant de reacutepondre aux objectifs a eacuteteacute reacutedigeacute Ce cahierdes charges a deacuteboucheacute sur le deacuteploiement de la plate-forme de meacutetrologie active RunPLet du deacuteveloppement de deux outils drsquoaide agrave lrsquoanalyse rgeoloc et rtraceroute La preacutesen-tation du protocole de mesure a eacuteteacute reacutealiseacutee dans la partie preacuteceacutedant celle des reacutesultatsLe chapitre se conclut par une synthegravese des reacutesultats qui ont servi agrave nos contributions

La seconde eacutetude est preacutesenteacutee dans le chapitre 3 Les objectifs du chapitre sont preacute-senteacutes dans un premier temps et diviseacutes en deux Ce chapitre preacutesente la mise en oeuvredrsquoune plate-forme de meacutetrologie et du protocole de mesure associeacute Une section reacutesultatassocieacutee agrave une conclusion termine le chapitre Ce chapitre a fait lrsquoobjet drsquoune contributionscientifique

Nous concluons notre thegravese par un reacutesumeacute des diffeacuterentes contributions Un apportsur les perspectives qursquoautorisent nos travaux est proposeacute dans le chapitre 35

8

Chapitre 1

Eacutetat de lrsquoart

Transmission Control Protocol (TCP) est le protocole de transport le plus utiliseacute sur lrsquoIn-ternet Lrsquoeacutetude reacutealiseacutee par Center for Applied Internet Data Analysis (CAIDA) sur une du-reacutee de 2 ans du trafic passant par le point drsquoeacutechange (IXP) EQUNIX de Chicago a montreacuteque 90 97 des paquets Internet Protocol (IP) acheminent des segments TCP [EQUINIX]TCP est un protocole de transport qui rend un service de transfert fiable de donneacuteesLorsque la somme du deacutebit des eacutemetteurs TCP partageant une mecircme ressource du reacute-seau excegravede la capaciteacute de cette ressource il se produit de la congestion La congestionest un pheacutenomegravene indeacutesirable qui met le reacuteseau dans un eacutetat ougrave le service rendu est deacute-gradeacute Cette deacutegradation peut ecirctre seacutevegravere en fonction de lrsquointensiteacute du pheacutenomegravene Poureacuteviter que lrsquoeffet de la congestion empire quand elle apparaicirct TCP integravegre une fonctionde reacutesolution connue sous le nom de controcircle de congestion Le principe est que chaqueeacutemetteur deacutetecte la congestion et diminue son deacutebit drsquoeacutemission Pour se faire le controcirclede congestion srsquoappuie sur la boucle de controcircle constitueacutee entre lrsquoeacutemission drsquoun segmentde donneacutees et la reacuteception de lrsquoacquittement correspondant Le controcircle de congestionagit sur le deacutebit drsquoeacutemission de lrsquoeacutemetteur avec une latence lieacutee au Round-Trip delay Time(RTT) Lorsque le produit du RTT avec la capaciteacute drsquoeacutecoulement offerte par le reacuteseau estrelativement important le controcircle de congestion de TCP peine agrave utiliser les ressourcesdu reacuteseau efficacement Ce produit du deacutelai et du deacutebit repreacutesente la quantiteacute de donneacuteesnon acquitteacutees qui peut circuler On peut assimiler ce produit agrave la capaciteacute de stockage dedonneacutees dans le reacuteseau

Ces derniegraveres anneacutees lrsquoaugmentation de la bande passante a fait croicirctre significative-ment cette capaciteacute de stockage En effet comme les deacutelais nrsquoont pas diminueacute dans lesmecircmes proportions la capaciteacute de stockage nrsquoa fait que croicirctre Cette eacutevolution pose undeacutefi au controcircle de congestion de TCP pour maintenir ses performances Cette eacutevolutiona entraicircneacute une activiteacute intense de recherche pour traiter ce problegraveme de produit deacutelai-bande passante pour TCP Ainsi de nouvelles versions du controcircle de congestion de TCPont eacuteteacute eacutetudieacutees pour lrsquoadapter aux speacutecificiteacutes des reacuteseaux agrave forte capaciteacute de stockageLong Fat Network (LFN)

Si le stockage important de donneacutees dans le reacuteseau pose un problegraveme pour le controcirclede congestion de TCP qursquoen est-il en pratique dans le cas de lrsquoInternet agrave La Reacuteunion Pourreacutepondre agrave cette question il faut pouvoir mesurer lrsquoexistant Depuis quelques anneacutees ily a un inteacuterecirct croissant pour la mesure Une science de la mesure sur lrsquoInternet se deacute-veloppe Il faut chercher dans la croissance continue et soutenue de lrsquoInternet ainsi quedans lrsquoabsence drsquoune exploitation coordonneacutee les motivations agrave deacutevelopper la meacutetrologiesur Internet Cette meacutetrologie vise agrave mieux comprendre le fonctionnement de lrsquoInternet

Ce chapitre se compose de deux sections theacutematiques La premiegravere section 11 traitede la probleacutematique du controcircle de congestion de TCP utiliseacute sur les reacuteseaux agrave grande

9

capaciteacute de stockage La sous-section 111 rappelle le principe du controcircle de conges-tion et sa mise en œuvre dans TCP Dans la partie 112 les problegravemes speacutecifiques ducontrocircle de congestion de TCP appliqueacute dans le contexte des reacuteseaux agrave forte capaciteacute demeacutemorisation sont indiqueacutes Face agrave ces problegravemes des propositions ont eacuteteacute eacutetudieacutees quenous preacutesenterons dans les parties 113 et 114 Pour conclure cette section nous pose-rons dans la sous-section 115 les arguments qui permettent drsquoavancer que lrsquoicircle de LaReacuteunion a une connectiviteacute qui srsquoapparente agrave celle des reacuteseaux agrave forte capaciteacute de sto-ckageLa seconde section 12 est consacreacutee agrave la meacutetrologie du trafic Internet La deacutefinition et lesmeacutethodologies de la meacutetrologie sont indiqueacutees dans la partie 121 La preacutesentation de lameacutetrologie active sera reacutealiseacutee dans la section 122 suivie par celle de la meacutetrologie pas-sive dans la section 123 La comparaison entre la meacutetrologie active et passive termineracette preacutesentation et sera faite dans la partie 124 Pour conclure ce chapitre une synthegraveseest reacutealiseacutee par la section 13 dans laquelle nous tirons les enseignements pour mener deseacutetudes depuis et vers La Reacuteunion

11 Le controcircle de congestion TCP et les reacuteseaux agrave grande capa-citeacute de stockage

TCP est un protocole de transport creacuteeacute en 1980 et deacutecrit pour la premiegravere fois dans le[RFC793] il a subi depuis de nombreuses eacutevolutions comme lrsquoindique le [RFC7414] Lesuccegraves de TCP repose sur son service de transmission fiable et ordonneacutee drsquoun flux de don-neacutees asynchrones Crsquoest un protocole fonctionnant de point agrave point et de bout en bout au-trement dit entre lrsquoeacutemetteur et le reacutecepteur des donneacutees sans concerner les eacutequipementsintermeacutediaires TCP offre un service de communication eacutequivalent agrave un canal virtuel bi-directionnel entre 2 entiteacutes applicatives Le canal de communication se caracteacuterise par satransparence seacutemantique crsquoest-agrave-dire par lrsquoabsence drsquoalteacuteration des donneacutees transfeacutereacuteesPour reacutealiser cette fiabiliteacute de lrsquoeacutechange TCP supervise les eacutechanges de donneacutees par desacquittements (Acknowledgement (ACK)) Cette supervision forme une boucle de controcirclecorrespondant agrave lrsquoeacutemission de donneacutees et agrave la reacuteception de lrsquoacquittement correspondantElle se caracteacuterise par le deacutelai pris nommeacute RTT La correction des donneacutees perdues oualteacutereacutees en cours de transit srsquoeffectue par retransmission de ces donneacutees Si le principe defonctionnement de TCP srsquoeacutenonce facilement sa mise en œuvre est complexe du fait de lanon fiabiliteacute du protocole IP sous-jacent et de la diversiteacute des contextes drsquoutilisation deTCP Lrsquoarticle [Ros2005] deacutetaille les diffeacuterentes caracteacuteristiques du protocole lieacutees agrave lrsquoeacuteta-blissement de connexion la numeacuterotation des donneacutees et agrave la fiabilisation des eacutechanges

Outre lrsquoobjectif de fiabiliteacute TCP a aussi un objectif de performance pour le servicerendu en termes de deacutebit eacutecouleacute et drsquoutilisation des capaciteacutes de transmission du reacuteseauPour atteindre cet objectif pour le service TCP integravegre une fonction de controcircle de flux quirepose sur une fenecirctre glissante geacutereacutee par le reacutecepteur Ainsi le deacutebit drsquoeacutemission peut srsquoali-gner sur le deacutebit de reacuteception de sorte qursquoun reacutecepteur lent ne puisse ecirctre satureacute par unexpeacutediteur rapide La speacutecification initiale de TCP a eacuteteacute conccedilue sans prendre en compteles ressources du reacuteseau Cet oubli a eacuteteacute agrave la source de dysfonctionnements seacutevegraveres du reacute-seau comme lrsquoeffondrement ducirc agrave la congestion (congestion collapse) [Afanasyev2010] Lafonction de controcircle de congestion vise agrave une prise en compte des ressources disponiblesdu reacuteseau et agrave leurs utilisations efficaces Le controcircle de congestion a susciteacute un travail derecherche intensif et ce sujet reste encore drsquoactualiteacute comme lrsquoindique le [RFC6077]

111 Controcircle de congestion de TCP

Drsquoapregraves [Jain1990] la congestion srsquoexprime par lrsquoeacutequation matheacutematique 11

10

sumDemande gt Ressources (11)

Du point de vue drsquoun reacuteseau par commutation de paquets les ressources sont princi-palement les meacutemoires tampon des nœuds de commutation et la capaciteacute de transmissiondes artegraveres de communication La congestion apparaicirct au niveau des nœuds de commu-tation et plus particuliegraverement sur leurs interfaces de sortie La condition pour voir ap-paraicirctre une congestion est laquo si la somme des deacutebits des flux arrivant sur lrsquointerface desortie est supeacuterieure agrave la capaciteacute de transmission du lien en sortie raquo Dans cette situationune file drsquoattente se constitue et quand elle deacuteborde les effets neacutefastes de la congestionse concreacutetisent A savoir que le taux de pertes des paquets augmente dans le reacuteseau cequi se traduit au niveau du service par un deacutebit eacutecouleacute qui chute et un deacutelai de trans-fert qui augmente Dans [Chiu1989] les auteurs montrent que la performance du reacuteseauest lieacutee agrave la charge appliqueacutee au reacuteseau Formellement la charge srsquoexprime comme tauxdrsquoarriveacutee sur le taux de service Informellement la charge repreacutesente la proportion de lademande autrement dit du trafic eacutemis par rapport agrave la capaciteacute de transfert La figure11 illustre lrsquoeacutevolution du deacutebit eacutecouleacute (throughput) et du RTT en fonction de la chargeappliqueacutee au reacuteseau (load) Au deacutebut le deacutebit eacutecouleacute srsquoaccroicirct avec la charge alors queles deacutelais nrsquoaugmentent presque pas On est dans une phase de remplissage des liensLorsque la charge srsquoapproche du taux de remplissage maximum des liens du reacuteseau Ledeacutebit eacutecouleacute nrsquoaugmente presque plus alors que les deacutelais augmentent fortement Crsquoestla phase de remplissage des files drsquoattente Ces deux phases sont seacutepareacutees par un pointcaracteacuteristique qui srsquoappelle le point drsquoinflexion (knee) Lorsque les files drsquoattente sontpleines et que la charge du reacuteseau continue de srsquoaccroicirctre les files drsquoattente vont deacutebor-der Agrave partir de ce point appeleacute le point de retournement (cliff ) le reacuteseau rentre dans lrsquoeacutetatdit drsquoeffondrement ducirc agrave la congestion (congestion collapse)

FIGURE 11 ndash Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989])

Lrsquoeffondrement ducirc agrave la congestion est rapporteacute par [Nagle1984] Dans cet eacutetat le reacute-seau enregistre des retransmissions abusives effectue des transferts avec des deacutelais ten-dant vers lrsquoinfini et rend un service avec un deacutebit eacutecouleacute proche de zeacutero Lrsquoeffondrementducirc agrave la congestion srsquoexplique par le gaspillage des ressources utiliseacutees en amont du point

11

de perte du paquet La solution agrave lrsquoeffondrement ducirc agrave la congestion reacuteside en lrsquoalignementdu deacutebit de lrsquoeacutemetteur agrave la capaciteacute drsquoeacutecoulement du canal de communication offert parle reacuteseau afin de ne produire aucune perte Ainsi les objectifs assigneacutes au controcircle decongestion de TCP sont drsquoeacuteviter lrsquoeacutetat drsquoeffondrement ducirc agrave la congestion drsquoallouer eacutequi-tablement les ressources du reacuteseau entres les flux concurrents et drsquooptimiser les perfor-mances obtenues par chaque flux [RFC2914]

Le controcircle de congestion de TCP fonctionne sur le principe de la boucle fermeacutee avecle reacuteseau vu comme une boicircte noire ainsi preacutesenteacute par la figure 12 Apregraves une stimu-lation sous la forme de lrsquoenvoi de paquets lrsquoobservation du comportement de la boicirctenoire agrave ce stimulus sera analyseacute par le controcircleur situeacute dans lrsquoeacutemetteur Le controcircleur rap-proche lrsquoobservation faite en retour du stimulus (feedback) par rapport agrave lrsquoobjectif affecteacuteau controcircleur Celui-ci par reacutetro-action ajustera le nombre des paquets suivants envoyeacutesCet ajustement est le reacutesultat drsquoune fonction de controcircle qui se base sur une perceptionbinaire des retours agrave savoir absence ou preacutesence de congestion

FIGURE 12 ndash Boucle fermeacutee du CC de TCP

Dans [Gevros2001] lrsquoauteur liste les moyens pour effectuer les observations que lrsquoonnomme en fait des notifications dans le contexte des reacuteseaux Les notifications de lacongestion dans le reacuteseau peuvent ecirctre implicites ou explicites Dans le premier caselles sont deacuteduites par lrsquoabsence drsquoACK Lrsquoaugmentation des deacutelais et les pertes des don-neacutees sont des causes possibles pour la non-reacuteception de lrsquoACK A lrsquoinverse lrsquoabsence decongestion est deacuteduite par la reacuteception drsquoun ACK Cette reacuteception autorise lrsquoenvoi drsquounnouveau paquet comme le montre [Jacobson1988-1] Les notifications peuvent ecirctre ex-plicites si les paquets veacutehiculent une marque mise par lrsquoeacuteleacutement congestionneacute commecrsquoest le cas avec la proposition Explicit Congestion Notification (ECN) [RFC3168] Nous re-viendrons sur cette proposition dans la sous-section 113 Lorsque le controcircleur deacuteduitla preacutesence de congestion il reacuteduit le deacutebit drsquoeacutemission de la source Le deacutebit est controcircleacuteagrave lrsquoaide drsquoune fenecirctre appeleacutee la fenecirctre de congestion (Congestion Window (CWND) ω)Elle indique la quantiteacute de donneacutees qui peut ecirctre eacutemise sur un RTT Autrement dit elleindique combien de donneacutees non acquitteacutees peut recevoir le canal de communicationSa taille eacutevolue dans le temps en fonction de lrsquoeacutetat du reacuteseau et selon une fonction decontrocircle Additive Increase and Multiplicative Decrease (AIMD) La fenecirctre drsquoeacutemission uti-liseacutee par un eacutemetteur TCP est le minimum entre la fenecirctre de congestion et la fenecirctreglissante du controcircle de flux Le controcircle de congestion comporte deux phases distinctes[Gevros2001]

mdash La premiegravere phase se nomme eacutevitement de la congestion (congestion avoidance) et sesitue autour du point drsquoinflexion de la figure 11

mdash La seconde phase se nomme reacutesolution de la congestion (congestion recovery) Ellese deacuteclenche quand lrsquoeacutetat du reacuteseau se situe au delagrave du point drsquoinflexion

Dans la phase de congestion avoidance le controcircle de congestion de TCP utilise deux al-gorithmes le deacutemarrage en douceur (slow-start (SS)) et lrsquoeacutevitement de congestion (conges-tion avoidance (CA)) Au deacutebut de la connexion TCP nrsquoa aucune connaissance de lrsquoeacutetat dureacuteseau autrement dit de lrsquoeacutetat du canal de communication entre lrsquoeacutemetteur et le reacutecep-teur TCP utilise lrsquoalgorithme du deacutemarrage en douceur pour sonder le canal Lrsquoobjectif

12

est drsquoatteindre le point drsquoinflexion rapidement et sans risquer de congestionner le canalpar des rafales Pour cela lrsquoalgorithme du deacutemarrage en douceur va eacutetaler sur plusieursRTT la croissance de la taille fenecirctre de congestion jusqursquoagrave atteindre une estimation dupoint drsquoinflexion Ainsi lrsquoeacutemetteur commence avec une fenecirctre de congestion assez pe-tite et lrsquoouvre au fur et agrave mesure et de plus en plus vite avec lrsquoarriveacutee des acquittementsPlus preacuteciseacutement le rythme de croissance de la taille de la fenecirctre de congestion est surle doublement tous les RTT Quant la fenecirctre de congestion atteint un certain seuil noteacuteslow-start threshold (ssthresh) le deacutemarrage en douceur srsquoarrecircte et lrsquoalgorithme drsquoeacutevite-ment de congestion est maintenant utiliseacute Cet algorithme augmente lineacuteairement et pluslentement que le deacutemarrage en douceur la taille de la fenecirctre de congestion En lrsquoabsencedrsquoindication explicite par le reacuteseau du deacutebit disponible sur le canal de communicationlrsquoeacutemetteur TCP continue de faire le sondage du canal et veacuterifie si le deacutebit eacutecouleacute peut ecirctreencore augmenteacute Pour lrsquoauteur de [Sallantin2014] lorsque la connexion TCP utilise lrsquoal-gorithme drsquoeacutevitement de congestion elle entre alors dans un eacutetat stable Dans cet eacutetat laconnexion doit se deacuterouler avec un deacutebit eacutecouleacute eacuteleveacute Crsquoest une indication que le pointdrsquoinflexion est atteint

La figure 13 donne une repreacutesentation simplifieacutee des eacutetats du controcircle de congestionde TCP Elle indique que lrsquoeacutetat stable peut ecirctre quitteacute si la connexion est libeacutereacutee ou si ily a un eacuteveacutenement de congestion TCP assimile les pertes implicitement agrave un eacuteveacutenementde congestion Lrsquoeacuteveacutenement de congestion fait basculer le controcircle de congestion de TCPdans la phase de reacutesolution de la congestion Dans cette phase la reprise de la perte oudes pertes est effectueacutee et la taille de la fenecirctre de congestion est diminueacutee et ceci afin dediminuer le deacutebit drsquoeacutemission

On distingue deux faccedilons de deacutetecter un eacuteveacutenement de congestion Une meacutethodesrsquoappuie sur la reprise de perte de TCP par retransmission des donneacutees perdues sur ex-piration drsquoun temporisateur (Retransmission TimeOut (RTO)) Une autre meacutethode utilisela caracteacuteristique de TCP qui consiste agrave ce que le reacutecepteur envoie un acquittement agravechaque segment de donneacutees reccedilu en seacutequence Ce segment porte le numeacutero des derniegraveresdonneacutees reccedilues seacutequentiellement Ainsi la reacuteception de donneacutees entraicircnant une rupturede la numeacuterotation en seacutequence geacutenegravere lrsquoeacutemission drsquoun acquittement dupliqueacute (Dupli-cate Acknowledgement (DupAck)) par le reacutecepteur Agrave la reacuteception de trois DupAck parlrsquoeacutemetteur les donneacutees indiqueacutees par la rupture de seacutequencement sont consideacutereacutees per-dues et retransmises sans attendre lrsquoexpiration du RTO Ce principe de retransmissionrapide porte le nom de fast retransmit (FR) Lrsquoalgorithme de reacutecupeacuteration rapide (fast reco-very (FR)) va maintenir la quantiteacute de donneacutees en transit dans le canal de communicationpour eacuteviter lrsquoeacutemission drsquoune rafale lorsqursquoun nouvel acquittement sera reccedilu En lrsquoabsencedu fast recovery agrave la reacuteception drsquoun nouvel acquittement la fenecirctre pourrait se vider parune rafale correspondant agrave des eacutemissions de paquets de donneacutees dos agrave dos sur un deacute-bit supeacuterieur agrave celui du deacutebit drsquoeacutecoulement du canal Ceci aurait pour effet de saturer lecanal et de renvoyer la connexion TCP dans une phase de reacutesolution de la congestion

Lorsque les eacutemissions de lrsquoeacutemetteur sont bloqueacutees par des donneacutees eacutemises et jamaisacquitteacutees le blocage est rompu par le RTO et ceci quel que soit lrsquoeacutetat Les deacutetails dela mise en œuvre des algorithmes du controcircle de congestion TCP sont deacutecrits par le[RFC5681]

Historiquement la version deacutenommeacutee TCP Tahoe incorporait la fonction de controcirclede congestion deacuteveloppeacutee en 1888 Elle comportait les algorithmes de slow-start conges-tion avoidance et de fast retransmit [Jacobson1988-1] La reprise de perte par fast retransmitsouffrait drsquoinefficaciteacute elle a eacuteteacute corrigeacutee avec lrsquoalgorithme du fast recovery Cette versionagrave quatre algorithmes est la version connue sous le nom de Reno et publieacutee la premiegraverefois en 1997 par le [RFC2001] Le couplage fast retransmit - fast recovery souffrait de deacutefauts

13

Deacutebut13

de13

connexion

Deacutemarrage13

en13

douceur

Etat13

stable

FRFR

Fin13

de13

connexion

3 Dupack

nouvel 13

ack

RTO

RTO

cwnd gt ss

tresh

SYN13

SYNACK

FIN-FINACK

FIGURE 13 ndash Etats du controcircle de congestion de TCP

lorsqursquoun eacuteveacutenement de congestion comportait plusieurs pertes Le [RFC2582] apportaitun correctif en 1999 On parla alors de version NewReno du controcircle de congestion En2005 une eacutetude montra que crsquoeacutetait la version du controcircle de congestion de TCP la plusutiliseacutee sur lrsquoInternet [Medina2005] Depuis de nouvelles versions ont eacuteteacute deacuteployeacutees dansles systegravemes drsquoexploitation tels que Windows et Linux appeleacutes respectivement C-TCP[Tan2006] et CUBIC [Ha2008] Dans la section 112 ces versions seront deacutetailleacutees

Le fonctionnement caracteacuteristique du controcircle de congestion de TCP est illustreacute parla figure 14 extraite de [Huston2000] Elle montre lrsquoeacutevolution de la fenecirctre de conges-tion dans le temps (exprimeacutee en terme de RTT) sur un canal de communication virtuelentre 2 stations Il srsquoagit ici drsquoun sceacutenario ideacutealiseacute dans lequel la connexion TCP nrsquoest pasen concurrence avec drsquoautres connexions La congestion se produit toujours agrave la mecircmevaleur de fenecirctre et pour laquelle la file drsquoattente deacuteborde Cette figure montre les deuxcaracteacuteristiques du controcircle de congestion de TCP qui deacutecoulent de la phase drsquoeacutevitementde congestion et de reacutesolution de la congestion et qui sont

mdash Lrsquoagressiviteacute elle provient du sondage du canal de communication LrsquoeacutemetteurTCP va chercher agrave accroicirctre le deacutebit eacutecouleacute en augmentant graduellement son deacutebitdrsquoeacutemission par lrsquoagrandissement de la taille de la fenecirctre de congestion

mdash La reacuteactiviteacute lorsque le canal de communication est plein et qursquoil deacuteborde quandcette perte est deacutetecteacutee lrsquoeacutemetteur TCP reacuteagit et diminue la taille de sa fenecirctre afinde diminuer son deacutebit drsquoeacutemission

Ces deux caracteacuteristiques donnent cette figure en dents de scie de la fenecirctre de conges-tion

112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de sto-ckage

Un reacuteseau agrave forte capaciteacute de stockage est un reacuteseau avec un produit deacutelai-bandepassante (Bandwidth Delay Product (BDP)) eacuteleveacute Dans lrsquoouvrage [Peterson2007] lrsquoauteureffectue une analogie du produit deacutelai-bande passante avec un tuyau Le deacutelai corres-pond agrave la longueur du tuyau et la bande passante au diamegravetre du tube Ainsi le BDPest le volume du tube Dans le cas drsquoun reacuteseau informatique le volume du tuyau srsquoex-prime en bits Ainsi lorsqursquoun canal de communication entre un eacutemetteur et un reacutecepteurpreacutesente un produit deacutelai-bande passante important un volume important de bits (autre-ment dit de donneacutees) peut ecirctre eacutemis avant de recevoir une notification Du point de vue

14

FIGURE 14 ndash Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP

de lrsquoeacutemetteur TCP ce volume de donneacutees injecteacute dans le reacuteseau sont des donneacutees nonencore acquitteacutees Les reacuteseaux qui offrent des canaux de communication avec un pro-duit deacutelai-bande passante important sont nommeacutes en anglais Long Fat Network (LFN) Le[RFC1072] preacutecise qursquoun LFN agrave un produit deacutelai-bande passante supeacuterieur agrave 12 5 Ko

Sachant que le controcircle de congestion de TCP srsquoappuie sur une reacutetro-action selon unepeacuteriode de RTT et que le deacutebit eacutecouleacute maximal est atteint lorsque la fenecirctre drsquoeacutemissionest au moins supeacuterieure au produit deacutelai(RTT)-bande passante du canal de communica-tion lrsquoutilisation de TCP sur un reacuteseau LFN a des conseacutequences neacutegatives sur la perfor-mance Les causes sont agrave chercher du cocircteacute du RTT et du produit deacutelai-bande passante quiprennent tous les deux des valeurs importantesDans le cas du RTT crsquoest le deacutelai de reacuteactiviteacute de TCP qui est impacteacute En effet quandle RTT est eacuteleveacute la dynamique de TCP est ralentie car lrsquoeacutemetteur TCP doit attendre pluslongtemps pour recevoir un ACK et savoir quoi faire par la suite

Pour ce qui concerne le produit deacutelai-bande passante crsquoest le deacutebit eacutecouleacute qui peutecirctre faible par rapport au deacutebit du canal de communication (sa bande passante) La fe-necirctre drsquoeacutemission de TCP nrsquoatteint pas la valeur du produit deacutelai-bande passante lrsquoeacutemet-teur se trouve alors bloqueacute en attente de lrsquoACK pour eacutemettre de nouvelles donneacutees Cespeacuteriodes de blocage concourent agrave faire chuter le taux drsquoutilisation du canal de communi-cation

Par la suite nous allons deacutetailler les conseacutequences de la faible reacuteactiviteacute et drsquoune fe-necirctre drsquoeacutemission importante agrave atteindre sur lrsquoefficaciteacute de TCP La probleacutematique se poseen terme de deacutemarrage de connexion et son implication pour le transfert des flots courtsde taille maximale possible de la fenecirctre de congestion et de reacutesolution de la congestion

Le deacutemarrage de connexion

Le deacutebut des connexions de TCP se fait agrave lrsquoaide de lrsquoalgorithme du deacutemarrage en dou-ceur Nous avons vu preacuteceacutedemment que ce meacutecanisme double la fenecirctre de congestionen un RTT Lorsque la fenecirctre de congestion atteint la valeur seuil ssthresh lrsquoalgorithmedrsquoeacutevitement de congestion est utiliseacute La valeur initiale du seuil est fixeacutee arbitrairementce qui soumet TCP agrave deux problegravemes Le doublement de la fenecirctre de congestion quandelle atteint des valeurs importantes constitue des increacutements avec une granulariteacute de plusen plus grosse Si la valeur de ssthresh est trop grande par rapport au BDP avec un grosincreacutement le deacutepassement du BDP peut conduire agrave eacutemettre trop de paquets causantdes pertes multiples induisant une augmentation de la latence et une reacuteduction du deacute-bit eacutecouleacute Dans le cas ougrave la valeur du ssthresh est trop basse par rapport au BDP la

15

connexion TCP va utiliser preacutematureacutement lrsquoalgorithme drsquoeacutevitement de congestion avecune increacutementation lineacuteaire Ce changement preacutematureacute aura pour conseacutequence une sous-utilisation de lrsquoalgorithme de deacutemarrage en douceur speacutecialement dans le cas ougrave le BDPest tregraves eacuteleveacute [Wang2004]

Le deacutemarrage de connexion est particuliegraverement important pour les flots courts TCP(short lived TCP flow) Un flot court TCP se deacutefinit comme un flot dont la taille est in-feacuterieure ou eacutegale agrave 10 segments TCP [Sallantin2014] La probleacutematique des flots courtsprovient du fait qursquoils nrsquoont pas assez de donneacutees pour quitter lrsquoeacutetape du deacutemarrage endouceur En effet la taille de la fenecirctre de congestion nrsquoa pas le temps drsquoatteindre la va-leur du produit deacutelai-bande passante que la totaliteacute des donneacutees ont eacuteteacute transmises Laconseacutequence est qursquoils ont fonctionneacute avec une fenecirctre de congestion qui est resteacutee rela-tivement petite Dans le cas drsquoun LFN le rapport de la taille de la fenecirctre de congestionsur le produit deacutelai-bande passante tend vers zeacutero et neacutecessite plusieurs RTT Il srsquoensuitque le deacutebit eacutecouleacute est extrecircmement faible De plus si le flot court souffre drsquoun eacuteveacutene-ment de congestion il sera particuliegraverement peacutenaliseacute Il a de fortes chances que la reprisesrsquoeffectue avec un RTO avec un deacutelai maximum de 1 agrave 3 secondes [RFC6298] Ce genrede flots nrsquoa pas toujours assez de donneacutees eacutemises apregraves la perte pour geacuteneacuterer trois Du-pAck et proceacuteder agrave une reprise par fast retransnmit Comme ces flots repreacutesentent drsquoapregraves[Ciullo2009] 90 des flux preacutesents dans lrsquoInternet leur sous-performance sur les LFN estprobleacutematique

La reacutesolution de la congestion

TCP deacutetecte une perte par lrsquoexpiration du RTO ou par la reacuteception de trois DupAckTCP va reacuteagir en deux temps en renvoyant le paquet perdu et en divisant par deux lafenecirctre de congestion Si la taille de la fenecirctre est importante la division par deux vaentraicircner une chute significative de la capaciteacute drsquoenvoi Par rapport au produit deacutelai-bande passante cette division par deux peut entraicircner une sur-reacuteaction de lrsquoeacutemetteur Ledeacutebit eacutecouleacute apregraves un eacuteveacutenement de congestion peut devenir faible et se pose le problegravemede la dynamique de sondage

Dynamique du sondage

TCP a un objectif de performance en terme de deacutebit eacutecouleacute et drsquoutilisation des capa-citeacutes de transmission du reacuteseau TCP possegravede un comportement conservateur Avec lafonction de controcircle AIMD TCP aura besoin drsquoun cycle eacutegal agrave ω2 RTT pour reacutecupeacutererune taille de fenecirctre eacutegale agrave celle avant reacuteduction Dans les reacuteseaux agrave forte capaciteacute destockage TCP tend agrave ecirctre trop prudent agrave ouvrir sa fenecirctre de congestion trop lentementLa capaciteacute de stockage importante demande un nombre de cycles important pour quela fenecirctre de congestion puisse couvrir le BDP Durant ce temps il est important de nepas avoir de pertes Lrsquoexemple donneacute par le [RFC3649] preacutesente un reacuteseau agrave une capa-citeacute de 10 Gbits un deacutelai de 100 ms et une taille de paquets drsquoun maximum de 1500octets Cela demanderait un eacutechange drsquoune dureacutee de deux heures environ De plus la to-taliteacute des paquets devront ecirctre transmis dans la dureacutee indiqueacutee preacuteceacutedemment Le tauxde perte maximal permettant lrsquousage de la totaliteacute de la bande passante est de lrsquoordrede 10minus10 Crsquoest un taux de perte irreacutealiste Il faut donc appliquer une autre fonction decontrocircle pour utiliser efficacement la capaciteacute des liens et pour reacutepondre rapidement auxchangements drsquoeacutetats du reacuteseau

16

113 Un controcircle de congestion de TCP adapteacute aux LFN

Pour rappel dans la partie 111 nous avons vu que le controcircle de congestion de TCPse deacutecoupait en deux phases La premiegravere phase de congestion avoidance comporte les al-gorithmes de sondage alors que la seconde phase dite de congestion recovery comporte lesalgorithmes de reacutesolution de la congestion Nous preacutesentons les propositions qui visentagrave changer le controcircle de congestion de TCP sur ces deux phases pour les adapter auxcontraintes des LFN et donc traiter les problegravemes que nous avons mis en eacutevidence dansla sous-section 112 Lrsquoutilisation de TCP sur des reacuteseaux agrave forte capaciteacute de stockage asusciteacute des propositions qui sont classeacutees dans le tableau 11 Ces propositions vont ecirctredeacutetailleacutees dans la suite de ce manuscrit

TABLE 11 ndash Tableau de synthegravese des propositions

Phase Problegraveme SolutionsCongestion avoidance Deacutemarrage de

connexionInitial Spreading Reacuteduc-tion du RTO Quick-startJump Start

Congestion recoveryReacutesolution decongestion

MulTCP

Dynamique dusondage

HighSpeed TCP C-TCPBIC CUBIC

Le deacutemarrage de connexion

Lrsquoideacutee de la premiegravere solution est de reacuteduire le nombre de cycles au deacutemarrage drsquounflot Le doublement de la taille lorsque la fenecirctre de congestion vaut 2 segments parexemple conduit agrave un increacutement qui reste faible sur un RTT Le principe de la premiegraveresolution est drsquoaugmenter la taille initiale de la fenecirctre de congestion (Initial Window (IW))[RFC6928] Avec une taille initiale de fenecirctre de congestion eacutequivalent agrave 10 Maximun Seg-ment Size (MSS) lrsquoeacutemetteur peut transmettre degraves le deacutebut de connexion une rafale de 10segments Parmi les avantages de cette solution on peut citer la reacuteduction de la latencedu transfert de donneacutees en consideacuterant que le canal ne sera pas congestionneacute Un des in-conveacutenients de cette solution est la possibiliteacute de congestionner la file drsquoattente du goulotdrsquoeacutetranglement Afin de reacutesoudre ce problegraveme [Sallantin2014] propose lrsquoInitial SpreadingCette proposition combine lrsquoaugmentation de la fenecirctre drsquoeacutemission et le meacutecanisme drsquoes-pacement meacutecanisme limitant la preacutesence de rafales Ces travaux ont fait lrsquoobjet drsquouneproposition aupregraves de lrsquoInternet Engineering Task Force (IETF) [Arnal2014]

La deacutetection drsquoune perte au deacutepart du deacutemarrage en douceur se fait agrave travers lrsquoex-piration du RTO soit trois secondes Pour ameacuteliorer la reprise sur erreur le [RFC6298]propose de reacuteduire la dureacutee du RTO agrave une seconde Cette reacuteduction du RTO autorise uneretransmission plus rapide des paquets perdus et apporte un gain relativement importantpour des flots qui ont une latence tregraves faible comme celle des flots courts

Une autre solution eacutevalueacutee par [Scharf2008-1] et deacutecrite par le [RFC4782] se nommeQuick-start Lrsquoeacutemetteur eacutemet une requecircte contenant le deacutebit drsquoeacutemission qursquoil souhaite uti-liser Chaque nœud traverseacute peut alors accepter rejeter ignorer ou modifier la requecircteen fonction de son deacutebit disponible Pour bien fonctionner ce meacutecanisme de neacutegociationneacutecessite que lrsquoensemble des routeurs traverseacutes aient reacutepondu agrave la requecircte La figure 15compare les performances du deacutemarrage en douceur (en rouge) et de Quick-start sur unteacuteleacutechargement vu depuis le serveur Le serveur a eacutemis deux requecirctes la premiegravere agrave undeacutebit de 8192 Mbits (en vert) et lrsquoautre pour un deacutebit drsquoune valeur de 512 Mbits (en

17

bleu) Lrsquoaxe des abscisses repreacutesente la latence (dureacutee de la connexion) depuis lrsquoeacutemissionde la demande drsquoeacutetablissement de connexion et en ordonneacutee le deacutebit drsquoeacutemission Les deacute-bits ont eacuteteacute calculeacutes agrave partir de la quantiteacute de donneacutees moyenne eacutemises en un RTT Les reacute-sultats montrent des performances supeacuterieures de Quick-start par rapport au deacutemarrageen douceur En effet une requecircte de Quick-start avec un deacutebit suffisamment eacuteleveacute per-met drsquoatteindre rapidement lrsquoutilisation maximale de la bande passante disponible Ledeacutemarrage en douceur limite la croissance du deacutebit drsquoeacutemission On remarque eacutegalementque si la valeur seuil du deacutemarrage est trop basse le deacutebit drsquoeacutemission croicirct beaucoupmoins rapidement (lien en pointilleacute sur la figure 15) Quick-start reste performant sur lesflots courts en appliquant un deacutebit drsquoeacutemission qui sera eacutequivalent agrave un flot long

FIGURE 15 ndash Principe de Quick-Start (Source [Scharf2008-1])

Dans lrsquoarticle [Liu2007] lrsquoauteur preacutesente Jump Start Cette proposition reacutealise uneestimation des donneacutees precirctes agrave ecirctre envoyeacutees ainsi que du RTT Lrsquoobjectif est drsquoeacutemettreles segments de faccedilon reacuteguliegravere en un RTT Ce meacutecanisme srsquoavegravere trop agressif dans lesenvironnements congestionneacutes Le nombre de segments envoyeacutes en un RTT peut ecirctreimportant et ainsi causer de seacutevegraveres deacutegradations de performance

La reacutesolution de la congestion

Quand TCP a atteint lrsquoeacutetat stable et qursquoune perte est deacutetecteacutee la fenecirctre de conges-tion va ecirctre diviseacutee par deux Cette reacuteduction diminuera le deacutebit eacutecouleacute Il est importantpour TCP drsquoecirctre reacuteactif vis agrave vis des pertes Pour cela de nouveaux algorithmes doiventecirctre mis en place dans la phase drsquoeacutevitement de congestion Ces algorithmes devront ecirctrereacuteactifs aux pertes mais sans sur-reacuteagir Ces nouveauteacutes doivent permettre de retrouverrapidement un deacutebit eacutecouleacute important

Lorsque plusieurs flux TCP empruntent une route congestionneacutee ils sont soumis aumecircme taux de pertes Le but eacutetant de reacutepartir eacutequitablement la bande passante dispo-nible Une approche de diminution moins agressive de la fenecirctre de congestion consistea reacutealiser des connexions TCP parallegraveles Lrsquoobjectif est drsquoavoir un flux TCP se comportantcomme lrsquoagreacutegation de plusieurs flux

Dans lrsquoarticle [Crowcroft1998] les auteurs proposent une version du controcircle de conges-tion de TCP qui se comporte drsquoune maniegravere eacutequivalente agrave N sessions TCP parallegraveles Ilsrsquoagit de MulTCP MulTCP geacutenegravere un flux TCP unique ougrave les sessions virtuelles sont reacute-parties uniformeacutement afin drsquoobtenir le reacutesultat maximal en terme de deacutebit Le controcircle decongestion de TCP change lorsqursquoil utilise lrsquoalgorithme drsquoeacutevitement de congestion et qursquoil

18

deacutetecte un eacuteveacutenement de congestion (par deacutetection drsquoau moins une perte drsquoun segmentdans une fenecirctre de congestion) Les eacutequations suivantes sont utiliseacutees dans chacun descas MulTCP

ACK ω larr ω +N

ω

DROP ω larr ω times (1minus 1

2N)

(12)

En eacutevitement de congestion lorsqursquoun ACK est reccedilu MulTCP augmente sa fenecirctre decongestion (ω) de N segments par RTT Lors de la perte de segments (DROP) MulTCPreacuteduit sa fenecirctre de ω(2N) plutocirct que la valeur par deacutefaut de ω2 La figure 16 montrelrsquoeacutevolution de la fenecirctre de congestion de MulTCP par rapport agrave TCP On voit sur la fi-gure 16 que MulTCP a de meilleures performances qursquoun flux TCP normal Lorsque lesperformances sont combineacutees le reacutesultat est supeacuterieur agrave un flux unique

FIGURE 16 ndash Simulation de MulTCP avec N=5 (Source [Huston2006])

Dynamique du sondage

Lrsquoobjectif de lrsquoeacutemetteur de TCP est drsquoenvoyer le plus de donneacutees le plus vite possibleMais agrave condition qursquoelles arrivent sans produire de la congestion sinon les donneacutees se-ront perdues et il faudra les reacute-eacutemettre Il faut eacutegalement tenir compte des autres flotsen partageant eacutequitablement les ressources du reacuteseau Une approche pour traiter le pro-blegraveme de la dynamique du sondage consiste agrave changer la fonction de controcircle de TCP

Lrsquoobjectif de HighSpeed-TCP (HS-TCP) est drsquoatteindre les hauts deacutebits en ayant desperformances comparables agrave TCP classique dans les environnements agrave faible BDP [RFC3649]La version du controcircle de congestion HighSpeed-TCP utilise le meacutecanisme drsquoAdditive In-crease and Multiplicative Decrease combineacute agrave un facteur calculeacute en fonction de la taille dela fenecirctre de congestion tel qursquoindiqueacute par les eacutequations 13 En deccedila drsquoun certain seuilde ω la reacuteponse de HighSpeed-TCP est eacutequivalente agrave TCP Reno HS-TCP est limiteacute durantla phase de deacutemarrage en douceur Durant cette phase HS-TCP peut normalement en-voyer un grand nombre de paquets Lrsquoenvoi drsquoun trop grand nombre de donneacutees risquedrsquooccasionner de la congestion Le [RFC3742] propose de limiter agrave 100 paquets la capaciteacutedrsquoenvoi drsquoHS-TCP durant la phase de deacutemarrage en douceur

ACK ω larr ω +α(ω)

ωDROP ω larr (1minus β(ω))times ω

(13)

19

La figure 17 illustre le comportement de la fenecirctre de congestion de HighSpeed-TCPLorsqursquoune perte est deacutetecteacutee la diminution de la fenecirctre est moins importante gracircceau facteur β Le retour a la valeur preacuteceacutedente se fait beaucoup plus rapidement qursquoavecReno ou NewReno (en gris clair sur la figure) gracircce au facteur α Ainsi HS-TCP offre unemeilleure utilisation de la capaciteacute disponible sur le lien

FIGURE 17 ndash Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source [Afanasyev2010])

Dans [Tan2006] lrsquoauteur propose une version de TCP alliant lrsquoapproche pro-activeet reacuteactive Une approche pro-active utilise les variations du RTT pour estimer lrsquoeacutetat dureacuteseau Alors qursquoune approche reacuteactive agit quand lrsquoeacuteveacutenement de congestion srsquoest pro-duit Lrsquoobjectif est de maintenir de bonnes performances sur reacuteseaux avec un haut deacutebitet un grand RTT Compound-TCP (C-TCP) maintient deux fenecirctres de congestion Lrsquounecroicirct de faccedilon lineacuteaire mais deacutecroicirct via un certain coefficient en cas de perte La secondefenecirctre est lieacutee agrave lrsquoapproche pro-active de TCP-Vegas [Brakmo1994] La taille de la fenecirctrede congestion reacuteellement utiliseacutee est la somme des deux fenecirctres Lrsquoeacutequation 14 illustrecette addition

ACK ω larr ωreno + ωfast (14)

Si le RTT est bas alors la fenecirctre ωfast va croicirctre rapidement Si C-TCP rencontre uneperte alors ωreno diminuera rapidement pour compenser lrsquoaugmentation preacuteceacutedente deωfast Ce systegraveme cherche agrave garder une valeur constante de la fenecirctre drsquoeacutemission C-TCPutilise efficacement des liens sur les reacuteseaux agrave forte capaciteacute de stockage C-TCP est sujetau mecircme deacutefaut que TCP-Vegas sur lrsquoexactitude des mesures RTT Si les flux en concur-rence les uns avec les autres dans le reacuteseau observent des valeurs RTT minimales diffeacute-rentes le flux se voyant un RTT plus eacuteleveacute sera beaucoup plus agressif et injuste pourlrsquoautre flux La figure 18 illustre le fonctionnement de la fenecirctre de congestion de C-TCPLa partie convexe de la courbe repreacutesente un fonctionnement plus proche de TCP RenoCela indique donc une valeur de ωfast faible Nous remarquons qursquoapregraves une perte TCPessaye de reacutecupeacuterer rapidement la valeur preacuteceacutedente Lors de pertes multiples la fenecirctrede congestion suit une forme proche agrave ce moment de la courbe de HighSpeed-TCP (voirfigure 17) Ce comportement est la conseacutequence drsquoune valeur eacuteleveacutee de ωfast C-TCP per-met ainsi drsquoatteindre le deacutebit maximum disponible sur le lien tout en lissant sa capaciteacutedrsquoenvoi en se basant sur le RTT C-TCP est la version de TCP installeacutee nativement sur lesystegraveme drsquoexploitation Windows de Microsoft

Lrsquoalgorithme de controcircle de congestion de TCP connu sous le nom Binary IncreaseCongestion control (BIC) vise agrave une convergence rapide [Xu2004] La fenecirctre doit atteindrela taille maximale possible sans qursquoil y ait de pertes Pour cela il met en œuvre une nou-velle fonction du controcircle de la taille de la fenecirctre de congestion La fonction de controcircle

20

FIGURE 18 ndash Comportement de la fenecirctre de congestion de Compound-TCP (Source [Afanasyev2010])

de BIC est structureacutee en trois phases (Additive Increase Binary Search Max Probing) tellesqursquoillustreacutees par la figure 19a Au deacutemarrage de la connexion BIC va increacutementer lineacuteai-rement la fenecirctre de congestion Crsquoest la phase drsquoAdditive Increase

Durant la phase Binary Search BIC va essayer de deacutecouvrir la taille optimale de lafenecirctre de congestion La taille optimale est la taille permettant drsquoeacutemettre le maximum dedonneacutees sans essuyer de pertes Elle se base sur lrsquoeacutetude entre la valeur minimale (ωmin)et la valeur maximale (ωmax) de la fenecirctre de congestion Ces variables vont permettredrsquoaffiner la valeur de la fenecirctre de congestion Au deacutebut de la connexion ωmin est mise agrave1 et ωmax est mis arbitrairement agrave une valeur eacuteleveacutee

Lorsqursquoune perte est deacutetecteacutee la fenecirctre de congestion va ecirctre reacuteduite et prendre pourvaleur la moyenne entre ωmin et ωmax ωmin prend alors pour valeur la taille de la fenecirctrede congestion apregraves reacuteduction et ωmax la valeur de la fenecirctre de congestion avant la perteSi lrsquoeacutecart entre la valeur de la fenecirctre de congestion avant et apregraves la perte est supeacuterieuragrave une constante Smax alors la fonction de controcircle de BIC entre en phase dite AdditiveIncrease Durant cette phase Smax va servir de valeur drsquoincreacutementation pour la fenecirctrede congestion agrave chaque RTT Par la suite et si aucune perte nrsquoest de nouveau deacutetecteacuteela fonction de controcircle de BIC retourne en phase de Binary Search Lrsquoobjectif est de stabi-liser la taille de la fenecirctre aux alentours de la valeur de ωmax rencontreacutee avant la pertepreacuteceacutedente

Lorsque cette valeur est deacutepasseacutee BIC entre dans la phase dite Max Probing Lrsquoaug-mentation de la fenecirctre de congestion est alors lineacuteaire Lrsquoobjectif eacutetant la recherche drsquounnouvel ωmax La figure 19b illustre le fonctionnement de la fenecirctre de congestion dansle temps Lors du deacutebut de connexion BIC se comporte comme Reno avec le meacutecanismedu deacutemarrage en douceur Degraves qursquoune perte est deacutetecteacutee la diminution de la fenecirctre estalors moins agressive qursquoavec Reno Au centre de la courbe nous remarquons la fonctiondrsquoaccroissement avec les trois phases

BIC est un controcircle de congestion performant dans les reacuteseaux agrave forte capaciteacute destockage Neacuteanmoins BIC peut ecirctre trop agressif pour les flux qui ont des courts deacutelaisCela a pour conseacutequence un partage ineacutequitable de la bande passante disponible avec lesflux qui ont des longs deacutelais

Afin de reacutesoudre le problegraveme drsquoiniquiteacute lieacute au RTT lrsquoalgorithme CUBIC propose dechanger la fonction de controcircle de la taille de la fenecirctre de congestion pour la rendreplus agressive La fonction retenue est cubique et son eacutevolution est repreacutesenteacutee par la fi-gure 110a Contrairement agrave la figure drsquoaccroissement de BIC (fig 19a) qui comporte troisphases la fonction drsquoaccroissement de CUBIC nrsquoen compte que deux (fig 110a) Sur lafigure 110b on constate que ces deux phases sont preacutesentes tout au long de lrsquoeacutevolutionde la fenecirctre de congestion de CUBIC Ces deux phases ne sont pas forceacutement conseacute-cutives lrsquoune de lrsquoautre Apregraves la deacutetection drsquoune perte CUBIC va essayer de croicirctre le

21

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez BIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deBIC-TCP (Source [Afanasyev2010])

FIGURE 19 ndash Fonctionnement de BIC TCP

plus rapidement possible jusqursquoagrave ωMax Lorsque ωMax est atteint la taille de la fenecirctre vasrsquoincreacutementer lentement Mais plus la valeur drsquoω est eacuteloigneacutee en taille de ωMax plus lacroissance va srsquoacceacuteleacuterer Lrsquoavantage de CUBIC sur BIC est le remplacement la fonction decontrocircle lineacuteaire par une fonction cubique pour plus drsquoagressiviteacute Lrsquoalgorithme CUBICest deacutecrit par le [RFC8312]

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez CUBIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deCUBIC-TCP (Source [Afanasyev2010])

FIGURE 110 ndash Fonctionnement de CUBIC

114 Controcircle de congestion avec implication des routeurs

Drsquoautres approches ont eacuteteacute eacutetudieacutees pour aider le controcircle de congestion de TCP Cesapproches impliquent les routeurs et ne reposent plus que sur le principe de bout-en-boutpropre agrave TCP

Explicit Congestion Notification (ECN) vise agrave renforcer lrsquoindication drsquoun eacuteveacutenement decongestion [RFC3168] Avec ECN la congestion est signaleacutee avant que la perte drsquoun pa-quet ne se produise Lors de la reacuteception drsquoun paquet indiquant une congestion lrsquoeacutemet-teur va alors reacuteduire sa fenecirctre de congestion et sa fenecirctre drsquoeacutemission La reacuteduction dela capaciteacute drsquoeacutemission de lrsquoeacutemetteur eacutevitera pertes et retransmissions et une reacuteductiondes deacutelais de reprise Lrsquousage de cette option neacutecessite que lrsquoeacutemetteur le reacutecepteur et lesrouteurs du chemin soient capables de geacuterer les notifications explicites Avec ECN lrsquoin-formation de congestion est transmise agrave lrsquoeacutemetteur Aucune indication sur le lieu preacutecisde la congestion est indiqueacutee

eXplicit Control Protocol (XCP) est un protocole de controcircle de congestion utilisantles notifications explicites de deacutebit [Katabi2002] En cela il reprend lrsquoideacutee de Quick-startCependant il se diffeacuterencie par le deacutecouplage opeacutereacute entre la probleacutematique du partageeacutequitable entre les flots et celle de lrsquoefficaciteacute du transfert Dans lrsquoarchitecture de proto-coles XCP se situe entre TCP et IP XCP repose sur un en-tecircte qui va servir aux routeurs

22

traverseacutes pour indiquer le deacutebit drsquoeacutemission pour le flot La valeur drsquoadaptation de la fe-necirctre de congestion est calculeacutee agrave partir des informations contenues dans lrsquoen-tecircte XCPXCP propose un controcircle de congestion qui fonctionne sur un reacuteseau 100 XCP Uneseconde limite est lrsquoiniquiteacute avec les autres protocoles de transport Les performancessont fortement deacutegradeacutees si diffeacuterents protocoles de bout en bout sont exeacutecuteacutes dans lemecircme reacuteseau tels que TCP XCP possegravede de mauvaises performances si des routeurs IPclassiques (non-XCP) se trouvent au niveau du goulot drsquoeacutetranglement

Afin de reacutesoudre le problegraveme drsquointeropeacuterabiliteacute Dans [Lopez2006] lrsquoauteur proposeXCP-interoperable (XCP-i) une version XCP qui garde les meacutecanismes de controcircle XCPsans ajouter drsquoeacutetat de flux Lrsquoobjectif drsquoXCP-i est de deacuteployer XCP sur un reacuteseau com-prenant des routeurs XCP et non-XCP Pour cela XCP-i va fonctionner en deux phasesDans une premiegravere phase il va deacutecouvrir les nuages non-XCP Un nuage non-XCP est unensemble de routeurs non capables de traiter XCP En comparant les champs Time-To-Live(TTL) drsquoIP et drsquoXCP le nombre de routeurs non-XCP preacutesents dans le reacuteseau peut ecirctredeacuteduit La seconde phase consiste agrave deacuteterminer les ressources du nuage non-XCP En ra-joutant un champ last_xcp_routeur XCP-i garde en meacutemoire lrsquoadresse du dernier routeurXCP traverseacute Agrave partir drsquoalgorithmes drsquoestimation de bande passante la bande passantedu nuage non-XCP sera estimeacutee entre les deux nœuds XCP La derniegravere phase pour reacutea-liser une inter-opeacuterabiliteacute complegravete entre routeurs classiques et routeurs XCP consiste agraveprendre en consideacuteration la bande passante estimeacutee dans les calculs du feedback de XCPLe protocole XCP-i va creacuteer un routeur XCP virtuel agrave la place du nuage non-XCP Gracirccea ces meacutecanismes un reacuteseau heacuteteacuterogegravene devient virtuellement homogegravene pour XCP Lesperformances de XCP-i sont comparables agrave celle de XCP [Lopez2006] XCP-i reacutesout leproblegraveme drsquointer-opeacuterabiliteacute de XCP sur des reacuteseaux non 100 XCP

Ces solutions preacutesentent le deacutesavantage de devoir ecirctre deacuteployeacutees eacutegalement au seindes routeurs Le principal avantage de ces solutions est une indeacutependance au deacutelai Lesprobleacutematiques lieacutees au deacutelai que lrsquoon a preacutesenteacutees preacuteceacutedemment sont alors inopeacute-rantes Dans le cadre de La Reacuteunion les deacutelais peuvent ecirctre importants

115 Caracteacuterisation de La Reacuteunion

Lrsquoaugmentation des deacutebits drsquoaccegraves srsquoaccompagne de lrsquoaugmentation de la capaciteacute desliens drsquointerconnexion comme celles des cacircbles sous-marins Malgreacute cette augmentationdes deacutebits le temps de propagation reste inchangeacute Dans cette partie nous deacuteterminonsagrave partir de quel deacutebit un accegraves Internet agrave La Reacuteunion peut ecirctre sujet aux problegravemes ren-contreacutes sur les LFN

Dans la section 21 nous avons vu que La Reacuteunion est raccordeacutee agrave Internet par deuxaccegraves reposant sur des cacircbles sous-marins le SAFE et le LION Le cacircble SAFE est prolongeacutepar le cacircble SAT-3WASC Le temps de propagation (tp) sur un cacircble peut ecirctre estimeacutepar la formule matheacutematique 15 dans laquelle d repreacutesente la distance et c la vitesse depropagation du signal sur le support

tp =d

c(15)

Si nous retenons la route directe entre La Reacuteunion et la France hexagonale qui passepar le plus long des accegraves constitueacute par les cacircbles SAFE et SAT-3WASC Sachant que lecacircble SAFE a une longueur totale de 13 500 km pour aller de lrsquoAfrique du Sud agrave lrsquoAsie Sion fait lrsquohypothegravese que lrsquoicircle de La Reacuteunion se situe agrave une distance eacutequivalente agrave la moitieacutedu cacircble SAFE La longueur du cacircble pour La Reacuteunion est de 6 750 Km La vitesse de

23

propagation du signal pour une fibre optique est eacutegale agrave la vitesse de la lumiegravere (299 792Kms) Lrsquoapplication de la formule 15 donne tp1 avec

tp1 = 12times dSAFEc = 22 52ms (16)

tp1 approxime le temps de propagation entre La Reacuteunion et le point de sortie du cacircbleSAFE en Afrique du Sud ou en Asie Pour obtenir le RTT ce temps est agrave doubler Onobtient alors la valeur RTT1 = 45 04 ms

La seconde partie du trajet de lrsquoAfrique du Sud jusqursquoen Europe emprunte le cacircbleSAT-3WASC Drsquoapregraves [Cablesmap] la longueur du cacircble est de 14 350 Km Le temps depropagation entre lrsquoAfrique du Sud et lrsquoEurope noteacute tp2 srsquoexprime comme

tp2 = (dSATminus3WASC)c = 47 87ms (17)

Le RTT sur ce cacircble est de RTT2 = 95 74 msAu total le RTT incompressible pour joindre lrsquoEurope en passant par les cacircbles SAFESAT-3WASC consiste agrave additionner le RTT de chaque cacircble agrave savoir RTT1 et RTT2 Le RTTincompressible est donc minimal de 140 78ms Ce deacutelai comme nous venons de le calcu-ler ne prend en compte que la propagation Il neacuteglige le temps de transmission du paquetainsi que les temps drsquoattente avant la transmission

Lrsquoeacutetude preacutesenteacutee dans[Anelli2012] a mesureacute un RTT minimal pour les paquets quit-tant lrsquoicircle de La Reacuteunion de 185 ms Ce reacutesultat a eacuteteacute obtenu par une eacutetude de mesuresdepuis les locaux de lrsquoUniversiteacute de La Reacuteunion La figure 111 repreacutesente la Probabi-lity Density Function (PDF) des RTT mesureacutes Cette fonction est compareacutee agrave celle qui estobtenue depuis la France hexagonale et de Paris en particulier On constate une forte si-militude sur la forme des courbes La courbe de La Reacuteunion enregistre un deacutecalage dansle temps de 185 ms par rapport agrave celle de Paris Ce deacutecalage repreacutesente le RTT minimummesureacute pour rejoindre la meacutetropole et acceacuteder agrave lrsquoInternet

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

FIGURE 111 ndash Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

Si lrsquoon considegravere la valeur de BDP de 12 5 Ko indiqueacutee par le [RFC1072] comme lalimite basse drsquoun LFN et si nous reprenons les diffeacuterentes TAI preacutesenteacutees dans la section21 nous pouvons calculer le produit deacutelai-bande passante drsquoun canal de communica-tion entre La Reacuteunion et la meacutetropole Il est fait lrsquohypothegravese pour ce calcul que le goulotdrsquoeacutetranglement est donneacute par lrsquoaccegraves agrave Internet Le tableau 12 preacutesente les reacutesultats ob-tenus

24

TABLE 12 ndash Approximation du produit deacutelai bande passante de la connectiviteacute de LaReacuteunion agrave lrsquoInternet

NomhhhhhhhhhhhhhhhhhhhBande passante

RTT (en secondes)Estimeacute 0141

Mesureacute 0185

Modem56 Kbits 987 o 130 Ko128 Kbits 226 Ko 296 Ko512 Kbits 902 Ko 118 Ko

ADSL1 Mbits 176 Ko 231 Ko8 Mbits 141 Ko 185 Ko20 Mbits 353 Ko 463 Ko

VDSL 50 Mbits 881 Ko 116 Mo

Fibre

35 Mbits 617 Ko 809 Ko100 Mbits 176 Mo 231 Mo200 Mbits 353 Mo 463 Mo

1 Gbits 176 Mo 231 Mo

Le tableau preacutesente en gras les produits deacutelai-bande passante deacutepassant la limite des12 5 Ko Ainsi les reacutesultats sont assez eacuteloquents Degraves que lrsquoon arrive sur un accegraves ADSLavec un deacutebit minimal drsquo1 Mbits nous avons un BDP supeacuterieur agrave la limite fixeacutee par le[RFC1072] Ainsi rapidement lrsquoeacutevolution des deacutebits proposeacutes sur lrsquoicircle et les capaciteacutes descacircbles sous-marins associeacutes agrave un deacutelai eacuteleveacute ont fait de lrsquoInternet reacuteunionnais un reacuteseauqui a les caracteacuteristiques drsquoun LFN

Nous avons vu que TCP est un protocole de transport dont la performance est deacutepen-dante du RTT et du BDP Les deacutelais sont une des caracteacuteristiques des LFN La Reacuteunionest un reacuteseau agrave forte capaciteacute de stockage due agrave des deacutelais importants Il est important demesurer pour comprendre lrsquoimpact de cette caracteacuterisation sur les performances de TCP

12 Meacutetrologie du trafic Internet

Avec lrsquoInternet qui devient de plus en plus gros et de plus en plus complexe la meacutetro-logie est une activiteacute qui vise agrave mieux comprendre le fonctionnement de lrsquoInternet Nousallons dans cette partie du manuscrit preacutesenter les techniques de meacutetrologie appliqueacuteesagrave lrsquoInternet

121 Deacutefinition

Meacutetrologie est un mot composeacute de deux termes grecs Le premier metron signifie lamesure tandis que logos fait reacutefeacuterence agrave la science Par deacutefinition la meacutetrologie deacutesignela science de la mesure Par la suite le terme meacutetrologie fera uniquement reacutefeacuterence agrave la meacute-trologie appliqueacutee aux reacuteseaux informatiquesLa meacutetrologie signifie donc la mesure des caracteacuteristiques drsquoun reacuteseau sous de nombreuxaspects Cette science est devenue un outil indispensable pour avoir une compreacutehensionde divers aspects de lrsquoInternet On peut citer la complexiteacute la qualiteacute de service et laqualiteacute utilisateur la performance du reacuteseau la performance des protocoles le fonction-nement ou encore la validation des modegravelesLa meacutetrologie Internet englobe deux types drsquoactiviteacutes La premiegravere est lrsquoeacutetude des para-megravetres physiques de la qualiteacute de service La seconde consiste a mettre en eacutevidence lesproblegravemes lieacutes agrave lrsquoInternet [Larrieu2010]

25

Dans [Paxson2001] lrsquoauteur preacutesente lrsquoapproche research driven et lrsquoapproche measure-ment driven pour deacutefinir les objectifs drsquoune eacutetude de meacutetrologie Le choix drsquoune approcheva aider une personne souhaitant faire de la meacutetrologie sur la bonne faccedilon drsquoaborderlrsquoeacutetude qursquoelle veut mettre en place

Lrsquoexpression research driven peut ecirctre traduite par axeacutee sur la recherche Elle consisteagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires de lancer les campagnes de mesures et drsquointerpreacuteter les reacute-sultats Une meacutetrique se deacutefinit comme une grandeur mesurable et speacutecifieacutee de maniegravererigoureuse Une bonne meacutetrique doit pouvoir se mesurer de faccedilon reproductible ecirctreutile en pratique pour les utilisateurs et les administrateurs du reacuteseau [RFC2330] Cetteapproche est celle geacuteneacuteralement utiliseacutee par les opeacuterateurs et les groupes de recherchesElle est deacuteveloppeacutee par le groupe de travail IP Performance Metrics (IPPM) de lrsquoIETF Cegroupe de travail a produit de nombreux documents pour deacutefinir les mesures de per-formances Lrsquoapproche research driven comporte un deacutefaut principal En laissant de cocircteacutecertaines meacutetriques des aspects du comportement du reacuteseau ne sont pas eacutetudieacutes Parexemple une eacutetude restreinte aux deacutelais ne peut indiquer les raisons de la variation desdeacutelais dans le temps

Lrsquoapproche measurement driven peut se traduire en la mesure pour la mesure Cettemeacutethode consiste agrave mettre en place une infrastructure de mesures afin de reacutecupeacuterer lemaximum drsquoinformations puis effectuer toutes les analyses possibles sur les traces col-lecteacutees et interpreacuteter les reacutesultats obtenus Une telle meacutethode peut srsquoutiliser lorsque lrsquoonsouhaite mettre en avant le comportement geacuteneacuteral drsquoun lien Cette approche permet agrave ladiffeacuterence de la preacuteceacutedente drsquoanalyser agrave plusieurs reprises une mecircme source de donneacuteesen fonction des reacutesultats obtenus

Le tableau 13 reacutesume les deux approches de conduite de projet en meacutetrologie

TABLE 13 ndash Comparatif entre les approches de meacutetrologie

Research Driven Measurement Driven1 - Meacutetriques deacutefinies preacutealablement2 - Utilisation drsquoun outil adapteacute

1 - Collecte des donneacutees2 - Analyse exhaustive

Ces deux approches sont compleacutementaires lrsquoune de lrsquoautre et srsquoappliquent dans lesdeux classes de techniques de mesures les techniques de mesures actives et les tech-niques de mesures passives

122 Meacutetrologie active

La meacutetrologie active consiste agrave injecter un trafic speacutecifique et agrave mesurer en reacuteceptionlrsquoeffet sur le reacuteseau agrave eacutetudier Lrsquohypothegravese faite par la meacutetrologie active est que la mesurefaite de bout en bout est reacuteveacutelatrice de la performance du service du reacuteseau telle qursquoellepeut ecirctre perccedilue par une application Les paquets eacutemis sont des sondes qui en emprun-tant la route entre la source et la destination expeacuterimentent la performance du canal decommunication Il convient de limiter le trafic des sondes afin qursquoil ne vienne pas pertur-ber le trafic et donc fausser la mesure Les meacutetriques mesureacutees par les mesures activessont geacuteneacuteralement des meacutetriques associeacutees agrave la topologie du reacuteseau ou au trafic commeles routes ou les deacutelais Dans le cas de la meacutetrologie active il se peut que lrsquoeacutemetteur soiteacutegalement le collecteur La figure 112 illustre ce principe

La meacutetrologie active est opeacutereacutee agrave lrsquoaide drsquooutils speacutecifiques de geacuteneacuteration et de collectede sondes Le tableau 14 indique les meacutetriques obtenues avec les outils de meacutetrologiepreacutesenteacutes par la suite

26

FIGURE 112 ndash Principe de la meacutetrologie active

TABLE 14 ndash Classement des outils

XXXXXXXXXXXOutilMeacutetriques

RTT Routes Deacutebits

Ping XTraceroute X XParis Traceroute X XReverse-traceroute X XTraceIXroute X XPathchar XClink XIperf X

La mesure du RTT est geacuteneacuteralement obtenue par lrsquooutil ping (Packet Internet Groper)Cet outil se preacutesente sous la forme drsquoune commande dans un systegraveme de type Unix Ellesert en premier lieu agrave veacuterifier la connectiviteacute agrave Internet et lrsquoaccessibiliteacute drsquoun nœud Ensecond lieu avec cette veacuterification le RTT et la longueur de la route exprimeacutee en nombrede sauts sont deacutetermineacutes Elle utilise le protocole Internet Control Message Protocol (ICMP)pour effectuer la mesure Un message ICMP Echo request est eacutemis Le destinataire renvoieagrave lrsquoeacutemetteur un message ICMP Echo reply La peacuteriode qui seacutepare lrsquoeacutemission de la reacuteceptiondu coteacute eacutemetteur est mesureacutee

Pour en savoir plus sur la connectiviteacute drsquoun nœud et notamment sur la route emprun-teacutee pour atteindre une destination donneacutee lrsquooutil traceroute offre le moyen de cette deacute-couverte [Jacobson1989-1] Cet outil se preacutesente comme pour ping sous la forme drsquounecommande de type Unix Son principe de fonctionnement est baseacute sur un envoi successifde messages avec un champ TTL du paquet IP qui va croissant Le routeur qui reccediloit unmessage dont le TTL du paquet a atteint la valeur zeacutero envoie un message ICMP TimeExceeded pour reporter lrsquoerreur agrave lrsquoeacutemetteur Par ce message il indique en adresse sourcelrsquoadresse IP de son interface qui a rejeteacute le paquet Ainsi si un paquet ayant un TTL posi-tionneacute agrave n est envoyeacute vers une destination donneacutee le routeur situeacute agrave n sauts de la sourceva faire connaicirctre son adresse IP et ceci tant que le chemin vers la destination est supeacute-rieur agrave n sauts [Crovella2006] Le reacutesultat est lrsquoensemble des nœuds traverseacutes reacutepondantau protocole ICMP De nouveaux outils utilisant le principe de traceroute furent deacutevelop-peacutes pour reacutepondre agrave drsquoautres probleacutematiques comme la preacutesence des points drsquoeacutechangeou encore lrsquoasymeacutetrie des liens

La reacuteponse afficheacutee par la commande traceroute nrsquoest pas la seule route existanteEn exeacutecutant agrave plusieurs reprises la mecircme commande traceroute les reacuteponses obtenuespeuvent ecirctre diffeacuterentes A cause de lrsquoeacutequilibrage de charge (load-balancing) la sortie drsquounrouteur ne sera pas toujours la mecircme Lrsquoeacutequilibrage des charges sert agrave reacutepartir le traficsur diffeacuterents liens Ainsi il est possible que deux paquets provenant de la mecircme sourcevers la mecircme destination nrsquoempruntent pas la mecircme route Sur la figure 113 les liensphysiques entre les diffeacuterents nœuds sont indiqueacutes en rouge Les traits en pointilleacute repreacute-sentent le chemin emprunteacute par les messages ICMP envoyeacutes par la source La figure 113amontre le reacutesultat trouveacute par traceroute La route emprunteacutee est SRC A D DST

27

Traceroute va envoyer 3 paquets avec un champ TTL eacutegal agrave 2 Dans le cas de cet exemplelrsquoensemble des paquets est dirigeacute vers B Ainsi malgreacute lrsquoabsence de liaison physique di-recte entre les nœuds A et D traceroute nous indique la preacutesence drsquoune route entre ceuxdeux eacutequipements Lrsquooutil Paris-traceroute vise agrave traiter ce problegraveme [Augustin2006]La figure 113b montre la route deacutecouverte par Paris-traceroute La route afficheacutee estSRC A C DST On remarque que la route obtenue existe physiquement Pour obte-nir ce reacutesultat Paris-traceroute change le numeacutero drsquoidentification du flux agrave lrsquoeacutemission despaquets ICMP Cette modification oblige les routeurs agrave suivre une seule et unique routeParis-traceroute autorise eacutegalement lrsquoaffichage des numeacuteros de voies logiques MPLS

(a) Traceroute

(b) Paris-traceroute

FIGURE 113 ndash Illustration du pheacutenomegravene drsquoeacutequilibrage des charges

MultiProtocol Label Switch (MPLS) est un meacutecanisme de commutation rapide de pa-quets fondeacute sur des adresses de format fixe et sans structure hieacuterarchique [RFC3031]Ces adresses sont des numeacuteros de voies logiques appeleacutees des eacutetiquettes ou labels (paranglicisme) Dans le cas de lrsquoutilisation de traceroute avec MPLS il faut que le routeurMPLS puisse envoyer un message ICMP Le [RFC4950] documente une simple extensionagrave ICMP pour retourner de lrsquoinformation speacutecifique agrave MPLS autrement dit pour qursquounrouteur MPLS puisse indiquer des informations speacutecifiques agrave MPLS dans le paquet ICMPeacutemis en cas de problegraveme [Donnet2012] a eacutetudieacute les possibiliteacutes offertes par des routeursMPLS

Dans les explicit tunnels la structure interne du tunnel est entiegraverement visible et chaquenœud dans le Label Switched Path (LSP) est marqueacute comme nœud MPLS Dans ce type detunnel le champ ttl-propagate qui est dans lrsquoen-tecircte MPLS des paquets et le [RFC4950] sontappliqueacutes Cela signifie que le champ TTL du datagramme IP est deacutecreacutementeacute agrave chaquerouteur rencontreacuteDans les implicit tunnels le LER drsquoentreacutee active lrsquooption ttl-propagate mais les LSR nrsquoim-pleacutementent pas le [RFC4950] La deacutecreacutementation du TTL est effective mais aucune infor-mation de routeur MPLS nrsquoest visibleDans les opaque tunnels crsquoest lrsquoinverse de lrsquoimplicit tunnels Les routeurs impleacutementent le[RFC4950] Le nœud drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Le TTL est alors deacutecreacute-menteacute agrave la sortie du tunnel MPLS Le paquet ICMP-reply indique quand mecircme lrsquoexistencedrsquoun tunnel MPLSPour les invisible tunnels le LER drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Dans ce casle TTL est deacutecreacutementeacute uniquement lors du dernier routeur du tunnel Le [RFC4950] nrsquoestpas impleacutementeacute par le dernier routeur du LSP Cela implique lrsquoabsence drsquoinformation

28

sur le meacutecanisme MPLS au sein des paquets ICMP On nrsquoa alors pas drsquoinformations surlrsquoexistence drsquoun tunnel ICMP sur la route emprunteacutee

Avec lrsquoacheminement avec MPLS des mauvaises valeurs de TTL peuvent ecirctre obte-nues agrave cause du type de tunnel mis en œuvre Il est donc important que le [RFC4950] soitimpleacutementeacute dans les routeurs

FIGURE 114 ndash Taxonomie des configurations de tunnels MPLS et des comportements detraceroute correspondants (Source [Donnet2012] )

Paris-traceroute propose lrsquoaffichage des informations MPLS lorsque celles-ci sont dis-ponibles [Augustin2007] La texte ci-dessous illustre les reacutesultats obtenus par Paris-traceroutesur un Explicit tunnel On y voit lrsquoaffichage des marques MPLS avec le TTL associeacute agravechaque nœud

traceroute [(412131413533456) -gt (818216615733457)]protocol icmp algo hopbyhop duration 3 s1 4121314133 23266 ms 2542 ms 3696 ms2 4121313397 6811 ms 5613 ms 4635 ms3 10322161 5779 ms 6841 ms 4073 msMPLS Label 16445 TTL=1 | 2129964 1032237 2223 ms 2249 ms 2264 msMPLS Label 16386 TTL=2 | 2129965 4121312850 2185 ms 2245 ms 2097 msMPLS Label 16442 TTL=3 | 2129966 10322193 3551 ms 9330 ms 7775 ms7 41213133158 2337 ms 3088 ms 2250 ms8 4121312854 195439 ms 195555 ms 195512 ms9 213242121233 211737 ms 211724 ms 212013 ms10 469148181 234190 ms 234271 ms 234323 ms11 4687222 236854 ms 236798 ms 237063 ms12 213224250110 237108 ms T0 236580 ms T0 236570 msT013 2132242502 237213 ms 236631 ms 236694 ms14 213224201252 239100 ms 239461 ms 238680 ms15 8182166157 250874 ms 249608 ms 248057 ms

Avec traIXroute lrsquoobjectif est de deacutecouvrir les diffeacuterents points de peering (IXP) sur unchemin vers une destination [Nomikos2016] Pour lrsquoidentification des nœuds drsquoeacutechangecette version de traceroute combine deux bases de donneacutees compleacutementaires qui sontPeeringDB [PeeringDB] et Packet Clearing House [PCH] Avec une geacuteolocalisation desadresses retourneacutees la liste des pays traverseacutes peut ecirctre eacutetablie

29

Drsquoapregraves [Steenbergen2009] laquo lrsquooutil de deacutepannage numeacutero 1 pour veacuterifier la connec-tiviteacute drsquoun nœud reste traceroute raquo pour les administrateurs reacuteseaux mais laquo les liens asy-meacutetriques sont les fleacuteaux numeacutero un de lrsquooutil raquo car laquo le chemin de retour est entiegraverementmasqueacute raquo Afin de corriger cela lrsquooutil reverse-traceroute propose drsquoobtenir une routenon pas entre la source et la destination mais entre la destination et la source [Katz2010]pour cela lrsquooutil va utiliser lrsquoenregistrement des adresses IP des routeurs sur le chemindu retour agrave lrsquoaide des options drsquoen-tecircte Record-Route et Timestamp drsquoIP

Pour deacuteterminer le deacutebit pathchar [Jacobson1997] vise agrave donner le deacutebit saut par sautvers une destination Aussi il reprend le principe de traceroute en eacutemettant des sondesavec le champ TTL avec une valeur croissante Lorsqursquoil injecte le trafic de sondes vers unnœud du chemin il le fait avec des paquets de taille variable Ainsi pathchar deacuteterminela bande passante disponible entre chaque nœud rencontreacute

Lrsquooutil Clink [Downey1999] est similaire agrave pathchar La diffeacuterence se fait au niveausur le nombre de paquets envoyeacutes Clink envoie un nombre de paquets plus importantque Pathchar Ainsi les mesures reacutealiseacutees par Clink auront une meilleure preacutecision

Iperf [Tirumala2005] est un outil pour mesurer la bande passante et la qualiteacute drsquounlien reacuteseau Ce dernier est deacutelimiteacute par deux machines sur lesquelles est installeacute IperfUne machine tient le rocircle de serveur tandis que la seconde machine sera parameacutetreacuteecomme client

Pour des mesures plus repreacutesentatives il est neacutecessaire drsquoaugmenter les points decollectes Des outils de meacutetrologie active ont eacuteteacute conccedilus pour ecirctre reacutepartis sur plusieursnœuds Ces outils se preacutesentent sous la forme de plates-formes de meacutetrologie active deacute-ployeacutees agrave travers le monde De nos jours on compte de nombreuses plates-formes demeacutetrologie active Comme chaque plate-forme a un objectif preacutecis et pour identifier laplate-forme approprieacutee pour reacutealiser une eacutetude preacutecise lrsquoauteur de [Bajpai2015-1] effec-tue une comparaison des diffeacuterentes plates-formes selon 5 critegraveres qui sont

1 lrsquoeacutechelle la couverture et la dureacutee de vie de la plate-forme

2 le mateacuteriel physique utiliseacute pour la sonde

3 les meacutetriques disponibles

4 lrsquoarchitecture de mesure de la plate-forme

5 lrsquoimpact de son utilisation pour la recherche

De cette comparaison nous avons gardeacute 4 plates-formes que sont Atlas RIPE NCC BIS-Mark DASU SamKnows Ces plates-formes ont eacuteteacute gardeacutees car elles autorisent lrsquoeacutetudedes performances des reacuteseaux drsquoaccegraves Nous y avons ajouteacute les plates-formes Archipe-lago et Planet-Lab Ces deux plates-formes ne font pas partie du document drsquoorigine maisfont lrsquoobjet drsquoune utilisation par de nombreux participants tel que lrsquoindique le nombrede sondes actives de ces deux plates-formes

En 2007 le CAIDA a deacuteployeacute sa propre plate-forme de mesures [Archipelago] Atravers le deployement de nœuds (des sondes dans le vocabulaire de Archipelago) surlrsquoensemble de la planegravete lrsquoobjectif est drsquooffrir des accegraves pour effectuer des mesures avecdes outils tels que ping et traceroute Archipelago est composeacutee agrave la date du 1er Mars2017 de 170 sondes reacuteparties dans 59 pays et sur tous les continents

Dans le courant de lrsquoanneacutee 2010 le Regional Internet Registry (RIR) europeacuteen RIPENCC a deacutemarreacute la distribution de sondes pour la creacuteation de la plate-forme Atlas [Ripe2010]Cette plate-forme vise agrave creacuteer un reacuteseau de sondes pour lrsquoeacutetude de la connectiviteacute de lrsquoIn-ternet Composeacutee actuellement de pregraves de 10 000 sondes reacuteparties agrave travers le monde elleest capable drsquoeffectuer des tests de meacutetrologie active autour des commandes ping DNSHTTP NTP traceroute et Paris-traceroute

30

Agrave lrsquoinitiative de Georgia Tech la plate-forme Broadband Internet Service Benchmark (BIS-Mark) a vu le jour en 2010 Lrsquoobjectif est la reacutealisation drsquoun eacutetat des lieux des performancesdes accegraves Internet [Sundaresan2011] La plate-forme est composeacutee de 405 routeurs instru-menteacutes avec OpenWrt laquo Le projet OpenWrt est un systegraveme drsquoexploitation Linux ciblantles appareils embarqueacutes OpenWrt fournit un systegraveme de fichiers entiegraverement inscriptibleavec gestion des modules drsquoinstallation de logiciels Cela libegravere la seacutelection et la configu-ration des applications fournies par le fournisseur et permet de personnaliser lrsquoappareilgracircce agrave lrsquoutilisation de progiciels adapteacutes agrave nrsquoimporte quelle application raquo [OpenWrt] Lessondes sont distribueacutees dans 34 pays agrave travers le monde

DASU est un utilitaire deacuteveloppeacute en 2010 agrave lrsquoUniversiteacute de Northwestern Le logicielcouple meacutetrologie active et passive avec pour objectif de caracteacuteriser les performancesdes utilisateurs Lrsquooutil fut deacuteveloppeacute comme une extension drsquoun logiciel peer-to-peer Bit-Torrent [Sanchez2013] Depuis Juillet 2010 plus de 90 000 personnes reacuteparties agrave travers147 pays utilisent DASU

En 2003 des chercheurs ameacutericains ont deacuteployeacute une plate-forme de test Planet-Lab[Chun2003] En 2008 une extension europeacuteenne [PlanetLabEurope] a vu le jour Planet-Lab deacutepasse le seul objectif de meacutetrologie elle vise aussi de tester des nouveaux servicesde communication en situation reacuteelle Les nœuds Planet-Lab ont pour Operating System(OS) Fedora Il est possible drsquoinstaller nrsquoimporte quel logiciel du moment qursquoil est com-patible avec cet OS Avec une certaine liberteacute il est possible drsquoeffectuer des tests et desmesures depuis 425 sites reacutepartis sur tous les continents

La plate-forme SamKnows a vu le jour en 2008 [SamKnows] SamKnows sert agrave lrsquoeacutetudedes performances des connexions des particuliers et des entreprises Elle est composeacuteede pregraves de 440 000 sondes Cette infrastructure est partenaire de 36 Fournisseurs drsquoAccegravesInternet (FAI) de tous les continents

Le tableau 15 reacutesume les possibiliteacutes offertes par les plates-formes La colonne Impactsur la recherche est deacutetermineacutee agrave partir du nombre de citations par des articles scientifiquessuivis par le site Google Scholar

La plate-forme de mesures Atlas RIPE NCC [Ripe2010] a eacuteteacute utiliseacutee dans le contexteinsulaire de Cuba Dans lrsquoarticle [Bischof2015] lrsquoauteur cherche agrave caracteacuteriser lrsquoaccegraves In-ternet cubain Dans ses reacutesultats lrsquoauteur a montreacute une forte asymeacutetrie des routes in-ternationales pour le trafic cubain Drsquoun point de vue de la topologie physique cette icirclepossegravede une connectiviteacute qui peut par certains aspects ressembler agrave de celle de lrsquoicircle de LaReacuteunion

Lrsquoicircle de La Reacuteunion bien que Franccedilaise est rattacheacutee administrativement au RIR dela zone Afrique (AfriNIC) LrsquoAfriNIC est le dernier RIR creacuteeacute et les eacutetudes de meacutetrolo-gie concernant cette zone sont peu nombreuses Nous pouvons citer [Gupta2014] qui sepenche sur lrsquointerconnexion des FAI sur le continent africain Cette eacutetude montre que leseacutechanges de paquets ne se font pas au sein du continent africain mais en Europe La rai-son avanceacutee par lrsquoauteur est un coucirct drsquointer-connexion infeacuterieur en Europe Ces regravegles deroutage on des conseacutequences sur les deacutelais et donc sur les performances sur le servicede transport rendu par TCP Ces reacutesultats ont eacuteteacute confirmeacutes par [Fanou2015] Cette eacutetudesrsquointeacuteresse en plus agrave la stabiliteacute des routes Les reacutesultats ont montreacute que les chemins afri-cains restent stables sur une longue dureacutee Pour les auteurs lrsquoeacutemergence de nouveauxpoints drsquoeacutechanges sur le continent doit aider agrave la reacuteduction des deacutelais agrave conditions queles coucircts drsquointerconnexion soient proches de ceux pratiqueacutes en Europe

Enfin lrsquoarticle [Chavula2017] publieacute en 2017 preacutesente la latence pour les transferts defichiers agrave partir de 53 pays africains diffeacuterents Ces mesures srsquoappuient sur la plate-formeRIPE Atlas [Ripe2010] et Speedchecker [Speechecker] Agrave partir des mesures reacutealiseacutees les

31

TABLE 15 ndash Tableau des plates-formes de mesures de meacutetrologie active

Nom Nombre desondes deacuteployeacutees

Meacutetriques dispo-nibles

Impact sur la re-cherche

Archipelago ~200 Longueur duchemin RTTDNS Autono-mous System(AS)

109

Atlas RIPE NCC ~12 000 RTT RouteHTTP GET etrequecirctes SSL

38

BISMark ~420 RTT taux depertes deacutebiteacutecouleacute tempsde chargementdrsquoune page web

304

DASU ~100 000 Informations surles flux TCP RTTroutes emprun-teacutees reacutesolutionDNS HTTP GETdeacutebit eacutecouleacute

84

PlanetLab ~400 1218SamKnows ~70 000 RTT deacutebit

eacutecouleacute deacutebitutile giguetaux de perteperformance decertains services

154

auteurs avancent que lrsquoAfrique est un continent ineacutegalitaire en terme de latence intra etinter pays Ils ont conclu que lrsquoexistence drsquoune faible latence entre deux FAI drsquoun mecircmepays provient drsquoaccord de peering au sein drsquoun IXP heacutebergeacute soit par le pays concerneacutesoit par un pays voisin

123 Meacutetrologie passive

La meacutetrologie passive a pour objectif la mesure des flots de paquets agrave partir drsquounpoint particulier du reacuteseau appeleacute le point de collecte Elle consiste agrave eacutecouter captureret analyser les paquets IP La figure 115 illustre le principe de la meacutetrologie passiveElle montre que le point de collecte nrsquoest pas forceacutement localiseacute du coteacute eacutemetteur oureacutecepteur Les paquets IP transitant par le point de collecte sont captureacutes et sauvegardeacutesOn appelle alors les fichiers contenant les paquets IP collecteacutes des traces Les mesurespassives peuvent ecirctre effectueacutees agrave diffeacuterents niveaux de granulariteacute

Au niveau microscopique les mesures passives tendent agrave eacutetudier les flots au niveaude la connexion de transport On peut par exemple eacutetudier le nombre de paquets per-dus durant une connexion TCP Au niveau macroscopique les mesures passives sonteffectueacutees sur des meacutetriques agreacutegeacutees comme le deacutebit eacutecouleacute total ou le nombre total deconnexions

32

FIGURE 115 ndash Principe de la meacutetrologie passive

La meilleure faccedilon de reacutealiser des mesures passives au niveau microscopique est decapturer tous les paquets traversant le point de collecte Mais comme il est difficile decapturer tous les paquets lorsque le deacutebit du lien est eacuteleveacute il faut avoir recours agrave lrsquoeacutechan-tillonnage du trafic Dans ce cas les mesures ne sont pas faites sur la totaliteacute des pa-quets traversant le point de collecte mais sur un sous-ensemble bien speacutecifique de cespaquets Le groupe de travail Packet Sampling (PSAMP) de lrsquoIETF travaille sur un algo-rithme drsquoeacutechantillonnage adapteacute au trafic Internet [PSAMP]

Une combinaison entre lrsquoanalyse des deux granulariteacutes est capable de donner uneeacutevaluation reacuteelle du trafic Les informations que lrsquoon peut obtenir par la meacutetrologie pas-sive sont nombreuses Elles reposent sur lrsquoeacutetude des informations contenues dans le da-tagramme IP que ccedila soit dans lrsquoen-tecircte du datagramme IP ou dans celle du message duprotocole de transport Les meacutetriques sont eacutegalement deacutependantes des outils utiliseacutes Onpeut classer les meacutetriques en deux cateacutegories que sont la supervision et la performance

La supervision donne des informations sur le fonctionnement du reacuteseau et la carac-teacuterisation du trafic On peut ainsi eacutetudier les diffeacuterents services et protocole de transportutiliseacutesLa performance se rapporte agrave celle du protocole de transport crsquoest-agrave-dire son fonction-nement ou sur lrsquoanalyse des flots par rapport soit agrave la composante temporelle ou soit agravela composante seacutemantique On peut alors comparer le deacutebit drsquoaccegraves theacuteorique et le deacutebitmesureacute Pour cela on va eacutetudier le taux de perte le RTT et la MSS

La meacutethode de capture peut reposer sur des eacutequipements mateacuteriels deacutedieacutes ou par unsystegraveme logiciel fonctionnant sur un eacutequipement standard Le logiciel srsquoappuie majori-tairement sur la bibliothegraveque Libpcap [Jacobson1989-2] Cette bibliothegraveque capture lespaquets reccedilus mais elle srsquoutilise eacutegalement en lisant des traces de paquets preacutealablementcaptureacutes Le problegraveme principal des solutions logicielles viennent de la vitesse des liensPlus le lien a un deacutebit eacuteleveacute plus la capture au niveau logiciel devient difficile Il fautalors se tourner vers des solutions de mateacuteriels deacutedieacutes La carte DAG [Graham1997] deacute-veloppeacutee par lrsquoeacutequipe [WAND] de lrsquoUniversiteacute de Waikato en Nouvelle Zeacutelande en est unparfait exemple Cette carte de capture est capable de capter les paquets sur des liens detregraves haut deacutebit Ce mateacuteriel se charge drsquoextraire les entecirctes des paquets de les estampillersuivant une horloge synchroniseacutee et de les stocker sur un disque dur

Lrsquoanalyse des donneacutees est reacutealiseacutee selon deux techniques temps reacuteels ou Batch Leprincipe du temps reacuteel est de pouvoir reacutecupeacuterer extraire et restituer de lrsquoinformation entemps reacuteel sur des flux continus de donneacutees Le mode Batch va englober tous les traite-ments de donneacutees neacutecessitant un temps de calcul plus conseacutequent Le premier proceacutedeacutese propose drsquoanalyser agrave la voleacutee ce qui se passe dans le reacuteseau par le branchement drsquouneacutequipement drsquoeacutecoute sur le reacuteseau On se concentre alors sur la performance du lien Desoutils comme Tstat [Mellia2005] ou Netflow [Claise2004] reacutealisent ce genre drsquoanalyse La

33

seconde technique se deacutecompose en deux phases distinctes que sont la capture et lrsquoana-lyse La premiegravere eacutetape est de reacutealiser la capture du trafic appeleacutee des traces Des outilscomme TCPDump [Jacobson1989-1] ou Wireshark [Chappell2010] peuvent enregistrerdes traces sous format DUMP ou PCAP La seconde phase consiste agrave analyser les tracescollecteacutees Les formats de sortie des donneacutees analyseacutees sont deacutependants des outils Lesinformations peuvent ecirctre retranscrites au format texte ou graphique Des outils commeTCPTrace [Ostermann2000] ou TCPStat [Herman2001] peuvent effectuer ce genre drsquoana-lyse de donneacutees Crsquoest avec cette technique qursquoil est possible drsquoeacutetudier les performancesdrsquoun protocole

Il nrsquoexiste pas de plate-forme drsquoaccegraves publique reacutealisant des captures de trafic au ni-veau international Malgreacute cela des traces collecteacutees sont disponibles sur Internet agrave desfins de recherche Dans [Allman2007] les auteurs preacutesentent les regravegles agrave respecter avantde publier des traces Un point est agrave souligner et concerne les adresses IP des paquets Lanon-anonymisation des adresses IP constitue une violation de la vie priveacutee de plus ellepreacutesente un risque drsquoinseacutecuriteacute pour les machines impliqueacutees par les paquets captureacutesCAIDA gegravere un deacutepocirct de partage et propose drsquoacceacuteder agrave des traces collecteacutees agrave traversplusieurs points drsquoeacutechange ameacutericains Pour y acceacuteder il faut indiquer la finaliteacute de lrsquouti-lisation des traces demandeacutees Drsquoautres plates-formes deacutedieacutees agrave des projets ont eacuteteacute misesen place agrave travers le monde

Le projet IPMon de lrsquoopeacuterateur ameacutericain SPRINT consiste agrave identifier les problegravemesdrsquoun reacuteseau deacutejagrave deacuteployeacute afin de pouvoir anticiper son eacutevolution future[IPMon] Danslrsquoarticle [Fraleigh2001] lrsquoauteur preacutesente lrsquoinfrastructure de mesure qui est deacuteployeacutee endivers points du reacuteseau de lrsquoopeacuterateur Les premiers reacutesultats publieacutes dans [Fraleigh2003]ont montreacute une utilisation de plus en plus importante par du trafic multimeacutedia sur le pro-tocole TCP De plus les flots TCP preacutesentent des performances eacuteleveacutees avec des taux dedeacute-seacutequencement faibles et un deacutelai minimal proche du temps de propagation

Le projet METROPOLIS srsquoest inspireacute du projet IPMon Il srsquoagit drsquoun projet franccedilaisavec des points de mesures sur deux types de reacuteseaux Internet diffeacuterents RENATER etle reacuteseau ADSL de France Teacuteleacutecom laquo Lrsquoobjectif de METROPOLIS eacutetait de concevoir denouvelles meacutethodologies pour la meacutetrologie des reacuteseaux IP raquo [METROPOLIS] Dans lecadre de ce projet un outil de caracteacuterisation et drsquoanalyse des traces fut deacuteveloppeacute Cenouvel outil srsquointitule ZOO Une preacutesentation de lrsquooutil sera reacutealiseacutee dans la sous-section322 Les reacutesultats ont mis une eacutevidence lrsquousage preacutedominant du protocole de transportTCP Les applications de type peer-to-peer repreacutesentaient plus de 80 du trafic eacutetudieacute

La position geacuteographique de La Reacuteunion et son rattachement au RIR AfriNIC attirentnotre attention sur les travaux de meacutetrologie passive africains La carte [AfterFibre] preacute-sente les reacuteseaux fibres terrestres et maritimes lieacutes au continent africain On voit ainsi queles reacuteseaux sont ineacutegalement reacutepartis sur le territoire La grandeur du continent et les in-terconnections preacutesentes font du territoire un espace drsquoeacutetude inteacuteressant Crsquoest pourquoide nombreux chercheurs privileacutegient lrsquoeacutetude de la connectiviteacute et des performances delrsquoInternet africain

Dans lrsquoarticle [Johnson2011] une eacutetude sur une zone rurale connecteacutee par satelliteest reacutealiseacutee Les reacutesultats ont montreacute que le trafic est principalement composeacute de fluxweb dont une forte proportion pourrait ecirctre mise en cache Au niveau des deacutelais le RTTmoyen sur la peacuteriode de mesure varie entre 3 et 10 secondes Ce deacutelai rend lrsquoutilisationdes applications temps-reacuteel difficile Le dernier reacutesultat notable de cette analyse est lapreacutesence de trafic geacuteneacutereacute par des logiciels malveillants (malware) Des attaques pour listerles ports UDP et TCP ouverts ont eacuteteacute remarqueacutees

En 2015 les auteurs de [Zheleva2015] ont eacutetudieacute les performances du reacuteseau et le com-portement des usagers apregraves une augmentation de la bande passante en Zambie Lrsquoun des

34

premiers reacutesultats indique une augmentation de plus de 58 de la quantiteacute des donneacuteeseacutechangeacutees Au niveau des performances ils ont pu eacutegalement remarquer une tregraves leacutegegraveredeacutegradation du canal de communication avec un taux de retransmission en hausse Cepourcentage est passeacute de 1 12 agrave 1 16 Le dernier reacutesultat noteacute porte sur lrsquoaugmenta-tion du RTT moyen de plus de 100 passant de 0 1436 s agrave 0 3190 s Lrsquoaugmentation dela bande passante a permis lrsquoaccegraves agrave de nouveaux services entraicircnant des changementspour les usagers

Dans [Fanou2016] lrsquoauteur srsquointeacuteresse aux services proposeacutes et compare la localisa-tion des serveurs Le premier reacutesultat montre lrsquoexternalisation continentale de nombreuxserveurs Ceci a pour conseacutequence drsquoaugmenter les deacutelais et de deacutegrader la performancedu service de communication Il faut pour lrsquoauteur arrecircter de raisonner en terme drsquoin-frastructure mais plus en terme de service et mettre lrsquoutilisateur au centre du systegravemePour cela il propose de rapatrier les services sur le territoire et drsquoaugmenter les accordsdrsquoeacutechanges entre les opeacuterateurs continentaux

Enfin dans [Johnson2016] les auteurs srsquointerrogent sur les faibles performances deTCP en Afrique La preacutesence de zone reculeacutees avec des accegraves satellitaires poussent lesdeacutelais vers des valeurs allant au delagrave des 400 ms Ces longs deacutelais sont agrave rapprocher desdeacutebits faibles De plus une expeacuterimentation sur les performances de TCP en fonction dusystegraveme drsquoexploitation a eacuteteacute meneacutee Les reacutesultats ont mis en eacutevidence que le systegraveme Li-nux avec la version TCP CUBIC est moins sensible au long deacutelais La solution proposeacutee auproblegraveme de la diffeacuterence de connectiviteacute agrave travers le continent est la creacuteation drsquoune ingeacute-nierie reacuteseau (liaison physique protocole de transport nouveau service) tenant comptedu contexte Africain

124 Comparatif entre mesures actives et mesures passives

La meacutetrologie active et la meacutetrologie passive preacutesentent des points communs et despoints de divergences Une fois des objectifs fixeacutes et au moment du choix de la meacutethodeil est important de connaicirctre les avantages et les inconveacutenients lieacutes agrave chaque type demesure Le tableau 16 reacutecapitule syntheacutetiquement ce qui vient drsquoecirctre preacutesenteacute

TABLE 16 ndash Comparatif entre mesures actives et mesures passives

Meacutetrologie Active Meacutetrologie Passive

Avantages

1 - Pour la mesure directe des pa-ramegravetres de QoS principalementle deacutelai le taux de pertes et lagigue

1 - Non intrusives2 - Permettent une mesure directedes paramegravetres utiliseacutes dans lrsquoin-geacutenierie des reacuteseaux

Inconveacutenients

1 - Intrusives le trafic de mesurepeut dans certains cas fausser lesmesures elles-mecircmes2 - Le fait que certains adminis-trateurs et entreprises bloquentou limitent le trafic ICMP peutfausser les reacutesultats obtenus parles techniques actives car ces der-niegraveres font souvent usage de ceprotocole

1 - Elles sont locales (relatives agraveun lien) et il est difficile de leseacutetendre agrave la globaliteacute du reacuteseau2 - Elles ne permettent pas la me-sure directe des paramegravetres deQoS3 - Elles neacutecessitent des ressourcesdisque et meacutemoire vive impor-tantes

35

13 Synthegravese

Ce chapitre a rappeleacute le fonctionnement du controcircle de congestion de TCP Le controcirclede congestion de TCP vise agrave maximiser lrsquoutilisation des ressources et agrave maximiser le deacute-bit utile eacutecouleacute de la connexion Ce controcircle est reacutegi par une boucle fermeacutee caracteacuteriseacuteepar un RTT Plus le deacutelai est eacuteleveacute moins TCP est susceptible de reacuteagir dynamiquementaux eacuteveacutenements de congestion Lorsque le produit du RTT et de la capaciteacute du canalde communication est trop important TCP peine agrave atteindre les objectifs preacuteceacutedemmentpreacutesenteacutes Lrsquoaugmentation progressive de la bande passante sans diminution des deacutelais apour effet lrsquoaugmentation de la capaciteacute de stockage des liens Cet accroissement a uneffet neacutegatif sur les performances de TCP Cet effet neacutegatif impacte le deacutemarrage deconnexion les flots courts la reacutesolution de la congestion et la dynamique du sondagePour diminuer lrsquoeffet de la capaciteacute de stockage des liens sur les performances de TCPde nouveaux controcircles de congestion furent deacuteveloppeacutes Chaque nouvelle version ducontrocircle de congestion ambitionne de reacutesoudre une agrave plusieurs probleacutematiques des reacute-seaux agrave forte capaciteacute de stockage Le deacutemarrage de connexion et les flots courts ont dessolutions communes comme une augmentation de la capaciteacute drsquoeacutemission de TCP agrave lrsquoini-tialisation de la connexion ou la reacuteduction du RTO Les probleacutematiques de reacutesolution decongestion et de dynamique de sondage ont permis la creacuteation de nouvelles versions ducontrocircle de congestion de TCP Ces versions de TCP sont des solutions de bout-en-boutDrsquoautres solutions neacutecessitent un changement de paradigme et lrsquointeraction avec les rou-teurs Ces solutions ont lrsquoavantage drsquoecirctre reacuteactives mais neacutecessitent la mise agrave jour deseacutequipements intermeacutediaires du reacuteseau

Le localisation geacuteographique de La Reacuteunion au milieu de lrsquooceacutean indien place lrsquoicircledans une situation ougrave la capaciteacute de stockage du reacuteseau peut ecirctre importante Nous avonsainsi estimeacute cette capaciteacute agrave lrsquoaide des deacutebits theacuteoriques des accegraves et les deacutelais de propa-gation estimeacutes et mesureacutes Les reacutesultats obtenus ont mis en eacutevidence une capaciteacute destockage autorisant la caracteacuterisation de lrsquoInternet reacuteunionnais comme un reacuteseau agrave fortecapaciteacute de stockage Lrsquoimpact de cette capaciteacute de meacutemorisation nrsquoa pas encore eacuteteacute me-sureacute Crsquoest pourquoi nous nous sommes concentreacutes sur la meacutetrologie Internet

La meacutetrologie active est une science invasive en injectant des paquets dans le reacuteseauLa meacutetrologie active mesure directement des paramegravetres de qualiteacute de service comme lesdeacutelais les routes le taux perte et la gigue Nous avons vu que des outils sont en capa-citeacute de mesurer deux meacutetriques simultaneacutement Certains outils peuvent ecirctre distribueacuteset ainsi former des plates-formes de mesure Ces plates-formes offrent la possibiliteacute auxpersonnes inteacuteresseacutees du monde entier de geacuteneacuterer des donneacutees de mesure agrave travers lemonde Les performances de TCP sont deacutependantes du deacutelai Les deacutelais sont eux-mecircmedeacutependants des routes physiques et logiques emprunteacutees Il est donc important drsquoeacutetudierces deux paramegravetres Connaissant nos besoins nous utiliserons lrsquoapproche research drivenpour lrsquoeacutetude de meacutetrologie active Lrsquoapproche research driven est une approche consistantagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires agrave lrsquoeacutetude Notre eacutetude de meacutetrologie active est preacutesenteacutee dansle chapitre 2

La meacutetrologie passive permet une mesure directe des paramegravetres utiliseacutes Cette classede meacutetrologie est centreacutee sur un lien de mesure Elle utilise lrsquoeacutecoute et la capture desdatagrammes IP La meacutetrologie passive eacutetudie la caracteacuterisation du trafic et la perfor-mance des protocoles Nous avons vu que des outils sont en capaciteacute de reacutealiser les deuxeacutetudes en parallegravele Ne pouvant reacutealiser des eacutetudes de meacutetrologie passive agrave distance denombreux chercheurs ont mis agrave disposition de la communauteacute scientifique des donneacuteespubliques La litteacuterature scientifique propose un grand nombre de meacutetriques pour lrsquoeacutetudedes performances du protocole de transport TCP et de la supervision du trafic Afin de

36

ne pas nous concentrer sur une meacutetrique en particulier nous faisons le choix de ne pasdresser une liste de meacutetriques Notre eacutetude de meacutetrologie passive que nous preacutesente-rons dans le chapitre 3 utilisera lrsquoapproche measurement driven Cette approche consiste agravemettre en place une infrastructure de mesures afin de reacutecupeacuterer le maximum drsquoinforma-tions puis drsquoeffectuer toutes les analyses possibles sur les donneacutees collecteacutees Neacuteanmoinsla meacutetrologie passive souffre de deux faiblesses essentielles (1) elle reste locale et il estdifficile drsquoeacutetendre les reacutesultats agrave la globaliteacute du reacuteseau (2) au niveau microscopique lescaptures aboutissent tregraves rapidement agrave des volumes de traces colossaux

37

38

Chapitre 2

Caracteacuterisation de la connectiviteacute deLa Reacuteunion

Le rapport [Mediametrie2018-2] sur lrsquoaccegraves Internet agrave La Reacuteunion a montreacute que 856de la population reacuteunionnaise de plus de 13 ans srsquoest deacutejagrave connecteacutee agrave Internet 747 deces personnes sont des usagers reacuteguliers En comparaison le rapport [Mediametrie2018-1]montre qursquoaux alentours de 68 de la population franccedilaise meacutetropolitaine se connectequotidiennement Ces sondages montrent lrsquointeacuterecirct pris par lrsquoInternet pour la populationreacuteunionnaise

En 2013 une eacutetude de meacutetrologie reacutealiseacutee par BinarySec vise a effectuer un classementdes fournisseurs drsquoaccegraves Internet de La Reacuteunion Dans le rapport associeacute [Vergoz2013] 9meacutetriques sont preacutesenteacutees Parmi elles le deacutebit descendant moyen est mesureacute agrave 9 36MbsEn comparaison le deacutebit descendant moyen en France meacutetropolitaine mesureacute par[Akamai2015] srsquoeacutelegraveve agrave 8 2 Mbits Akamai utilise la plate-forme Intelligent PlatformTM

pour reacutecolter des donneacutees dont le deacutebit reacuteel La Reacuteunion posseacutedait ainsi un meilleurdeacutebit descendant que la France meacutetropolitaine Le deacutebit moyen franccedilais preacutesenteacute par[Akamai2017] est de 10 75 Mbits Le deacutebit descendant minimum reacuteunionnais mesureacutepar [nPerf2017] est de 18 63 Mbits Ainsi lrsquoeacutecart entre les deacutebits franccedilais et reacuteunionnaissrsquoest accentueacute Malgreacute un deacutebit plus eacuteleveacute La Reacuteunion preacutesente des deacutelais plus eacuteleveacutesque la France

Lrsquoeacutevolution des deacutebits pose la question sur lrsquoeacutevolution des deacutelais depuis la derniegraverecampagne de mesure La figure 111 montre des deacutelais plus importants agrave La Reacuteunion qursquoagraveParis Lrsquoobjectif de ce chapitre est drsquoeacutetudier lrsquoeacutevolution des deacutelais depuis 2012 On srsquointeacute-resse eacutegalement agrave la connectiviteacute de La Reacuteunion en terme de deacutelai et de routes Lrsquoasymeacute-trie des liens est une chose courante dans lrsquoInternet Les questions que lrsquoon se pose de-puis La Reacuteunion doivent eacutegalement ecirctre poseacutees lorsque lrsquoon essaye de joindre lrsquoicircle Dansce chapitre nous allons explorer la connectiviteacute de La Reacuteunion Pour cela nous avonsmis en place un protocole de mesures se basant sur notre propre plate-forme de mesuresrespectant la reacutepartition des destinations Notre plate-forme a pour objectif lrsquoeacutetude desroutes et des deacutelais speacutecifiques de lrsquoicircle par rapport agrave son accegraves Internet via les cacircblessous-marins

Une seconde question est alors apparue Est-ce que ces speacutecificiteacutes sont uniquementcelles de La Reacuteunion ou alors communes aux icircles de la Zone Oceacutean Indien

Dans la section 21 nous preacutesentons les objectifs de notre eacutetude de meacutetrologie et lescontraintes associeacutees Afin de reacutepondre agrave ces contraintes un cahier des charges est preacute-senteacute dans la section 22 Le protocole drsquoeacutetude est deacutecrit dans la section 23 Les reacutesultatsobtenus pour La Reacuteunion suivis de ceux des icircles de lrsquoOceacutean Indien sont preacutesenteacutes dansla section 24

39

21 Objectifs

En 2012 [Anelli2012] a reacutealiseacute une campagne de mesure des deacutelais depuis La Reacuteunionet Paris Cette campagne de meacutetrologie active baseacutee sur la commande ping a pour ob-jectif de deacutemontrer la diffeacuterence de deacutelai et de deacutebit entre La Reacuteunion et Paris Le premierobjectif de nos travaux consiste agrave la mise jour des donneacutees par une nouvelle eacutetude desdeacutelais Nous ferons par la suite reacutefeacuterence agrave cet objectif par le titre Evolution

Le second objectif est lrsquoanalyse de la connectiviteacute Internet de La Reacuteunion Pour arri-ver agrave obtenir une analyse preacutecise de la connectiviteacute Internet reacuteunionnaise une eacutetude surles routes emprunteacutees par les paquets IP en provenance et agrave destination de La Reacuteunionsera reacutealiseacutee Pour cela on utilisera un outil de type traceroute On utilisera les donneacuteesreacutecolteacutees pour lrsquoidentification des portes de lrsquoInternet reacuteunionnais La reacutefeacuterence utiliseacuteepour cet objectif dans le suite du manuscrit est Connectiviteacute

Ayant cibleacute les meacutetriques nous avons fait le choix de la meacutethode research-driven Cettemeacutethode preacutesenteacutee dans la section 121 a lrsquoavantage de se concentrer uniquement surdes meacutetriques deacutecideacutees preacutealablement Dans le cas de notre eacutetude ce sont les deacutelais et lesroutes

22 Cahier des charges

Deux paramegravetres doivent ecirctre pris en consideacuteration lors de la reacutedaction du cahier descharges lrsquooutil de mesure et lrsquooutil drsquoanalyse

221 Evolution

Pour reacutepondre agrave lrsquoobjectif nous allons effectuer une reprise de lrsquoexistant Lrsquooutil demesure sera la commande ping associeacutee agrave la plate-forme Planet-Lab [PlanetLabEurope]Lrsquooutil drsquoanalyse sera identique agrave celui utiliseacute par [Anelli2012]

222 Connectiviteacute

Identification des besoins

Dans le tableau 14 nous avons vu que diffeacuterents outils sont capables de mesurer lesroutes et les deacutelais Lrsquooutil retenu devra limiter les erreurs lieacutees aux meacutecanismes de lrsquoeacutequi-librage de charge et de MPLS Cet outil devra reacutealiser des mesures depuis des nœudsreacutepartis sur lrsquoensemble de lrsquoicircle Pour cela il est neacutecessaire drsquoeffectuer un choix de plate-forme de meacutetrologie active Ce choix se fera sur 2 points la distribution geacuteographiquedes nœuds de mesure et la couverture des diffeacuterents fournisseurs drsquoaccegraves internet

Lrsquooutil drsquoanalyse devra ecirctre en capaciteacute drsquoidentifier les portes de lrsquoInternet reacuteunion-nais agrave travers la geacuteolocalisation des adresses IP drsquoidentifier les marques MPLS preacutesentesdans les donneacutees pour une meilleure compreacutehension des regravegles de routage geacuteneacuterer unecarte des relations entre pays agrave travers les eacutechanges de paquets envoyeacutes et reacutealiser desstatistiques sur les diffeacuterents nœuds emprunteacutes

Mise en œuvre drsquoune infrastructure de meacutetrologie active

Dans la section preacuteceacutedente nous avons vu que notre cahier des charges devra respec-ter 3 principaux critegraveres outil de mesure plate-forme de mesure et outil drsquoanalyse

40

Paris-traceroute

Nous avons vu dans la partie 122 que lrsquoeacutetude des routes et des deacutelais peut se faire agravelrsquoaide drsquoun seul outil traceroute Or cet outil est sujet agrave des impreacutecisions lieacutees agrave lrsquoeacutequili-brage des charges par exemple Souhaitant limiter lrsquoimpact de ces aleacuteas dans nos donneacuteesnous faisons le choix de Paris-traceroute Pour rappel une preacutesentation de lrsquooutil et deses meacutecanismes est faite agrave la section 122

La plate-forme RunPL

Les plates-formes disponibles Similairement dans la section 122 nous avons preacute-senteacute des plates-formes de meacutetrologie active La plate-forme seacutelectionneacutee devra respecterles critegraveres preacutesenteacutes preacuteceacutedemment

Parmi les plates-formes seules Atlas et Planet-Lab ont des sondes preacutesentes sur lrsquoicirclerespectivement 21 et 2 Ces sondes sont reacuteparties de maniegravere ineacutequitable sur lrsquoicircle Lareacutegion Est de lrsquoicircle ne compte qursquoune sonde quand le minimum est de 6 dans les autresreacutegions De plus certains des Fournisseurs drsquoAccegraves Internet (FAI) nrsquoheacutebergent pas de sondede mesure Le reacutesumeacute de notre comparaison est indiqueacute dans le tableau 21

TABLE 21 ndash Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet

Archipelago Atlas BISMark DASU Planet-Lab SamKnowsParis-traceroute

Oui Oui Oui Non Oui Non

Disponibiliteacutesur lrsquoicircle

Non Oui Non Non Oui Non

Couverturede lrsquoicircle

Non Oui Non Non Non Non

Reacutepartitionfournis-seurs

Non Non Non Non Non Non

On constate ainsi qursquoaucune des plates-formes preacutesenteacutees ne remplit la totaliteacute descritegraveres de seacutelection Nous avons souhaiteacute deacuteployer notre propre infrastructure Cettenouvelle plate-forme reacutepondra agrave nos critegraveres en offrant une meilleure couverture de lrsquoicirclesur les aspects geacuteographiques FAI et Technologies drsquoAccegraves agrave Internet (TAI) Lrsquoeacutechantillon depopulation est repreacutesenteacute par un ensemble drsquoeacutetudiants Notre plate-forme nous autoriseeacutegalement agrave ecirctre maicirctre de lrsquoinfrastructure de mesures que lrsquoon souhaite mettre en placeAfin de seacutelectionner les outils (physiques et logiciels) les plus adapteacutes agrave nos objectifsnous avons deacutecideacute des speacutecificiteacutes de notre plate-forme

Creacuteation et deacuteploiement de la plate-forme RunPL La plate-forme que lrsquoon souhaitedeacuteployer devra respecter un scheacutema de connectiviteacute bien preacutecis repreacutesenteacute par la figure21 La Sonde de mesure est le cœur de la plate-forme La Destination correspond agrave uneadresse IP ou un nom de domaine agrave joindre pour obtenir des informations sur les routesemprunteacutees et les deacutelais associeacutes Le Serveur de stockage est preacutesent pour deacutelester la sondede mesure LrsquoOrdinateur distant repreacutesente lrsquoadministrateur de la plate-forme Ne pouvantse deacuteplacer pour configurer la sonde un accegraves distant doit ecirctre reacutealiseacute Il est illustreacute parle train en pointilleacute sur la figure Le trait plein entre la sonde et la destination correspondagrave lrsquointeraction entre la sonde et la destination Cette interaction repreacutesente les mesuresque lrsquoon obtiendra sur les performances des liens Les sondes de mesure devront pou-voir effectuer les mesures sans limitation de destinations Elles devront afin de limiter

41

le stockage effectuer un deacutelestage des mesures collecteacutees sur un serveur de stockage Ceserveur de stockage tout comme la sonde de mesure devra pouvoir ecirctre joint par lrsquoordi-nateur distant Cette communication a un double objectif Le premier est la reacutecupeacuterationdes donneacutees pour les analyses Le second est la mise agrave jour du protocole de mesure sineacutecessaire Une interaction seacutecuriseacutee est eacutetablie entre lrsquoordinateur distant la sonde et leserveur de stockage Cette liaison est caracteacuteriseacutee par les pointilleacutes sur la figure 21

FIGURE 21 ndash Scheacutema drsquointerconnexion de la plate-forme

Les speacutecificiteacutes de notre plate-forme se deacutecomposent en deux grandes parties quesont la partie mateacuterielle et la partie systegraveme

Mateacuterielle Un cahier des charges speacutecifique agrave notre plate-forme de mesure doit ecirctrereacutealiseacute La premiegravere partie concerne le choix du mateacuteriel physique

La partie mateacuterielle de la plate-forme de mesure est formeacutee de deux composants lasonde de mesure et le serveur de stockage des donneacutees Le serveur de stockage serafourni par le Laboratoire drsquoInformatique et de Matheacutematiques (LIM) Seule la sonde de me-sure sera indiqueacutee dans le cahier des charges Le mateacuteriel seacutelectionneacute devra respecter lescritegraveres preacutecis Ces critegraveres ont eacuteteacute deacutecideacutes en eacutetudiant les solutions proposeacutees par lesplates-formes preacuteceacutedemment eacutetudieacutees

mdash Peu encombrant de nombreuses sondes proposeacutees par les diffeacuterentes plates-formessont tregraves discregravetes Notre sonde devra eacutegalement ecirctre peu visible Nous souhaitonsque la sonde soit directement connecteacutee sur le routeur de lrsquousager

mdash Peu coucircteux le coucirct unitaire de chaque kit ne devait pas deacutepasser 50D afin que lrsquoonpuisse avoir un nombre de nœuds conseacutequent Un kit sera composeacute de la sonde deson cacircble alimentation drsquoune carte meacutemoire et drsquoun cacircble reacuteseau

mdash Peu eacutenergivore la facture drsquoeacutelectriciteacute eacutetant agrave la charge de lrsquousager nous souhai-tions une solution agrave faible consommation drsquoeacutenergie

mdash Diversiteacute du systegraveme drsquoexploitation (OS) Le systegraveme drsquoexploitation choisi devrasupporter lrsquoinstallation de Paris-traceroute

La seconde partie du cahier des charges de notre plate-forme se concentre sur le choixdu systegraveme drsquoexploitation

Pour rappel sur la figure 21 nous avons repreacutesenteacute en pointilleacute des interactions seacute-curiseacutees Ces eacutechanges concernent lrsquoaccegraves distant agrave la sonde au serveur de stockage et agravela sauvegarde des donneacutees de mesures sur le serveur Le systegraveme drsquoexploitation devracorrespondre aux critegraveres de seacutelection suivants

42

mdash Paris-traceroute Le systegraveme drsquoexploitation devra inteacutegrer Paris-traceroute dans seslibrairies drsquoinstallations ou supporter lrsquoinstallation du code source

mdash Licence GNU-GPL Des modifications du systegraveme seront potentiellement neacuteces-saires

mdash Accegraves distant Le mateacuteriel devant ecirctre geacutereacute agrave distance Un accegraves Secure SHell (SSH)devra donc ecirctre configureacute Le protocole SSH [RFC4250] fut deacuteveloppeacute pour per-mettre lrsquoaccegraves agrave distance de terminaux

mdash Transmission seacutecuriseacutee Lrsquoaccegraves au diffeacuterents composants de la plate-forme devrase faire drsquoune faccedilon seacutecuriseacutee La restriction se fera agrave travers un systegraveme drsquoidentifi-cation

Seacutelection du mateacuteriel [Maksimovic2014] reacutealise une comparaison de diffeacuterents micro-ordinateurs tels que Arduino [Arduino] BeagleBone [Beaglebone] Phidgets [Phidgets]Udoo [Udoo] et RaspberryPi [RaspberryPi] Dans ce comparatif les critegraveres utiliseacutes sontproches de ceux que lrsquoon a seacutelectionneacutes Le tableau 22 reacutesume lrsquoensemble des critegraveres deseacutelection du mateacuteriel Il provient directement de lrsquoarticle [Maksimovic2014]

TABLE 22 ndash Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

Critegraveres Arduino BeagleBone Phidegts Raspberry Pi UdooEncombrement(en mm)

7553 863533 813533 8565398 11085

Coucirct (en $ parnœud

30 45 50-200 25-35 99-135

Eacutenergie (en V) 7-12 5 6-15 5 6-15

Systegraveme

drsquoexploitation

Linux ang-strom

Linux

RaspbianUbuntuAndroidArchLinuxFreeBSDFedoraRISC OS

UbuntuAn-droidLinuxArchLi-nux

Nous avons mis en eacutevidence les valeurs respectant les critegraveres Nous faisons le choixdu Raspberry Pi car il possegravede le plus de critegraveres respecteacutes

Seacutelection du systegraveme drsquoexploitation Le premier critegravere de seacutelection est lrsquoinstalla-tion de Paris-traceroute Drsquoapregraves [Paris-traceroute] lrsquooutil est disponible sur les systegravemesRaspbian Ubuntu ArchLinux et FreeBSDConcernant les licences lrsquoensemble des OS ne sont pas eacutequivalents Ainsi seul RaspbianUbuntu et ArchLinux proposent une licence General Public Licence (GPL) RISC OS est as-socieacute agrave une licence proprieacutetaire Android FreeBSD et Fedora sont sous licence de logiciellibre et open source Les licences de distribution open source vont nous autoriser agrave ajou-ter modifier voire supprimer des parties du code pour qursquoil corresponde plus facilementagrave nos besoinsDe nombreux OS proposent nativement la version cliente du protocole SSH La versionserveur peut ecirctre activeacutee lors de lrsquoinstallation du systegraveme drsquoexploitation Lrsquoaccegraves distantnous permettra eacutegalement la mise agrave jour des outils et des OS pour des raisons de seacutecu-riteacuteLa seacutecurisation des eacutechanges se fera au travers drsquoun Virtal Private Network (VPN) Un

43

VPN est un systegraveme permettant de creacuteer un lien direct entre des ordinateurs distants[Coonjah2015] reacutealise une comparaison entre deux outils permettant la creacuteation de VPNOpenSSH et OpenVPN OpenSSH propose de meilleures performances qursquoOpenVPN auniveau de lrsquoutilisation de la bande passante et des temps de transferts de fichiers Malgreacutecela nous avons pris le parti drsquoutiliser OpenVPN car crsquoest un outil majoritairement uti-liseacute par les entreprises [Coonjah2015] Cet utilitaire nous propose la mise en place drsquouneconnexion seacutecuriseacutee baseacutee sur lrsquoidentification agrave travers un certificat drsquoauthentificationLe VPN permet de joindre agrave travers un adressage priveacute les diffeacuterentes sondes qui se-ront distribueacutees sur lrsquoicircle de La Reacuteunion Drsquoapregraves le site officiel drsquo[OpenVPN] lrsquooutil peutsrsquoinstaller facilement sur les distributions Rapsbian Ubuntu et Fedora

Le choix du systegraveme drsquoexploitation va deacutependre des critegraveres de seacutelection Nous reacuteca-pitulons les critegraveres preacutesenteacutes preacuteceacutedemment dans le tableau 23

TABLE 23 ndash Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur RaspberryPi

Critegraveres Raspbian Ubuntu Android ArchLinux FreeBSD Fedora RISC OSParis-traceroute

Oui Oui Non Oui Oui Non Non

Licence GPL GPL ASL GNULinux

BSD CreativeCom-mons

CastleTechno-logiesLtdLicence

Accegraves dis-tant (SSH)

Oui Oui Oui Oui Oui Oui Oui

OpenVPN Oui Oui Non Non Non Oui Non

Deux systegravemes disponibles pour Raspberry Pi reacutepondent agrave nos critegraveres Raspbian etUbuntu Nous faisons le choix du systegraveme Raspbian Cet OS est une distribution Linuxentiegraverement revue pour des performances optimales sur la carte Raspberry Pi Fortementinspireacutee par la distribution Linux Debian elle propose les mecircmes caracteacuteristiques que ladistribution dite de Bureau Les sondes nrsquoeacutetant pas eacutequipeacutees drsquoun systegraveme drsquoaffichagenous optons pour lrsquoinstallation la plus leacutegegravere possible avec uniquement les paquets neacute-cessaires agrave notre eacutetude

Lrsquooutil drsquoanalyse rTraceroute

Dans la section 21 nous avons preacutesenteacute les contraintes lieacutees agrave la seacutelection drsquoun outildrsquoanalyse des donneacutees de type traceroute Pour rappel ces contraintes sont les suivantes la geacuteolocalisation des adresses IP lrsquoidentification des liens MPLS la geacuteneacuteration drsquounecarte des liens logiques et la geacuteneacuteration drsquoun fichier comportant des statistiques sur lesdiffeacuterents nœuds rencontreacutes

Les outils disponibles Il existe diffeacuterents outils drsquoanalyse des routes que lrsquoon peut ran-ger en trois cateacutegories les geacuteneacuterateurs de donneacutees brutes les plates-formes de mesures etles outils drsquoanalyse graphiques Lrsquooutil que lrsquoon souhaite utiliser entre dans la troisiegravemecateacutegorie La litteacuterature autour drsquooutils graphiques pour lrsquoanalyse des routes nrsquoest pasaussi complegravete que lrsquoon pourrait croire

Gtrace est un outil creacuteeacute par [Periakaruppan1999] Cet outil reproduit graphiquementles reacutesultats obtenus par Traceroute Le logiciel geacutenegravere ses propres donneacutees avant de les

44

repreacutesenter sous forme graphique La geacuteolocalisation ne se fait pas sur les adresses IPmais sur le nom Domain Name System (DNS) des nœuds rencontreacutes La localisation drsquounnœud nrsquoest valideacutee qursquoapregraves croisement des informations entre les abreacuteviations des villeset aeacuteroports drsquoinformations contenues dans deux bases de donneacutees Une derniegravere veacuteri-fication est reacutealiseacutee agrave lrsquoaide de la commande nslookup Actuellement cet outil nrsquoest plusmaintenu Il nrsquoimpleacutemente pas le [RFC4950] permettant lrsquoidentification des nœuds MPLSdans les routes

[Aben2015] preacutesente un outil drsquoanalyse des routes inteacutegreacute agrave Atlas RIPE NCC Cet outildrsquoanalyse se nomme OpenIPMap Il utilise la base de donneacutees de RIPE pour effectuer lageacuteolocalisation des donneacutees Les routes sont ensuite traceacutees sur une carte interactive Lesmesures geacuteneacutereacutees par Atlas sont directement visibles et peuvent srsquointeacutegrer dans OpenIP-Map Lrsquoidentification des nœuds MPLS ainsi que la partie statistique ne sont pas inclusesdans les sorties proposeacutees par OpenIPMap

Dans [Yang2016] lrsquoauteur preacutesente un outil drsquoanalyse des routes centreacute sur le conti-nent africain African Visual Route Le design de lrsquooutil srsquoinspire largement du projetOpenIPMap [Aben2015] Lrsquooutil possegravede un deacutefaut important Il lit uniquement les fi-chiers provenant de la plate-forme Atlas

Le tableau 24 preacutesente les possibiliteacutes offertes par chaque outil preacutesenteacute preacuteceacutedem-ment

TABLE 24 ndash Fonctions disponibles dans les outils graphiques drsquoanalyse des routes

African Visual Route Gtrace OpenIPMapGeacuteolocalisation Oui Oui OuiIdentificationdes liens MPLS

Non Non Non

Cartographie Oui Oui OuiStatistiques Non Non Non

On peut constater que par rapport agrave nos besoins les outils listeacutes preacutesentent des la-cunes Les critegraveres drsquoaffichage des liens MPLS et la partie statistique sur les nœuds inter-meacutediaires nrsquoont pu ecirctre remplis Pour ces raisons nous avons deacuteveloppeacute un outil drsquoana-lyse rTraceroute

Deacuteveloppement de rTraceroute

Geacuteolocalisation Dans le cadre de nos travaux la geacuteolocalisation drsquoadresse IP consi-degravere la position geacuteographique de lrsquoadresse les informations sur le deacutetenteur de lrsquoadresseet lrsquoAutonomous System (AS) associeacutes Un AS est un ensemble drsquoeacutequipements et de reacuteseauxsous une mecircme autoriteacute rTraceroute geacuteolocalise les adresses IP rencontreacutees agrave travers unebase de donneacutees impleacutementeacutee au sein du LIM Cette base de donneacutees est remplie au furet agrave mesure que de nouvelles adresses IP sont remonteacutees par les mesures Lrsquoidentificationdes nouvelles adresses se fait par un script deacuteveloppeacute en python sous ma direction parun eacutetudiant de Licence 3eme anneacutee [LanYanFock2015] Cet outil nommeacute rgeoloc utiliseles commandes de lrsquoApplication Programming Interface (API) de RIPE NCC En interro-geant une base de donneacutees drsquoun RIR nous espeacuterons limiter les erreurs lieacutees agrave la geacuteoloca-lisation Pour nos besoins nous limitons les informations lieacutees agrave la localisation et au FAICes informations sont Pays Latitude Longitude Nom du FAI Numeacutero de lrsquoASLes informations (pays longitude latitude) seront utiliseacutees par la suite pour effectuer

45

des calculs de distance entre deux adresses IP Le nom du FAI autorise le suivi des ac-cords drsquoeacutechanges de paquets sur les routes Le numeacutero de lrsquoAS nous offre la possibiliteacutede suivre les diffeacuterents chemins emprunteacutes en termes drsquoAS diffeacuterents

rgeoloc est capable drsquoextraire les informations de deacutelais et de longueurs de routesdrsquoun fichier traceroute Il peut eacutegalement deacutecouper un fichier contenant plusieurs don-neacutees traceroute en fichier unitaire

La geacuteolocalisation des adresses associeacutees agrave lrsquoidentification des liens MPLS va aider agravela compreacutehension des routes de lrsquoInternet dans le monde

Identification des liens MPLS Paris-traceroute indique dans ses sorties les liensMPLS rencontreacutes [Augustin2007] indique que lrsquoidentification des liens se fait par la lec-ture des informations contenues dans les paquets reccedilus par lrsquooutil rTraceroute va identi-fier les marques MPLS et les repreacutesenter en un coloris diffeacuterent sur les cartes

Cartographie Lors de la geacuteolocalisation des adresses IP lrsquoinformation neacutecessaire agravela cartographie est le pays Lors de cette identification deux nouvelles informations sontassocieacutees agrave lrsquoIP Ce sont les coordonneacutees du pays pour la carte passeacutee en paramegravetre Agravepartir de ces nouvelles coordonneacutees rTraceroute va geacuteneacuterer une nouvelle carte affichantlrsquoensemble des liens logiques (entre pays) preacutesents dans les traces analyseacutees

Statistique rTraceroute geacutenegravere des statistiques sur chaque nœud rencontreacute La cleacutedrsquoidentification drsquoun nœud est son adresse IP et sa position sur la route analyseacutee Les sta-tistiques geacuteneacutereacutees sont lrsquooccurrence de la paire drsquoidentification le deacutelai minimal obtenupour joindre ce nœud agrave cette position et le pays rattacheacute agrave lrsquoadresse IP

Notre outil est actuellement disponible sur le site du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrrtraceroute [rtraceroute] Cet outil est distribueacute sous licencelibre pour une large diffusion dans la communauteacute scientifique

23 Protocole de mesure

La connectiviteacute particuliegravere de lrsquoicircle par les deux cacircbles sous-marins provoque un in-teacuterecirct de lrsquoeacutetude des routes emprunteacutees Lrsquoun des objectifs de nos mesures est drsquoeacutetudierlrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012 et 2016 Le second objec-tif est lrsquoeacutetude de la connectiviteacute en terme de routes de deacutelais et des accegraves logiques delrsquoInternet reacuteunionnais

Notre protocole de mesure se divise en 3 parties La premiegravere partie preacutesente lespoints communs entre les deux objectifs La seconde consiste agrave effectuer une comparai-son de lrsquoeacutetat actuel avec le travail effectueacute preacuteceacutedemment par [Anelli2012] Le troisiegravemepoint concerne les mesures drsquoidentification des portes de lrsquoaccegraves Internet de La Reacuteunion

231 Eacutechantillon de mesure

Lrsquoeacutechantillon drsquoadresses IP que lrsquoon va utiliser dans nos eacutetudes se doit drsquoecirctre repreacute-sentatif et preacutecis La preacutecision srsquoobtient par la taille drsquoun eacutechantillon La repreacutesentativiteacutepar le respect de la distribution des adresses IP dans lrsquoInternet

Il existe 232 adresses IPv4 avec une reacutepartition bien speacutecifique Drsquoapregraves les [RFC3232RFC5735 RFC6761] 592 708 865 adresses sont reacuteserveacutees On peut citer en exemple lesadresses de type 1921680016 Ce bloc est reacuteserveacute aux reacuteseaux priveacutes Son utilisationpreacutevue est documenteacutee dans le [RFC1918] Telles que deacutecrites dans ce standard les adresses

46

de ce bloc nrsquoapparaissent pas leacutegitimement sur lrsquoInternet publicApregraves soustraction il ne reste que 3 702 258 431 adresses agrave reacutepartir dans les diffeacuterentspays et FAI Ces IP sont distribueacutees par preacutefixes par les RIR dont RIPE NCC pour lrsquoEu-rope et AfriNIC pour le continent africain Afin drsquoavoir un eacutechantillon preacutecis nous avonsgeacuteneacutereacute aleacuteatoirement 1 000 000 drsquoadresses non reacuteserveacutees Ces adresses ont eacuteteacute testeacutees parle protocole ICMP Ce test nous assure que les adresses IP sont des adresses que nouspourrons utiliser par la suite Nous avons ainsi valideacute 84 000 adresses Neacuteanmoins nousnrsquoavons aucune garantie sur la modification des attributions des adresses IP au fil dutemps

Pour que notre jeu de destinations soit repreacutesentatif nous avons geacuteolocaliseacute les adressesvalides Nous avons regroupeacute les reacutesultats par continent pour une meilleure lisibiliteacute Lereacutesultat obtenu est illustreacute par la figure 22a

Nous pouvons constater une forte dispariteacute entre les diffeacuterents continents LrsquoOceacuteanieet lrsquoAfrique ont moins de 1 de preacutesence dans notre jeu On constate eacutegalement une fortepreacutesence drsquoadresse de type BOGONS Ces adresses font parti de blocs encore non alloueacutespar les RIR ou alors reacuteserveacutees par lrsquoInternet Assigned Numbers Authority (IANA) maispreacutesentes au sein de lrsquoInternet On peut citer lrsquoadresse 10012016100 en exemple Cetteadresse est marqueacutee comme reacuteserveacutee par lrsquoIANA par RIPE NCC Ce nombre drsquoadressesest en diminution avec lrsquoattribution des blocs restant aux diffeacuterents FAI Pour validerce reacutesultat nous lrsquoavons compareacute agrave la distribution datant de Mai 2016 du site CountryIP-Blocks 1 Le regroupement est illustreacute par la figure 22b On remarque un certain eacutequilibreentre lrsquoEurope et lrsquoAsie et une domination de lrsquoAmeacuterique du Nord

Notre reacutepartition est diffeacuterente en de trop nombreux points agrave celle de CountryIP-Blocks Les donneacutees communiqueacutees par CountryIPBlocks proviennent des RIR Cettedistribution est donc plus proche de la reacutepartition reacuteelle Crsquoest pourquoi agrave partir de notreensemble drsquoadresses initales nous seacutelectionnerons un sous ensemble en respectant la dis-tribution preacutesenteacutee par la figure 22b

232 Eacutevolution

En 2012 [Anelli2012] a effectueacute une campagne de ping depuis Paris et La ReacuteunionCette campagne reacutealiseacutee sur le FAI RENATER avait pour objectif la mise en eacutevidence dela diffeacuterence des deacutelais entre Paris et La Reacuteunion Afin drsquoeacutetudier lrsquoeacutevolution des deacutelaiset de la longueur des routes depuis lrsquoeacutetude preacuteceacutedente nous avons reacutealiseacute une nouvellecampagne de ping depuis Paris et La Reacuteunion Cette campagne a mis a contribution lesnœuds [PlanetLabEurope] de lrsquoUniversiteacute de La Reacuteunion et de lrsquoUniversiteacute Pierre et Ma-rie Curie

Agrave partir du jeu drsquoadresses preacutepareacute preacutesenteacute preacuteceacutedemment nous avons tireacute le maxi-mum drsquoadresses IP possibles tout en respectant la reacutepartition geacuteographique de la figure22b Nous avons obtenu un jeu de 40 000 adresses Nous avons fait le choix drsquoutiliserun eacutechantillon drsquoadresses diffeacuterentes par rapport agrave la premiegravere eacutetude Cette deacutecision pro-vient de notre volonteacute drsquoobtenir des donneacutees repreacutesentatives de lrsquoeacutetat actuel de lrsquoInterneten terme de reacutepartition des adresses Chaque mesure sera indeacutependante lrsquoune de lrsquoautreEn effet pour qursquoune mesure se lance il faut que la preacuteceacutedente soit finie

Lrsquoanalyse se deacuteroulera agrave lrsquoidentique de ce qui srsquoest fait pour lrsquoeacutetude preacuteceacutedente agravelrsquoexception drsquoune modification Nous y ajouterons la comparaison de la longueur desroutes Les reacutesultats associeacutes agrave cette eacutetude seront preacutesenteacutes dans la section 241

1 Source httpswww countryipblocks net

47

(a) IP seacutelectionneacutee au hasard (b) CountryIPBlocks

FIGURE 22 ndash Distribution geacuteographique des adresses IPv4 publiques

233 Connectiviteacute

La seconde eacutetude de meacutetrologie active concerne lrsquoeacutetude de la connectiviteacute de La ReacuteunionPour reacutepondre agrave notre objectif nous mettons en place deux protocoles de mesure Unprotocole eacutetudiant la connectiviteacute Depuis La Reacuteunion et un protocole dans le sens Vers LaReacuteunion

Depuis La Reacuteunion

Notre eacutetude de meacutetrologie se compose de plusieurs phases

1 la preacuteparation du jeu de destinations

2 la reacutealisation des mesures par les sondes

3 la quantification des perturbations de nos mesures sur lrsquoaccegraves des usagers

4 la collecte des reacutesultats obtenus par les sondes

5 lrsquoanalyse des reacutesultats

Preacuteparation La reacutepartition geacuteographique preacutesenteacutee dans la figure 22b ne peut pas srsquoap-pliquer agrave lrsquointeacutegraliteacute de notre ensemble de deacutepart Afin de pouvoir garder cette reacutepar-tition nous avons reacuteduit notre jeu de destinations agrave 10 000 adresses Cette reacuteduction estneacutecessaire afin que lrsquoensemble de nos mesures puissent ecirctre reacutealiseacutees en un deacutelai de 24heures Bien que le nombre drsquoadresses seacutelectionneacutees repreacutesente moins de 1 des adressesIP publiques de lrsquoInternet il est neacuteanmoins suffisant pour que notre jeu reste preacutecis

48

Reacutealisation Chaque sonde eacutetant indeacutependante lrsquoautomatisation du lancement des me-sures degraves le deacutemarrage est neacutecessaire De fait une proceacutedure a eacuteteacute implanteacutee au seinde lrsquoOS Cette proceacutedure va autoriser le deacutemarrage des mesures degraves la fin de la phasedrsquoinitialisation de lrsquoensemble des services de Raspbian La mise en place des mesures estdiviseacutee en 2 eacutetapes

La premiegravere consiste pour chaque sonde agrave creacuteer ses propres sceacutenarios de mesuresUn sceacutenario est un fichier contenant deux colonnes destination et intervalle de temps Lapremiegravere colonne contient les 10 000 adresses IP de destination La seconde colonne re-groupe des valeurs qui serviront drsquoeacutecart entre deux mesures Ces valeurs ont eacuteteacute geacuteneacutereacuteessuivant une loi exponentielle de taux 864 Ce taux provient de lrsquoeacutequation 21 ci-dessous

taux = nombre de secondes par journombre dprimeadresses IP = 8640010000 = 8 64(21)

Les valeurs obtenues seront identiques sur lrsquoensemble des sondes de mesures Chaquesceacutenario sera creacuteeacute en tirant aleacuteatoirement une adresse IP et un eacutecart Une fois que lrsquoen-semble des sceacutenarios est eacutecrit et numeacuteroteacute de 1 agrave 28 la sonde va programmeacute dans le tempslrsquoexeacutecution de la seconde eacutetape gracircce agrave la commande at

La seconde eacutetape consiste agrave lire le sceacutenario du jour et agrave joindre la destination par lrsquooutilde mesure La commande exacte exeacutecuteacutee par chaque test est

Paris-traceroute -m 255 -n -p icmp ip

Dans laquelle les options indiquent

mdash -m 255 la valeur du champ TTL du paquet est mise agrave sa valeur maximale (255)Nous faisons le choix drsquoautoriser lrsquooutil agrave essayer de joindre la destination jusqursquoagraveeacutepuisement de la valeur maximale autoriseacutee par le protocole pour identifier certainsproblegravemes de routage

mdash -n pas de reacutesolution de DNS Afin drsquooptimiser les mesures nous avons eacutelimineacute lareacutesolution des noms des routeurs Seules les adresses IP seront afficheacutees

mdash -p icmp le protocole utiliseacute pour la mesure [Wenwei2006] effectue une eacutetude com-parative entre les protocoles ICMP et TCP pour les mesures de deacutelai Ils ont montreacuteque dans certaines conditions les reacutesultats sont similaires Quand le ratio α calculeacuteentre le RTT moyen et le RTT minimal tend agrave ecirctre important (supeacuterieur agrave 20) TCPest moins stable que son concurrent Crsquoest pour cette raison que nous avons fait lechoix de lrsquoICMP

mdash ip adresse IP de destination que la commande va essayer de joindre

Veacuterification La sonde va consommer de la bande passante de chaque connexion Inter-net Lrsquoestimation du deacutebit de la mesure deacutepend du nombre moyen de paquets eacutemis parmesure et de la dureacutee moyenne drsquoune mesure Agrave lrsquoaide drsquoune peacuteriode de test nous avonspu calculer divers paramegravetres drsquoune mesure reacutealiseacutee avec Paris-traceroute Les informa-tions obtenues concernent la dureacutee drsquoune mesure et le nombre de paquets eacutechangeacutes Lesreacutesultats obtenus montrent qursquoune mesure dure en moyenne 28 secondes et se composede 54 paquets de 64 octets Une mesure geacutenegravere donc un deacutebit drsquoeacutemission de 987 bitss agravelrsquoentreacutee de lrsquointerface reacuteseau Le deacutebit geacuteneacutereacute effectif (au niveau du support) est de 1265bitss Le deacutebit geacuteneacutereacute par rapport au deacutebit drsquoaccegraves drsquoun accegraves ADSL est alors neacutegli-geable

49

Drsquoapregraves le rapport [Vergoz2013] le deacutebit montant le plus faible mesureacute est de 128 33KbsLa charge calculeacutee repreacutesente pregraves de 1 de la capaciteacute du lien drsquoaccegraves Comme il yaura en moyenne 4 mesures simultaneacutees la capaciteacute consommeacutee correspond donc agrave 4Cette situation correspond au pire cas Dans la situation courante drsquoun accegraves theacuteorique enMbits nous pouvons avancer que la sonde nrsquoaura aucun impact sensible sur la connec-tiviteacute du participant

Collecte Une phase de collecte des donneacutees de mesures est reacutealiseacutee Le but de cetteeacutetape est de libeacuterer de lrsquoespace disque sur la sonde Chaque jour agrave minuit un nouveausceacutenario est lanceacute Une fois que 7 sceacutenarios ont eacuteteacute lus la sonde va creacuteer une archive Lenom de lrsquoarchive sera composeacute de la date de creacuteation de lrsquoarchive du nom de la sonde etde la TAI Le nom propose un classement rapide des donneacutees que ccedila soit par TAI ou pardate Lrsquoarchive contiendra les mesures des 7 jours preacuteceacutedents Lrsquoarchive est envoyeacutee sur leserveur de stockage localiseacute au sein du laboratoire Une comparaison de lrsquoempreinte MD5de lrsquoarchive preacutesente sur le serveur et sur la sonde de mesure sera reacutealiseacutee Si les deuxempreintes sont identiques alors la suppression de lrsquoarchive heacutebergeacutee sur le RaspberryPi est reacutealiseacutee Le jour drsquoenvoi des donneacutees sur le serveur aucune mesure nrsquoest effectueacuteeafin de ne pas geacuteneacuterer de bruit suppleacutementaire sur le lien Le lendemain de la copiedes donneacutees la sonde va amorcer 7 nouveaux jours de mesures Un cycle de mesuresest composeacute de 7 jours de mesures conseacutecutifs et drsquoun jour drsquoenvoi des donneacutees versle serveur de stockage Ce cycle est reacutepeacuteteacute 4 fois par mois La figure 23 scheacutematise lefonctionnement drsquoune sonde de mesure sur une dureacutee de 32 jours soit 4 cycles de mesureet de collecte

La plate-forme reacutealise des mesures en continue jusqursquoagrave lrsquoarrecirct complet de lrsquoappareil demesures Nous nrsquoavons pour lrsquoinstant pas programmeacute drsquoarrecirct des mesures Dans le cadrede lrsquoanalyse reacutealiseacutee dans ce manuscrit nous avons pris un cycle complet de mesure soit32 jours Nous nrsquoeffectuons pas drsquoanalyse comparative temporelle de nos mesures

Analyse La plate-forme reacutealise les mesures par cycle de 7 jours Lrsquoanalyse des tracesreacutecolteacutees se fait en plusieurs eacutetapes Le processus drsquoanalyse commence par la deacutecoupedu fichier de donneacutees en fichiers atomiques Chaque fichier atomique contiendra uni-quement le reacutesultat drsquoune mesure Chaque fichier de donneacutees reacutecolteacutees par jour va doncecirctre deacutecouper en 10 000 fichiers atomiques Cette deacutecoupe est reacutealiseacutee par lrsquooutil rgeolocLrsquoanalyse des fichiers atomiques diffegravere selon lrsquoobjectif

Lrsquoextraction des deacutelais srsquoeffectue agrave lrsquoaide de rgeoloc Lors de lrsquoextraction les informa-tions sur les deacutelais sont accompagneacutees de la longueur du chemin et des adresses IP sourceet destination

Nous souhaitons deacuteterminer si les routes Internet provenant de La Reacuteunion sont sy-meacutetriques ou non Pour cela une eacutetude des deacutelais et des routes vers La Reacuteunion est effec-tueacutee

Vers La Reacuteunion

Les routes asymeacutetriques sont freacutequentes et principalement dues agrave des politiques deroutage et agrave lrsquoingeacutenierie de trafic Des meacutecanismes comme lrsquoeacutequilibrage de charge (load-balancing) Hot Potato Routing ou encore BGP (Border Gate Protocol) peuvent eacutegalementgeacuteneacuterer un pheacutenomegravene drsquoasymeacutetrie des liensHot Potato Routing est un pheacutenomegravene lieacute au routage sans regraveglement Le routeur transfegraverele paquet aussi vite que possible vers un routeur situeacute en aval sur la route [Feige1992Wang2018]

50

FIGURE 23 ndash Fonctionnement de la sonde

BGP est protocole de routage inter-AS deacutefini dans le [RFC1105] En fonction des informa-tions eacutechangeacutees deux paquets peuvent ne pas suivre la mecircme chemin IP mais suivre unchemin AS identique

Afin de veacuterifier la preacutesence des liens asymeacutetriques nous avons mis en place le proto-cole suivant en utilisant la plate-forme Atlas RIPE NCC [Ripe2010]

Preacuteparation Pour notre eacutetude et en accord avec les Conditions Geacuteneacuterales drsquoUtilisation(CGU) drsquoAtlas nous avons seacutelectionneacute le nombre maximal de sondes autoriseacutees soit1 000 Ces sondes serviront de sources pour nos mesures La seacutelection des sondes srsquoestfaite selon deux critegraveresLe premier est le fait que la sonde soit active En effet mecircme si la sonde nrsquoest pas joi-gnable Atlas continue drsquoindiquer la sonde dans ses donneacuteesLa seconde indication neacutecessaire agrave la seacutelection drsquoune sonde est son pays drsquoheacutebergementIl est neacutecessaire de garder la mecircme reacutepartition geacuteographique que les destinations seacutelec-tionneacutees pour lrsquoeacutetude preacuteceacutedente (voir Figure 22b)

La seacutelection des destinations srsquoest effectueacutee sur les critegraveres drsquoidentification des FAI etdes TAI disponibles sur lrsquoicircle Tout comme notre plate-forme de mesure de la section 233

51

il est pour nous important que nos destinations respectent une pariteacute sur ces critegraveres deseacutelection Afin de nous assurer que nos destinations soient physiquement heacutebergeacutees surlrsquoicircle nous avons pris la deacutecision de seacutelectionner des sondes de mesure de lrsquoeacutetude preacuteceacute-dente Lrsquoutilisation drsquoAtlas eacutetant reacutegi par un systegraveme drsquoutilisation et de creacuteation de creacuteditnous avons ducirc limiter le nombre de nos destinations agrave 10 IP publiques de la plate-formeRunPL Nous avons pleinement conscience que ce nombre nrsquoest pas forceacutement repreacute-sentatif du nombre drsquoadresse IP disponibles sur lrsquoIcircle de La Reacuteunion mais nous sommesrestreint par les CGU drsquoAtlas

Reacutealisation Atlas propose deux possibiliteacutes de programmation des sondes La premiegraveresrsquoeffectue agrave travers son interface graphique Le second choix est drsquoutiliser une API Commeil est fastidieux de programmer un nombre important de mesures agrave travers lrsquointerfacegraphique nous faisons le choix drsquoutiliser lrsquoAPI Pour effectuer 10 000 mesures par journous avons fait le choix de garder le taux de la loi exponentielle de lrsquoeacutetude preacuteceacutedentesoit 8 64 secondes Afin de limiter les pheacutenomegravenes de synchronisation le calendrier demesures a eacuteteacute geacuteneacutereacute aleacuteatoirement Nous nous sommes assureacutes que chaque sonde demesures allait effectivement joindre lrsquoensemble des destinations par jour

Veacuterification La veacuterification des perturbations se fait sur la bande passante descendanteEn effet ce sont les sondes de la plate-forme RunPL qui geacutenegraverent du trafic en continu Ilne faut pas que les mesures de la section 233 soient impacteacutees par lrsquoarriveacutee des paquetsentrants Le nombre maximal de paquets arrivant jusqursquoau routeur de lrsquoheacutebergeur estde 3 Un paquet possegravede un poids maximal de 64 octets Un poids total de 1536 bitsest envoyeacute agrave la destination Une mesure eacutetant programmeacutee toutes les 8 secondes nousutilisons cette valeur comme variable pour calculer le deacutebit Nous avons donc un deacutebitde 192 bits

Drsquoapregraves le rapport [Vergoz2013] le deacutebit descendant le plus faible mesureacute est de 1 58Mbits Notre mesure impact repreacutesente donc approximativement 0 12 de la capaciteacutedu lien Cet impact est neacutegligeable agrave un instant donneacute

Collecte La plate-forme Atlas stocke automatiquement les reacutesultats lieacutes agrave ses expeacuteri-mentations sur son propre serveur Une fois lrsquoensemble des mesures reacutealiseacutees nous avonsreacutecupeacutereacute les reacutesultats Un total de 300 000 fichiers correspondant aux 300 000 mesuresont eacuteteacute teacuteleacutechargeacutes du serveur drsquoAtlas

Analyse Cette partie de lrsquoeacutetude est fortement similaire agrave lrsquoanalyse effectueacutee pour lrsquoeacutetudedes routes et deacutelais depuis La Reacuteunion Une seule partie diffegravere En effet comme indiqueacutedans la section preacuteceacutedente chaque fichier collecteacute repreacutesente une mesure Nous nrsquoavonsdonc pas la neacutecessiteacute drsquoeffectuer une phase de deacutecoupage de nos donneacutees en fichiersatomiques

Reacutecapitulatif

Afin de pouvoir effectuer une comparaison entre les deux protocoles de mesures surlrsquoeacutetude des routes et des deacutelais associeacutes le tableau 25 reacutesume les deux protocoles sur lemois de mesure analyseacute

Nous constatons une diffeacuterence notable en terme de sources et de destinations Cettediffeacuterence impacte le nombre de fichiers atomiques que lrsquoon a obtenus Le nombre defichiers atomiques provient de la multiplication entre le nombre de sources le nombre dedestinations et le nombre de jours de mesures Cela correspond au nombre maximal de

52

TABLE 25 ndash Reacutesumeacute des caracteacuteristiques du jeu de donneacutees

Depuis VersSondes de mesures Raspberry Pi Atlas RIPE NCC

Nombres de Destinations 10 000 IP 10 raspberry-piNombres de sources 27 1 000

Nombres de jours de mesures 28 30Outil de mesure Paris-traceroute

Nombres de fichiers atomiques 7 560 000 300 000

Nombres de fichiers analyseacutes 1 015 180 38 714

fichiers que lrsquoon peut obtenir La derniegravere ligne du tableau indique le nombre de fichiersque lrsquoon a pu analyser apregraves veacuterification des mesures et nettoyage des fichiers erroneacutesCe nettoyage se fait par lrsquooutil drsquoanalyse rTraceroute Dans la section 233 nous avons puanalyser 13 43 des donneacutees De la section 233 12 91 des donneacutees ont eacuteteacute exploiteacutesNous avons dans les deux cas un taux de pertes de donneacutees important

24 Reacutesultats

Dans la suite de notre manuscrit et pour des raisons pratiques nous avons reacuteduit lenom des continents agrave deux lettres La correspondance entre lrsquoacronyme et le nom completest indiqueacutee dans le tableau 26

TABLE 26 ndash Correspondance entre acronymes et noms des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

Cette correspondance provient de lrsquoutilisation des deux premiegraveres lettres de chaquecontinent en version anglophone

241 Eacutevolution

La comparaison avec lrsquoexistant fut diviseacutee en deux Dans un premier temps nousavons compareacute les deacutelais Par la suite nous avons utiliseacute une partie des donneacutees nonencore exploiteacutees pour reacutealiser une comparaison de la longueur des routes

Distribution du RTT

Les mesures obtenues ont permis drsquoeffectuer une comparaison avec les donneacutees reacute-colteacutees en 2012 par [Anelli2012] Nous avons effectueacute une campagne de ping en 2016 afindrsquoeacutetudier lrsquoeacutevolution des deacutelais depuis Paris et La Reacuteunion La figure 24 illustre lrsquoeacutevolu-tion de la distribution du RTT en 4 ans

Entre 2012 et 2016 le jeu drsquoadresses IP de destination fut diffeacuterent En 2012 aucunereacutepartition geacuteographique ne fut eacutetablie En 2016 la distribution des adresses est cellepreacutesenteacutee dans la partie 231 Malgreacute ces diffeacuterences nous remarquons que les courbesont les mecircmes tendances en 2012 et en 2016 Des pics sont preacutesents aux environs desvaleurs 005 01 et 03 secondes pour Paris en 2012 Des pics sont identifieacutes aux valeurs02 035 et 05 secondes pour La Reacuteunion en 2012 Les pics sont preacutesents aux alentours desmecircmes valeurs sur les deux campagnes de mesure Nous eacutemettons lrsquohypothegravese que ces

53

pics correspondent aux 3 continents les plus repreacutesenteacutes dans nos eacutechantillons agrave savoirlrsquoAmeacuterique du Nord lrsquoAsie et lrsquoEurope Nous veacuterifierons cela par la suite

Malgreacute un eacutecart de 4 ans entre les deux campagnes de mesures on constate une sta-biliteacute du deacutelai minimal aux alentours de 02 secondes La stabiliteacute du deacutelai srsquoest elle ac-compagneacutee drsquoune stabiliteacute de la longueur des routes

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(a) 2012

0

0002

0004

0006

0008

001

0012

0014

0016

01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(b) 2016

FIGURE 24 ndash Comparaison des deacutelais entre Paris et La Reacuteunion

Longueur du chemin

Dans le section preacuteceacutedente nous avons constateacute que le deacutelai minimal pour quitter lrsquoicircleest resteacute stable en 4 ans Nous allons essayer de corroborer cette stabiliteacute du deacutelai par unestabiliteacute de la longueur des routes sur la mecircme peacuteriode

La longueur des routes fut obtenue par lrsquoanalyse inverse du TTL Le [RFC1700] preacute-conise une valeur de deacutepart de 64 Or le site Wikipeacutedia [WikiPing] indique que le TTLinitial peut varier Les valeurs les plus communes sont 64 128 voire 255 dans certains casNous avons donc en fonction de la valeur du TTL soustrait une valeur de deacutepart agrave la va-leur indiqueacutee pour obtenir la longueur de la route Dans les donneacutees datant de 2012 leslongueurs de certaines routes sont eacutegales agrave 127 Ne pouvant deacutecider de la valeur de TTLde deacutepart nous avons fait le choix de ne garder que les reacutesultats dont le TTL afficheacute parping est supeacuterieur ou eacutegal agrave 128 Pour les donneacutees de 2016 nous nrsquoavons pas reacutepertorieacutede valeurs comprises dans lrsquointervalle [ 120 208] De fait nous avons gardeacute lrsquoensembledes valeurs obtenues

La figure 25 illustre lrsquoeacutevolution des routes entre les deux jeux de reacutesultats En 2012la longueur des routes eacutevolue entre 10 et 40 nœuds avec un pic agrave 24 nœuds En 2016les routes ont une longueur qui varie entre 5 et 30 sauts avec un pic agrave 17 Un eacutecart de 7nœuds repreacutesenteacute sur notre figure

Les deacutelais entre La Reacuteunion et Paris sont resteacutes stables entre 2012 et 2016 Sur la mecircmepeacuteriode la longueur des routes depuis La Reacuteunion a diminueacute

242 Connectiviteacute de La Reacuteunion

La section 241 a montreacute lrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012et 2016 Malgreacute ces eacutetudes aucune caracteacuterisation de la connectiviteacute de La Reacuteunion nrsquoaeacuteteacute reacutealiseacutee Dans cette section nous allons effectuer cette caracteacuterisation en termes dedeacutelais et des routes emprunteacutees

54

FIGURE 25 ndash Eacutevolution de la longueur des routes entre 2012 et 2016

Geacuteneacuteraliteacutes

Nous avons en plus des informations sur les deacutelais et la longueur des routes desinformations sur les adresses IP rencontreacutees tout au long des mesures Ainsi nous avonsdeacutecideacute de reacutepartir notre analyse sur 4 principales meacutetriques que sont

mdash La longueur du chemin est deacutetermineacutee par le nombre de nœuds rencontreacute par Paris-traceroute

mdash Le deacutelai analyseacute est le RTT Il est associeacute agrave la destination jointe

mdash La localisation des adresses IP avant (resp apregraves) le passage par les cacircbles sous-marins quand nos donneacutees arrivent (resp quittent) agrave La Reacuteunion

mdash La distance geacuteographique correspond agrave la distance reacuteelle (en Km) entre la source etla destination Pour cela on utilise lrsquoeacutequation (22) Ils srsquoagit de lrsquoeacutequation de calculde distance entre deux points sur une sphegravere

d = arccos[cos(x)times cos(y)times cos(m)times cos(n) ++ cos(x)times sin(y)times cos(m)times sin(n) ++ sin(x)times sin(m)]times 6371 1 [km]

(22)

ougrave

mdash (xy) (mn) sont respectivement la latitude et la longitude de la source et de la des-tination (en radians)

mdash 63711 km est la reacutefeacuterence en radius de la Terre

Les coordonneacutees geacuteographiques des adresses IP ont eacuteteacute obtenues par notre outil degeacuteolocalisation Nous avons ainsi pu calculer la distance geacuteographique entre deux adressesIP Si nous prenons lrsquoexemple de la reacutepartition geacuteographique des adresses IP des sondesatlas et des destinations seacutelectionneacutees nous obtenons la figure 26 Les deux courbes sontsimilaires en terme de reacutepartition des distances La diffeacuterence des valeurs de lrsquoaxe des

55

ordonneacutees provient du nombre plus important drsquoeacutechantillons pour la figure 26a Surcette figure il est difficile de visualiser la distance des adresses relatives au continentoceacuteanique La faible eacutepaisseur de la probabiliteacute des adresses oceacuteaniques est eacutegalementpreacutesente sur la figure 26b On constate sur cette figure une preacutesence plus importantedrsquoadresses IP africaines et asiatiques

(a) Depuis (b) Vers

FIGURE 26 ndash Distribution de la distance geacuteographique par continent

La reacutepartition des adresses IP dans le monde et leur distance geacuteographique ont-ellesun impact sur la distribution des deacutelais Crsquoest agrave cette question que nous allons essayerde reacutepondre dans la section suivante

Distribution du RTT par continent

La figure 27 repreacutesente la distribution des deacutelais obtenus par nos mesures incluantla reacutepartition par continent Nous avons utiliseacute un regroupement des deacutelais par eacutecart de10 ms On constate rapidement que les deux figures nrsquoont pas la mecircme tendance Dans lasection 241 nous avions eacutemis lrsquohypothegravese que les pics preacutesents sur les courbes des deacutelaiseacutetaient associeacutes aux continents les plus preacutesents dans la geacuteolocalisation des adresses IP

La comparaison que lrsquoon peut effectuer avec les donneacutees de lrsquoexistant est celle delrsquoeacutetude Depuis Ainsi on remarque que la figure garde la mecircme forme avec la preacutesencedes 3 pics Sur la figure 27a nous pouvons identifier ces pics Ces pics repreacutesentent lrsquoEu-rope lrsquoAmeacuterique du Nord et lrsquoAsie On constate que le deacutelai minimal est stable avec unevaleur proche des 200 ms

Dans lrsquoexpeacuterimentation Vers La Reacuteunion nous constatons la preacutesence de non pas 3mais de 2 pics Le pic relatif au continent asiatique a disparu De plus les deacutelais associeacutesagrave ce continent sont moins concentreacutes Pour les autres continents la distribution des deacute-lais est relativement identique agrave lrsquoexpeacuterimentation preacuteceacutedente Nous pouvons remarquerla preacutesence de deacutelais africains vers La Reacuteunion aux alentours des 100 ms Les deacutelais de-puis lrsquoEurope sont sensiblement eacutequivalents agrave ceux de lrsquoeacutetude Depuis avec des deacutelaiscompris entre 180 et 190ms

Agrave la lecture des reacutesultats nous pouvons confirmer que lrsquohypothegravese avanceacutee preacuteceacute-demment est juste

Nous avons connaissance drsquoune relation entre la distance et le temps mis pour parcou-rir cette distance Ayant constateacute lrsquoeacutevolution des deacutelais nous allons maintenant eacutetudierlrsquoeacutevolution de la distance parcourue

56

(a) Depuis (b) Vers

FIGURE 27 ndash Distribution du RTT par continent

Longueur du chemin par continent

Nous avons pu dans la section 241 constater une diminution des routes entre 2012et 2016 Les figures 28 indiquent la reacutepartition de la longueur des routes obtenues enfonction des continents La premiegravere constatation est la forte similitude entre les deuxcourbes

Sur la figure 28a on remarque la preacutesence drsquoun pic pour une longueur de 18 nœudsCela indique que peu importe le continent de destination la probabiliteacute drsquoavoir une routedrsquoune longueur de 18 sauts est importante

Dans le sens Vers le pic est quasiment identique selon le continent de deacutepart Lavaleur geacuteneacuterale se situe agrave une valeur de 15 nœuds pour lrsquoAmeacuterique du Nord lrsquoOceacuteanieet lrsquoAmeacuterique du Sud et agrave une valeur de 16 sauts pour les autres continents

Avec un eacutecart de 2 agrave 3 sauts selon le sens on peut donc consideacuterer que la longueur duchemin reste identique pour lrsquoInternet reacuteunionnais

(a) Depuis (b) Vers

FIGURE 28 ndash Distribution de la longueur des routes par continent

Longueur du chemin et distance geacuteographique

Le premier reacutesultat analyseacute concerne la distance logique par rapport agrave la distancephysique Dans lrsquoarticle [Leguay2004] lrsquoauteur a calculeacute la moyenne des chemins dans

57

lrsquoInternet agrave partir drsquoun jeu incluant plus de 7 000 000 de donneacutees La valeur obtenue estde 15 57 sauts

Dans nos reacutesultats la valeur moyenne calculeacutee est de 17 11 eacutequipements traverseacutesavant de joindre la destination Cette valeur regroupe lrsquoensemble de nos donneacutees sansaucune distinction de la localisation de la source drsquoeacutemission En eacutetudiant uniquementles donneacutees Depuis les routes ont une longueur moyenne de 17 37 sauts Si on analysela longueur des routes des donneacutees entrant sur lrsquoicircle on obtient une moyenne de 16 85eacutequipements On observe deacutejagrave une premiegravere asymeacutetrie des routes selon que lrsquoon quitteou que lrsquoon joint lrsquoicircle de La Reacuteunion

Les figures 29a et 29b illustrent les reacutesultats obtenus Chaque figure est diviseacutee endeux On a inseacutereacute en bas de chaque figure la PDF de la longueur du chemin en fonctionde la distance entre sources et destinations Tandis qursquoen haut les aires dessineacutees parles ellipses contiennent 95 des eacutechantillons rattacheacutes agrave chaque continent Les barresdrsquoerreurs repreacutesentent quant agrave elles la moyenne et lrsquoeacutecart-type de la longueur du cheminassocieacutes agrave chaque continent

Nous remarquons que depuis La Reacuteunion la majoriteacute des distance sont situeacutees danstrois grandes reacutegions Le premier regroupement se situe entre 8 000 et 12 000 km Cebloc inclus lrsquoAsie lrsquoOceacuteanie lrsquoEurope et lrsquoAmeacuterique du sud Le second bloc comporteque lrsquoAmeacuterique du Nord et se situe au delagrave des 14 000 km Reste le cas africain Ce conti-nent est tregraves proche de La Reacuteunion Les destinations et sources africaines sont toutesinfeacuterieures agrave 10 000 km

Lrsquoanalyse geacuteneacuterale des reacutesultats obtenus montre que le nombre de sauts nrsquoest pas deacute-pendant de la distance geacuteographique Sur la figure 29a on constate des chemins aussilongs sur la boucle locale que pour joindre certaines destinations lointaines On a eacutegale-ment repreacutesenteacute sur les figures PL(d) = α times d + β qui est la fonction lineacuteaire de la lon-gueur du chemin comme fonction de la distance geacuteographique Le tableau 27 regroupeles eacutequations obtenues selon lrsquoexpeacuterimentation

TABLE 27 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

Expeacuterimentation Eacutequation PL(d)Depuis La Reacuteunion 1 58 lowast 10minus5 timesD + 16 65

Vers La Reacuteunion 7 50 lowast 10minus5 timesD + 18 32

La valeur obtenue pour α qui est le coefficient directeur de la droite possegravede unmultiplicateur eacutegal agrave 10minus5 Cette valeur indique le nombre de sauts suppleacutementaires pourchaque kilomegravetre Les valeurs de α proches de zeacutero indiquent clairement que la distancegeacuteographique nrsquoimpacte pas la longueur du chemin quelle que soit lrsquoexpeacuterimentation

Impact de la longueur du chemin sur le RTT

Les figures 210a et 210b repreacutesentent la distribution du RTT comme fonction dunombre de sauts ainsi que la meacutediane et les PDF Est eacutegalement preacutesente en bas dechacune des figures la probabiliteacute de densiteacute de la longueur du chemin

Les figures montrent une croissance du deacutelai avec lrsquoaugmentation du nombre denœuds jusqursquoagrave une certaine limite Sur la figure 210a repreacutesentant lrsquoeacutetude Depuis nousremarquons des deacutelais importants deacutepassant les 3 secondes Cette valeur des 3 secondespeut ecirctre atteinte degraves que lrsquoon deacutepasse le 9eme saut Agrave lrsquoinverse sur lrsquoeacutetude Vers illustreacuteepar la figure 210b nous constatons une certaine stabiliteacute du deacutelai Les valeurs restent

58

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 29 ndash Relation entre la longueur de la route et la distance geacuteographique

majoritairement infeacuterieures agrave 2 secondes Lrsquoeacutetude de la meacutediane nous indique des routesplus courtes lorsque lrsquoon essaye de joindre La Reacuteunion Il y a une forte variation de lameacutediane agrave la fin de la figure due au nombre drsquoeacutechantillons pour chaque valeur de lalongueur des routes Afin drsquoidentifier le deacutelai associeacute agrave chaque nouveau nœud la fonc-tion lineacuteaire D(d) = α times d + β du deacutelai comme fonction de la longueur du chemin esteacutegalement repreacutesenteacutee

Le tableau 28 indique les eacutequations obtenues lors de lrsquoanalyse des donneacuteesLa variable drsquoajustement β ne sera pas analyseacutee bien qursquoelle repreacutesente un deacutelai mi-

nimal Nous avons vu dans la partie preacuteceacutedente que ce deacutelai eacutetait eacutequivalent peu importe

59

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 210 ndash Relation entre la longueur de la route et les deacutelais

TABLE 28 ndash Formule de correacutelation du deacutelai en fonction de la longueur du chemin

Expeacuterimentation Eacutequation D(PL)Depuis La Reacuteunion 11 11times PL+ 204 92

Vers La Reacuteunion 6 22times PL+ 249 66

lrsquoexpeacuterimentation La pente de la droite repreacutesenteacutee par le coefficient α indique la valeurassocieacutee agrave chaque nouvel eacutequipement Cette valeur diffegravere fortement selon lrsquoexpeacuterimen-tation mise en place Ainsi le temps accordeacute agrave chaque eacutequipement est beaucoup pluslong lorsque nos donneacutees quittent La Reacuteunion que dans le sens inverse avec un coef-ficient proche du double Cela signifie que pour chaque saut suppleacutementaire un deacutelaiadditionnel de 6 22ms (resp 11 11ms) doit ecirctre pris en compte lorsque lrsquoon joint (resp

60

quitte) La Reacuteunion On passe quasiment du simple au double

Nous avons preacuteceacutedemment analyseacute les Cumulative Density Function (CDF) des lon-gueurs des routes logiques par continent Nous avions constateacute pour certains continentsune forte similitude entre les diffeacuterentes courbes Cette observation est de nouveau preacute-sente ici Les deux PDF sur la longueur des chemins emprunteacutes sont similaires Neacutean-moins le fait drsquoavoir un plus grand nombre drsquoeacutechantillons sur lrsquoexpeacuterimentation Depuisa permis un lissage de la courbe

Correacutelation entre deacutelai et distance geacuteographique

Dans [Krajsa2011] les auteurs se sont inteacuteresseacutes agrave lrsquoimpact de la distance sur le RTTLes reacutesultats ont eacuteteacute obtenus a partir drsquoune eacutetude de meacutetrologie active reacutealiseacutee dans despays agrave forte connectiviteacute en terme de liaisons sous-marines Les auteurs ont deacutetermineacuteune fonction lineacuteaire repreacutesenteacutee par lrsquoeacutequation suivante

y = 0 0128times x (23)

Cette eacutequation preacutedit le deacutelai en fonction drsquoune distance geacuteographique donneacutee Nousallons eacutetudier la pertinence de ce modegravele dans le cas de lrsquoicircle de La Reacuteunion On se reacutefegravereagrave ce modegravele par la notation Expected Internet RTT for a given geographical Distance (EIRD)

La figure 211 est composeacuteee de trois parties En haut nous avons repreacutesenteacute les dis-tances couvertes par chaque continent La figure 211a (resp fig 211b) graphe la fonctionExpected RTT (ER) pour le cas Depuis (resp Vers) et le modegravele EIRD Le modegravele ER(d) vientde la repreacutesentation sous forme lineacuteaire de lrsquoimpact de la distance geacuteographique sur lesdeacutelais obtenus Nous avons eacutegalement repreacutesenteacute les 5eme 10eme 25eme 75eme 90eme et95eme percentiles Les points preacutesents agrave lrsquointeacuterieur des barres drsquoerreurs indiquent le 50eme

percentile Au bas de chaque figure la PDF de la distance geacuteographique est repreacutesenteacutee

Lrsquoeacutetude de la reacutepartition de nos destinations (resp sources) pour notre eacutetude montreque les distances vont drsquoune valeur infeacuterieure agrave 10 km jusqursquoagrave pregraves de 20 000 km Nousconstatons un regroupement des continents entre 5 000 et 10 000 km pour lrsquoeacutetude DepuisLe regroupement se fait agrave une distance plus grande (comprise en 7 500 et 14 000 km)pour Vers Ces valeurs sont remarqueacutees dans la PDF de chaque eacutetude Malgreacute la preacutesenceseule du continent Nord Ameacutericain apregraves 15 000 km la densiteacute de probabiliteacute drsquoavoir unedestination prise dans cet ensemble est importante

Les figures montrent une complegravete opposition entre le modegravele EIRD et nos reacutesul-tats Afin drsquoeffectuer une meilleure comparaison nous avons traduit nos reacutesultats sousla forme ER(d) = αtimes d+ β fonction lineacuteaire du deacutelai en fonction de la distance geacuteogra-phique Une repreacutesentation graphique de ER(d) est indiqueacutee sur les figures Les eacutequa-tions obtenues sont indiqueacutees dans le tableau 29

TABLE 29 ndash Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique

Expeacuterimentation Eacutequation d(t) R2

EIRD y = 0 0128times t 0 9794

ER(d) (Depuis La Reacuteunion) y = minus62 92 lowast 10minus4 times t+ 477 6 16 80 lowast 10minus3ER(d) (Vers La Reacuteunion) y = minus29 4 lowast 10minus5 times t+ 358 1 14 81 lowast 10minus5

Les coefficients de deacutetermination (R2) entre les fonctions lineacuteaires et nos donneacutees in-diquent que nous nrsquoavons pas pu trouver de modegravele de preacutediction suffisamment preacuteciscontrairement au modegravele EIRD Nous constatons eacutegalement que les pentes de nos mo-degraveles ER(d) sont toutes deux neacutegatives Cela signifie que le deacutelai sera plus court pour

61

(a) Depuis La Reacuteunion

(b) Vers La Reacuteunion

FIGURE 211 ndash Relation entre les deacutelais et la distance geacuteographique

joindre une distance eacuteloigneacutee physiquement degraves que lrsquoon emprunte les cacircbles sous-marins La preacutesence du GIX Reunix sur lrsquoicircle permet drsquoavoir des deacutelais courts du mo-ment que lrsquoon reste sur la boucle locale Gazelle (cf section 21) Par exemple le deacutelai pourjoindre un pays europeacuteen est plus court que le deacutelai pour joindre les pays de la ZOI Cereacutesultat est contraire agrave lrsquoanalyse EIRD Il peut srsquoexpliquer en partie par le fait lrsquoeacutetude preacute-senteacute dans [Krajsa2011] est reacutealiseacutee dans des lieux ougrave la connectiviteacute (en terme de liaisonssous-marines) est importante

La partie drsquoanalyse des routes emprunteacutees va nous aider agrave valider ou infirmer lrsquohy-pothegravese suivante Les coefficients α obtenus sur nos eacutequations ER(d) proviennent du routage

Analyse des routes

Dans la section 22 nous avons montreacute lrsquoexistence de liens physiques reliant lrsquoen-semble des icircles de la ZOI Nous cherchons agrave caracteacuteriser lrsquoefficaciteacute des routes emprunteacutees

62

drsquoun point de vue geacuteographique La figure 212 repreacutesente les diffeacuterents points drsquoentreacuteeset de sorties logiques de lrsquoInternet reacuteunionnais que nous avons extraits de nos donneacutees

Des donneacutees obtenues de lrsquoeacutetude Depuis nous avons extrait le pays du premier nœudbaseacute agrave lrsquoexteacuterieur de lrsquoicircle Cette information nous permet drsquoeacutetudier les sorties logiques delrsquoInternet reacuteunionnais Le reacutesultat obtenu est indiqueacute par la figure 212a La taille du lienest proportionnelle au nombre drsquoeacutechantillons passant par ce pays Nous deacutenombrons4 sorties dont 3 en Europe Malgreacute lrsquoabsence de lien direct avec lrsquoAmeacuterique du Norddepuis La Reacuteunion nous avons identifieacute une sortie dans la moitieacute ouest des Eacutetats-UnisLes sorties physiques directes de La Reacuteunion qui sont baseacutees en Afrique Asie et sur lesicircles de la ZOI ne sont pas utiliseacutees La majoriteacute du routage de nos donneacutees avec pregraves de97 srsquoeffectue en France

Dans la figure 212b nous indiquons le dernier eacutequipement localiseacute en dehors deLa Reacuteunion pour une destination finale localiseacutee sur lrsquoicircle Ce sont les entreacutees logiquesde lrsquoInternet reacuteunionnais que nous avons pu obtenir des donneacutees provenant de lrsquoeacutetudeVers Le nombre drsquoentreacutees est double par rapport au nombre de sorties et plus reacuteparti enterme de continent Quatre continents sont directement relieacutes agrave notre icircle lrsquoAfrique lrsquoAsielrsquoEurope et lrsquoAmeacuterique du Sud Le continent europeacuteen est largement repreacutesenteacute dans nosdonneacutees avec 99 51 transitant sur ce territoire La France hexagonale capte 99 33 desdonneacutees soit la quasi-totaliteacute de nos donneacutees Nous avons tout de mecircme pu identifier desliaisons minimales avec lrsquoAfrique du Sud lrsquoInde le Sri Lanka et le Paraguay Ce dernierest le seul agrave ne pas ecirctre directement relieacute agrave lrsquoicircle par un cacircble sous-marin

Le tableau 210 reacutesume les informations contenues dans les figures 212a et 212b Leslignes sont rangeacutees par taux drsquoutilisation deacutecroissant

TABLE 210 ndash Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunionnais

Depuis La Reacuteunion Vers La Reacuteunion

France (9699) 18101 msAllemagne (1 03) 299 26 msEacutetat-Unis (1 03) 293 15 msItalie (1 03) 289 46 ms

France (9933) 18330 msAfrique du Sud (0 45) 66 42 msBelgique (0 1) 197 48 msItalie (0 04) 202 59 msSloveacutenie (0 04) 205 50msInde (0 01) 161 45 msParaguay (0 01) 454 36 msSri Lanka (0 01) 207 88 ms

La preacutesence de liens directs entre La Reacuteunion et des pays beaucoup plus eacuteloigneacutestels que les Eacutetats-Unis ou le Paraguay sans cacircbles physiques directs est symptomatiquede lrsquoabsence drsquoinformations ou drsquoerreurs de geacuteolocalisation Nous pouvons preacutesenter etexpliquer quelques points preacutesents dans nos reacutesultats

1 Les erreurs de geacuteolocalisation Les erreurs de geacuteolocalisation sont principalementdues agrave une mauvaise utilisation des blocs drsquoadresses IP par les opeacuterateurs Ils preacute-fegraverent utiliser des adresses qui leur ont deacutejagrave eacuteteacute attribueacutees que drsquoeffectuer une de-mande drsquoadresse IP aupregraves drsquoun RIR Un exemple est lrsquoadresse IP rsquo19416714221rsquoCette adresse est attribueacutee agrave lrsquoopeacuterateur franccedilais RENATER Comme RENATERpossegravede la nationaliteacute franccedilaise le pays de localisation de lrsquoadresse est rsquoFRANCErsquoOr il srsquoavegravere que cette adresse est utiliseacutee comme adresse publique de lrsquoUniversiteacutede La Reacuteunion Elle est donc localiseacutee sur lrsquoicircle Un raisonnement similaire peut srsquoef-fectuer sur les autres reacutegions drsquooutre-mer posseacutedant des relations avec lrsquoopeacuterateurRENATER Les filiales drsquoopeacuterateur meacutetropolitain comme Orange peuvent eacutegale-ment utiliser ce systegraveme sur lrsquoensemble de leur reacuteseau Pour reacutesoudre ce problegraveme

63

(a) Sorties

(b) Entreacutees

FIGURE 212 ndash Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais

nous avons effectueacute une analyse du deacutelai Si le deacutelai associeacute agrave certaines adresses IPcorrespond au deacutelai theacuteorique associeacute au continent nous avons consideacutereacute que lageacuteolocalisation est correcte Dans les cas contraires nous nrsquoavons pas la possibiliteacutedrsquoecirctre sucircrs agrave 100 de la bonne localisation

2 Les accords de peering se font dans un pays avant que le paquet nrsquoemprunte le cacircblesous-marin Lrsquoexemple illustreacute par la figure 213 montre que les eacutechanges entre deuxadresses IP srsquoeffectuent au sein drsquoun IXP Ces eacutechanges peuvent se faire entre deuxpays distants au sein drsquoun troisiegraveme pays Dans notre exemple lrsquoeacutechange entre LaReacuteunion et les USA se fait en France

3 Lrsquoencapsulation des donneacutees au sein du systegraveme MPLS geacutenegravere eacutegalement des in-coheacuterences au sein de nos analyses Lrsquoexemple que lrsquoon peut indiquer est lrsquoanalysede la mesure numeacuteroteacutee 4178740 2 chez Atlas RIPE NCC Cette trace est composeacuteede 5 sauts entre le Paraguay et La Reacuteunion avec un lien direct Or il nrsquoexiste aucuncacircble physique entre ces deux points du monde Une encapsulation au niveau In-

2 httpsatlasripenetmeasurements4178740

64

Internet InternetUtilisateur DestinationIXP (FR)

RE US

FIGURE 213 ndash Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dansun pays tiers

visible des donneacutees nrsquoindique pas le parcours preacutecis des donneacutees tel que lrsquoindiquelrsquoauteur de lrsquoarticle [Donnet2012]

Ces explications ne sont pas les seules mais potentiellement les plus freacutequemmentrencontreacutees Dans notre cas les points 2 et 3 semblent ecirctre les raisons preacutedominantesLes marques du systegraveme MPLS sont dues agrave la division de la capaciteacute des cacircbles pour lesdiffeacuterents opeacuterateurs et agrave la connexion en diffeacuterents points pour reacutegeacuteneacuterer le signal

Des reacutesultats de nos eacutetudes nous deacuteplorons lrsquoabsence de peering reacutegional Cette ano-malie est la principale cause de la tendance des courbes obtenues dans le tableau 29 Eneacutetudiant les diffeacuterents IXP nous constatons lrsquoabsence drsquoopeacuterateurs communs entre les 3icircles comme lrsquoillustre la figure 214 Ces informations proviennent directement des sitesinternet officiels des IXP [MIXP2017 MGIX2017 REUNIX2017] On peut neacuteanmoins no-ter la preacutesence des filiales de lrsquoopeacuterateur Orange agrave Madagascar et agrave La Reacuteunion Il srsquoagitdans le cas drsquoOrange Madagascar de lrsquoexploitation du nom sans ecirctre dirigeacutee par lrsquoen-treprise Orange De cette figure on peut deacuteduire que les eacutechanges drsquoinformations et dedonneacutees se font dans une reacutegion eacuteloigneacutee de la ZOI et agrave un niveau plus eacuteleveacute On peutsupposer que ce sont des Tiers-1 qui se chargent du peering de cette zone Afin de vali-der cette hypothegravese nous avons deacuteployeacute des sondes de mesures de RunPL sur les icirclesvoisines

FIGURE 214 ndash FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien

243 Connectiviteacute des icircles de la Zone Oceacutean Indien

Nous avons vu dans la section 22 que les icircles de la ZOI partagent des routes phy-siques en commun Nous avons constateacute dans la section 242 que La Reacuteunion possegravede

65

une connectiviteacute Internet particuliegravere Nous sommes donc en droit de nous demander sicette connectiviteacute est commune agrave lrsquoensemble des icircles de la ZOI ou non Nous avons pu deacute-ployer un minimum de deux sondes par pays eacutetudieacute Le protocole de mesure et drsquoanalysemis en place est en tout point identique agrave celui utiliseacute pour lrsquoeacutetude de la connectiviteacute deLa Reacuteunion Ainsi nous avons utiliseacute les mecircmes meacutetriques pour valider la comparaison

Distribution du RTT par pays eacutetudieacute

La figure 215 illustre la reacutepartition des deacutelais des icircles de la ZOI selon le pays drsquooriginedes mesures (215a) et du continent de destination (215b) Comme pour La Reacuteunion nousremarquons la preacutesence des trois pics

Drsquoapregraves la figure 215b ces pics ont la mecircme signification que dans la situation preacute-ceacutedente crsquoest-agrave-dire la preacutesence des deacutelais pour joindre lrsquoEurope lrsquoAmeacuterique du Nord etlrsquoAsie

Sur la figure 215a on remarque eacutegalement des valeurs minimales et maximales dif-feacuterentes selon le pays Ainsi les Seychelles ont les deacutelais les plus courts de la ZOI Agravelrsquoinverse crsquoest La Reacuteunion qui possegravede le plus de deacutelais au delagrave des 800 ms

Le comportement des deacutelais eacutetant communs agrave lrsquoensemble de la ZOI nous allons main-tenant eacutetudier la longueur des routes pour chaque icircle eacutetudieacutee

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 215 ndash Distribution des deacutelais des icircles de la ZOI

Longueur des routes par pays eacutetudieacute

La figure 216 repreacutesente la densiteacute de probabiliteacute de la longueur des routes En confon-dant les destinations nous pouvons eacutetudier la reacutepartition de la distance en fonction delrsquoicircle source (216a) Nous avons appliqueacute le mecircme raisonnement en meacutelangeant les icirclessources pour se concentrer sur la destination (216b) Les figures eacutetudieacutees nrsquoont pas lamecircme forme que celles uniquement deacutedieacutees agrave La Reacuteunion En effet la courbe 216 pos-segravede 2 pics

Sur la figure 216a on remarque que cette diffeacuterence est fortement accentueacutee par lapreacutesence des donneacutees reacuteunionnaises

Sur la figure 216b on voit une diffeacuterence de comportement en fonction du contientjoint Ainsi lrsquoAfrique lrsquoAsie et lrsquoEurope ont la preacutesence drsquoun seul pic Cela signifie queces continents seront majoritairement joints par des routes comprises entre 10 en 20 sautsPour les Ameacuteriques et lrsquoOceacuteanie il y a deux pics Cela sous-entend la preacutesence de deuxgrandes routes avec lrsquoune plus courte que lrsquoautre La plus petite est composeacutee de 13sauts La seconde route est quant agrave elle drsquoune longueur de 16 sauts

66

Cette diffeacuterence peut srsquoexpliquer par la preacutesence de routes emprunteacutees diffeacuterentes enfonction des pays de destinations Pour corroborer cela nous allons poursuivre lrsquoeacutetudeen fonction des meacutetriques preacutesenteacutees dans la section 242

0

003

006

009

012

0 5 10 15 20 25 30 35 40

P [

X=

x]

Longueur du chemin (en noeuds)

Mayotte

Seychelles

Reunion

Maurice

Madagascar

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 216 ndash Longueur des routes emprunteacutees

Longueur du chemin et distance geacuteographique

Dans cette section on va eacutetudier la relation entre la longueur du chemin et la distancegeacuteographique On a vu agrave travers le reacutesultat preacuteceacutedent que le choix du continent avaitun impact sur la longueur du chemin Pour plus de lisibiliteacute nous avons repreacutesenteacute lesreacutesultats sous la forme drsquoeacutequations lineacuteaires repreacutesenteacutes par lrsquoeacutequation 24

PL(d) = αtimes d+ β (24)

Les eacutequations obtenues sont indiqueacutees dans le tableau 211 et repreacutesenteacutees graphique-ment par la figure 217

TABLE 211 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation PL(d)Madagascar y = minus0 000303631times d+ 26 1771

Maurice y = minus0 000183807times d+ 18 4231

Reacuteunion y = minus9 18819 lowast 10minus5 times d+ 17 1201

Seychelles y = minus0 000183362times d+ 18 9892

Mayotte y = minus7 15288 lowast 10minus5 times d+ 18 4781

Nous pouvons seacuteparer nos reacutesultats en 3 groupes Drsquoun cocircteacute les deacutepartements fran-ccedilais avec La Reacuteunion et Mayotte Dans un second groupe lrsquoicircle Maurice et les SeychellesEt dans un troisiegraveme groupe Madagascar Les reacutesultats de La Reacuteunion et de Mayotte sontsimilaires La pente α est quasi-nulle et lrsquoeacutecart sur le coefficient β est de 1 saut Ce reacutesul-tat est similaire agrave celui obtenu preacuteceacutedemment Maurice et les Seychelles ont eacutegalementdes coefficients proches Les pentes sont leacutegegraverement neacutegatives Cela implique une petitedeacutependance du nombre de sauts en fonction de la distance geacuteographique Le cas le plusinteacuteressant est Madagascar Nous allons nous inteacuteresser plus en deacutetail agrave son comporte-ment

Madagascar possegravede les coefficients α et β les plus eacuteleveacutes Cela signifie que le payspossegravede une route minimale plus longue que les autres icircles Son coefficient α neacutegatif

67

10

20

30

0 5000 10000 15000 20000

Pat

h L

ength

PL

(N

um

ber

of

hops)

Distance d (Km)

MGMURESCYT

FIGURE 217 ndash Relation entre la longueur de la route et la distance geacuteographique

est presque deux fois plus eacuteleveacute que pour Maurice et les Seychelles Lrsquoimpact de la dis-tance sur le nombre de sauts est donc plus fort La figure 218 a eacuteteacute reacutealiseacutee selon le mecircmescheacutema que les figures 28 La repreacutesentation de la PDF de la distance des destinations parrapport aux sondes deacuteployeacutees agrave Madagascar montre deux grands groupes Le premiersitueacute entre 5 000 et 10 000 kilomegravetres Ce groupe regroupe Asie Europe Oceacuteanie et Ameacute-rique du Sud Le second groupe eacutevoluant aux alentours des 15 000 kilomegravetres englobe latotaliteacute des adresses IP geacuteolocaliseacutees en Ameacuterique du Nord Le nombre drsquoadresses prove-nant du continent africain est compris entre 0 et 10 000 La pente neacutegative suggegravere doncque les routes vers les continents eacuteloigneacutes sont plus courtes que les routes vers des desti-nations proches geacuteographiquement Neacuteanmoins la lecture des cercles montre des routesglobalement aussi longues quel que soit le continent

Impact de la longueur du chemin sur le RTT

Tout comme la section preacuteceacutedente nous avons repreacutesenteacute les reacutesultats sous formedrsquoeacutequations lineacuteaires Le tableau 212 regroupe les eacutequations obtenues tandis que la fi-gure 219 les repreacutesente graphiquement

TABLE 212 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation D(PL)Madagascar y = 13 5709times t+ 119 717

Maurice y = 14 296times t+ 171 69

Reacuteunion y = 14 2259times t+ 166 84

Seychelles y = 17 3953times t+ 35 3596

Mayotte y = 16 3138times t+ 90 9087

Comme on pouvait srsquoy attendre le deacutelai srsquoaccroicirct avec le nombre de sauts Les coef-ficients α obtenus sont proches les uns des autres La diffeacuterence se fait plus sur la valeurdrsquoajustement β Cette valeur correspond au deacutelai minimal Les Seychelles ont la pente

68

FIGURE 218 ndash Relation entre la longueur de la route et la distance geacuteographique pourMadagascar

la plus eacuteleveacutee et la valeur drsquoajustement la plus basse Cela signifie que malgreacute un deacute-lai minimal faible le temps mis par un paquet dans chaque routeur est plus importantque pour les autres icircles Mayotte est sensiblement dans le mecircme cas Pour Maurice et LaReacuteunion les pentes sont proches et la valeur de β eacutegalement Ces deux icircles auraient doncun comportement similaire

0

50

100

150

200

250

300

350

400

10 20 30

RT

T D

elay

(m

s)

Path Length PL (Number of hops)

MGMURESCYT

FIGURE 219 ndash Relation entre la longueur de la route et les deacutelais

69

Correacutelation entre deacutelai et distance geacuteographique

Nous avions vu que pour La Reacuteunion il y avait une incoheacuterence sur la relation entrele deacutelai et la distance geacuteographique En effet nous avions comme reacutesultat le fait que ledeacutelai deacutecroissait avec la distance Ce scheacutema se reproduit eacutegalement pour les autres icirclesde la ZOI tel qursquoillustreacute par la figure 220 Les eacutequations associeacutees agrave chaque pays sontpreacutesenteacutees dans le tableau 213

TABLE 213 ndash Formule de correacutelation de la distance geacuteographique et du RTT

icircle de deacutepart Eacutequation PL(t)Madagascar y = minus0 0053913times t+ 476 626

Maurice y = minus0 00418997times t+ 438 177

Reacuteunion y = minus0 00370839times t+ 440 249

Seychelles y = minus0 00344991times t+ 368 501

Mayotte y = minus0 0015904times t+ 397 1

On constate des pentes fortement diffeacuterentes en fonction des pays Ainsi Mayotte aune pente beaucoup plus douce que les autres icircles Malgreacute un β proche on voit que lrsquoeacutecartdes deacutelais entre La Reacuteunion et Maurice srsquoaccroicirct avec la distance La pente de Madagascarest tregraves importante Ccedila indique une forte deacutecroissance du deacutelai avec la distance Ainsi ledeacutelai pour joindre lrsquoicircle Maurice sera beaucoup plus important que pour joindre les paysdrsquoAmeacuterique du Nord

Lrsquoune des conseacutequences de ces reacutesultats est la preacutesence drsquoun deacutelai plus eacuteleveacute pourjoindre les icircles de la ZOI que pour joindre des destinations plus lointaines Et cela malgreacutedes routes toutes aussi longues Cela montre une contradiction agrave travers nos reacutesultatsPour comprendre cela il est neacutecessaire drsquoeacutetudier les portes de sorties de lrsquoInternet desicircles de la ZOI

300

350

400

450

500

0 5000 10000 15000 20000

RT

T D

elay

(m

s)

Distance d (Km)

MGMURESCYT

FIGURE 220 ndash Relation entre les deacutelais et la distance geacuteographique

Analyse des portes de sortie

Chaque icircle de la ZOI possegravede ses propres routes avec ses propres regravegles et ses propressorties Agrave la fin de la section 242 nous avons eacutemis lrsquohypothegravese suivante les eacutechanges de

70

paquets entre les FAI des icircles de la ZOI ne se font pas au sein de la ZOILa figure 221 indique le nombre de sorties que lrsquoon a pu relever durant nos mesures

(221a) et le pourcentage de leur reacutepartition geacuteographique (221b)

En analysant la figure 221b on constate que la majoriteacute des pays de sortie est situeacuteeen Europe avec 9463 On remarque lrsquoabsence de sortie au niveau Africain et drsquointer-connexion directe entre les icircles de la ZOI

Sur la figure 221a on remarque qursquoagrave lrsquoexception de Mayotte chaque pays a plus de20 sorties diffeacuterentes Pour La Reacuteunion crsquoest un reacutesultat fortement diffeacuterent de celui ob-tenu dans la section 242 Cela peut srsquoexpliquer par les mecircmes raisons que lors de lrsquoeacutetudepreacuteceacutedente pour rappel les raisons invoqueacutees sont potentiellement des erreurs de geacuteolo-calisation des accords de peering direct dans un pays tiers ou encore de lrsquoencapsulationMPLS

0

5

10

15

20

25

30

35

40

45

50

MG

MU

RE

SC YT

Num

ber

of

links

(a) Nombre de points de sorties pour chaqueicircle de la ZOI

0

20

40

60

80

100

AS

EU NA

Use

d l

inks

()

(b) En fonction du continent

FIGURE 221 ndash Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI

La figure 222 montre la reacutepartition des sorties en pourcentage selon les pays (fig222a) et les continents (222b) pour La Reacuteunion En comparaison avec les reacutesultats ob-tenus preacuteceacutedemment on constate une forte diminution du pourcentage de sorties geacuteo-localiseacutees en France hexagonale (FR) Nous sommes passeacutes de 9699 agrave une valeur de55408 Neacuteanmoins le pourcentage par continent reste extrecircmement eacuteleveacute avec 951636de sorties localiseacutees en Europe

Agrave travers lrsquoanalyse des points de sorties de lrsquoInternet des icircles de la ZOI nous validonslrsquohypothegravese preacutesenteacutee selon laquelle les accords drsquoeacutechanges entre opeacuterateurs des icircles dela ZOI se font agrave travers un Tiers-1

244 Synthegravese des reacutesultats

Lrsquoeacutetude des routes et des deacutelais meneacutee durant nos travaux de thegravese a eacuteteacute diviseacutee entrois grandes parties La premiegravere consistait agrave comparer lrsquoeacutetat actuel avec une eacutetude reacutea-liseacutee quatre ans auparavant La seconde phase de meacutetrologie active a mis en avant uneanalyse plus fine de la connectiviteacute Internet de La Reacuteunion avec lrsquoeacutetude des routes Laderniegravere partie avait pour objectif de comparer la connectiviteacute Internet de La Reacuteunionavec les autres icircles de la ZOI

La campagne de ping meneacutee agrave lrsquoUniversiteacute de La Reacuteunion au sein du LIM a montreacuteune reacuteduction de la longueur des routes depuis La Reacuteunion En deacutepit de la reacuteduction desroutes nous avons constateacute une stabiliteacute des deacutelais aux alentours des 200 ms

71

0

20

40

60

80

100

US-C

O

US

GB

FR

Use

d l

inks

()

(a) par pays

0

20

40

60

80

100

EU NA

Use

d l

inks

()

(b) par continent

FIGURE 222 ndash Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion

Notre seconde eacutetude faite agrave partir de donneacutees de type traceroute meneacutee depuis dif-feacuterents points de mesures reacutepartis sur lrsquoicircle a montreacute des reacutesultats inteacuteressants Le pre-mier reacutesultat est la correacutelation des deacutelais et de la localisation des destinations jointesdepuis lrsquoicircle de La reacuteunion Nous avions constateacute des pics sur la PDF des deacutelais Cespics correspondaient bien agrave la reacutepartition des continents dans notre jeu de destinationsLa longueur des routes est quant agrave elle moins impacteacutee par cette reacutepartition des des-tinations Nous avons tout de mecircme trouveacute une forte symeacutetrie aux courbes peu im-porte le sens de lrsquoeacutetude Agrave partir de ces donneacutees nous avons eacutetudieacute les relations sui-vantes Longueur du chemin Distance geographique Longueur du chemin RTTet RTT Distance geographique La premiegravere concordance a montreacute que la longueurdu chemin nrsquoest pas deacutependante de la distance geacuteographique La seconde correacutelation amontreacute une premiegravere asymeacutetrie des liens En effet le temps associeacute agrave chaque nœud dutrajet est tregraves diffeacuterent selon que lrsquoon quitte ou que lrsquoon essaye de joindre La Reacuteunion Ledernier rapport a mis en eacutevidence une particulariteacute de lrsquoaccegraves Internet de La Reacuteunion Agravelrsquoinverse de tout sens commun les deacutelais provenant et agrave destination de La Reacuteunion vonten deacutecroissant en fonction de la distance geacuteographique Lrsquoanalyse des routes et plus par-ticuliegraverement les points drsquoentreacutees et de sorties logiques de lrsquoInternet reacuteunionnais a permisdrsquoexpliquer ce comportement

Notre derniegravere eacutetude utilise le mecircme protocole et la mecircme plate-forme que lrsquoeacutetudepreacuteceacutedente Nous avons reacuteussi agrave distribuer des sondes sur les icircles de la ZOI Agrave traverscette eacutetude nous avons pu constater un comportement proche pour lrsquoensemble des icircleseacutetudieacutees Ainsi nous avons pu trouver des speacutecificiteacutes de lrsquoInternet de la ZOI La dis-tance geacuteographique a un impact sur la longueur de la route le deacutelai associeacute agrave chaquenœud de la route est similaire Mais surtout le deacutelai pour toute destination baseacutee agrave lrsquoex-teacuterieur drsquoune icircle est plus long pour les distances geacuteographiques courtes Ce comporte-ment srsquoexplique par une inter-connexion des FAI reacutegionaux agrave travers des Tiers-1 situeacutesmajoritairement en Europe

25 Conclusion

Dans ce chapitre nous avons eacutetudieacute la connectiviteacute de La Reacuteunion en terme de deacutelaiset de routes emprunteacutees

Lors de la premiegravere section nous avons vu que La Reacuteunion ne propose pas drsquoinfra-structure permettant la mise en place de notre eacutetude La premiegravere eacutetape fut le deacuteploie-ment de raspberry-pi sur lrsquoensemble de lrsquoicircle Ces sondes connecteacutees agrave lrsquoensemble des FAI

72

et TAI utilisent lrsquooutil Paris-traceroute pour reacutealiser des mesures de deacutelais et de routesCet outil est moins sensible au pheacutenomegravene drsquoeacutequilibrage de charges que le traceroutetraditionnel

Une fois notre plate-forme deacuteployeacutee nous avons reacutealiseacute des mesures durant plusieursmois Ces mesures actives eacutetudient la connectiviteacute depuis et vers La Reacuteunion Cette vo-lonteacute drsquoeffectuer les mesures dans les deux sens provient de la forte preacutesence de routesasymeacutetriques dans lrsquoInternet

Nos donneacutees ont montreacute que La Reacuteunion est confronteacutee agrave ce pheacutenomegravene Nous avonseffectueacute une analyse selon 4 paramegravetres le deacutelai la distance geacuteographique la longueurdu chemin et les routes emprunteacutees La litteacuterature ne proposant pas drsquooutil respectantnos critegraveres de seacutelection nous avons deacuteveloppeacute notre propre outil drsquoanalyse rTrace-route Nous avons souhaiteacute partager notre outil drsquoanalyse agrave travers une publicationDans lrsquoattente drsquoune publication scientifique un site internet deacutedieacute agrave lrsquooutil est dispo-nible [rtraceroute]

Le premier reacutesultat concerne la longueur des routes Les routes reacuteunionnaises sontplus longues que la moyenne mondiale On constate eacutegalement une diffeacuterence selon lesens de communication En eacutetudiant lrsquoimpact de la distance kilomeacutetrique sur la longueuron voit qursquoaucune correacutelation nrsquoexiste entre les deux paramegravetres Les routes Internet dela boucle locale sont aussi longues que les routes reliant des points situeacutes agrave plus de 15 000kmLorsqursquoun paquet traverse un nœud un deacutelai associeacute au traitement agrave lrsquoeacutemission et agrave lapropagation des donneacutees vers le saut suivant peut ecirctre calculeacute Cette valeur diffegravere eacutenor-meacutement selon que lrsquoon quitte ou que lrsquoon joint La Reacuteunion On a un coefficient de 1 79entre les deux valeurs Cela corrobore lrsquoasymeacutetrie des liens mais aucunement un com-portement speacutecifique agrave la connectiviteacute reacuteunionnaiseLrsquoun des reacutesultats les plus inteacuteressants concerne la relation entre la distance geacuteogra-phique et les deacutelais associeacutes Contrairement agrave ce que lrsquoon pouvait attendre la connectiviteacutereacuteunionnaise deacutecroicirct les deacutelais avec lrsquoincreacutementation de la distance lorsque le trafic em-prunte les cacircbles sous-marinsDans lrsquoanalyse des routes nous avons constateacute que lrsquointer-connexion reacutegionale se faitnon pas au sein de la ZOI mais dans une zone eacuteloigneacutee La Reacuteunion possegravede 3 sortiesphysiques que sont lrsquoAsie lrsquoAfrique et lrsquoEurope Pour autant seule la France hexagonalesemble ecirctre inteacuteressante pour les FAI locaux Plus de 97 de nos donneacutees sortent agrave traversce pays localiseacute agrave plus de 10 000 km

Nous avons confirmeacute le fait que lrsquointer-connexion se fait dans une zone eacuteloigneacutee agravetravers lrsquoeacutetude de la connectiviteacute de la ZOI Cette eacutetude a deacutemontreacute un comportementsimilaire entre La Reacuteunion et les icircles de la zone La seule diffeacuterence notable provient dunombre de portes de sorties pour les icircles Neacuteanmoins elles sont agrave une tregraves forte majoriteacutegeacuteolocaliseacutees en Europe

Le deacutelai minimal mesureacute pour La Reacuteunion et la configuration actuelle de la connec-tiviteacute Internet reacuteunionnaise peuvent avoir des conseacutequences sur les performances desprotocoles de transport comme TCP Pour veacuterifier cela une eacutetude de meacutetrologie passivea eacuteteacute reacutealiseacutee Cette eacutetude est preacutesenteacutee dans le chapitre 3

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors dela confeacuterence Asian INTernet Engineering Conference (AINTEC) en 2016 [Noordally2016]Cette publication a eacuteteacute axeacutee sur les reacutesultats reacuteunionnais Une seconde contribution deacute-dieacutee agrave la connectiviteacute des icircles de la ZOI a eacuteteacute publieacutee lors de la confeacuterence Global Informa-tion Infrastructure and Networking Symposium (GIIS) en 2017 [Nicolay2017-2]

73

74

Chapitre 3

Meacutetrologie sur le service de transportagrave La Reacuteunion

TCP est un protocole de transport dont la performance est deacutependante du RTT etdu taux de perte des segments Plus exactement ces deux paramegravetres entrent en comptepour deacuteterminer le deacutelai pris par la fenecirctre de congestion pour qursquoelle atteigne une taillequi couvre le produit deacutelai-bande passante du canal virtuel qui relie la source agrave la desti-nation Aussi TCP voit ses performances reacuteduites lorsque ce produit augmente et changede facteur drsquoeacutechelle Les reacutesultats obtenus par lrsquoeacutetude de la connectiviteacute de lrsquoicircle de LaReacuteunion ont montreacute un RTT minimal de 180 ms pour le trafic quittant lrsquoicircle de La Reacuteunion(cf tableau 210) Avec les technologies drsquoaccegraves agrave haut deacutebit il devient techniquementpossible que des connexions TCP depuis ou vers La Reacuteunion souffrent des symptocircmesque lrsquoon retrouve avec lrsquoutilisation drsquoun LFN

Dans ce chapitre nous allons eacutetudier quel peut ecirctre lrsquoimpact de la capaciteacute de stockagedes canaux de communication depuis et vers lrsquoicircle La Reacuteunion sur les performances deTCP Pour cela nous allons nous appuyer sur de la meacutetrologie passive afin de pouvoirfaire des observations sur la performance de TCP Dans ce chapitre nous preacutesentonsla meacutethode que nous avons appliqueacutee afin drsquoestimer par la meacutetrologie le service quenous obtenons agrave La Reacuteunion Lrsquoobjectif ici nrsquoest pas drsquoobtenir des reacutesultats repreacutesentatifsde lrsquoInternet applicables agrave La Reacuteunion dans sa globaliteacute mais de mener une premiegravereexpeacuterience pour valider la meacutethode et les outils que nous pourrions ensuite appliqueraupregraves des diffeacuterents opeacuterateurs locaux

Ce chapitre se compose de quatre sections La premiegravere section 31 fixe les objectifs delrsquoeacutetude de meacutetrologie Elle preacutesente les meacutetriques agrave deacuteterminer pour pouvoir atteindreces objectifs La partie 32 preacutesente la meacutethode de mise en œuvre de la plate-forme demeacutetrologie Le protocole de mesure mis en place pour la reacutealisation drsquoune eacutetude est preacute-senteacute dans la section 33 Enfin cette section est suivie par la partie 34 qui preacutesente lesreacutesultats que lrsquoon peut obtenir et lrsquointerpreacutetation qui peut en ecirctre faite

31 Objectifs

Lrsquoeacutetude des deacutelais aller-retour (RTT) et des routes Internet de lrsquoicircle de La Reacuteunion quenous avons preacutesenteacutee dans le chapitre preacuteceacutedent a mis en eacutevidence une connectiviteacute speacute-cifique Lrsquoaccegraves agrave lrsquoInternet passe principalement par la meacutetropole avec un RTT minimalde 180 ms Ce RTT multiplieacute par un deacutebit drsquoaccegraves de 1 Mbits deacutebit theacuteorique minimalproposeacute dans les diffeacuterentes offres par les FAI donne une quantiteacute de donneacutees eacutemisespar anticipation de 22 5 Ko Ce calcul prend comme hypothegravese que le goulot drsquoeacutetran-glement est le lien drsquoaccegraves de lrsquohocircte Ce produit deacutelai bande passante repreacutesente la taille

75

de la fenecirctre drsquoeacutemission agrave partir de laquelle une transmission continue de lrsquoeacutemetteur de-vient possible Avec une valeur de 22 5 Ko cela place le canal de communication de LaReacuteunion dans la cateacutegorie des reacuteseaux agrave forte capaciteacute de stockage (LFN) Dans la section21 nous avons vu que La Reacuteunion est pleinement inteacutegreacutee au plan tregraves haut deacutebit delrsquoeacutetat franccedilais Ce plan a pour objectif de deacuteployer une infrastructure de distribution enfibre optique (Fiber To The Home (FTTH)) sur lrsquoensemble du territoire franccedilais Cela aurapour conseacutequence si les deacutelais ne sont pas en diminution drsquoaugmenter la capaciteacute destockage du canal de communication

311 Les objectifs de lrsquoeacutetude

Le lien drsquoaccegraves de La Reacuteunion conduit agrave consideacuterer lrsquoInternet avec les caracteacuteristiquesdrsquoun reacuteseau agrave forte capaciteacute de stockage Ceci est ducirc agrave un deacutelai minimal eacuteleveacute Avec cedeacutelai des deacutegradations potentielles des performances de TCP sont envisageables La miseen place drsquoune eacutetude de meacutetrologie passive agrave lrsquoeacutechelle reacutegionale nrsquoa pas encore eacuteteacute reacuteali-seacutee Les opeacuterateurs ont une connaissance partielle de la situation de lrsquoicircle Afin drsquoobtenirune vision globale de lrsquousage de lrsquoInternet sur lrsquoicircle de La Reacuteunion il nous faut reacutepondreaux diffeacuterentes questions suivantes

mdash Quel est lrsquoimpact de lrsquoaugmentation de la capaciteacute de stockage sur les performancesdu protocole TCP

mdash Est-ce que lrsquoaugmentation des deacutebits theacuteoriques est reacutecupeacutereacutee dans les deacutebits me-sureacutes par TCP

Dans la section 123 nous avons preacutesenteacute lrsquoarticle [Zheleva2015] Pour rappel dans cettepublication les auteurs ont mis en avant un changement drsquoutilisation des services Internetapregraves une augmentation de la bande passante Nous allons eacutegalement reacutepondre agrave desquestions orienteacutees vers la supervision du trafic Ces questions sont les suivantes

mdash Quels sont les protocoles de transport utiliseacutes

mdash Quels sont les services les plus freacutequents

mdash Quelle est la distribution geacuteographique des services joints

Les reacuteponses agrave ces questions impliqueront lrsquoapparition drsquoautres questions

312 Les meacutetriques de lrsquoeacutetude

Le tableau 31 indique les meacutetriques que lrsquoon va eacutetudier Chaque meacutetrique eacutetudieacuteesera mise en relation avec une des questions poseacutees preacuteceacutedemment

Meacutetriques de supervision

La supervision du trafic consiste agrave analyser le flux geacuteneacuteral de paquets qui transite ausein drsquoun eacutequipement comme un routeur ou un commutateur On parle drsquoeacutetude macro-scopique telle qursquoindiqueacutee dans le rapport [Owezarski2003-1] Les informations analy-seacutees par la supervision sont geacuteneacuteralement les informations analyseacutees par un adminis-trateur Reacuteseau ou encore un FAI En reacuteponse aux questions sur la supervision nousavons seacutelectionneacute dans un premier temps lrsquoidentification des protocoles de transportLe champ protocole de lrsquoen-tecircte IP indique le protocole de niveau suivant utiliseacute dans lapartie des donneacutees du datagramme Internet [RFC760] Les valeurs des diffeacuterents proto-coles sont speacutecifieacutees en reacutefeacuterence [RFC3232 IANA-port]

76

TABLE 31 ndash Les meacutetriques de meacutetrologie passive

Meacutetriques En-tecircte Champs

Supervisiondu trafic

Caracteacuterisation des destinationsIP

Adressessources etdestinations

Protocole de transport employeacute ProtocoleService utiliseacute

TCP

Numeacutero deport

Performanceprotocolaire

Performance deTCP

Eacuteveacutenement de congestion ECNNS+ CWRNumeacutero deseacutequence

RTT TimestampPertes Numeacutero de

seacutequencedeacute-seacutequencementsRetransmissions

Deacutebits binaires

EacutecouleacuteTimestampNumeacutero deseacutequencefenecirctre

DescendantMontant

UtileCaracteacuterisationdes flots

DeacutebitDureacutee Timestamp

Longueur Nombrede paquetseacutechangeacutes

Nous avons vu preacuteceacutedemment que les services eacutevoluent dans le temps et selon lesdeacutebits [Zheleva2015] Lrsquoanalyse du champ numeacutero de port de lrsquoen-tecircte TCP aide agrave lrsquoidenti-fication du Service utiliseacute Chaque numeacutero de port est associeacute agrave un service preacutecis deacutefinidans le [RFC776]

En regravegle geacuteneacuterale le trafic Internet est diviseacute en trois cateacutegories en fonction de ladestination par rapport agrave la source Crsquoest le groupe de travail 802 de lrsquoIETF qui est encharge des caracteacuterisations

mdash Local Area Network (LAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir une zonede quelques kilomegravetres carreacutes ou moins Parce que le reacuteseau est connu pour necouvrir qursquoune petite zone des optimisations peuvent ecirctre faites dans les protocolesde signal de reacuteseau qui permettent des deacutebits de donneacutees jusqursquoagrave 100 Mbits raquo[RFC1983]

mdash Metropolitan Area Network (MAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir unezone proche de celle drsquoune grande ville Ces reacuteseaux sont mis en œuvre par destechniques innovantes comme le passage de cacircbles agrave fibres optiques dans les tun-nels du meacutetro raquo [RFC1983]

mdash Wide Area Network (WAN) laquo Un reacuteseau geacuteneacuteralement construit avec des lignesseacuteries qui couvrent une large zone geacuteographique raquo [RFC1983]

La reacutepartition des adresses IP de destination va permettre drsquoidentifier le pays ougrave se si-tue lrsquoinformation Cette information peut permettre de connaicirctre la pertinence du lieudrsquoheacutebergement de lrsquoinformation par rapport au service et agrave lrsquoapplication utiliseacutee Nousutilisons pour cela la base de donneacutees associeacutee agrave lrsquooutil rTraceroute outil drsquoanalyse gra-phique des traces preacutesenteacute dans la section 222 Dans le cas ougrave une adresse IP nrsquoest pas

77

reacutepertorieacutee dans notre base de donneacutees lrsquoinformation sera extraite de la base de donneacuteesde RIPE NCC avec lrsquooutil rgeoloc [LanYanFock2015]

Meacutetriques de performance

Le groupe de travail IPPM de lrsquoIETF a deacutefini dans diffeacuterents documents des meacutetriquesde bases comme la mesure de connectiviteacute [RFC2678] le deacutelai unidirectionnel [RFC2679]le taux de perte unidirectionnel [RFC2680] Ces deux derniegraveres meacutetriques sont eacutegalementdeacutefinies dans le sens aller-retour avec le [RFC2681]

Nous avons comme objectif la comparaison du deacutebit theacuteorique et le deacutebit mesureacute Lecalcul du deacutebit mesureacute par TCP se fait agrave travers 3 meacutetriques le RTT la taille de la fe-necirctre drsquoeacutemission et la probabiliteacute de perte de paquets Le RTT est le deacutelai entre la misedu premier bit de la question sur le cacircble et la reacuteception du dernier bit de la reacuteponse[RFC2681] Il est calculeacute par la diffeacuterence de temps entre lrsquoeacutemission du paquet et la reacute-ception de lrsquoACK correspondant Si le RTT est trop important TCP peut consideacuterer unpaquet comme perdu

Une perte est deacutefinie comme laquo lrsquoeacutemission drsquoun paquet par la source mais non reccedilupar la destination raquo [RFC2680] Si le paquet est perdu alors TCP va reacuteduire la fenecirctredrsquoeacutemission

La fenecirctre drsquoeacutemission est calculeacutee agrave partir du champ Fenecirctre des segments TCP Cechamp est deacutefini dans le [RFC6528] comme le nombre drsquooctets de donneacutees commenccedilantpar celui indiqueacute dans le champ drsquoaccuseacute de reacuteception que lrsquoexpeacutediteur de ce segment estprecirct agrave accepter

Agrave lrsquoaide de la formule indiqueacutee par lrsquoeacutequation 31 il est possible de calculer le deacutebitmesureacute par TCP

Debit =FenetreRTTradic

Probabilite perte(31)

Les deacutebits mesureacutes pourront ecirctre classeacutes selon qursquoils soient montants descendantsconfondus ou utiles Cette diffeacuterenciation srsquoexplique par le fait que la comparaison avecle deacutebit theacuteorique est montant et descendant Le deacutebit eacutecouleacute (throughput) correspond laquo aunombre de paquets ou de bits par seconde raquo [RFC6201] Le deacutebit utile (goodput) corres-pond laquo au nombre de paquets ou de bits utiles (non retransmis) par seconde raquo[RFC5166]

Lrsquoeacutetude des performances du protocole TCP passe dans un premier temps par lrsquoeacutetudedes pertes et des retransmissions

Une retransmission est deacutefinie par le [RFC6298] comme eacutetant le laquo segment le plusancien qui nrsquoa pas eacuteteacute acquitteacute par le reacutecepteur TCP raquo Pour obtenir le nombre de re-transmissions on regarde les numeacuteros de seacutequences des segments TCP Si dans un flotIP un numeacutero de seacutequence apparaicirct plusieurs fois alors cela implique la retransmissiondu paquet Les retransmissions seront seacutepareacutees selon la raison de la retransmission (fastretransmit) ou retransmissions abusives (spurious retransmit)Le [RFC5681] explique le pheacutenomegravene pouvant provoquer une retransmission par le meacute-canisme de fast retransmit La retransmission drsquoun paquet due au meacutecanisme de fast re-transmit est calculeacutee en fonction du nombre drsquoacquittements dupliqueacutes et de la diffeacuterencetemporelle entre le paquet de donneacutees observeacutees et le preacuteceacutedent acquittementLes paquets spurious retransmit sont des paquets subissant des fausses retransmissions Sile numeacutero de seacutequence du paquet attendu est infeacuterieur ou eacutegal au numeacutero drsquoacquittementdu preacuteceacutedent ACK alors le paquet observeacute est un paquet retransmis abusivement

78

Lorsque le paquet est reacute-eacutemis il va se produire du deacute-seacutequencement Le deacute-seacutequencementse deacutefinit dans le [RFC6248] laquo Lrsquoarriveacutee ordonneacutee est une proprieacuteteacute que lrsquoon trouve dansles paquets qui transitent par leur chemin ougrave le numeacutero de seacutequence des paquets aug-mente avec chaque nouvelle arriveacutee et il nrsquoy a pas de reacutegression La deacutetection du reacute-ordonnancement agrave destination est baseacutee sur lrsquoordre drsquoarriveacutee des paquets par rapport agraveune valeur de reacutefeacuterence non inverseacutee raquo

Les paquets retransmis peuvent eacutegalement servir agrave lrsquoidentification des eacuteveacutenementsde congestion Pour identifier ces eacuteveacutenements deux techniques peuvent ecirctre mises enplaceLa premiegravere consiste a eacutetudier la preacutesence des drapeaux ECN et Congestion Window Re-duce (CWR) dans les en-tecirctes des paquets TCP [RFC8311]La seconde technique se propose drsquoeacutetudier les variations de la fenecirctre drsquoeacutemission de TCPCette eacutetude doit ecirctre coupleacutee avec lrsquoanalyse des pheacutenomegravenes de pertes et de retransmis-sion autour de cet eacuteveacutenement

Dans la section 112 nous avons constateacute que la capaciteacute de stockage drsquoun lien estprobleacutematique pour les flots courts Afin de poursuivre lrsquoeacutetude de lrsquoimpact de la capa-citeacute de stockage des liens de lrsquoInternet reacuteunionnais nous allons caracteacuteriser les flux Lacaracteacuterisation drsquoun flot peut se faire selon la dureacutee (temps eacutecouleacute entre le premier etle dernier paquet) la taille (nombre de paquets eacutechangeacutes) et le ratio entre la dureacutee et lataille Drsquoapregraves les travaux reacutealiseacutes par [Lan2006] un flot se caracteacuterise par la deacutefinitionsuivante laquo a flow is an unidirectional series of IP packets with same source and destinationaddresses port numbers and protocol numbers raquo Ce qui peut se traduire par la deacutefinition sui-vante laquo un flot est une seacuterie de paquets IP avec le mecircme tuple suivant (adresse IP sourceport source adresse IP destination port destination protocole IP) raquo Dans ce cas preacutecisune connexion TCP de par son coteacute bi-directionnel est constitueacutee de deux flots

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie

La mise en place drsquoune eacutetude de meacutetrologie passive au sein du territoire reacuteunionnaissoulegraveve trois contraintes

La premiegravere est la mise en place drsquoun accord de partenariat avec un ou plusieurs FAILrsquoobjectif de ce partenariat est la mise en place drsquoun systegraveme drsquoeacutecoute et de capture dedonneacutees au sein de leur infrastructure tout en garantissant une confidentialiteacute maximaleagrave leur clients et agrave lrsquoentreprise

Une seconde contrainte est la seacutelection drsquoun outil de mesure Cet outil sera capablenon seulement drsquoeacutecouter les donneacutees circulant sur une interface mais eacutegalement de cap-turer les donneacutees sous diverses extensions

La derniegravere contrainte est lieacutee agrave la seacutelection drsquoun outil drsquoanalyse Cet outil sera ca-pable drsquoapporter un support de reacuteponses aux questions poseacutees preacuteceacutedemment Il devrareacutepondre agrave des critegraveres que lrsquoon deacutetaillera par la suite

Le trafic eacutetant variable drsquoun instant t agrave lrsquoinstant t+1 nous allons mettre en place un sys-tegraveme de capture de donneacutees Ce systegraveme permettra lrsquoanalyse a posteriori des meacutetriquesEn fonction des reacutesultats drsquoautres meacutetriques pourront ecirctre extraites des donneacutees Deplus la capture nous autorise apregraves quelques deacutemarches administratives de partagerles traces aupregraves de la communauteacute scientifique

321 Pour la capture du trafic

Nous avons vu dans le chapitre 1 que les outils neacutecessaires agrave la reacutealisation drsquoeacutetudes demeacutetrologie passive sont nombreux Notre analyse sera la plus large possible en terme de

79

meacutetriques Nous devrons en fonction des reacutesultats obtenus eacutetudier drsquoautres meacutetriquesque celles choisies en premier lieu Pour ces raisons nous faisons le choix de reacutealiser descaptures du trafic Dans la section 123 nous avons preacutesenteacute les outils disponibles pourla capture de trafic Nous allons dans un premier temps utiliser une solution logicielleDans le cas ougrave les deacutebits sur les liens seraient trop eacuteleveacutes nous basculerons alors vers unesolution mateacuterielle

322 Pour analyser les traces

De nombreux outils drsquoanalyse de traces existent dans la litteacuterature Afin drsquoen choi-sir un nous allons deacutetailler des critegraveres de seacutelection Nous preacutesenterons quelques outilsdrsquoanalyse existants en mettant en avant leurs reacuteponses aux critegraveres preacutesenteacutes Nous fini-rons par la preacutesentation drsquoun outil drsquoanalyse de traces deacuteveloppeacute au sein du LIM

Deacutefinition des critegraveres

Lrsquooutil drsquoanalyse pour la plate-forme de meacutetrologie passive devra reacutepondre aux cri-tegraveres de seacutelection suivants

1 Protection de la vie priveacutee des utilisateurs Pour respecter ce critegravere une fonctiondrsquoanonymisation des traces doit ecirctre appliqueacutee La loi Informatique et Liberteacute de1978 reacuteglemente le traitement des donneacutees personnelles [LIL1978] Une trace estune eacutecoute drsquoun trafic initieacute par un utilisateur Les donneacutees transporteacutees nrsquoont pasagrave ecirctre lues En plus des donneacutees ce sont aussi les adresses IP qui ne doivent pasapparaitre en clair

2 traiter une volumeacutetrie importante Le volume des traces eacutetant variable il est neacuteces-saire que lrsquooutil soit capable de traiter des traces de grande taille Potentiellementce sont des fichiers de traces de plusieurs dizaines de Go (Giga-octets) qui peuventecirctre ameneacutes agrave ecirctre traiteacutes

3 proposer des meacutetriques adapteacutees Pour reacutealiser une analyse approfondie il fautque la liste des meacutetriques proposeacutees par lrsquooutil drsquoanalyse soit la plus large possibleAgrave ce titre nous avons preacutesenteacute dans le tableau 31 une base de meacutetriques a analyser

Les outils drsquoanalyse disponibles

Il existe de nombreux outils drsquoanalyse de donneacutees de meacutetrologie passive Nous pro-posons une classification selon les possibiliteacutes offertes par chaque outil CAIDA pro-pose sur son site internet une partie deacutedieacutee aux diffeacuterents outils de meacutetrologie passive[CAIDA-Tools]

BRO est un outil pour la deacutetection drsquointrus sur le reacuteseau en temps-reacuteel agrave partir demeacutetrologie passive Il est preacutesenteacute pour la premiegravere fois dans lrsquoarticle [Paxson1999] Agravepartir drsquoun systegraveme de script il accepte en entreacutee des fichiers de taille importante Leprincipal deacutefaut de Bro par rapport agrave nos critegraveres de seacutelection est le non-respect de la viepriveacutee

CoralReef [Moore2001] est une suite logicielle deacuteveloppeacutee par CAIDA en 1999 Cetoutil reacutealise des analyses de donneacutees que ccedila soit en temps reacuteel ou sur des traces Le critegraverede respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pas respecteacuteLrsquooutil est plus adapteacute agrave lrsquoeacutetude des caracteacuteristique du trafic qursquoau performance de TCPAinsi les meacutetriques lieacutees agrave lrsquoeacutetude des performances ne sont pas incluses dans le code delrsquooutil

Netflow est un outil proprieacutetaire Il neacutecessite lrsquoutilisation drsquoun mateacuteriel de la marqueCISCO plus la licence du logiciel Lrsquooutil reacutealise principalement la supervision du trafic

80

transitant sur le mateacuteriel Le respect de la vie priveacutee est ici respecteacute mais les meacutetriques deperformance protocolaire ne sont pas inclues

TCPStat [Herman2001] rapporte certaines statistiques du trafic transitant agrave traversune interface reacuteseau Crsquoest un outil qui peut travailler sur un flot en temps reacuteel ou enanalysant un fichier de trace Cet outil ne permet pas lrsquoanonymisation des adresses IPPeu de meacutetriques sont ainsi renseigneacutees On pourrait obtenir les deacutebits et la volumeacutetriedes paquets IPv4 eacutechangeacutes

TCPTrace [Ostermann2000] est un logiciel qui permet le traitement de traces drsquoeacutecouteOutil tregraves complet il a deacutejagrave fait ses preuves sur drsquoautres projets de meacutetrologie passive Lecritegravere de respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pasrempli La meacutetrique de caracteacuterisation des destinations et la reacutepartition geacuteographique nesont pas incluses dans les meacutetriques proposeacutees par lrsquooutil

Tstat [Mellia2003-1] est un outil qui peut reacutealiser la collecte et lrsquoanalyse du trafic Cetteanalyse se fait sur diffeacuterents niveaux passant des paquets agrave la couche applicative Cetteanalyse reacutealise une anonymisation des adresses IP Les meacutetriques de caracteacuterisations desdestinations et de reacutepartitions geacuteographiques ne sont pas inteacutegreacutees dans lrsquooutil

Wireshark [Orebaugh2006] est un outil graphique drsquoanalyse reacuteseau tregraves reacutepandu Cetoutil permet de filtrer et drsquoanalyser des donneacutees entrantes et sortantes drsquoun point entemps reacuteel ou sur des traces collecteacutees Il autorise eacutegalement la capture et la lecture detraces Lrsquooutil preacutesente des lacunes sur les trois critegraveres preacutesenteacutes

ZOO est un outil deacuteveloppeacute dans le cadre du projet Metropolis Creacuteeacute par le Labora-toire drsquoAnalyse et drsquoArchitecture des Systegravemes (LAAS) le logiciel essaie de trouver un moyende mesurer la qualiteacute du service de trouver des paramegravetres pour deacutefinir le processus detrafic et drsquoaider agrave eacutemettre un modegravele adapteacute pour le trafic [Owezarski2004] Au niveaudes meacutetriques preacutesenteacutees ce sont principalement des statistiques et des informations desupervision qui sont disponibles Lrsquoanonymisation des adresses IP nrsquoest pas incluse dansles caracteacuteristiques de lrsquooutil

Le tableau 31 sert de base pour la reacuteponse aux critegraveres deacutedieacutes des meacutetriques Netflowpossegravede un catalogue de meacutetriques restreint agrave la supervision du trafic TCPTrace et Tstatsont des outils qui auraient pu correspondre agrave nos besoins mais les meacutetriques de caracteacute-risation des destinations et la reacutepartition geacuteographiques sont absentes Nrsquoayant pu faireun choix sur un outil pouvant reacutepondre agrave la totaliteacute des critegraveres nous nous orientons versle deacuteveloppement drsquoun analyseur de traces

Deacuteveloppement de Xanalyse

Lrsquoanalyse des traces de meacutetrologie passive peut srsquoeffectuer avec de nombreux outilsDans la section preacuteceacutedente nous avons preacutesenteacute les critegraveres de diffeacuterenciation de cesoutils Tstat et TCPTrace sont des outils tregraves complets Ces deux outils auraient pu nousconvenir Neacuteanmoins le temps de traitement des fichiers de volumeacutetrie importante estbeaucoup trop important Ducirc agrave cela nous avons pris le parti de deacutevelopper un nouveloutil drsquoanalyse de traces Xanalyse

Le premier critegravere concerne le respect de la vie priveacutee Une approche simple pouranonymiser une adresse IP est de la faire correspondre avec une adresse IP aleacuteatoireUne telle meacutethode rend la trace inutilisable dans des situations utilisant la logique desadressages IP Lrsquoanonymisation drsquoadresse est performante si elle preacuteserve le mecircme preacute-fixe Autrement dit si deux adresses IP partagent k-bits de preacutefixes leurs eacutequivalencesanonymiseacutees conserveront ces k-bits de preacutefixes en commun La meacutethode crypto-pan deacute-crite dans lrsquoarticle [Xu2002] sert de base agrave la fonction drsquoanonymisation mise en œuvreLrsquoanonymisation srsquoappliquera que lors de lrsquoaffichage des reacutesultats Nous avons besoin de

81

lrsquoadresse pour deux meacutetriques de supervision que sont la reacutepartition du trafic et la geacuteo-localisation Concernant le champ Donneacutees des paquets TCP il nrsquoest pas utiliseacute Lrsquoeacutetudene recommande que les en-tecirctes

Sur lrsquoaspect du traitement drsquoune volumeacutetrie importante Xanalyse fut deacuteveloppeacute avecla volonteacute de maximiser lrsquoutilisation des ressources de la machine hocircte Pour cela nousavons eu lrsquoideacutee drsquoutiliser la programmation parallegravele (thread) La paralleacutelisation permetlrsquoexeacutecution de plusieurs instructions simultaneacutement

Le calcul des meacutetriques fut directement reacutealiseacute en consideacuterant leurs deacutefinitions dansles diffeacuterents RFC tel que nous lrsquoavons deacutecrit dans la section 312 Une partie statistiquefut eacutegalement inteacutegreacutee agrave notre outil Des calculs de moyenne de variance et drsquoeacutecart-typefurent inteacutegreacutes Ces calculs se font agrave la toute fin du programme Durant le deacuteveloppe-ment nous avons corroboreacute lrsquoensemble de nos reacutesultats avec les reacutesultats de TCPTraceCette comparaison a eacuteteacute mise en place pour veacuterifier lrsquoexactitude de nos reacutesultats Le deacuteve-loppement de lrsquooutil fut reacutealiseacute sous ma direction dans le cadre drsquoun stage de fin drsquoeacutetudede Master 2 [Ravoavahy2017]

Pour finir nous avons reacutealiseacute une validation par comparaison entre Xanalyse et TCP-Trace Le tableau 32 montre le bilan de cette comparaison

TABLE 32 ndash Comparaison de performances

TCPTrace XanalyseTemps drsquoanalyse sur une trace de 20 Go 10 jours 7 joursTemps drsquoanalyse sur une trace de 1 Go 1 Heure 3 Min

Xanalyse se reacutevegravele ecirctre un outil beaucoup plus rapide que TCPTrace avec des reacutesul-tats identiques sur le calcul des meacutetriques Cet outil est actuellement disponible sur lesite du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrxanalyse

33 Protocole de mesure

Le protocole de mesure preacutesente les diffeacuterentes phases que lrsquoon souhaite mettre enplace durant lrsquoeacutetude Elles sont ainsi au nombre de cinq les contraintes reacuteglementairesla veacuterification des perturbations la capture du trafic la collecte et lrsquoanalyse Ce protocolefut reacutedigeacute en prenant en consideacuteration les conseils indiqueacutes dans [John2010] Dans cetarticle les auteurs deacutelivrent diffeacuterents conseils et indications baseacutes sur lrsquoexpeacuterience deplusieurs acteurs de meacutetrologie passive

Notre protocole a eacuteteacute mis en place dans le but de rassurer lrsquoensemble des acteurs Ceprotocole fut testeacute dans le cadre drsquoune eacutetude de meacutetrologie passive du LIM

Contraintes reacuteglementaires Avant toute eacutetude de meacutetrologie Internet passive au seinde lrsquoUniversiteacute de La Reacuteunion il faut obtenir lrsquoautorisation du preacutesident de lrsquoeacutetablisse-ment Le preacutesident consultera le Correspondant Informatique et Liberteacutes (CIL) et le Respon-sable Seacutecuriteacute et Systegravemes drsquoInformation (RSSI) de lrsquouniversiteacute Ces personnes deacutefiniront enfonction des objectifs de lrsquoeacutetude les limites de notre eacutetude en accord avec les lois fran-ccedilaises Les limites imposeacutees par la preacutesidence de lrsquoUniversiteacute indiqueacutees par le CIL et leRSSI furent celles autour de la vie priveacutee Agrave ce titre nous nrsquoavions pas le droit drsquoeacutetudierle trafic en temps reacuteel nrsquoy drsquoeacutetudier le champ Donneacutees des paquets TCP Nous avionseacutegalement lrsquoobligation drsquoanonymiser lrsquoensemble des adresses IP priveacutees rencontreacutees Laderniegravere obligation fut la restriction de nos eacutecoutes au LIM Ces obligations furent res-pecteacutees dans le deacuteveloppement de lrsquooutil drsquoanalyse

82

Afin de ne capturer que le trafic du Laboratoire nous avons travailleacute en collaborationavec la Direction des Services Informatiques (DSI) de lrsquoUniversiteacute Ce partenariat a pourobjectif drsquoisoler le trafic du LIM dans un Virtual Local Area Network (VLAN) speacutecifique UnVLAN est laquo un meacutecanisme par lequel les hocirctes qui reacutesident dans la mecircme infrastructurephysique commuteacutee mais des domaines de diffusion virtuelle seacutepareacutes sont adresseacutes agravepartir du mecircme sous-reacuteseau IPv4 et partagent une adresse IP de passerelle par deacutefautcommune supprimant ainsi lrsquoexigence drsquoun sous-reacuteseau IP deacutedieacute pour chaque reacuteseaulocal virtuel (Local Area Network (LAN) ou MAN) raquo [RFC3069] Les VLAN seacuteparent lesusagers selon leur autorisations et les types de connexion Par exemple un enseignant-chercheur a plus de droits qursquoun eacutetudiant Une personne connecteacutee par connexion filairea des droits diffeacuterents drsquoune personne connecteacutee par agrave un reacuteseau sans fil Le RSSI delrsquoUniversiteacute ne souhaitant pas obliger les membres du LIM agrave participer agrave cette eacutetudeune campagne de preacutevention fut organiseacutee Les personnes ayant explicitement eacutemis lesouhait de ne pas participer agrave notre eacutetude seraient de facto connecteacutees agrave un autre VLANpar la DSI Au sein du laboratoire tout le personnel a accepteacute de participer agrave notre eacutetude

Veacuterification des perturbations La figure 31 illustre lrsquointer-connectiviteacute mise en placepour lrsquoeacutecoute du LIMChaque ordinateur du laboratoire geacutenegravere un trafic Internet qui passe par le VLAN dulaboratoire Par le systegraveme de port-mirroring le routeur va creacuteer une copie des paquetstransitant par le port du VLAN laboratoire Le paquet copieacute sera alors redirigeacute vers lasonde de capture La sonde de capture aura deux interfaces reacuteseaux La premiegravere (Eth0)sera deacutedieacutee agrave la capture des paquets provenant de la technique de port-mirroring La se-conde carte reacuteseau (Eth1) servira pour lrsquoaccegraves distant agrave la sonde de captureLrsquoordinateur drsquoaccegraves possegravede une cleacute priveacutee permettant lrsquoaccegraves agrave distance agrave la sonde decapture Cette porte drsquoentreacutee seacutecuriseacutee permet une gestion agrave distance de la sonde Lestraces collecteacutees seront transfeacutereacutees sur un serveur de stockage deacutedieacute au sein du LIM Letransfert se fera agrave lrsquoaide de la commande SCP et lrsquoaccegraves seacutecuriseacute preacutesenteacute preacuteceacutedemmentLrsquoaccegraves distant et le transfert des traces font partie inteacutegrante du trafic geacuteneacutereacute par lesmembres du laboratoire Les perturbations peuvent survenir agrave deux niveaux au routeuret agrave la sonde Au niveau de la sonde drsquoeacutecoute le deacutebit affecteacute en entreacutee-sortie du VLANdu laboratoire est eacutegal agrave 1 000 Mbits Ce deacutebit est devenu freacutequent sur les cartes reacuteseauxvendues sur les ordinateurs grand public Les caracteacuteristiques de la carte reacuteseau deacutedieacuteeagrave la capture accepte un deacutebit maximum eacutegal au deacutebit du VLAN du LIM On considegraverealors que le taux de pertes occasionneacute par la carte de capture peut ecirctre neacutegligeableAu niveau du routeur la fonction port-mirroring copie lrsquointeacutegraliteacute des segments IP en-trant sur un port Le paquet original est redirigeacute vers lrsquoadresse de destination incluse dansle champ destination de lrsquoen-tecircte IP Le paquet forgeacute au sein du routeur est dirigeacute versun port deacuteclareacute lors de la programmation de lrsquoeacutequipement La fonction de port-mirroringfait partie des techniques deacuteveloppeacutees dans le but drsquoeacutetudier le comportement drsquoun reacute-seau [Zhang2007] a eacutetudieacute les deacuterives lieacutes agrave la fonction port-mirroring Cette fonctionneacutecessite la mise en meacutemoire tampon des paquets provenant du lien eacutetudieacute jusqursquoagrave ceqursquoils puissent ecirctre transmis sur le lien miroir Cette mise en meacutemoire tampon joue sur lasynchronisation des paquets entre le lien eacutetudieacute et le lien miroir Lors de la transmissiondes paquets sur le lien miroir est-ce que la transmission srsquoest faite dans lrsquoordre drsquoarriveacuteesur le port eacutetudieacute Il y a donc une question drsquoordonnancement des paquets agrave eacutetudier Lameacutemoire tampon du routeur nrsquoest pas infinie Il existe donc des cas ougrave la meacutemoire estremplie occasionnant agrave ce moment lagrave des pertes Les reacutesultats de [Zhang2007] ont misen avant une diffeacuterence de synchronisation entre les paquets du lien eacutetudieacute et les paquetsdu lien miroir La diffeacuterence de synchronisation implique eacutegalement des erreurs dans lereacute-ordonnancement des paquets Ces erreurs auront pour conseacutequences des erreurs dans

83

lrsquoanalyse des performances de TCP Pour reacutesoudre ces problegravemes les auteurs preacuteconisentlrsquousage drsquoune carte physique speacutecifique agrave lrsquoeacutetude passive comme les cartes DAG

FIGURE 31 ndash Scheacutema de distribution de la plate-forme de mesure

Capture du trafic La mise en place des mesures se fait degraves la mise sous tension de lasonde et la fin du chargement du systegraveme drsquoexploitation La capture des donneacutees auraune dureacutee comprise entre 1 et 23 heures Elle srsquoeffectue agrave lrsquoaide de la commande

tcpdump -i eth0 -w trace-$timestamptrace amp

Dans laquelle les options indiquent

mdash -i eth0 indique lrsquointerface de capture Nous avons preacutevu une seconde interfacereacuteseau pour lrsquoaccegraves distant seacutecuriseacute

mdash -w trace-$timestamptrace cette option deacutesigne le fichier drsquoeacutecriture Les fichiers sontnommeacutes par le timestamp de deacutebut

Une fois la capture finie la sonde va deacutecider du temps avant la prochaine eacutecouteCette dureacutee nrsquoexceacutedera pas 24 heures Lrsquoobjectif est drsquoavoir des mesures quotidiennesmais programmeacutees de maniegravere aleacuteatoire sur la dureacutee drsquoeacutecoute et sur lrsquoeacutecart entre deuxmesures

Le paragraphe de veacuterifications des perturbations a deacutemontreacute qursquoil est difficile demettre en place une capture de la totaliteacute des paquets Une solution de capture est lrsquoeacutechan-tillonnage Dans notre cas nous avons reacutealiseacute un eacutechantillonnage indeacutependant du contenu[RFC5475] Cet eacutechantillonnage est reacutealiseacute sans prendre en consideacuteration le contenu dupaquet Ayant une volonteacute drsquoobtenir un grand nombre de donneacutees nous avons mis enplace une dureacutee de capture maximale de 23 heures et un eacutecart entre deux captures de 24heures

Collecte Une phase de collecte des traces est reacuteguliegraverement reacutealiseacutee Lrsquoobjectif est delibeacuterer de lrsquoespace disque au niveau de la sonde de capture Lorsque la sonde a fini dereacutealiser sa capture elle va envoyer le fichier de capture vers un serveur de stockage ausein du LIM Nous avons vu que le fichier de capture est nommeacute selon une nomenclaturespeacutecifique Pour rappel cette nomenclature comporte la date (au format timestamp) dudeacutebut de lrsquoeacutecoute La deacutenomination du fichier autorise un classement des traces par datede capture Ce classement peut permettre une eacutetude temporelle du trafic

Lrsquoenvoi du fichier se fait agrave travers lrsquointerface eth1 La technique utiliseacutee pour le trans-fert est la commande SCP Lrsquoutilisation de lrsquoempreinte MD5 du fichier nous assure que letransfert des donneacutees srsquoest reacutealiseacute correctement En cas de diffeacuterence entre les empreintes

84

le transfert srsquoeffectue agrave nouveau Lrsquoobjectif est de veacuterifier lrsquointeacutegriteacute des donneacutees transfeacute-reacutes

Le scheacutema 32 scheacutematise le fonctionnement de notre sonde de mesure Nous consi-deacuterons que la fonction de port-mirroring est deacutejagrave programmeacutee sur le routeur DSI

Degraves que la sonde est alimenteacutee eacutelectriquement et que lrsquoOS est chargeacute la sonde vaveacuterifier qursquoune capture est programmeacutee Si aucune capture de trace nrsquoest programmeacuteela sonde va en planifier une dans les prochaines 24 heures Si la sonde a connaissancedrsquoune programmation elle va alors reacutealiser la capture La sonde va enregistrer le traficsur une dureacutee allant entre 1 et 23 heures Lorsque la capture est finie la sonde va alorsprogrammer le prochain enregistrement La sonde va eacutegalement envoyer la trace vers leserveur de stockage

Capture

Alimentation

eacutelectrique

Veacuterification

dune capture

Programmation

dune capture

Collecte

PreacutesenteAbsente

24 heures maximum

1 - 23 heures maximum

FIGURE 32 ndash Scheacutema de fonctionnement de la plateforme de mesure

Analyse Lrsquoanalyse des donneacutees obtenues se fait en deux eacutetapes La premiegravere consiste agraveutiliser lrsquooutil Xanalyse pour obtenir les reacutesultats bruts La seconde eacutetape est lrsquoextractiondes donneacutees pour les repreacutesenter sous forme graphique

34 Reacutesultats

Notre eacutetude se cantonne agrave mesurer les performances du trafic au sein du LIM Le LIMfait partie inteacutegrante de lrsquoUniversiteacute de La Reacuteunion et agrave ce titre les usages de lrsquoInternetau sein de lrsquoeacutetablissement sont reacuteglementeacutes Ainsi lrsquoeacutetude des meacutetriques de supervisionpourraient ne pas correspondre agrave un usage plus libeacuteral de lrsquoInternet Pour rappel lesmeacutetriques eacutetudieacutees sont indiqueacutees dans le tableau 31

Nous avons fait le choix de seacuteparer notre eacutetude en deux La partie supervision donneun aperccedilu de lrsquousage du reacuteseau Internet au sein du LIM Nous essaierons dans la mesuredu possible de faire des extrapolations avec lrsquousage de lrsquoInternet agrave La Reacuteunion La sectionperformance est celle qui est la plus inteacuteressante Crsquoest elle qui va nous indiquer les deacutegra-dations occasionneacutees par les longs deacutelais pour La Reacuteunion

85

341 Supervision du trafic

Le tableau 33 montre la distribution des 4 protocoles de transport rencontreacutes

TABLE 33 ndash Distribution des protocoles encapsuleacutes dans IP

Protocole ICMP IGMP TCP UDPPourcentage 572 001 9249 178

La preacutesence du protocole ICMP agrave plus de 5 srsquoexplique par la preacutesence des sondesde mesures de RunPL Pour rappel lrsquoobjectif de cette plate-forme est drsquoeacutetudier la connec-tiviteacute de La Reacuteunion et des icircles de la Zone Oceacutean Indien agrave travers de la meacutetrologie activeNous avons dans le chapitre 2 preacutesenteacute des reacutesultats lieacutes agrave ces eacutetudes Lrsquousage du pro-tocole ICMP est freacutequent au sein de lrsquoInternet Une eacutetude du trafic reacuteunionnais mettraiteacutegalement lrsquousage de ce protocole

Le protocole Internet Group Management Protocol (IGMP) deacutefini dans le [RFC3376] estun protocole utiliseacute par les systegravemes IPv4 (hocirctes et routeurs) pour signaler leur appar-tenance agrave un groupe de multidiffusion IP agrave tout routeur multicast voisin Son usage estrestreint au sein drsquoun reacuteseau priveacute

Le protocole User Datagram Protocol (UDP) a une preacutesence infeacuterieure agrave 2 Son rocircleest la transmission de donneacutees simples sans fiabiliteacute Son usage est geacuteneacuteralement li-miteacute au service DNS Reacutecemment lrsquoentreprise Google a deacuteveloppeacute lrsquooption QUIC QUICpermet au navigateur Google Chrome drsquoeffectuer des requecirctes HyperText Transfer Protocol(HTTP)HyperText Transfer Protocol Secured (HTTPS) sur le protocole UDP [Carlucci2015]a eacutetudieacute les performances de ce systegraveme Les reacutesultats obtenus ont montreacute un meilleurgoodput que TCP-CUBIC malgreacute un taux de perte plus important Lrsquousage de QUIC estlimiteacute au navigateur Google Chrome navigateur le plus reacutepandu agrave La Reacuteunion drsquoapregraves[GSCounter] Neacuteanmoins cette option est deacutesactiveacutee par deacutefaut

Les reacutesultats de TCP sont en accord avec lrsquoeacutetude reacutealiseacutee par [EQUINIX] Avec unpourcentage de 92 49 TCP est majoritaire Les services proposeacutes par TCP sont plusnombreux que ceux offerts par les autres protocoles de transport

Le tableau 34 indique les services utiliseacutes Les services ont eacuteteacute rangeacutes par pourcentagereleveacute

TABLE 34 ndash Reacutepartition des services utiliseacutes par TCP

Service SSH DNS Mail Non identi-fieacutes

Autres HTTPS HTTP

Percent 002 163 491 721 945 3297 4379

La preacutesence du service Secure SHell (SSH) srsquoexplique par les accegraves distants agrave diffeacuterentsoutils propres au laboratoire On peut citer les nœuds Planet-Lab [PlanetLab] agrave traversle monde les sondes de la plate-forme RunPL lrsquoaccegraves agrave la sonde de capture pour cetteeacutetude lrsquoaccegraves agrave des serveurs distants etc

163 des paquets eacutechangeacutes dans nos traces sont des requecirctes de DNS Ces paquetspermettent de convertir un nom de domaine en adresse IP Lrsquoutilisation du DNS avec leprotocole TCP a eacuteteacute restreint aux transferts de zone et aux reacuteponses dont la taille est tropimportante pour UDP [RFC5936 RFC6691 RFC7766]

Le service intituleacute Mail regroupe les services identifieacutes par les ports numeacuteroteacutes 25110 143 465 995 et 993 Ces ports correspondent respectivement agrave Simple Mail TransfertProtocol (SMTP) Post Office Protocol (POP) Internet Message Access Protocol (IMAP) et leursversions seacutecuriseacutees SMTPs POPs IMAPs Lrsquoutilisation de ces ports est faite par les agents

86

de messagerie comme Windows Live Mail Mozilla Thunderbird ou Mail Lrsquoeacutechange decourriel repreacutesente 4 91 des paquets eacutechangeacutes Ce pourcentage est fausseacute par lrsquoutilisa-tion des interfaces web des messageries Par exemple on peut utiliser la page web duservice de message Gmail de Google pour envoyer directement des mails Le service uti-liseacute est alors un service web HTTP ou HTTPS

Le service nommeacute Non identifieacutes est une connexion dont le numeacutero de port nrsquoest pasrattacheacute agrave un service en particulier Ce sont geacuteneacuteralement des numeacuteros supeacuterieurs agrave 1 000

La partie Autres regroupe plusieurs services Ces services sont assez divers On peutainsi y retrouver lrsquoutilisation du port numeacuteroteacute 139 correspondant agrave netbios-ssn Ce servicede NetBIOS autorise lrsquoeacutechange de message en mode connecteacute On peut eacutegalement citerlrsquousage du service Hyper Text Caching Protocol (HTCP) [RFC2756] Ce service est utiliseacutepour partager et deacutecouvrir les contenus des caches (anteacutemeacutemoires) HTTP entre serveursmandataires

Nous avons deacutecideacute de garder la seacuteparation entre les services HTTP et HTTPS HTTPSest lrsquousage de HTTP avec un chiffrement Ce chiffrement permet au visiteur de veacuterifierlrsquoidentiteacute du site web gracircce agrave un certificat Ces services sont preacute-dominants au sein duLIM

Lrsquousage de ces services peut ecirctre deacutegradeacute si lrsquoon quitte La Reacuteunion Le tableau 35 in-dique la reacutepartition du trafic selon le type drsquoadresse de destination

TABLE 35 ndash Distribution du trafic

Trafic LAN MAN WANPourcentage 2165 0 7835

La reacutepartition srsquoest faite selon la geacuteolocalisation des adresses IP Le trafic LAN cor-respond agrave des eacutechanges entre adresses priveacutees Le trafic identifieacute MAN correspond agrave deseacutechanges entre adresses geacuteolocaliseacutees agrave La Reacuteunion On constate ainsi qursquoaucune infor-mation chercheacutee par les utilisateurs nrsquoest geacuteolocaliseacutee agrave La Reacuteunion Le trafic Wide AreaNetwork (WAN) repreacutesente le trafic transitant par les cacircbles sous-marins Ce deacutecoupageest rendu possible par lrsquointer-connexion des opeacuterateurs au sein du GIX Reunix Ce deacutecou-page ne serait pas le mecircme si on eacutetudiait la totaliteacute du trafic de La Reacuteunion Ainsi onconstate qursquoil nrsquoy a aucun service dont la destination finale serait La Reacuteunion

Le tableau 37 indique la reacutepartition des destinations de type WAN Le tableau 36rappelle la correspondance entre lrsquoacronyme et le nom complet de chaque continent

TABLE 36 ndash Correspondance entre acronymes et nom des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

TABLE 37 ndash Distribution geacuteographique des destinations WAN

Continent AF AS EU NA OC SAPourcentage 019 168 4850 4867 064 032

On constate que la reacutepartition des continents est fortement ineacutegale LrsquoEurope et lrsquoAmeacute-rique du Nord concentrent plus de 97 des destinations reacuteunies Lrsquoeacutetude reacutealiseacutee par[Fanou2016] a montreacute une incoheacuterence dans lrsquoaccegraves aux contenus Les reacutesultats ont ainsiprouveacute que malgreacute la preacutesence drsquoune infrastructure web deacuteveloppeacutee sur le continent afri-cain la majoriteacute du contenu eacutetait stockeacute sur les continents europeacuteen et nord-ameacutericain

87

Dans le cadre de La Reacuteunion les regravegles de routage vues dans le chapitre preacuteceacutedent sonten coheacuterence avec la reacutepartition des continents

342 Performance de TCP

Un flot peut ecirctre caracteacuteriseacute selon sa longueur (nombre de paquets ou octets eacutechan-geacutes) sa dureacutee (dureacutee des eacutechanges entre le premier et le dernier paquet captureacute) et sonratio Chaque caracteacuterisation est associeacutee agrave deacutenomination selon que le flux est court oulong Il existe plusieurs deacutefinitions de limites de chaque caracteacuterisation Dans le tableau38 nous indiquons le nom associeacute agrave chaque flux selon sa caracteacuterisation ainsi que desexemples de limites

Pour rappel nous avons deacutefini un flot comme laquo une seacuterie de paquets IP avec le mecircmetuple suivant ldquoadresse IP source port source adresse IP destination port destinationprotocole IPrdquo raquo Dans notre eacutetude nous consideacutererons un flot TCP sans tenir compte desmeacutecanismes drsquoeacutetablissement et de fermeture de connexion Ainsi un flot pourra conteniruniquement des paquets de donneacutees et drsquoacquittement

TABLE 38 ndash Tableau de deacutenomination des flux selon [Lan2006]`````````````Meacutetrique

Taille des fluxCourts Longs limites

Longueur Souris Eacuteleacutephant 10 paquets [Sallantin2014]1 de lrsquoutilisation du lien[Estan2001] 100 Ko[Lan2006]

Dureacutee Libellule Tortue 2 secondes[Brownlee2002] 15 mi-nutes [Lan2006]

Deacutebit Gueacutepard Escargot 100 Kos [Lan2006]

Les limites varient selon les eacutetudes Pour notre eacutetude les limites seront choisies enfonction des reacutesultats Nous comparerons nos limites avec celles indiqueacutees dans le ta-bleau ci-dessus Dans notre preacutesentation la caracteacuterisation des flux confond flux montantet flux descendant Drsquoapregraves la loi de Pareto environ 80 des effets sont le produit de 20des causes Dans lrsquoInternet 80 du trafic est reacutealiseacute par seulement 20 de flux eacuteleacutephants[Paxson1995] Nous regarderons si cette loi est respecteacutee par les limites proposeacutees

Dans la figure 33 nous avons repreacutesenteacute les CDF de la longueur des flux selon lespaquets (33a) et le nombre drsquooctets (33b) Les traits verticaux repreacutesentent les limitesindiqueacutees dans le tableau 38 Sur la figure 33a le trait vertical repreacutesente la limite des10 paquets de [Sallantin2014] Sur la figure 33b le trait vertical drsquoune valeur de 10 000octets repreacutesente la limite indiqueacutee par [Lan2006] Le trait de droite repreacutesente les 1 dela capaciteacute du lien drsquoaccegraves soit 107 octets (100 Ko)

Sur la figure 33a plus de 50 des flux sont des flux mono-paquet Les flux infeacuterieursagrave la limite proposeacutee par [Sallantin2014] de 10 paquets ont une probabiliteacute de 0 67 Notretrafic est donc constitueacute drsquoune majoriteacute de flots courts sur les paquets La seacuteparation de80 du trafic se fait agrave partir de 18 paquets

Lrsquoaxe des abscisses de la figure 33b deacutemarre agrave 500 octets avec une probabiliteacute de 0 28La valeur de deacutepart de lrsquoaxe des abscisses repreacutesente le pas utiliseacute pour le calcul de laCDF Le premier axe vertical repreacutesenteacute agrave 10 000 octets seacutepare 79 27 des flux sont desflux courts La limite proposeacutee par [Estan2001] est repreacutesenteacutee agrave 107 octets Cette seacutepara-tion indique que 99 des flux sont des flux courts Aucune des deux limites proposeacutees

88

ne permet une eacutetude fine de la seacuteparation des flux La limite proposeacutee par [Lan2006]approche la reacutepartition de Pareto

(a) Paquets (b) Octets

FIGURE 33 ndash Longueur des flux

La dureacutee drsquoun flot TCP correspond au deacutelai qui seacutepare la capture du premier et dudernier paquets du flot La figure 34 repreacutesente la PDF pour la dureacutee des flots en se-condes Le pas utiliseacute pour effectuer le traceacute est de 1 seconde Ce pas srsquoexplique par lavaleur minimale que peut prendre le RTO comme deacutefini dans le [RFC6298] La ligne ver-ticale repreacutesente la limite de [Brownlee2002] eacutegale agrave 2 secondes

La dureacutee maximale enregistreacutee pour un flot est de 61 192 secondes soit plus de 10heures drsquoeacutechange Au delagrave des 60 secondes la probabiliteacute drsquoavoir un flot supeacuterieur agravecette dureacutee est eacutegale agrave 0 081 Nous consideacuterons cette probabiliteacute neacutegligeable Plus de 59de nos flux sont infeacuterieurs agrave la limite repreacutesenteacutee par lrsquoexpiration du RTO (1 seconde) Lalimite des deux secondes indique que 64 des flux eacutechangeacutes sont des flux courts Pouratteindre la reacutepartition indiqueacutee par la loi de Pareto la seacuteparation devrait atteindre les 10secondes

Les figures 35 repreacutesentent la reacutepartition du deacutebit utile moyen de chaque flux selonle nombre de paquets par seconde (35a) et le nombre drsquooctets par seconde (35b) Laligne verticale sur la figure 35a repreacutesente la limite seacuteparant les flux courts et les fluxlongs Drsquoune valeur de 10 paquetsseconde elle est deacuteduite de la limite de 10 paquetsde la longueur des flux preacutesenteacutes preacuteceacutedemment La limite de 100 Ko de [Lan2006] suitle mecircme raisonnement Ils sont partis de la limite de la longueur des flux pour choisir lalimite de caracteacuterisation des flux sur les deacutebits

La figure 35a deacutemarre avec des deacutebits peu eacuteleveacutes mais nombreux Ainsi les flux infeacute-rieurs agrave la limite des 10 paquetsseconde repreacutesentent plus de 90 des flux rencontreacutesOn peut donc en deacuteduire que le trafic analyseacute a tregraves forte majoriteacute de flux agrave tregraves bas deacutebit

La figure 35b est calculeacutee avec le mecircme pas que pour la longueur des flux soit 500 oc-tets En analysant la figure on remarque ainsi que les flux infeacuterieurs ou eacutegaux agrave 500 octetsont une probabiliteacute drsquoexister proche de 09 La limite preacutesenteacutee par [Lan2006] autorise unecaracteacuterisation de 99 de nos flux en tant que flux courts

Tout comme lrsquoindiquaient [Paxson1995 Ciullo2009] le trafic est constitueacute en majoriteacutede flots courts Dans les trois caracteacuterisations effectueacutees (longueur dureacutee deacutebit) le traficeacutetudieacute est constitueacute agrave plus 50 voire 90 comme pour les deacutebits de flots courts

TCP est un protocole srsquoappuyant sur les deacutelais et le systegraveme drsquoacquittement pouradapter ses eacutemissions On a vu dans le chapitre 2 que lrsquoicircle de La Reacuteunion possegravede un

89

FIGURE 34 ndash Flux TCP - Densiteacute de la dureacutee de communication

(a) Paquetsseconde (b) Octetsseconde

FIGURE 35 ndash Deacutebits des flux

comportement particulier vis-agrave-vis de ce paramegravetre Nous faisons lrsquohypothegravese qursquoune desconseacutequences de ce fonctionnement est que La Reacuteunion possegravede une forte sensibiliteacute auxeacuteveacutenements de congestions Nous avons deux outils permettant de confirmer ce postulat

1 Le premier est lrsquoidentification des diffeacuterentes options preacutesentes dans lrsquoen-tecircte TCPplus particuliegraverement les options ECN Echo (ECE) Explicit Congestion Notification(ECN)Nonce Sum (NS) et CWR Le passage du bit de ces options agrave 1 indique unegestion des eacuteveacutenements de congestion

2 La seconde possibiliteacute est de repeacuterer les reacuteductions de la fenecirctre de TCP et les typesde retransmissions qui ont lieu aux alentours de cette diminution

Avec la premiegravere meacutethode nous nrsquoavons trouveacute aucun paquet avec une option degestion de la congestion (ECN) agrave 1 Cela indique que les eacuteveacutenements de congestion nepeuvent ecirctre identifieacutes par la lecture des drapeaux Les auteurs de [Trammell2015] ontmontreacute que le nombre de serveurs reacutepondant agrave la neacutegociation de lrsquooption ECE agrave traversle monde a augmenteacute ces derniegraveres anneacutees Lrsquoabsence de paquets deacutebutant la neacutegociation

90

donc provenant des utilisateurs du reacuteseau du laboratoire peut srsquoexpliquer par 3 hypo-thegravesesLa premiegravere est lrsquoobsolescence des ordinateurs du Laboratoire drsquoInformatique et de Ma-theacutematiques En effet il faut un systegraveme drsquoexploitation reacutecent pour que la version de TCPpuisse marquer les paquets avec lrsquooption Cette hypothegravese est vite abandonneacutee sachantque plusieurs participants agrave notre eacutetude possegravedent des ordinateurs acheteacutes agrave partir delrsquoanneacutee 2014La seconde hypothegravese est la suppression de lrsquooption par un eacutequipement reacuteseau traverseacute agravelrsquoUniversiteacute de La Reacuteunion Cette piste fut abandonneacutee apregraves un test de mesures Ce testconsistait agrave envoyer des paquets avec lrsquooption ECN agrave 1 et agrave regarder leurs options agrave leurarriveacutee au point de capture Les reacutesultats obtenus ont montreacute que lrsquooption eacutetait inchan-geacuteeLa derniegravere possibiliteacute est que le systegraveme drsquoexploitation ne marque pas lrsquoensemble despaquets avec le drapeau de neacutegociation Certains routeurs ou pare-feux incompatiblespeuvent bloquer le trafic entre deux hocirctes impleacutementant ECN [Bauer2011] Crsquoest pourcette raison qursquoelle est deacutesactiveacutee implicitement sur la plupart des systegravemes drsquoexploita-tion contemporains Nous avons confirmeacute cette hypothegravese agrave travers une demande drsquouti-lisation de la commande sysctl et des options de TCP des systegravemes drsquoexploitation DebianUbuntu et Mac OS X Les reacutesultats ont ainsi montreacute que les systegravemes drsquoexploitation eacutetu-dieacutes nrsquoactivaient pas cette option de TCP

Dans tous les cas lrsquoabsence des options ECE ECNNS et CWR est neacutefaste pour lesperformances de TCP Les travaux reacutealiseacutes par [Mellia2003-2] ont montreacute que les per-formances de TCP sont accrues lorsque les paquets sont marqueacutes avec ces options Sanselles les eacuteveacutenements de congestion sont plus difficiles agrave identifier

La seconde faccedilon drsquoidentifier les eacuteveacutenements de congestion est plus compliqueacutee agravemettre en place Il srsquoagit drsquoidentifier les reacuteductions de fenecirctre et drsquoeacutetudier des pertes etoudes retransmissions de paquets Elle provoque des incertitudes Sur un total de 42 386 540paquets nous avons identifieacute 21 022 400 paquets indiquant une diminution de fenecirctreSoit pregraves drsquoun paquet sur deux

Le tableau 39 indique les pourcentages des paquets retransmis etou perdus

TABLE 39 ndash Reacutepartition des paquets

fast retrans-mit

spurious retrans-mit

Paquetsperdus

Non retransmiset non perdus

Pourcentage 5 2times 10minus3 7 8times 10minus3 14times10minus3 99 97

On constate que le pourcentage des paquets retransmis ou perdus sont ridicules avecmoins de 1 des paquets eacutechangeacutes Ces pourcentages sont en deccedilagrave des valeurs que TCPpeut produire dans certaines zones Aux Eacutetat-Unis [Gettys2011] a eacutetudieacute le taux de pertesur un lien montant agrave 2 Mbits lors drsquoun transfert de fichiers drsquoun poids de 20 Go Letaux de perte est tregraves eacuteleveacute avec 33 de moyenne En comparaison avec ces eacutetudes reacuteali-seacutees lrsquoicircle de La Reacuteunion possegravede des performances de TCP que lrsquoon pourrait qualifier denormales

343 Synthegravese des reacutesultats

Lrsquoanalyse mise en place a pour objectif de tester en conditions reacuteelles notre plate-forme de mesure et la chaicircne drsquoanalyse

Lrsquoeacutetude du trafic du LIM a eacuteteacute deacutecoupeacutee en deux parties La premiegravere concerne lasupervision du trafic et traite de la composition La seconde partie se concentre sur les

91

performances du protocole de transport TCP sur le trafic agrave destination de lrsquoexteacuterieur delrsquoicircle de La ReacuteunionLrsquoeacutetude des donneacutees collecteacutees a mis en avant la preacutedominance drsquoun trafic empruntantles cacircbles sous-marins agrave destination de lrsquoEurope et de lrsquoAmeacuterique du Nord Ces deuxdestinations heacutebergent de nombreux serveurs de donneacutees scientifiquesLrsquointerrogation de ces serveurs se fait agrave partir du protocole TCP en utilisant les servicesHTTP ou HTTPS Le protocole TCP est majoritaire dans les protocoles rencontreacutes toutcomme les services preacutesenteacutes

Sur lrsquoeacutetude des performance du protocole TCP nous avons effectueacute une caracteacuteri-sation des flots en terme de longueur (paquets eacutechangeacutes) de dureacutee et de vitesse Lamajoriteacute de nos flots sont des flots courts contenant peu de donneacutees

35 Conclusion

Dans ce chapitre nous avons preacutesenteacute la meacutethode mise en place pour la reacutealisationdrsquoune eacutetude de meacutetrologie passive sur lrsquoicircle de La Reacuteunion

La Reacuteunion est une icircle dont la connectiviteacute en terme de deacutelais et de routes est par-ticuliegravere telle que le chapitre 2 preacutesente Lrsquoaugmentation progressive des deacutebits drsquoaccegravesa pour conseacutequence lrsquoaugmentation de la capaciteacute de stockage des liens On considegravereqursquoun lien possegravede une forte capaciteacute de stockage quand le produit deacutelai bande passante(BDP) associeacute agrave ce lien deacutepasse la limite de 12 5 Ko Pour La Reacuteunion la capaciteacute destockage minimale calculeacutee est de 22 5 ko Cette capaciteacute de stockage entraicircne des deacutegra-dations sur les performances du protocole TCP Nous avons souhaiteacute eacutetudier lrsquoimpact dela capaciteacute de stockage des liens sur les performances du protocole TCP agrave La ReacuteunionLrsquoaugmentation de la capaciteacute des liens entraicircne eacutegalement un changement des usagesNous souhaitons eacutegalement eacutetudier les diffeacuterents services utiliseacutes dans lrsquoInternet agrave LaReacuteunion

Le cahier des charges fut preacutesenteacute dans la section 31 Le cahier mis en place preacutesenteles meacutetriques de lrsquoeacutetude Ces meacutetriques ont eacuteteacute seacutelectionneacutees afin de reacutepondre aux objec-tifs preacutesenteacutes ci-dessus Elles couvriront un aspect supervision du trafic pour lrsquoeacutetude desservices et la reacutepartition geacuteographique Lrsquoaspect des performances du protocole TCP seraanalyseacute agrave travers les deacutebits les deacutelais les pertes les retransmissions et la preacutesence deseacuteveacutenements de congestion

Pour obtenir ces meacutetriques il est neacutecessaire de mettre en place une infrastructure demesure et une chaicircne drsquoanalyse La section 32 preacutesente lrsquoinfrastructure mise en place Lavariabiliteacute du trafic dans le temps nous a encourageacutes agrave mettre en place une plate-formede capture de trafic Le choix de lrsquooutil de capture nrsquoest pas deacutefinitif Il est deacutependant dudeacutebit associeacute au lien de capture Diffeacuterents outils drsquoanalyses de donneacutees passives existentDans le paragraphe 322 nous avons reacutealiseacute une comparaison des diffeacuterents outils selondes critegraveres de seacutelection Ces critegraveres sont au nombre de 3 protection de la vie priveacutee trai-tement drsquoune volumeacutetrie de donneacutees importante et le calcul des meacutetriques seacutelectionneacuteesAucun des outils preacutesenteacutes ne reacutepondait agrave la totaliteacute des critegraveres A la suite de ce constatnous avons fait le choix de deacutevelopper un outil reacutepondant agrave ces 3 critegraveres Lrsquoavantage decet outil est qursquoil pourra eacutevoluer en parallegravele agrave lrsquoeacutevolution de lrsquoeacutetude

Ces outils furent mis en place au sein du Laboratoire drsquoInformatique et de Matheacutematiquesdans le cadre drsquoune phase de test Les reacutesultats obtenus ont eacuteteacute compareacutes avec les reacutesultatsobtenus par TCPTrace afin de nous assurer de lrsquoexactitude de nos reacutesultats Le protocolede mesure mis en place pour cette eacutetude est deacutecrit dans la section 33 Dans ce protocolenous avons preacutesenteacute les contraintes reacuteglementaires imposeacutees par lrsquoUniversiteacute Nous nous

92

sommes ensuite assureacutes que le systegraveme mis en place pour la capture du trafic nrsquoeacutetaitsoumis agrave aucune perturbation Le systegraveme choisi pour eacutecouter le lien fut celui de port-mirroring Cette fonction des routeurs permet de copier lrsquoensemble des paquets entrantsur un lien vers un second lien Cette recopie est soumise agrave la limitation de la capaciteacutede meacutemoire des eacutequipements Elle peut entraicircner des erreurs au niveau de la datationdes paquets et dans lrsquoordre de reacute-eacutemission des paquets vers le lien miroir Dans cetteeacutetude la capture du trafic srsquoest faite agrave lrsquoaide du logiciel TCPDump Reacuteguliegraverement unephase de deacutelestage de la meacutemoire de la sonde de capture vers un serveur de stockage dulaboratoire a eacuteteacute mise en place

Les reacutesultats preacutesenteacutes dans la section 34 nous donnent une vision biaiseacutee du com-portement de lrsquoInternet reacuteunionnais Ces reacutesultats ne peuvent correspondre au compor-tement de TCP pour lrsquoensemble de lrsquoInternet de La Reacuteunion Ces reacutesultats nous donnentdes indications sur le comportement de TCP dans le cadre drsquoune connexion agrave forte capa-citeacute de meacutemorisation

Dans la partie supervision on a vu la preacutedominance du protocole TCP des servicesHTTP et HTTPS Ces usages srsquoaccompagnent drsquoune reacutepartition geacuteographique tregraves in-eacutegale LrsquoEurope et lrsquoAmeacuterique du Nord sont les deux continents avec lesquels les interac-tions sont les plus nombreuses (plus de 48 du trafic pour chaque continent)

Au niveau des performances de TCP nous avons pu voir que la majoriteacute des flotseacutetudieacutes sont des flots courts que ccedila soit en longueurs en dureacutees et en deacutebits Aucun eacuteveacute-nement de congestion ne fut releveacute Cela indique que la capaciteacute drsquoenvoi des eacutemetteursnrsquoa pas couvert le BDP du lien Cela srsquoest ressenti au niveau de la reacutepartition des paquetsRetransmissions et pertes nrsquoont repreacutesenteacute pregraves de 0 03 des paquets eacutechangeacutes

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors de laconfeacuterence Next Generation Computing Applications (NextComp) en 2017 [Noordally2017]

93

94

Conclusion amp Perspectives

1 Synthegravese des travaux

Les travaux de cette thegravese sont placeacutes dans le cadre reacutegional de lrsquoaccegraves de lrsquoicircle de LaReacuteunion agrave lrsquoInternet Ils visent agrave identifier les caracteacuteristiques qui ont une influence sur lesperformances de lrsquoInternet agrave La Reacuteunion La Reacuteunion est un deacutepartement drsquooutre-mer si-tueacute dans lrsquoOceacutean Indien Lrsquoicircle est connecteacutee agrave Internet agrave travers deux cacircbles sous-marins le SAFE et le LION Le SAFE relie lrsquoAfrique agrave lrsquoAsie Le LION interconnecte Madagascarlrsquoicircle Maurice et La Reacuteunion Lrsquoarriveacutee de ces cacircbles sur lrsquoicircle a permis le deacuteveloppement duhaut deacutebit et du tregraves haut deacutebit sur lrsquoicircle avec lrsquoarriveacutee des technologies ADSL VDSL etFTTH Des extensions agrave ces cacircbles permettent de remonter jusqursquoen Europe La Reacuteunionpossegravede REUNIX un point drsquointer-connexion (IXP) pour les opeacuterateurs locaux Ce typedrsquoaccegraves agrave Internet est speacutecifique aux icircles de la zone oceacutean indien Dans un premier tempsnous avons eacutetudieacute la connectiviteacute de lrsquoicircle sous lrsquoangle des deacutelais et des routes Dans unsecond temps lrsquoeacutetude a porteacute sur les flots TCP

TCP est le protocole de transport majoritaire dans lrsquoInternet qui rend un service detransport fiable et efficace de donneacutees Lrsquoefficaciteacute srsquoappreacutecie en terme de deacutebit eacutecouleacutepour le service rendu et drsquoutilisation des capaciteacutes de transmission du reacuteseau Lrsquoobjectifdrsquoefficaciteacute est du ressort du controcircle de flux et du controcircle de congestion Ces fonctionsagissent selon une peacuteriode correspondant au RTT de la connexion On voit alors que laperformance de TCP est deacutependante du deacutelai que va expeacuterimenter la connexion TCP

Nous avons dans un premier temps eacutetudieacute lrsquoeacutevolution du deacutelai et de la longueur desroutes entre 2012 et 2016 Cette eacutetude a mis en eacutevidence une stabiliteacute des deacutelais malgreacuteune reacuteduction de la longueur des routes Cette eacutetude a eacuteteacute reacutealiseacutee depuis un seul pointde mesure Afin drsquoeacutetudier en deacutetail la connectiviteacute de La Reacuteunion nous avons deacuteployeacuteune plate-forme de meacutetrologie active speacutecifique agrave lrsquoeacutetude Durant plusieurs mois nousavons mesureacute les deacutelais et les routes depuis et vers La Reacuteunion agrave lrsquoaide de lrsquooutil Paris-traceroute Lrsquoanalyse des reacutesultats a eacuteteacute reacutealiseacutee agrave partir de deux outils deacuteveloppeacutes pourle besoin de lrsquoeacutetude rgeoloc et rtraceroute rgeoloc sert agrave la geacuteolocalisation des adressesIP et agrave lrsquoextraction des deacutelais et de la longueur des routes depuis un fichier de sortiede traceroute rtraceroute est un outil drsquoanalyse graphique des routes Il va utiliser lesdonneacutees obtenues depuis rgeoloc pour placer sur une carte les diffeacuterents pays traverseacutespar les donneacutees collecteacutees

Les reacutesultats ont eacuteteacute eacutetudieacutes selon quatre critegraveres les deacutelais la longueur des routesla distance geacuteographique entre la source et la destination et lrsquoidentification des portesde lrsquoInternet reacuteunionnais Nous avons ainsi pu mettre en eacutevidence lrsquoindeacutependance de lalongueur de la route en fonction de la distance geacuteographique Nous avons calculeacute le deacutelaineacutecessaire agrave chaque noeud traverseacute Cette valeur est fortement deacutependante du sens decirculation de lrsquoinformation La relation entre le deacutelai et la distance geacuteographique a misen eacutevidence une incoheacuterence Le deacutelai neacutecessaire pour joindre une destination ou ecirctrejoint depuis lrsquoexteacuterieur de lrsquoicircle est inversement proportionnel agrave la distance geacuteographiqueCela signifie donc que plus la distance est importante moins le deacutelai est eacuteleveacute Nous

95

avons eacutetudieacute ce comportement vis agrave vis des portes de lrsquoInternet reacuteunionnais et mis enavant le fait que plus de 97 du trafic reacuteunionnais passe par la France hexagonale sanstenir compte si crsquoest du trafic montant ou descendant Ce comportement a eacutegalement eacuteteacuteeacutetudieacute pour les icircles de la ZOI dans le sens montant Le deacutelai minimal mesureacute accompagneacutedu routage analyseacute peut avoir des conseacutequences sur les performances drsquoun protocole detransport deacutependant au deacutelai comme lrsquoest TCP

Lrsquoaugmentation de la bande passante sur le reacuteseau de distribution de lrsquoicircle et sur lesliens reliant lrsquoIle agrave lrsquoInternet nrsquoont pas permis la reacuteduction des deacutelais Cela a pour conseacute-quence lrsquoaugmentation de la capaciteacute de stockage des canaux de communication La ca-paciteacute de stockage est calculeacutee agrave partir de la bande passante et du RTT On parle de Pro-duit Deacutelai-Bande passante (BDP) Si le BDP deacutepasse la valeur seuil de 12 5 Ko alors lecanal est consideacutereacute comme un reacuteseau agrave forte capaciteacute de stockage (LFN) Si on considegravereque le deacutebit drsquoaccegraves theacuteorique fourni par les FAI est le goulot drsquoeacutetranglement alors uncanal de communication sur lrsquoInternet depuis La Reacuteunion possegravede un BDP minimal eacutegalagrave 22 5 Ko Lorsque le transport des donneacutees srsquoeffectue avec TCP en passant par un LFNceci agrave des implications sur les performances du service rendu par TCP Lrsquoobjectif a eacuteteacute deconcevoir un systegraveme meacutetrologique pour pouvoir eacutetudier le service et analyser le fonc-tionnement du protocole Nous avons mis en place et expeacuterimenteacute une infrastructure demeacutetrologie passive interne au laboratoire En parallegravele nous avons conccedilu un outil drsquoana-lyse de traces drsquoeacutecoute speacutecifiques agrave notre eacutetude Lrsquoensemble de la chaicircne de mesure etdrsquoanalyse a eacuteteacute testeacute durant un mois au sein du LIM Les reacutesultats obtenus ont eacuteteacute valideacutespar comparaison agrave ceux fournis par drsquoautres outils

2 Perspectives

icircle de La Reacuteunion

La mise en place drsquoune eacutetude de meacutetrologie passive en collaboration avec les diffeacute-rents FAI permettrait drsquoeacutetudier le reacuteel impact de lrsquoeacuteloignement de La Reacuteunion sur lesperformances du protocole de transport TCP De plus lrsquoanalyse de supervision permet-trait drsquoidentifier des leviers pour limiter le rapatriement de trafic commun par les cacircblessous-marins

Zone Oceacutean Indien

Cette thegravese a mis en eacutevidence une connectiviteacute particuliegravere en terme de deacutelais et deroutes depuis lrsquoicircle de La Reacuteunion et les icircles de la Zone Oceacutean Indien dans le sens De-puis Lrsquoasymeacutetrie des routes est freacutequente dans lrsquoInternet Crsquoest pourquoi une eacutetude desdeacutelais et des routes depuis le monde agrave destination des sondes de la plate-forme RunPLbaseacutees sur les icircles de la ZOI peut ecirctre pertinente

Par la suite une eacutetude de meacutetrologie passive similaire agrave celle que lrsquoon veut mettreen place sur le territoire reacuteunionnais pourrait ecirctre reacutealiseacutee Lrsquoobjectif est de mettre eneacutevidence un comportement speacutecifique en terme drsquousage et de performance protocolairepour lrsquoensemble des usagers de la zone Cette eacutetude aura eacutegalement comme but le calculde la volumeacutetrie eacutechangeacutee et des services utiliseacutes entre les diffeacuterents territoires Si lesreacutesultats montrent une preacutedominance des trafics de consultation (accegraves agrave un serveur)la technique drsquooffloading pourrait ecirctre envisageacutee Cette meacutethode inspireacutee des travaux de[Baron2016] impliquerait lrsquousage des transports aeacuteriens pour charger des caches locauxDrsquoautres solutions seront eacutegalement eacutetudieacutees comme lrsquoimpleacutementation de serveurs departage de contenus localiseacutes sur lrsquoicircle

96

Territoires ultra-marins franccedilais

La Reacuteunion et Mayotte sont deux territoires franccedilais localiseacutes dans la ZOI Mais drsquoautresreacutegions ultra-marines peuvent ecirctre soumises agrave des comportements similaires Pour veacuteri-fier cette hypothegravese des eacutetudes de meacutetrologie active et passive pourraient venir validerou non cette hypothegravese Pour reacutepondre agrave cela nous privileacutegierons lrsquoenvoi de sondes dela plate-forme RunPL

Zone Isoleacutee

La derniegravere perspective que lrsquoon souhaite mettre en avant est le concept de ZoneIsoleacutee Si plusieurs reacutesultats des perspectives preacuteceacutedentes sont en adeacutequation avec lesreacutesultats obtenus et preacutesenteacutes dans cette thegravese nous aimerions deacutefinir ce concept Unepremiegravere deacutefinition serait axeacutee sur les trois points suivants

mdash Un routage limiteacute Un maillage important est un standard dans les zones bienconnecteacutees Les routes et les possibiliteacutes de trouver le plus court chemin sont nom-breuses Une faible valeur signifie de faibles alternatives ce qui sous-entend que laroute prise nrsquoest pas forceacutement la plus courte mais celle par deacutefaut

mdash Peering reacutegional et trafic interne Lrsquoensemble du trafic drsquoune zone va vers un GIXdrsquoautres pays pour des raisons de coucirct Lrsquoabsence drsquoaccords de peering entre lesFAI drsquoun mecircme pays ou ceux drsquoune mecircme zone geacuteographique ne permet pas ladiversiteacute des routes et augmente ainsi le deacutelai [Obar2012]

mdash Forts deacutelais Le deacutelai est un paramegravetre important de lrsquoaccegraves Internet Les forteslatences peuvent impacter les autres paramegravetres des connexions TCP [RITE2014-1]

97

98

Table des figures

1 Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000]) 2

2 Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000]) 33 Carte des deacutebits agrave La Reacuteunion 44 Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion 55 Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source

[Cablesmap]) 76 Carte des points drsquoeacutechange preacutesents actuellement et dans un futur proche

dans la ZOI 7

11 Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989]) 11

12 Boucle fermeacutee du CC de TCP 1213 Etats du controcircle de congestion de TCP 1414 Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP 1515 Principe de Quick-Start (Source [Scharf2008-1]) 1816 Simulation de MulTCP avec N=5 (Source [Huston2006]) 1917 Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source

[Afanasyev2010]) 2018 Comportement de la fenecirctre de congestion de Compound-TCP (Source

[Afanasyev2010]) 2119 Fonctionnement de BIC TCP 22110 Fonctionnement de CUBIC 22111 Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

24112 Principe de la meacutetrologie active 27113 Illustration du pheacutenomegravene drsquoeacutequilibrage des charges 28114 Taxonomie des configurations de tunnels MPLS et des comportements de

traceroute correspondants (Source [Donnet2012] ) 29115 Principe de la meacutetrologie passive 33

21 Scheacutema drsquointerconnexion de la plate-forme 4222 Distribution geacuteographique des adresses IPv4 publiques 4823 Fonctionnement de la sonde 5124 Comparaison des deacutelais entre Paris et La Reacuteunion 5425 Eacutevolution de la longueur des routes entre 2012 et 2016 5526 Distribution de la distance geacuteographique par continent 5627 Distribution du RTT par continent 5728 Distribution de la longueur des routes par continent 5729 Relation entre la longueur de la route et la distance geacuteographique 59210 Relation entre la longueur de la route et les deacutelais 60211 Relation entre les deacutelais et la distance geacuteographique 62

99

212 Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais 64213 Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dans

un pays tiers 65214 FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien 65215 Distribution des deacutelais des icircles de la ZOI 66216 Longueur des routes emprunteacutees 67217 Relation entre la longueur de la route et la distance geacuteographique 68218 Relation entre la longueur de la route et la distance geacuteographique pour

Madagascar 69219 Relation entre la longueur de la route et les deacutelais 69220 Relation entre les deacutelais et la distance geacuteographique 70221 Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI 71222 Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion 72

31 Scheacutema de distribution de la plate-forme de mesure 8432 Scheacutema de fonctionnement de la plateforme de mesure 8533 Longueur des flux 8934 Flux TCP - Densiteacute de la dureacutee de communication 9035 Deacutebits des flux 90

100

Liste des tableaux

11 Tableau de synthegravese des propositions 1712 Approximation du produit deacutelai bande passante de la connectiviteacute de La

Reacuteunion agrave lrsquoInternet 2513 Comparatif entre les approches de meacutetrologie 2614 Classement des outils 2715 Tableau des plates-formes de mesures de meacutetrologie active 3216 Comparatif entre mesures actives et mesures passives 35

21 Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet 4122 Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

4323 Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur Raspberry

Pi 4424 Fonctions disponibles dans les outils graphiques drsquoanalyse des routes 4525 Reacutesumeacute des caracteacuteristiques du jeu de donneacutees 5326 Correspondance entre acronymes et noms des continents 5327 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 5828 Formule de correacutelation du deacutelai en fonction de la longueur du chemin 6029 Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique 61210 Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunion-

nais 63211 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 67212 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 68213 Formule de correacutelation de la distance geacuteographique et du RTT 70

31 Les meacutetriques de meacutetrologie passive 7732 Comparaison de performances 8233 Distribution des protocoles encapsuleacutes dans IP 8634 Reacutepartition des services utiliseacutes par TCP 8635 Distribution du trafic 8736 Correspondance entre acronymes et nom des continents 8737 Distribution geacuteographique des destinations WAN 8738 Tableau de deacutenomination des flux selon [Lan2006] 8839 Reacutepartition des paquets 91

101

102

Bibliographie

[ANRTIC2016] ANRTIC Autoriteacute Nationale de Reacutegulation des TIC 2016

[ARCEP2004] Autoriteacute de Reacutegulation des Teacuteleacutecommunications Deacutecision n04-375 delrsquoautoriteacute de reacutegulations des teacuteleacutecommunications en date du 4 mai 2004 seprononccedilant sur un diffeacuterent opposant mobius agrave france teacuteleacutecom 2004

[ARTEC2016] Autoriteacute de Reacutegulation des TEchnologies de Communication Artec 2016

[AXIS] African internet exchange system project 2016

[Aben2015] Emile Aben Infrastructure geolocation - plan of action 2015

[Afanasyev2010] A Afanasyev N Tilley P Reiher and L Kleinrock Host-to-hostcongestion control for tcp IEEE Communications Surveys amp Tutorials 12(3)Third quarter 2010

[Africa1] Telegeography Submarine Cable Submarine cable map 2018

[AfterFibre] Steve Song African undersea and terrestrial fibre optic cables Last visit 09262017

[Akamai2015] Akamai Akamairsquos [state of the internet] 2015

[Akamai2017] Akamai Akamairsquos [state of the internet] 2017

[Allman2007] Mark Alllman and Vern Paxson Issues and etiquette concerning use ofshared measurement data In Proceedings of the 7th ACM SIGCOMM confe-rence on Internet measurement pages 135ndash140 ACM 2007

[Anelli2012] Pascal Anelli Des aleacuteas de la communication de la transmission au trans-port Habilitation agrave diriger des recherches en informatique Universiteacute deLa Reacuteunion 2012

[Archipelago] Kimberly Claffy Young Hyun Ken Keys Marina Fomenkov and DmitriKrioukov Internet mapping from art to science In Conference For Home-land Security 2009 CATCHrsquo09 Cybersecurity Applications amp Technology pages205ndash211 IEEE 2009

[Arduino] Arduino AG Arduino home

[Arnal2014] F Arnal E Dubois E Chaput and A Beylot Internet-draft r sallantin in-tended status Proposed standard e bouttier expires April 30 2015 cnes-tastesa c baudoin 2014

[Augustin2006] Brice Augustin Xavier Cuvellier Benjamin Orgogozo Fabien Viger Ti-mur Friedman Matthieu Latapy Cleacutemence Magnien and Renata TeixeiraAvoiding traceroute anomalies with paris traceroute In Proceedings of the 6thACM SIGCOMM conference on Internet measurement pages 153ndash158 ACM2006

[Augustin2007] Brice Augustin Timur Friedman and Renata Teixeira Multipath tracingwith paris traceroute In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

103

[Bajpai2015-1] Vaibhav Bajpai and Juumlrgen Schoumlnwaumllder A survey on internet perfor-mance measurement platforms and related standardization efforts IEEECommunications Surveys amp Tutorials 17(3) 1313ndash1341 2015

[Baron2016] Benjamin Baron Transport intermodal de donneacutees massives pour le deacutelestage desreacuteseaux drsquoinfrastructure PhD thesis Paris 6 2016

[Bauer2011] Steven Bauer Robert Beverly and Arthur Berger Measuring the state of ecnreadiness in servers clients and routers In Proceedings of the 2011 ACM SIG-COMM conference on Internet measurement conference pages 171ndash180 ACM2011

[Beaglebone] BeagleBoardorg Foundation Beagleboardorg - community supportedopen hardware computers for making

[Bischof2015] Zachary S Bischof John P Rula and Fabiaacuten E Bustamante In and out ofCuba Characterizing Cubarsquos connectivity In Proceedings of the 2015 ACMConference on Internet Measurement Conference pages 487ndash493 ACM 2015

[Brakmo1994] Lawrence S Brakmo Sean W OrsquoMalley and Larry L Peterson TCP Vegas New techniques for congestion detection and avoidance volume 24 ACM 1994

[Brownlee2002] Nevil Brownlee and KC Claffy Understanding internet traffic streams dragonflies and tortoises Communications Magazine IEEE 40(10) 110ndash1172002

[CAIDA-Tools] Center for Applied Internet Data Analysis Caida tools - overview

[Cablesmap] Telegeography Submarine cable map

[Carlucci2015] Gaetano Carlucci Luca De Cicco and Saverio Mascolo Http over udp An experimental investigation of quic In Proceedings of the 30th Annual ACMSymposium on Applied Computing SAC rsquo15 pages 609ndash614 New York NYUSA 2015 ACM

[Chappell2010] Laura Chappell and G Combs Wireshark network analysis the officialWireshark certified network analyst study guide Protocol Analysis InstituteChappell University 2010

[Chavula2017] Josiah Chavula Amreesh Phokeer Agustin Formoso and Nick FeamsterInsight into africarsquos country-level latencies In AFRICON 2017 IEEE pages938ndash944 IEEE 2017

[Chiu1989] Dah-Ming Chiu and Raj Jain Analysis of the increase and decrease algo-rithms for congestion avoidance in computer networks Computer Networksand ISDN systems 17(1) 1ndash14 1989

[Chun2003] Brent Chun David Culler Timothy Roscoe Andy Bavier Larry PetersonMike Wawrzoniak and Mic Bowman PlanetLab An overlay testbed forbroad-coverage services SIGCOMM Comput Commun Rev 33(3) 3ndash12July 2003

[Ciullo2009] D Ciullo M Mellia and M Meo Two schemes to reduce latency in shortlived TCP flows IEEE Communications Letters 13(10) October 2009

[Claise2004] Benoit Claise Cisco systems netflow services export 2004

[Comores2002] Mwezinet Lrsquoarriveacutee drsquointernet aux comores Last Seen 09062017

[Coonjah2015] Irfaan Coonjah Pierre Clarel Catherine and KMS Soyjaudah Perfor-mance evaluation and analysis of layer 3 tunneling between openssh andopenvpn in a wide area network environment In Computing Communica-tion and Security (ICCCS) 2015 International Conference on pages 1ndash4 IEEE2015

104

[Crovella2006] Mark Crovella and Balachander Krishnamurthy Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc New YorkNY USA 2006

[Crowcroft1998] Jon Crowcroft and Philippe Oechslin Differentiated end-to-end in-ternet services using a weighted proportional fair sharing tcp ACM SIG-COMM Computer Communication Review 28(3) 53ndash69 1998

[DICT2017] Government of Seychelles Office of the president Department of informa-tion communication technology 2016

[Donnet2012] Benoit Donnet Matthew Luckie Pascal Meacuterindol and Jean-Jacques Pan-siot Revealing mpls tunnels obscured from traceroute ACM SIGCOMMComputer Communication Review 42(2) 87ndash93 2012

[Downey1999] Allen B Downey Using pathchar to estimate internet link characteristicsIn ACM SIGCOMM Computer Communication Review volume 29 pages 241ndash250 ACM 1999

[EQUINIX] CAIDA Chicago passive network monitor Last visit 12012018

[Estan2001] Cristian Estan and George Varghese New directions in traffic measurementand accounting volume 32 ACM 2002

[Fanou2015] Rodeacuterick Fanou Pierre Francois and Emile Aben On the diversity of in-terdomain routing in africa In Passive and Active Measurement pages 41ndash54Springer 2015

[Fanou2016] Rodeacuterick Fanou Gareth Tyson Pierre Francois and Arjuna SathiaseelanPushing the frontier Exploring the african web ecosystem In Proceedingsof the 25th International Conference on World Wide Web pages 435ndash445 Inter-national World Wide Web Conferences Steering Committee 2016

[Feige1992] Uriel Feige and Prabhakar Raghavan Exact analysis of hot-potato routingIn Foundations of Computer Science 1992 Proceedings 33rd Annual Symposiumon pages 553ndash562 IEEE 1992

[Fraleigh2001] Chuck Fraleigh Christophe Diot Bryan Lyles Sue Moon Philippe Owe-zarski Dina Papagiannaki and Fouad Tobagi Design and deployment ofa passive monitoring infrastructure In Thyrrhenian Internatinal Workshop onDigital Communications pages 556ndash575 Springer 2001

[Fraleigh2003] Chuck Fraleigh Sue Moon Bryan Lyles Chase Cotton Mujahid KhanDeb Moll Rob Rockell Ted Seely and SC Diot Packet-level traffic measu-rements from the sprint IP backbone Network IEEE 17(6) 6ndash16 2003

[France2017] Mission Tregraves Haut Deacutebit Plan france tregraves haut deacutebit Last seen 09062017

[GOTICOM2011] Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de laCommunication Goticom Last Seen 09062017

[GSCounter] StatCounter Statcounter global stats - browser os search engine includingmobile usage share Last visit 13102017

[Gettys2011] Jim Gettys and Kathleen Nichols Bufferbloat Dark buffers in the InternetQueue 9(11) 40 2011

[Gevros2001] Panos Gevros Jon Crowcroft Peter Kirstein and Saleem Bhatti Conges-tion control mechanisms and the best effort service model IEEE network15(3) 16ndash26 2001

[Graham1997] Ian Graham Murray Pearson Jed Martens and Stephen Donnelly DAG- a cell capture board for ATMmeasurement systems 1997

105

[Gupta2014] Arpit Gupta Matt Calder Nick Feamster Marshini Chetty Enrico Calan-dro and Ethan Katz-Bassett Peering at the internetrsquos frontier A first lookat isp interconnectivity in africa In Passive and Active Measurement pages204ndash213 Springer 2014

[Ha2008] Sangtae Ha Injong Rhee and Lisong Xu Cubic A new tcp-friendly high-speed tcp variant SIGOPS Oper Syst Rev 42(5) 64ndash74 July 2008

[Herman2001] Paul Herman The tcpstat tool Publicly available at http wwwfrenchfriesnetpaultcpstat 2001

[Huston2000] Geoff Hutson Tcp performance The Internet Protocol Journal 3 2000

[Huston2006] Geoff Huston Gigabit tcp Internet Protocol Journal 9 2006

[IANA-port] IANA Service Name and Transport Protocol Port Number Registry Lastvisit 06202018

[ICTA2017] Information and Communication Technologies Authority of Mauritius IctaLast Seen 09062017

[IOX] Government Information Service Iox submarine cable to drive the newdigital economy of mauritius 2018

[IPMon] ATL Sprint Ipmon project

[Jacobson1988-1] V Jacobson Congestion avoidance and control ACM Computer Com-munications Review 18(4) 314ndash329 August 1988

[Jacobson1989-1] Van Jacobson Craig Leres and S McCanne The tcpdump manualpage Lawrence Berkeley Laboratory Berkeley CA 1989

[Jacobson1989-2] Van Jacobson Craig Leres and Steven McCanne pcap-packet capturelibrary UNIX man page 2001

[Jacobson1997] Van Jacobson Pathchar A tool to infer characteristics of internet paths1997

[Jain1990] Raj Jain Congestion Control in Computer Networks Issues and TrendsIEEE Network Magazine May 1990

[John2010] Wolfgang John Sven Tafvelin and Tomas Olovsson Passive internet mea-surement Overview and guidelines based on experiences Computer Com-munications 33(5) 533ndash550 2010

[Johnson2011] David L Johnson Veljko Pejovic Elizabeth M Belding and Gertjan vanStam Traffic characterization and internet usage in rural Africa In Pro-ceedings of the 20th International Conference Companion on World Wide WebWWW rsquo11 pages 493ndash502 New York NY USA 2011 ACM

[Johnson2016] David L Johnson and Gertjan van Stam The shortcomings of globalisedinternet technology in southern africa 2016

[Katabi2002] Dina Katabi Mark Handley and Charlie Rohrs Congestion control for highbandwidth-delay product networks In Proceedings of the 2002 Conference onApplications Technologies Architectures and Protocols for Computer Communi-cations SIGCOMM rsquo02 pages 89ndash102 New York NY USA 2002 ACM

[Katz2010] Ethan Katz-Bassett Harsha V Madhyastha Vijay Kumar Adhikari ColinScott Justine Sherry Peter Van Wesep Thomas E Anderson and ArvindKrishnamurthy Reverse traceroute In NSDI volume 10 pages 219ndash2342010

[Krajsa2011] Ondrej Krajsa and Lucie Fojtova RTT measurement and its dependence onthe real geographical distance In Telecommunications and Signal Processing(TSP) 2011 34th International Conference on pages 231ndash234 IEEE 2011

106

[LIL1978] Loi numeacutero 78-17 du 6 janvier 1978 relative agrave lrsquoinformatique aux fichiers etaux liberteacutes Last modification on 19 March 2014

[Lan2006] Kun-chan Lan and John Heidemann A measurement study of correlationsof internet flow characteristics Computer Networks 50(1) 46ndash62 2006

[LanYanFock2015] Jean-Christophe Lan-Yan-Fock Geacuteolocalisation drsquoadresses IP 2015

[Larrieu2010] Nicolas Larrieu and Philippe Owezarski Metrology of internet networksDigital Cognitive Technologies Epistemology and the Knowledge Economy pages101ndash117 2010

[Leguay2004] Jeremie Leguay Matthieu Latapy Timur Friedman and Kaveacute SalamatianDescribing and simulating internet routes CoRR csNI0411051 2004

[Leiner1997] Barry M Leiner Vinton G Cerf David D Clark Robert E Kahn LeonardKleinrock Daniel C Lynch Jon Postel Lawrence G Roberts and Stephen SWolff The past and future history of the Internet Communications of theACM 40(2) 102ndash108 1997

[Lemauricien] Le Mauricien Projet cacircble metiss le contrat deacutecrocheacute par alcatel subma-rine networks et electra tlc spa 2018

[Liu2007] Dan Liu Mark Allman Shudong Jin and Limin Wang Congestion controlwithout a startup phase In Workshop on Protocols for Fast Long-Distance Net-works (PFLDnet) 2007

[Lopez2006] Dino Martin Loacutepez-Pacheco Congduc Pham and Laurent Lefevre Nxg03-4 Xcp-i explicit control protocol for heterogeneous inter-networking ofhigh-speed networks In Global Telecommunications Conference 2006 GLO-BECOMrsquo06 IEEE pages 1ndash6 IEEE 2006

[METROPOLIS] Philippe Owezarski Metropolis meacutetrologie pour lrsquointernet et les ser-vices

[MGIX2017] Madagascar Internet Exchange Point Mgix Mauritius internet exchangepoint 2017

[MIXP2017] Mauritius Internet Exchange Point Mixp Mauritius internet exchangepoint 2017

[Maksimovic2014] Mirjana Maksimovic Vladimir Vujovic Nikola Davidovic VladimirMiloševic and Branko Perišic Raspberry pi as internet of things hardware performances and constraints design issues 3 8 2014

[Mediametrie2018-1] Benoit David Lrsquoanneacutee Internet 2017 Internet meacuteta-meacutedia Lastvisit 20042018

[Mediametrie2018-2] Benoit David Lrsquoobservatoire des Usages Digitaux Antilles-Guyane et Reacuteunion - Panorama 2017 Last visit 20042018

[Medina2005] Alberto Medina Mark Allman and Sally Floyd Measuring the evolutionof transport protocols in the internet ACM SIGCOMM Computer Communi-cation Review 35(2) 37ndash52 2005

[Mellia2003-1] Marco Mellia Andrea Carpani and Renato Lo Cigno Tstat Tcp statisticand analysis tool In International Workshop on Quality of Service in Multiser-vice IP Networks pages 145ndash157 Springer 2003

[Mellia2003-2] M Mellia I Stoica and H Zhang TCP-aware packet marking in net-works with diffserv support Elsevier Computer Networks 42(1) 81ndash100 2003

[Mellia2005] Marco Mellia R Lo Cigno and Fabio Neri Measuring ip and tcp behavioron edge nodes with tstat Computer Networks 47(1) 1ndash21 2005

107

[Moore2001] David Moore Ken Keys Ryan Koga Edouard Lagache and K C ClaffyThe coralreef software suite as a tool for system and network administra-tors In Proceedings of the 15th USENIX Conference on System AdministrationLISA rsquo01 pages 133ndash144 Berkeley CA USA 2001 USENIX Association

[NCSUNRL] North Caroline State University - Networking Research Lab Last seen 27022018

[Nagle1984] John Nagle Congestion control in iptcp internetworks 1984

[Nicolay2017-2] Xavier Nicolay Reacutehan Noordally Pascal Anelli Nour Mohammad Mu-rad and Tahiry Razafindralambo Where is my next hop the case of indianocean islands In 2017 Global Information Infrastructure and Networking Sym-posium (GIIS) (GIISrsquo17) St Denis Reunion October 2017

[Nomikos2016] George Nomikos and Xenofontas Dimitropoulos traixroute Detectingixps in traceroute paths In International Conference on Passive and ActiveNetwork Measurement pages 346ndash358 Springer 2016

[Noordally2016] Reacutehan Noordally Xavier Nicolay Pascal Anelli Richard Lorion andPierre Ugo Tournoux Analysis of internet latency The reunion island caseIn Proceedings of the 12th Asian Internet Engineering Conference AINTEC rsquo16pages 49ndash56 New York NY USA 2016 ACM

[Noordally2017] Reacutehan Noordally Yassine Gangat Arnaud Ravoavahy Pascal Anelliand Xavier Nicolay How long delays impact tcp performance for a connec-tivity from reunion island In Next Generation Computing Applications (Next-Comp) 2017 1st International Conference on page 103ndash108 IEEE 07 2017

[ONU2013] ONU The millennium development goals report 2013 Technical reportOrganisation Nations United 2013

[Obar2012] Jonathan A Obar and Andrew Clement Internet surveillance and boome-rang routing A call for Canadian network sovereignty In TEM 2013 Pro-ceedings of the Technology amp Emerging Media Track-Annual Conference of theCanadian Communication Association (Victoria) 2012

[OpenVPN] OpenVPN Openvpn - open source vpn Last visit 09102017

[OpenWrt] OpenWrt Openwrt project Welcome to the openwrt project Last visit 12062018

[Orebaugh2006] Angela Orebaugh Gilbert Ramirez and Jay Beale Wireshark amp Etherealnetwork protocol analyzer toolkit Syngress 2006

[Ostermann2000] Shawn Ostermann Tcptrace A TCP connection analysis tool URL http www tcptrace org 2000

[Owezarski2003-1] Philippe Owezarski Meacutetrologie de la qualiteacute de service Ecole drsquoeacuteteacutetemps reacuteel (ETR2003)-Systemes Reacuteseauxet Applications 2003

[Owezarski2004] Philippe Owezarski and Nicolas Larrieu Internet trafficcharacterizationndashan analysis of traffic oscillations High Speed Networks andMultimedia Communications pages 96ndash107 2004

[PCH] Packet Clearing House Internet exchange directory 2014

[PSAMP] The Internet Engineering Task Force Packet sampling (psamp) 2017

[Paris-traceroute] Paris Traceroute Team Paris traceroute Last visit 09292017

[Paxson1995] Vern Paxson and Sally Floyd Wide area traffic the failure of poissonmodeling IEEEACM Transactions on Networking (ToN) 3(3) 226ndash244 1995

[Paxson1999] Vern Paxson Bro a system for detecting network intruders in real-timeComputer networks 31(23) 2435ndash2463 1999

108

[Paxson2001] Vern Paxson Some not-so-pretty admissions about dealing with internetmeasurements In Workshop on Network-Related Data Management (NRDM2001) 2001

[PeeringDB] Peering DB Peeringdb facilitates the exchange of information related topeering

[Periakaruppan1999] Ram Periakaruppan Evi Nemeth et al GTrace A graphical trace-route tool In LISA volume 99 pages 69ndash78 1999

[Peterson2007] Larry L Peterson and Bruce S Davie Computer networks a systems ap-proach Elsevier 2007

[Phidgets] Phidgets Phidgets products for usb sensing and control

[PlanetLab] PlanetLab an open platform for developing deploying and accessingplanetary-scale services

[PlanetLabEurope] PlanetLab PlanetLab europe an open platform for developing de-ploying and accessing planetary-scale services last visit 09102017

[Pretet2000] Thierry Prete and Olivier Mas Avancement du projet SAFE Technicalreport 16 Janvier 2000

[REUNIX2017] RENATER RENATER Connecteur de savoirs - reunix Last visit 09102017

[RFC1072] V Jacobson and R Braden TCP extensions for long-delay paths RFC 1072October 1988

[RFC1105] K Lougheed and Y Rekhter Border Gateway Protocol (BGP) RFC 1105June 1989

[RFC1700] J Reynolds and J Postel Assigned numbers RFC 1700 October 1994

[RFC1918] Y Rekhter B Moskowitz D Karrenberg G J de Groot and E Lear Ad-dress Allocation for Private Internets RFC 1918 February 1996

[RFC1983] G Malkin (Ed) Internet Usersrsquo Glossary RFC 1983 (Informational) August1996

[RFC2001] W Richard Stevens TCP Slow Start Congestion Avoidance Fast Retrans-mit and Fast Recovery Algorithms RFC 2001 January 1997

[RFC2330] Dr Guy T Almes Jamshid Mahdavi Matt Mathis and Dr Vern PaxsonFramework for IP Performance Metrics RFC 2330 May 1998

[RFC2582] Tom Henderson and Sally Floyd The NewReno Modification to TCPrsquos FastRecovery Algorithm RFC 2582 April 1999

[RFC2678] J Mahdavi and V Paxson IPPM Metrics for Measuring Connectivity RFC2678 (Proposed Standard) September 1999

[RFC2679] G Almes S Kalidindi and M Zekauskas A One-way Delay Metric forIPPM RFC 2679 (Proposed Standard) September 1999 Obsoleted by RFC7679

[RFC2680] G Almes S Kalidindi and M Zekauskas A One-way Packet Loss Metricfor IPPM RFC 2680 (Proposed Standard) September 1999 Obsoleted byRFC 7680

[RFC2681] G Almes S Kalidindi and M Zekauskas A Round-trip Delay Metric forIPPM RFC 2681 (Proposed Standard) September 1999

[RFC2756] P Vixie and D Wessels Hyper Text Caching Protocol (HTCP00) RFC2756 (Experimental) January 2000

109

[RFC2914] Sally Floyd Congestion Control Principles RFC 2914 September 2000

[RFC3031] E Rosen Viswanathan A and R Callon Multiprotocol Label SwitchingArchitecture RFC 3031 January 2001

[RFC3069] D McPherson and B Dykes VLAN Aggregation for Efficient IP AddressAllocation RFC 3069 (Informational) February 2001

[RFC3168] Sally Floyd Dr K K Ramakrishnan and David L Black The Addition ofExplicit Congestion Notification (ECN) to IP RFC 3168 September 2001

[RFC3232] J Reynolds Assigned Numbers RFC 1700 is Replaced by an On-line Da-tabase RFC 3232 January 2002

[RFC3376] B Cain S Deering I Kouvelas B Fenner and A Thyagarajan InternetGroup Management Protocol Version 3 RFC 3376 (Proposed Standard)October 2002 Updated by RFC 4604

[RFC3649] Sally Floyd HighSpeed TCP for Large Congestion Windows RFC 3649December 2003

[RFC3742] S Floyd Limited Slow-Start for TCP with Large Congestion Windows RFC3742 (Experimental) March 2004

[RFC4250] Chris M Lonvick and Sami Lehtinen The Secure Shell (SSH) Protocol As-signed Numbers RFC 4250 January 2006

[RFC4782] Pasi Sarolahti Amit Jain Sally Floyd and Mark Allman Quick-Start forTCP and IP RFC 4782 January 2007

[RFC4950] R Bonica D Gan D Tappan and C Pignataro ICMP extensions for mul-tiprotocol label switching RFC 4950 August 2007

[RFC5166] S Floyd (Ed) Metrics for the Evaluation of Congestion Control Mecha-nisms RFC 5166 (Informational) March 2008

[RFC5475] T Zseby M Molina N Duffield S Niccolini and F Raspall Sampling andFiltering Techniques for IP Packet Selection RFC 5475 (Proposed Standard)March 2009

[RFC5681] Ethan Blanton Dr Vern Paxson and Mark Allman TCP CongestionControl RFC 5681 September 2009

[RFC5735] Michelle S Cotton and Leo Vegoda Special Use IPv4 Addresses RFC 5735January 2010

[RFC5936] E Lewis and A Hoenes (Ed) DNS Zone Transfer Protocol (AXFR) RFC5936 (Proposed Standard) June 2010

[RFC6077] Ed D Papadimitriou M Welzl M Scharf and Bob J Briscoe Open Re-search Issues in Internet Congestion Control RFC 6077 February 2011

[RFC6201] R Asati C Pignataro F Calabria and C Olvera Device Reset Characteri-zation RFC 6201 (Informational) March 2011

[RFC6248] A Morton RFC 4148 and the IP Performance Metrics (IPPM) Registry ofMetrics Are Obsolete RFC 6248 (Informational) April 2011

[RFC6298] Vern Paxson Mark Allman Jerry Chu and Matt Sargent Computing TCPrsquosretransmission timer RFC 6298 June 2011

[RFC6528] F Gont and S Bellovin Defending against Sequence Number Attacks RFC6528 February 2012

[RFC6691] D Borman TCP Options and Maximum Segment Size (MSS) RFC 6691(Informational) July 2012

110

[RFC6761] Marc Krochmal and Stuart Cheshire Special-Use Domain Names RFC6761 February 2013

[RFC6928] J Chu N Dukkipati Y Cheng and M Mathis Increasing TCPrsquos InitialWindow RFC 6928 (Experimental) April 2013

[RFC7414] M Duke R Braden W Eddy and E Blanton and TCP Extensions for HighPerformance RFC 7414 February 2015

[RFC760] DoD standard Internet Protocol RFC 760 January 1980

[RFC776] J Postel Assigned numbers RFC 776 (Historic) January 1981 Obsoletedby RFC 790

[RFC7766] J Dickinson S Dickinson R Bellis A Mankin and D Wessels DNS Trans-port over TCP - Implementation Requirements RFC 7766 (Proposed Stan-dard) March 2016

[RFC793] Information Sciences Institute Transmission Control Protocol RFC 793September 1981

[RFC8311] D Black Relaxing Restrictions on Explicit Congestion Notification (ECN)Experimentation RFC 8311 (Proposed Standard) January 2018

[RFC8312] I Rhee L Xu S Ha A Zimmermann and L Eggert CUBIC for Fast Long-Distance Networks RFC 8312 February 2018

[RITE2014-1] Bob Briscoe Anna Brunstrom Andreas Petlund David Hayes David RosIng-Jyh Tsang Stein Gjessing Gorry Fairhurst Carsten Griwodz and Mi-chael Welz Reducing internet latency A survey of techniques and theirmerits In IEEE Communications Surveys amp Tutorials IEEE 2014 (To appear)

[RITE2014-2] RITE | Reducing Internet Transport Latency Slow internet -more band-with is not the answer 2014

[RaspberryPi] RASPBERRY PI FOUNDATION Raspberry Pi official website Last visit 09102017

[Ravoavahy2017] Arnaud Ravoavahy Meacutetrologie Reacuteseaux 2017

[Ripe2010] RIPE NCC RIPE atlas 2010

[Ros2005] David Ros Protocole de Transport TCP Ed Techniques Ingeacutenieur 2005

[SDTAN2013] Reacutegion Reunion Sphegravere Public and TACTIS Schema directeur drsquoamena-gement numerique du territoire de la reunion Technical report 2013

[Sallantin2014] Renaud Sallantin Optimisation de bout-en-bout du deacutemarrage des connexionsTCP PhD thesis 2014

[SamKnows] SamKnows Ltd Samknowscom 2017

[Sanchez2013] Mario A Saacutenchez John S Otto Zachary S Bischof David R ChoffnesFabiaacuten E Bustamante Balachander Krishnamurthy and Walter WillingerDasu Pushing experiments to the internetrsquos edge In NSDI pages 487ndash4992013

[Scharf2008-1] Michael Scharf Simon Hauger and Jochen Koumlgel Quick-start tcp Fromtheory to practice In Proc 6th Intern Workshop on Protocols for FAST Long-Distance Networks (PFLDnet) Manchester 2008

[Speechecker] Speedchecker Ltd Internet Performance Monitoring | Speedchecker LtdLast visit 29032018

[Steenbergen2009] Richard A Steenbergen A practical guide to (correctly) troubleshoo-ting with traceroute North American Network Operators Group pages 1ndash492009

111

[Sundaresan2011] Srikanth Sundaresan Walter De Donato Nick Feamster RenataTeixeira Sam Crawford and Antonio Pescapegrave Broadband internet perfor-mance a view from the gateway In ACM SIGCOMM computer communica-tion review volume 41 pages 134ndash145 ACM 2011

[Tan2006] Kun Tan Jingmin Song Qian Zhang and Murad Sridharan A compoundtcp approach for high-speed and long distance networks In Proceedings-IEEE INFOCOM 2006

[Tirumala2005] Ajay Tirumala Feng Qin Jon Dugan Jim Ferguson and Kevin GibbsIperf The tcpudp bandwidth measurement tool htt p dast nlanr net-Projects 2005

[Trammell2015] Brian Trammell Mirja Kuumlhlewind Damiano Boppart Iain LearmonthGorry Fairhurst and Richard Scheffenegger Enabling internet-wide de-ployment of explicit congestion notification In International Conference onPassive and Active Network Measurement pages 193ndash205 Springer 2015

[Udoo] UDOO All you need mini pc android + linux + arduino | udoo

[Vergoz2013] Michael Vergoz Classement des opeacuterateurs Internet reacuteunionnais Techni-cal report BinarySec 2013

[WAND] WAND Wand network research group Last visit 09252017

[Wang2004] Ren Wang Giovanni Pau Kenshin Yamada MY Sanadidi and Mario GerlaTcp startup performance in large bandwidth networks In INFOCOM 2004Twenty-third AnnualJoint Conference of the IEEE Computer and CommunicationsSocieties volume 2 pages 796ndash805 IEEE 2004

[Wang2018] Jessie Hui Wang and Changqing An A study on geographic properties ofinternet routing Computer Networks 133 183ndash194 2018

[Wenwei2006] Li Wenwei Zhang Dafang Yang Jinmin and Xie Gaogang On evalua-ting the differences of TCP and ICMP in network measurement ComputerCommunications 30(2) 428ndash439 2007

[WikiPing] Wikipedia ping (logiciel) Last visit 06102017

[Xu2002] Jun Xu Jinliang Fan Mostafa H Ammar and Sue B Moon Prefix-preservingIP address anonymization Measurement-based security evaluation and anew cryptography-based scheme In Network Protocols 2002 Proceedings10th IEEE International Conferenceon pages 280ndash289 IEEE 2002

[Xu2004] Lisong Xu Khaled Harfoush and Injong Rhee Binary increase congestioncontrol (bic) for fast long-distance networks In INFOCOM 2004 Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Socie-ties volume 4 pages 2514ndash2524 IEEE 2004

[Yang2016] Chantal Yang Hussein Suleman and Josiah Chavula A topology visuali-sation tool for national research and education networks in Africa In IST-Africa Week Conference 2016 pages 1ndash11 IIMC 2016

[Zhang2007] Jian Zhang and Andrew Moore Traffic trace artifacts due to monitoringvia port mirroring In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

[Zheleva2015] Mariya Zheleva Paul Schmitt Morgan Vigil and Elizabeth Belding In-ternet bandwidth upgrade implications on performance and usage in ru-ral zambia Information Technologies amp International Development 11(2) ppndash12015

[nPerf2017] nperf awards broadband reunion 2017

112

[rtraceroute] Reacutehan Noordally Arnaud Ravohavay and Xavier Nicolay rtraceroute Lastvisit 18102017

113

Pocircle Recherche Ecoles doctorales

LETTRE DrsquoENGAGEMENT DE NON-PLAGIAT

Je soussigneacute(e) NOORDALLY Reacutehan

en ma qualiteacute de doctorant(e) de

lrsquoUniversiteacute de La Reacuteunion deacuteclare ecirctre conscient(e) que le plagiat est un acte deacutelictueux

passible de sanctions disciplinaires Aussi dans le respect de la proprieacuteteacute intellectuelle et du

droit drsquoauteur je mrsquoengage agrave systeacutematiquement citer mes sources quelle qursquoen soit la forme

(textes images audiovisuel internet) dans le cadre de la reacutedaction de ma thegravese et de toute

autre production scientifique sachant que lrsquoeacutetablissement est susceptible de soumettre le texte

de ma thegravese agrave un logiciel anti-plagiat

Fait agrave Saint-Denis le 06072018

Signature

Extrait du Regraveglement inteacuterieur de lUniversiteacute de La Reacuteunion (valideacute par le Conseil drsquoAdministration en date du 11 deacutecembre 2014)

Article 9 Protection de la proprieacuteteacute intellectuelle ndash Faux et usage de faux contrefaccedilon plagiat

Lrsquoutilisation des ressources informatiques de lrsquoUniversiteacute implique le respect de ses droits de proprieacuteteacute intellectuelle ainsi que ceux de ses partenaires et plus geacuteneacuteralement de tous tiers titulaires de tes droits En conseacutequence chaque utilisateur doit - utiliser les logiciels dans les conditions de licences souscrites - ne pas reproduire copier diffuser modifier ou utiliser des logiciels bases de donneacutees pages Web textes images photographies ou autres creacuteations proteacutegeacutees par le droit drsquoauteur ou un droit privatif sans avoir obtenu preacutealablement lrsquoautorisation des titulaires de ces droits

La contrefaccedilon et le faux Conformeacutement aux dispositions du code de la proprieacuteteacute intellectuelle toute repreacutesentation ou reproduction inteacutegrale ou partielle drsquoune œuvre de lrsquoesprit faite ans le consentement de son auteur est illicite et constitue un deacutelit peacutenal Lrsquoarticle 444-1 du code peacutenal dispose laquo Constitue un faux toute alteacuteration frauduleuse de la veacuteriteacute de nature agrave cause un preacutejudice et accomplie par quelque moyen que ce soit dans un eacutecrit ou tout autre support drsquoexpression de la penseacutee qui a pour objet ou qui peut avoir pour effet drsquoeacutetablir la preuve drsquoun droit ou drsquoun fait ayant des conseacutequences juridiques raquo Lrsquoarticle L335_3 du code de la proprieacuteteacute intellectuelle preacutecise que laquo Est eacutegalement un deacutelit de contrefaccedilon toute reproduction repreacutesentation ou diffusion par quelque moyen que ce soit drsquoune œuvre de lrsquoesprit en violation des droits de lrsquoauteur tels qursquoils sont deacutefinis et reacuteglementeacutes par la loi Est eacutegalement un deacutelit de contrefaccedilon la violation de lrsquoun des droits de lrsquoauteur drsquoun logiciel (hellip) raquo

Le plagiat est constitueacute par la copie totale ou partielle drsquoun travail reacutealiseacute par autrui lorsque la source emprunteacutee nrsquoest pas citeacutee quel que soit le moyen utiliseacute Le plagiat constitue une violation du droit drsquoauteur (au sens des articles L 335-2 et L 335- 3 du code de la proprieacuteteacute intellectuelle) Il peut ecirctre assimileacute agrave un deacutelit de contrefaccedilon Crsquoest aussi une faute disciplinaire susceptible drsquoentraicircner une sanction Les sources et les reacutefeacuterences utiliseacutees dans le cadre des travaux (preacuteparations devoirs meacutemoires thegraveses rapports de stagehellip) doivent ecirctre clairement citeacutees Des citations inteacutegrales peuvent figurer dans les documents rendus si elles sont assorties de leur reacutefeacuterence (nom drsquoauteur publication date eacutediteurhellip) et identifieacutees comme telles par des guillemets ou des italiques

Les deacutelits de contrefaccedilon de plagiat et drsquousage de faux peuvent donner lieu agrave une sanction disciplinaire indeacutependante de la mise en œuvre de poursuites peacutenales

  • Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion
  • Remerciements
  • Reacutesumeacute
  • Abstract
  • Table des matiegraveres
  • Liste des acronymes
  • Introduction
    • Contexte geacuteneacuteral
    • Contexte reacutegional
      • LInternet agrave La Reacuteunion
      • LInternet dans la Zone de lOceacutean Indien
        • Probleacutematique
        • Organisation de la thegravese
          • Eacutetat de lart
            • Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage
              • Controcircle de congestion de TCP
              • La probleacutematique de lutilisation dun reacuteseau agrave grande capaciteacute de stockage
              • Un controcircle de congestion de TCP adapteacute aux LFN
              • Controcircle de congestion avec implication des routeurs
              • Caracteacuterisation de La Reacuteunion
                • Meacutetrologie du trafic Internet
                  • Deacutefinition
                  • Meacutetrologie active
                  • Meacutetrologie passive
                  • Comparatif entre mesures actives et mesures passives
                    • Synthegravese
                      • Caracteacuterisation de la connectiviteacute de La Reacuteunion
                        • Objectifs
                        • Cahier des charges
                          • Evolution
                          • Connectiviteacute
                            • Protocole de mesure
                              • Eacutechantillon de mesure
                              • Eacutevolution
                              • Connectiviteacute
                                • Reacutesultats
                                  • Eacutevolution
                                  • Connectiviteacute de La Reacuteunion
                                  • Connectiviteacute des icircles de la Zone Oceacutean Indien
                                  • Synthegravese des reacutesultats
                                    • Conclusion
                                      • Meacutetrologie sur le service de transport agrave La Reacuteunion
                                        • Objectifs
                                          • Les objectifs de leacutetude
                                          • Les meacutetriques de leacutetude
                                            • Mise en oeuvre dune plate-forme de meacutetrologie
                                              • Pour la capture du trafic
                                              • Pour analyser les traces
                                                • Protocole de mesure
                                                • Reacutesultats
                                                  • Supervision du trafic
                                                  • Performance de TCP
                                                  • Synthegravese des reacutesultats
                                                    • Conclusion
                                                      • Conclusion amp perspectives
                                                        • Synthegravese des travaux
                                                          • Perspectives
                                                            • Table des figures
                                                            • Liste des tableaux
                                                              • Bibliographie
                                                                  • Table des figures
                                                                  • Liste des tableaux
                                                                  • Bibliographie
Page 6: Étude de la connectivité Internet de l'île de la Réunion

IV

Reacutesumeacute

Lrsquoaccegraves agrave Internet des icircles de la Zone Oceacutean Indien a la particulariteacute drsquoutiliser deuxlongs cacircbles sous-marins Les routes ont en commun de passer par un de ces liens etdrsquointroduire une composante de deacutelai qui peut ecirctre significative La performance de TCPest lieacutee agrave lrsquoeacutetat des routes et au deacutelai Dans la situation de lrsquoicircle de la Reacuteunion comment secomporte un protocole ayant une deacutependance au deacutelai tel que TCP

Dans cette thegravese nous proposons une eacutetude de lrsquoInternet agrave la Reacuteunion Les travauxvisent agrave pouvoir dresser un bilan de la connectiviteacute Internet Ils srsquoorientent drsquoune partagrave caracteacuteriser la connectiviteacute au niveau du reacuteseau et drsquoautre part agrave traduire ses caracteacute-ristiques au niveau de la couche de transport Ainsi les travaux preacutesenteacutes reposent surdeux eacutetudes de meacutetrologie sur le reacuteseau reacuteunionnais

Le premier examen a pour objectif la caracteacuterisation des deacutelais et des routes emprun-teacutees depuis et en direction de lrsquoicircle Ces travaux reposent sur une plate-forme de mesuresmise en place agrave cet effet Un outil drsquoidentification des routes a eacuteteacute deacuteveloppeacute afin drsquoana-lyser les chemins depuis et vers la Reacuteunion Cet outil utilise une base de donneacutees degeacuteolocalisation construite agrave partir des adresses IP rencontreacutees des deacutelais associeacutes et drsquoin-formations provenant des Registres Internet Reacutegionaux Lrsquoanalyse des reacutesultats montredes caracteacuteristiques propres agrave la reacutegion Reacuteunion

La seconde eacutetude de meacutetrologie vise lrsquoanalyse des flux TCP Des meacutetriques associeacuteesagrave lrsquoobservation des captures de trafic sont identifieacutees afin drsquoeacutetablir les performances deTCP mais eacutegalement les types de trafic entrant et sortant de lrsquoicircle Le volume des eacutecouteseacutetant important un outil drsquoanalyse pour des traitements efficaces et rapides a eacutegalementeacuteteacute deacuteveloppeacute

Les contributions de cette thegravese sont drsquoabord rattacheacutees au contexte reacuteunionnais etsont extrapoleacutees vers lrsquointernet de la Zone Oceacutean Indien Cette thegravese se veut ecirctre un eacuteleacute-ment pour une reacuteflexion avec lrsquoensemble des acteurs de lrsquoInternet agrave la Reacuteunion

Mots cleacutes

Meacutetrologie active Deacutelais Routage Meacutetrologie passive Performance TCP Zone OceacuteanIndien Reacuteunion

V

Abstract

The access to the Internet of the Islands of the Indian Ocean Area has the particularityof using two long submarines cables The routes have in common to go through one ofthese links and introduce a delay component that can be significant The performance ofTCP is linked to the state of the route and the delay In the situation of Reunion Islandhow does a protocol having a dependence on delay such as TCP behaves

In this thesis we propose a study of the Internet in Reunion Island The work aimsto be able to take stock of Internet connectivity They are oriented on the one hand tocharacterize the connectivity at the level of the network and on the other hand to translatethese characteristics at the level of the transport layer Thus the works presented arebased on two metrology studies on the Reunion network

The first review aims to characterize the delays and the routes taken from and to theisland This work is based on a platform of measures put in place for this purpose A roadidentification tool has been developed to analyze roads to and from Reunion Island Thistool uses a geolocation database built from IP addresses encountered associated delaysand information from the Regional Internet Registries The analysis of the results showscharacteristics specific to the Reacuteunion region

The second metrology study aims to analyze TCP flows Metrics associated with theobservation of the catches of traffic are identified in order to establish the performancesof TCP but also the types of traffic entering and leaving the island Since the volume ofthe intercepts is important an analysis tool for efficient and rapid treatments has beendeveloped

The contributions of this thesis are first of all related to the Reunionese context andare extrapolated to the Internet of the Indian Ocean Zone This thesis is meant to be anelement for a reflection with all the actors of the Internet in Reunion Island

Keywords

Active Metrology Delay Routage Passive metrology Performance TCP Indian OceanArea Reunion Island

VI

Table des matiegraveres

Remerciements III

Reacutesumeacute V

Abstract VI

Liste des acronymes IX

Introduction 11 Contexte geacuteneacuteral 12 Contexte reacutegional 1

21 LrsquoInternet agrave La Reacuteunion 122 LrsquoInternet dans la Zone de lrsquoOceacutean Indien 5

3 Probleacutematique 84 Organisation de la thegravese 8

1 Eacutetat de lrsquoart 911 Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage 10

111 Controcircle de congestion de TCP 10112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de

stockage 14113 Un controcircle de congestion de TCP adapteacute aux LFN 17114 Controcircle de congestion avec implication des routeurs 22115 Caracteacuterisation de La Reacuteunion 23

12 Meacutetrologie du trafic Internet 25121 Deacutefinition 25122 Meacutetrologie active 26123 Meacutetrologie passive 32124 Comparatif entre mesures actives et mesures passives 35

13 Synthegravese 36

2 Caracteacuterisation de la connectiviteacute de La Reacuteunion 3921 Objectifs 4022 Cahier des charges 40

221 Evolution 40222 Connectiviteacute 40

23 Protocole de mesure 46231 Eacutechantillon de mesure 46232 Eacutevolution 47233 Connectiviteacute 48

24 Reacutesultats 53241 Eacutevolution 53

VII

242 Connectiviteacute de La Reacuteunion 54243 Connectiviteacute des icircles de la Zone Oceacutean Indien 65244 Synthegravese des reacutesultats 71

25 Conclusion 72

3 Meacutetrologie sur le service de transport agrave La Reacuteunion 7531 Objectifs 75

311 Les objectifs de lrsquoeacutetude 76312 Les meacutetriques de lrsquoeacutetude 76

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie 79321 Pour la capture du trafic 79322 Pour analyser les traces 80

33 Protocole de mesure 8234 Reacutesultats 85

341 Supervision du trafic 86342 Performance de TCP 88343 Synthegravese des reacutesultats 91

35 Conclusion 92

Conclusion amp perspectives 951 Synthegravese des travaux 952 Perspectives 96

Table des figures 100

Liste des tableaux 101

Bibliographie 103

VIII

Liste des acronymes

ACK Acknowledgement

ADSL Asymmetric Digital Subscriber Line

AIMD Additive Increase and Multiplicative Decrease

API Application Programming Interface

ARCEP Autoriteacute de Reacutegulation des Communications Electroniques et des Postes

AS Autonomous System

BDP Bandwidth Delay Product

CAIDA Center for Applied Internet Data Analysis

CDCS Comoros Domestic Cable Sytem

CDF Cumulative Density Function

CIL Correspondant Informatique et Liberteacutes

CWND Congestion Window

CWR Congestion Window Reduce

DNS Domain Name System

DSI Direction des Services Informatiques

DupAck Duplicate Acknowledgement

EASSY Eastern Arfrica Submarine SYstem

ECE ECN Echo

ECN Explicit Congestion Notification

FAI Fournisseurs drsquoAccegraves Internet

FTTH Fiber To The Home

GIX Global Internet eXchange

GNU GNUrsquos Not Unix

GPL General Public Licence

HTTP HyperText Transfer Protocol

HTTPS HyperText Transfer Protocol Secured

IANA Internet Assigned Numbers Authority

ICMP Internet Control Message Protocol

IETF Internet Engineering Task Force

IX

IGMP Internet Group Management Protocol

IMAP Internet Message Access Protocol

IP Internet Protocol

IPPM IP Performance Metrics

IW Initial Window

IXP Internet eXchange Point

LAN Local Area Network

LER Label Edge Router

LFN Long Fat Network

LIM Laboratoire drsquoInformatique et de Matheacutematiques

LION Lower Indian Ocean Network

LSP Label Switched Path

LSR Label Switch Router

MAN Metropolitan Area Network

MPLS MultiProtocol Label Switch

MSS Maximun Segment Size

NRA Noeud de Raccordement drsquoAbonneacutes

NS Nonce Sum

OS Operating System

PDF Probability Density Function

POP Post Office Protocol

PSAMP Packet Sampling

RENATER REseau NAtional de communication eacutelectroniques pour la Technologie lrsquoEnseigne-ment et la Recherche

RIR Regional Internet Registry

RITE Reducing Internet Transport Latency

RSSI Responsable Seacutecuriteacute et Systegravemes drsquoInformation

RTO Retransmission TimeOut

RTT Round-Trip delay Time

SAFE South-Africa Far East

SAT-3 South Africa Transit-3

SCP Ssh CoPy

SEAS Seychelles to East Africa System

SMTP Simple Mail Transfert Protocol

SSH Secure SHell

ssthresh slow-start threshold

TAI Technologies drsquoAccegraves agrave Internet

X

TCP Transmission Control Protocol

TTL Time-To-Live

UDP User Datagram Protocol

VDSL Very-high-bit-rate Digital Subscriber Line

VLAN Virtual Local Area Network

VOD Video on demand

VPN Virtal Private Network

WAN Wide Area Network

WASC West Africa Submarine Cable

ZOI Zone Oceacutean Indien

XI

XII

Introduction

1 Contexte geacuteneacuteral

Depuis sa premiegravere deacutemonstration publique en 1972 Internet a fortement eacutevolueacute[Leiner1997] Dans une premiegravere phase nous avons les changements de services Les uti-lisateurs ont basculeacute des services historiques que sont lrsquoeacutechange drsquoe-mail et la navigationweb vers une utilisation interactive de lrsquoInternet Ces nouveaux services tels que la Voixsur IP les Jeux en ligne le Streaming etc sont maintenant possibles peu importe lrsquoendroitougrave lrsquoon se situe Cela gracircce agrave la seconde phase des innovations de lrsquoInternet lrsquoeacutevolu-tion des technologies logicielles et mateacuterielles Les technologies sont devenues de plusen plus mobiles et proposent des deacutebits drsquoaccegraves agrave lrsquoInternet de plus en plus importantsAinsi nous sommes passeacutes drsquoun accegraves physique de chez soi connecteacutes agrave un ordinateurfixe et une liaison 56 kbits (kilo-bitsseconde) agrave des smartphones et des connexions mo-biles avec un deacutebit theacuteorique minimal descendant de 20 Gbits (Giga-bitsseconde) dansun futur proche pour la technologie 5G En parallegravele lrsquoaccegraves agrave Internet srsquoest deacutemocra-tiseacute Drsquoapregraves une eacutetude de lrsquoOrganisation des Nations Unies le nombre de teacuteleacutephonesmobiles est devenu supeacuterieur au nombre drsquohabitants sur la planegravete [ONU2013] Ces eacutevo-lutions parallegraveles ont bouleverseacute lrsquousage de lrsquoInternet Est-ce que ces eacutevolutions ont eu unimpact sur lrsquoInternet reacuteunionnais

2 Contexte reacutegional

21 LrsquoInternet agrave La Reacuteunion

Pour comprendre la situation de lrsquoInternet agrave La Reacuteunion il est neacutecessaire de relaterlrsquohistoire de la connectiviteacute Internet et de dresser un bilan de lrsquoeacutetat actuel Cet historiqueest effectueacute agrave partir du document [Pretet2000] qui preacutesente lrsquoavancement du projet deconnexion de lrsquoicircle de La Reacuteunion au cacircble sous-marin South-Africa Far East (SAFE)

La premiegravere connexion de La Reacuteunion agrave lrsquoInternet date de 1992 avec la mise en servicedu projet Telecom-2 Agrave cette eacutepoque la seule liaison connectant La Reacuteunion agrave Interneteacutetait une connexion satellitaire Jusqursquoen 2001 et lrsquoarriveacutee du cacircble SAT-3WASCSAFEles deacutebits drsquoaccegraves reacutesidentiels ne deacutepassaient pas les 56 kbits La bande passante totalede lrsquoaccegraves Internet de lrsquoicircle par ce canal satellite eacutetait de 400 Mbits (Meacutega-bitsseconde)tous opeacuterateurs confondus Le coucirct drsquoutilisation de la liaison satellite avoisinait les17 000DMbmois et par opeacuterateur La technologie drsquoaccegraves et le tarif eacuteleveacute limitaient lesusages de lrsquoInternet priveacute agrave des services basiques comme lrsquoeacutechange drsquoe-mail Lrsquoarriveacuteedes cacircbles South Africa Transit-3 (SAT-3)West Africa Submarine Cable (WASC)SAFE en2001 visaient agrave deacutesenclaver numeacuteriquement lrsquoicircle

Ce cacircble drsquoune longueur totale de 28 000 Km (Kilo-megravetres) connecte lrsquoEurope (Es-pagne et Portugal) agrave lrsquoAsie (Inde et Malaisie) en longeant la cocircte Ouest africaine telqursquoillustreacutee par la carte figure 1 Le lien est composeacute de deux paires de fibres optiquesavec une capaciteacute globale de 135 Gbits La reacutepartition des capaciteacutes fut faite en fonction

1

du montant investi par les opeacuterateurs France Teacuteleacutecom fut seacutelectionneacutee pour la Franceavec un deacutebit total de 13 6 Gbits dont 155 Mbits furent alloueacutes agrave la connexion de LaReacuteunion Ce deacutebit eacutetait eacutequivalent agrave la capaciteacute maximale theacuteorique du lien satellite deFrance Teacuteleacutecom Outre la seacutecuriteacute apporteacutee par la fibre optique crsquoest la qualiteacute de la trans-mission qui a eacuteteacute ameacutelioreacutee avec ce support Ce cacircble a eacuteteacute une premiegravere eacutetape dans lamise en place drsquoune autoroute de lrsquoinformation entre lrsquoEurope lrsquoAsie et lrsquoAfrique PourLa Reacuteunion cette autoroute a eacuteteacute un facteur pour la baisse des coucircts de communication eten parallegravele le deacuteploiement de la technologie Asymmetric Digital Subscriber Line (ADSL)Les tarifs de consommation de la bande passante du lien ont connu une baisse impor-tante suite agrave une deacutecision de lrsquoAutoriteacute de Reacutegulation des Communications Electroniques etdes Postes (ARCEP) en 2004 [ARCEP2004] Les tarifs sont passeacutes de 17 000 DMbmois agrave1 550 DMbmois

FIGURE 1 ndash Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000])

Malgreacute la baisse des tarifs lrsquoADSL nrsquoeacutetait preacutesent que dans 6 villes agrave forte densiteacutede population Afin drsquoaugmenter la couverture de lrsquoaccegraves Internet de lrsquoicircle une dorsalefaisant le tour de lrsquoicircle est installeacutee Crsquoest le reacuteseau nommeacute Gazelle dont le deacutebut du deacute-ploiement fut effectueacute dans le courant de lrsquoanneacutee 2003 [SDTAN2013] Cette fibre est ins-talleacutee en hauteur en suivant le reacuteseau Haute Tension drsquoEDF selon le plan de la figure 2(en trait bleu ou fonceacute) Le but de ce reacuteseau est de raccorder lrsquoensemble des Noeud de Rac-cordement drsquoAbonneacutes (NRA) Un NRA est un local heacutebergeant un central teacuteleacutephonique delrsquoopeacuterateur historique France Teacuteleacutecom dans lequel aboutissent les lignes teacuteleacutephoniquesdes abonneacutes communeacutement appeleacutees boucles locales Au delagrave de ces locaux les boucleslocales forment le reacuteseau capillaire Lrsquointerconnexion entre le reacuteseau Gazelle et les NRAest repreacutesenteacutee en vert sur la figure 2

En 2004 La Reacuteunion srsquoest doteacutee drsquoun point drsquoeacutechange (Global Internet eXchange (GIX)ou Internet eXchange Point (IXP)) nommeacute Reunix Il fut pendant pregraves de 10 ans le seul IXPpreacutesent dans la Zone Oceacutean Indien (ZOI) Geacutereacute par le REseau NAtional de communicationeacutelectroniques pour la Technologie lrsquoEnseignement et la Recherche (RENATER) il vise agrave inter-connecter les fournisseurs drsquoaccegraves Internet de La Reacuteunion afin drsquoeacuteviter que le trafic localne sorte de lrsquoicircle et consomme des capaciteacutes sur le cacircble sous-marin En plus de cet eacutequi-pement des technologies de cache ont eacuteteacute deacuteployeacutees sur le territoire LrsquoUniversiteacute de LaReacuteunion a eacuteteacute un des acteurs de ce deacuteploiement

2

FIGURE 2 ndash Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000])

Depuis la deacutecision de lrsquoARCEP en 2004 chaque anneacutee une baisse de 20 agrave 40 duprix du Meacutegabit sur le cacircble sous-marin est enregistreacutee En 2006 pour 50D un abonneacutenrsquoavait droit qursquoagrave la connexion ADSL de 1 Mbits sans aucun service additionnel Lrsquoan-neacutee suivante pour le mecircme tarif la teacuteleacutephonie illimiteacutee vers certains pays a eacuteteacute ajouteacuteeau forfait Dans le courant de lrsquoanneacutee 2010 le forfait est resteacute le mecircme mais le deacutebit alloueacuteest augmenteacute pour atteindre 8 Mbits La Reacuteunion nrsquoa vu lrsquoarriveacutee du triple play (Teacuteleacutevi-sion Teacuteleacutephone Internet) qursquoagrave partir des anneacutees 20112012 avec lrsquoarriveacutee drsquoun nouveaucacircble Lower Indian Ocean Network (LION) Le LION est un cacircble sous-marin reliant LaReacuteunion Maurice et Madagascar depuis 2009 En 2012 une extension est rajouteacutee sousle nom de LION-2 connectant le LION agrave Mayotte et au Kenya Ce nouveau cacircble proposedegraves sa mise en service une capaciteacute deacutepassant le 1 Tbs (Teacuterabitseconde)

Lrsquoaugmentation continue des deacutebits et de la capaciteacute disponible sur le cacircble SAT-3WASCSAFE actuellement agrave 900 Gbits a acceacuteleacutereacute le deacuteploiement de nouveaux ser-vices et de nouvelles technologies drsquoaccegraves agrave Internet pour les abonneacutes Lrsquoicircle de La Reacuteuniondispose actuellement en dehors des connexions mobiles de trois Technologies drsquoAccegraves agrave In-ternet (TAI) La premiegravere est la technologie ADSL preacutesente depuis 2001 Elle propose desdeacutebits asymeacutetriques allant jusqursquoagrave 20 Mbitss en descente Crsquoest le deacutebit qursquoaura lrsquoutilisa-teur en teacuteleacutechargement Depuis 2014 lrsquoopeacuterateur historique Orange (ex-France Teacuteleacutecom)propose la technologie Very-high-bit-rate Digital Subscriber Line (VDSL) 2 avec des deacutebitsallant jusqursquoagrave 100 Mbits descendant La limite physique de cette TAI impose une dis-tance entre lrsquoabonneacute et le distributeur infeacuterieure agrave 1 Km La derniegravere technologie preacutesentesur lrsquoicircle est la fibre optique Deacuteployeacutee depuis 2007 par lrsquoopeacuterateur priveacute ZEOP elle eacutetaitjusqursquoagrave peu principalement deacuteployeacutee dans les villes du Port Sainte Marie et Saint Pierre

Chaque opeacuterateur dispose drsquoune ou plusieurs technologies drsquoaccegraves Chaque technolo-

3

gie est associeacutee agrave un deacutebit maximal theacuteorique La carte 3 1 preacutesente les deacutebits theacuteoriquesqui sont preacutesents sur lrsquoicircle [France2017]

Cette carte montre une dispariteacute des deacutebits selon les zones geacuteographiques de lrsquoicircleLe Plan France Tregraves Haut Deacutebit a pour objectif drsquouniformiser sur lrsquoensemble du territoirefranccedilais les deacutebits avec le deacuteploiement de la technologie drsquoaccegraves fibre optique

FIGURE 3 ndash Carte des deacutebits agrave La Reacuteunion

Reacutecapitulatif

La connexion agrave Internet donne agrave La Reacuteunion des capaciteacutes importantes La preacutesencedrsquoun GIX sur le territoire a limiteacute le trafic reacuteunionnais sur les cacircbles sous-marins La figure4 montre lrsquoensemble des eacuteveacutenements qui ont marqueacute le deacuteveloppement de lrsquoInternet agrave LaReacuteunion jusqursquoagrave nos jours

Depuis la deacutecision de lrsquoARCEP en 2004 [ARCEP2004] et lrsquoarriveacutee du cacircble LION lesopeacuterateurs ont fait le choix drsquoaugmenter les services proposeacutes avec un prix reacutesidentielstable Les derniers services ajouteacutes sont ceux de la Video on demand (VOD) et de la rediffu-sion (Replay) En 2014 le prix moyen du MeacutegabitMois sur le cacircble SAT-3WASCSAFEavoisinait les 25 D En pregraves de 15 ans on note la baisse du coucirct moyen du Meacutegabitmoisde 17 000 D agrave 25 D

Lrsquoeacutevolution de la connectiviteacute Internet agrave La Reacuteunion est lieacutee au deacuteveloppement de laconnectiviteacute des diffeacuterents pays preacutesents dans la Zone Oceacutean Indien

1 Source Observatoire France Tregraves Haut Deacutebit

4

FIGURE 4 ndash Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion

22 LrsquoInternet dans la Zone de lrsquoOceacutean Indien

Les acteurs du deacuteveloppement du numeacuterique dans la Zone Oceacutean Indien

Dans le cadre de nos eacutetudes nous restreignons la ZOI agrave 6 icircles ou archipels suivants(rangeacutes par ordre alphabeacutetique) les Comores Madagascar Maurice Mayotte La Reacuteunionet les Seychelles Agrave lrsquoexception de Mayotte et de La Reacuteunion qui sont des reacutegions fran-ccedilaises les autres icircles et archipels citeacutes sont des pays indeacutependants Nous allons dansun premier temps faire une preacutesentation des principaux acteurs du deacuteveloppement nu-meacuterique dans chaque territoire Le deacuteveloppement de lrsquoInternet dans la ZOI se fait encollaboration avec lrsquoensemble des pays Nous poursuivrons avec les futures installationsdes cacircbles sous-marins dans la ZOI

LrsquoUnion des Comores est une reacutepublique feacutedeacuterale drsquoAfrique Lrsquoarchipel est connecteacuteagrave Internet depuis le 19 Janvier 1998 via une connexion satellite En 2010 le gouverne-ment deacuteploie le Comoros Domestic Cable Sytem (CDCS) qui relie lrsquoensemble des icircles delrsquoarchipel entre elles avec en parallegravele le raccordement au cacircble Eastern Arfrica SubmarineSYstem (EASSY) [Comores2002] Ce cacircble relie lrsquoAfrique du Sud au Soudan en longeantla cocircte Est du continent En 2009 lrsquoAutoriteacute Nationale de Reacutegulation des TIC (ANRTIC) voitle jour De nombreuses missions sont donneacutees agrave cette autoriteacute comme appliquer et fairerespecter la loi des Technologies de lrsquoInformation et de la Communication (TIC) reacuteguler lesecteur des TIC favoriser la coopeacuteration entre les acteurs et geacuterer les diffeacuterends garan-tir une concurrence saine et loyale entre les opeacuterateurs et de deacutevelopper la recherche laformation et les innovations technologiques [ANRTIC2016] En deacutecembre 2016 un troi-siegraveme cacircble connecte lrsquoarchipel agrave Mayotte Actuellement un Vice-Preacutesident chargeacute desTIC travaille en collaboration avec un Conseiller du preacutesident en matiegravere de transports etteacuteleacutecommunications

La Reacutepublique de Madagascar est relieacutee agrave Internet par deux cacircbles sous-marins Lepremier est lrsquoEASSY Le second cacircble est le LION Au niveau des prises de deacutecisions 3 or-ganismes principaux existent Le plus important est le ministegravere des Teacuteleacutecommunicationset des Nouvelles Technologies Il a mis en place le Projet drsquoInfrastructure de Communicationpour Madagascar (PICOM) Lrsquoobjectif est la reacuteduction des coucircts drsquoaccegraves aux services deteacuteleacutecommunications Le second est lrsquoAutoriteacute de Reacutegulation des TEchnologies de Communica-tion (ARTEC) Cet administration octroie les licences aux proprieacutetaires des reacuteseaux arbitreles diffeacuterends entre opeacuterateurs et assure la gestion des spectres [ARTEC2016] Le dernierorganisme est le Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de la Commu-nication (GOTICOM) Il a pour objectif drsquoaccompagner et drsquoameacuteliorer les infrastructuresde teacuteleacutecommunication et de favoriser lrsquointeacutegration des TIC [GOTICOM2011] Depuis2016 un GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Africaine [MGIX2017]

5

La Reacutepublique de Maurice regroupe les icircles Rodrigues et Maurice Sous lrsquoimpulsiondu gouvernement anglais la premiegravere ligne teacuteleacutephonique fut installeacutee en 1883 Actuel-lement en plus drsquoune connexion satellitaire reliant les deux icircles le SAFE et le LIONconnectent Maurice agrave Internet Un ministegravere des Technologies de lrsquoInnovation et desCommunications existe au sein du gouvernement Crsquoest ce mecircme gouvernement quinomme le directeur de lrsquoInformation and Communication Technologies Authority (ICTA) Crsquoestlrsquoautoriteacute de reacutegulation des Teacuteleacutecoms et des Postes Il existe 2 principaux opeacuterateurs quesont Mauritius Telecom et Emtel Une dizaine drsquoopeacuterateurs cohabitent sur lrsquoicircle [ICTA2017]Depuis 2016 un nouveau GIX est preacutesent sur lrsquoicircle gracircce au projet AXIS de lrsquoUnion Afri-caine [MIXP2017]

Mayotte est un deacutepartement franccedilais depuis Mars 2011 Le raccordement au cacircbleLION-2 extension du cacircble LION en avril 2012 rend possible lrsquoarriveacutee du haut deacutebit surce territoire En 2013 un GIX geacutereacute par RENATER est installeacute au sein du Rectorat Il senomme Mayotix

Les Seychelles ont vu leur premiegravere connexion Internet introduite dans lrsquoarchipel parAtlas Seychelles Ltd en septembre 1996 En 2012 les Seychelles sont connecteacutes agrave une fibreen provenance de Tanzanie Crsquoest le cacircble Seychelles to East Africa System (SEAS) Crsquoestlrsquounique cacircble sous-marin connectant lrsquoarchipel Le Ministegravere des Technologie de lrsquoInforma-tion et des Communications (MITC) fait office drsquoautoriteacute de Reacutegulation des Teacuteleacutecommuni-cations dans le pays [DICT2017]

Chaque autoriteacute de reacutegulation agrave un impact sur le deacuteveloppement de lrsquoInternet dansson pays Ce deacuteveloppement se reacutepercute sur lrsquoameacutelioration de lrsquoaccegraves Internet dans laZOI

Deacuteveloppement de lrsquointerconnexion de la Zone Oceacutean Indien

Cette reacutegion a connu un premier bouleversement de sa connectiviteacute agrave Internet avecle deacuteploiement du cacircble sous-marin SAT-3WASCSAFE en 2001 pour La Reacuteunion etMaurice Lrsquoarriveacutee du LION en 2009 a connecteacute Madagascar aux deux icircles En 2010 lesComores et Madagascar se sont ouverts une voie vers lrsquoAfrique avec le cacircble EASSY Lrsquoin-terconnexion du LION 2 a deacuteveloppeacute lrsquoInternet agrave Mayotte tandis que le deacuteploiement ducacircble SEAS a ouvert les Seychelles agrave lrsquoInternet haut deacutebit La carte 5 indique les diffeacuterentscacircbles sous-marins preacutesents dans la ZOI

La ZOI srsquoengage dans le deacuteploiement de nouveaux liensLe cacircble MElting poT Indianoceanic Submarine System (METISS) drsquoune longueur de

3 500 kilomegravetres reliera Madagascar Maurice et La Reacuteunion agrave lrsquoAfrique du Sud La bandepassante du cacircble sera de 24 Tbs Sa mise en service est preacutevue pour le courant de lrsquoan-neacutee 2019 [Lemauricien]

Africa-1 est un cacircble reliant lrsquoAfrique du Sud le Moyen Orient et lrsquoAsie centrale Cecacircble de plus de 12 0000 kilomegravetres passera le long de la cocircte Est africaine avant de relierlrsquoArabie Saoudite lrsquoEacutegypte et le Pakistan La mise en service du cacircble est preacutevue pour lecourant de lrsquoanneacutee 2020 [Africa1]

En 2019 sera mis en service le cacircble IOX IOX est un cacircble sous-marin deacutedieacute agrave lrsquoicircleMaurice Il a pour but drsquooffrir une nouvelle liaison agrave Maurice en reliant lrsquoicircle agrave lrsquoAfrique etau reste du monde Il sera doteacute drsquoune capaciteacute de 54 Tbs [IOX]

La carte 6 repreacutesente lrsquoensemble des IXP preacutesents dans la Zone Oceacutean Indien En vertce sont les points drsquoeacutechanges deacutejagrave en service La France a degraves lrsquoanneacutee 2004 mis en placele point drsquoeacutechange agrave La Reacuteunion et en 2012 celui de Mayotte Ceux de Maurice et de

6

FIGURE 5 ndash Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source [Cablesmap])

Madagascar ont eacuteteacute mis en service en 2016 avec lrsquoaide de lrsquoUnion Africaine de lrsquoInter-net Society et du projet AXIS [AXIS] Les points bleus repreacutesentent les points drsquoeacutechangequi sont preacutevus drsquoecirctre deacuteployeacutes dans la zone oceacutean indien par le projet AXIS dans le fu-tur Drsquoici quelques anneacutees lrsquoensemble des territoires de la zone sera eacutequipeacute drsquoun pointdrsquoeacutechange Cet eacutequipement vise a maintenir le trafic de type Metropolitan Area Network(MAN) du pays ougrave il est installeacute Il facilite les eacutechanges entre les opeacuterateurs locaux enreacuteduisant la latence et en augmentant la qualiteacute de service

FIGURE 6 ndash Carte des points drsquoeacutechange preacutesents actuellement et dans un futur prochedans la ZOI

7

3 Probleacutematique

LrsquoInternet et ses applications ont eacuteteacute deacuteveloppeacutes dans des territoires ougrave les routes sontnombreuses Lrsquoicircle de La Reacuteunion comme beaucoup de territoires insulaires ne beacuteneacuteficiepas drsquoun nombre de liaisons physiques directes important Lrsquoeacutevolution de lrsquoInternet al-lant des applications toleacuterantes aux deacutelais vers des applications temps-reacuteel neacutecessite unerobustesse et une qualiteacute de service deacutependantes drsquoun maillage fort et de deacutelais courts

Lrsquoeacutetude drsquo[Anelli2012] a deacutemontreacute que les deacutelais agrave destination drsquoadresses aleacuteatoiressont sensiblement plus longs depuis La Reacuteunion que depuis Paris avec un eacutecart drsquoenvi-ron 180 ms Suite agrave ce constat lrsquoauteur a reacutealiseacute des simulations estimant les deacutebits asso-cieacutes avec un taux de pertes de 10 Ces simulations ont mis en avant des deacutebits eacutecouleacutesplus faibles pour un usager situeacute agrave La Reacuteunion qursquoun usager baseacute agrave Paris Une augmen-tation de la bande passante nrsquoentraicircnerait pas une diminution des deacutelais Le groupe detravail europeacuteen Reducing Internet Transport Latency (RITE) a reacutealiseacute une videacuteo explicativede ce pheacutenomegravene [RITE2014-2]

Cette thegravese vise agrave mettre en lumiegravere les principaux freins des deacutebits eacutecouleacutes

Dans une premiegravere eacutetape nous eacutetudierons lrsquoeacutevolution des deacutelais depuis La Reacuteunionen prenant comme base lrsquoeacutetude reacutealiseacutee par [Anelli2012]

Dans un second temps nous eacutetudierons les routes logiques de lrsquoInternet reacuteunionnais

Dans un dernier temps nous reacutealiserons une proposition drsquoeacutetude de meacutetrologie Cetteeacutetude vise agrave identifier la correacutelation des eacuteveacutenements de congestion entre les flots lrsquoimpor-tance des anomalies affectant Transmission Control Protocol (TCP) (pertes initiales fauxeacuteveacutenements de congestion) la reacutepartition des flots (en taille en protocole en application)et les paramegravetres de performances (taux de pertesRTT deacutebit eacutecouleacute)

4 Organisation de la thegravese

Suite agrave lrsquoexposition de notre probleacutematique le chapitre 1 preacutesente le contexte scienti-fique de nos travaux Dans un premier temps nous allons preacutesenter les caracteacuteristiquesde TCP et sa probleacutematique lieacutee aux reacuteseaux agrave forte capaciteacute de stockage Nous continue-rons avec une preacutesentation de quelques solutions Nous deacuteterminerons si lrsquoaccegraves Internetde La Reacuteunion doit ecirctre consideacutereacute comme un reacuteseau agrave forte capaciteacute de meacutemorisation Lasuite du chapitre inclura la deacutefinition de la meacutetrologie dans les reacuteseaux et une preacutesenta-tion des techniques de mesures active et passive

La premiegravere eacutetude est deacutecrite dans le chapitre 2 et deacutebute par la preacutesentation des ob-jectifs Un cahier des charges permettant de reacutepondre aux objectifs a eacuteteacute reacutedigeacute Ce cahierdes charges a deacuteboucheacute sur le deacuteploiement de la plate-forme de meacutetrologie active RunPLet du deacuteveloppement de deux outils drsquoaide agrave lrsquoanalyse rgeoloc et rtraceroute La preacutesen-tation du protocole de mesure a eacuteteacute reacutealiseacutee dans la partie preacuteceacutedant celle des reacutesultatsLe chapitre se conclut par une synthegravese des reacutesultats qui ont servi agrave nos contributions

La seconde eacutetude est preacutesenteacutee dans le chapitre 3 Les objectifs du chapitre sont preacute-senteacutes dans un premier temps et diviseacutes en deux Ce chapitre preacutesente la mise en oeuvredrsquoune plate-forme de meacutetrologie et du protocole de mesure associeacute Une section reacutesultatassocieacutee agrave une conclusion termine le chapitre Ce chapitre a fait lrsquoobjet drsquoune contributionscientifique

Nous concluons notre thegravese par un reacutesumeacute des diffeacuterentes contributions Un apportsur les perspectives qursquoautorisent nos travaux est proposeacute dans le chapitre 35

8

Chapitre 1

Eacutetat de lrsquoart

Transmission Control Protocol (TCP) est le protocole de transport le plus utiliseacute sur lrsquoIn-ternet Lrsquoeacutetude reacutealiseacutee par Center for Applied Internet Data Analysis (CAIDA) sur une du-reacutee de 2 ans du trafic passant par le point drsquoeacutechange (IXP) EQUNIX de Chicago a montreacuteque 90 97 des paquets Internet Protocol (IP) acheminent des segments TCP [EQUINIX]TCP est un protocole de transport qui rend un service de transfert fiable de donneacuteesLorsque la somme du deacutebit des eacutemetteurs TCP partageant une mecircme ressource du reacute-seau excegravede la capaciteacute de cette ressource il se produit de la congestion La congestionest un pheacutenomegravene indeacutesirable qui met le reacuteseau dans un eacutetat ougrave le service rendu est deacute-gradeacute Cette deacutegradation peut ecirctre seacutevegravere en fonction de lrsquointensiteacute du pheacutenomegravene Poureacuteviter que lrsquoeffet de la congestion empire quand elle apparaicirct TCP integravegre une fonctionde reacutesolution connue sous le nom de controcircle de congestion Le principe est que chaqueeacutemetteur deacutetecte la congestion et diminue son deacutebit drsquoeacutemission Pour se faire le controcirclede congestion srsquoappuie sur la boucle de controcircle constitueacutee entre lrsquoeacutemission drsquoun segmentde donneacutees et la reacuteception de lrsquoacquittement correspondant Le controcircle de congestionagit sur le deacutebit drsquoeacutemission de lrsquoeacutemetteur avec une latence lieacutee au Round-Trip delay Time(RTT) Lorsque le produit du RTT avec la capaciteacute drsquoeacutecoulement offerte par le reacuteseau estrelativement important le controcircle de congestion de TCP peine agrave utiliser les ressourcesdu reacuteseau efficacement Ce produit du deacutelai et du deacutebit repreacutesente la quantiteacute de donneacuteesnon acquitteacutees qui peut circuler On peut assimiler ce produit agrave la capaciteacute de stockage dedonneacutees dans le reacuteseau

Ces derniegraveres anneacutees lrsquoaugmentation de la bande passante a fait croicirctre significative-ment cette capaciteacute de stockage En effet comme les deacutelais nrsquoont pas diminueacute dans lesmecircmes proportions la capaciteacute de stockage nrsquoa fait que croicirctre Cette eacutevolution pose undeacutefi au controcircle de congestion de TCP pour maintenir ses performances Cette eacutevolutiona entraicircneacute une activiteacute intense de recherche pour traiter ce problegraveme de produit deacutelai-bande passante pour TCP Ainsi de nouvelles versions du controcircle de congestion de TCPont eacuteteacute eacutetudieacutees pour lrsquoadapter aux speacutecificiteacutes des reacuteseaux agrave forte capaciteacute de stockageLong Fat Network (LFN)

Si le stockage important de donneacutees dans le reacuteseau pose un problegraveme pour le controcirclede congestion de TCP qursquoen est-il en pratique dans le cas de lrsquoInternet agrave La Reacuteunion Pourreacutepondre agrave cette question il faut pouvoir mesurer lrsquoexistant Depuis quelques anneacutees ily a un inteacuterecirct croissant pour la mesure Une science de la mesure sur lrsquoInternet se deacute-veloppe Il faut chercher dans la croissance continue et soutenue de lrsquoInternet ainsi quedans lrsquoabsence drsquoune exploitation coordonneacutee les motivations agrave deacutevelopper la meacutetrologiesur Internet Cette meacutetrologie vise agrave mieux comprendre le fonctionnement de lrsquoInternet

Ce chapitre se compose de deux sections theacutematiques La premiegravere section 11 traitede la probleacutematique du controcircle de congestion de TCP utiliseacute sur les reacuteseaux agrave grande

9

capaciteacute de stockage La sous-section 111 rappelle le principe du controcircle de conges-tion et sa mise en œuvre dans TCP Dans la partie 112 les problegravemes speacutecifiques ducontrocircle de congestion de TCP appliqueacute dans le contexte des reacuteseaux agrave forte capaciteacute demeacutemorisation sont indiqueacutes Face agrave ces problegravemes des propositions ont eacuteteacute eacutetudieacutees quenous preacutesenterons dans les parties 113 et 114 Pour conclure cette section nous pose-rons dans la sous-section 115 les arguments qui permettent drsquoavancer que lrsquoicircle de LaReacuteunion a une connectiviteacute qui srsquoapparente agrave celle des reacuteseaux agrave forte capaciteacute de sto-ckageLa seconde section 12 est consacreacutee agrave la meacutetrologie du trafic Internet La deacutefinition et lesmeacutethodologies de la meacutetrologie sont indiqueacutees dans la partie 121 La preacutesentation de lameacutetrologie active sera reacutealiseacutee dans la section 122 suivie par celle de la meacutetrologie pas-sive dans la section 123 La comparaison entre la meacutetrologie active et passive termineracette preacutesentation et sera faite dans la partie 124 Pour conclure ce chapitre une synthegraveseest reacutealiseacutee par la section 13 dans laquelle nous tirons les enseignements pour mener deseacutetudes depuis et vers La Reacuteunion

11 Le controcircle de congestion TCP et les reacuteseaux agrave grande capa-citeacute de stockage

TCP est un protocole de transport creacuteeacute en 1980 et deacutecrit pour la premiegravere fois dans le[RFC793] il a subi depuis de nombreuses eacutevolutions comme lrsquoindique le [RFC7414] Lesuccegraves de TCP repose sur son service de transmission fiable et ordonneacutee drsquoun flux de don-neacutees asynchrones Crsquoest un protocole fonctionnant de point agrave point et de bout en bout au-trement dit entre lrsquoeacutemetteur et le reacutecepteur des donneacutees sans concerner les eacutequipementsintermeacutediaires TCP offre un service de communication eacutequivalent agrave un canal virtuel bi-directionnel entre 2 entiteacutes applicatives Le canal de communication se caracteacuterise par satransparence seacutemantique crsquoest-agrave-dire par lrsquoabsence drsquoalteacuteration des donneacutees transfeacutereacuteesPour reacutealiser cette fiabiliteacute de lrsquoeacutechange TCP supervise les eacutechanges de donneacutees par desacquittements (Acknowledgement (ACK)) Cette supervision forme une boucle de controcirclecorrespondant agrave lrsquoeacutemission de donneacutees et agrave la reacuteception de lrsquoacquittement correspondantElle se caracteacuterise par le deacutelai pris nommeacute RTT La correction des donneacutees perdues oualteacutereacutees en cours de transit srsquoeffectue par retransmission de ces donneacutees Si le principe defonctionnement de TCP srsquoeacutenonce facilement sa mise en œuvre est complexe du fait de lanon fiabiliteacute du protocole IP sous-jacent et de la diversiteacute des contextes drsquoutilisation deTCP Lrsquoarticle [Ros2005] deacutetaille les diffeacuterentes caracteacuteristiques du protocole lieacutees agrave lrsquoeacuteta-blissement de connexion la numeacuterotation des donneacutees et agrave la fiabilisation des eacutechanges

Outre lrsquoobjectif de fiabiliteacute TCP a aussi un objectif de performance pour le servicerendu en termes de deacutebit eacutecouleacute et drsquoutilisation des capaciteacutes de transmission du reacuteseauPour atteindre cet objectif pour le service TCP integravegre une fonction de controcircle de flux quirepose sur une fenecirctre glissante geacutereacutee par le reacutecepteur Ainsi le deacutebit drsquoeacutemission peut srsquoali-gner sur le deacutebit de reacuteception de sorte qursquoun reacutecepteur lent ne puisse ecirctre satureacute par unexpeacutediteur rapide La speacutecification initiale de TCP a eacuteteacute conccedilue sans prendre en compteles ressources du reacuteseau Cet oubli a eacuteteacute agrave la source de dysfonctionnements seacutevegraveres du reacute-seau comme lrsquoeffondrement ducirc agrave la congestion (congestion collapse) [Afanasyev2010] Lafonction de controcircle de congestion vise agrave une prise en compte des ressources disponiblesdu reacuteseau et agrave leurs utilisations efficaces Le controcircle de congestion a susciteacute un travail derecherche intensif et ce sujet reste encore drsquoactualiteacute comme lrsquoindique le [RFC6077]

111 Controcircle de congestion de TCP

Drsquoapregraves [Jain1990] la congestion srsquoexprime par lrsquoeacutequation matheacutematique 11

10

sumDemande gt Ressources (11)

Du point de vue drsquoun reacuteseau par commutation de paquets les ressources sont princi-palement les meacutemoires tampon des nœuds de commutation et la capaciteacute de transmissiondes artegraveres de communication La congestion apparaicirct au niveau des nœuds de commu-tation et plus particuliegraverement sur leurs interfaces de sortie La condition pour voir ap-paraicirctre une congestion est laquo si la somme des deacutebits des flux arrivant sur lrsquointerface desortie est supeacuterieure agrave la capaciteacute de transmission du lien en sortie raquo Dans cette situationune file drsquoattente se constitue et quand elle deacuteborde les effets neacutefastes de la congestionse concreacutetisent A savoir que le taux de pertes des paquets augmente dans le reacuteseau cequi se traduit au niveau du service par un deacutebit eacutecouleacute qui chute et un deacutelai de trans-fert qui augmente Dans [Chiu1989] les auteurs montrent que la performance du reacuteseauest lieacutee agrave la charge appliqueacutee au reacuteseau Formellement la charge srsquoexprime comme tauxdrsquoarriveacutee sur le taux de service Informellement la charge repreacutesente la proportion de lademande autrement dit du trafic eacutemis par rapport agrave la capaciteacute de transfert La figure11 illustre lrsquoeacutevolution du deacutebit eacutecouleacute (throughput) et du RTT en fonction de la chargeappliqueacutee au reacuteseau (load) Au deacutebut le deacutebit eacutecouleacute srsquoaccroicirct avec la charge alors queles deacutelais nrsquoaugmentent presque pas On est dans une phase de remplissage des liensLorsque la charge srsquoapproche du taux de remplissage maximum des liens du reacuteseau Ledeacutebit eacutecouleacute nrsquoaugmente presque plus alors que les deacutelais augmentent fortement Crsquoestla phase de remplissage des files drsquoattente Ces deux phases sont seacutepareacutees par un pointcaracteacuteristique qui srsquoappelle le point drsquoinflexion (knee) Lorsque les files drsquoattente sontpleines et que la charge du reacuteseau continue de srsquoaccroicirctre les files drsquoattente vont deacutebor-der Agrave partir de ce point appeleacute le point de retournement (cliff ) le reacuteseau rentre dans lrsquoeacutetatdit drsquoeffondrement ducirc agrave la congestion (congestion collapse)

FIGURE 11 ndash Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989])

Lrsquoeffondrement ducirc agrave la congestion est rapporteacute par [Nagle1984] Dans cet eacutetat le reacute-seau enregistre des retransmissions abusives effectue des transferts avec des deacutelais ten-dant vers lrsquoinfini et rend un service avec un deacutebit eacutecouleacute proche de zeacutero Lrsquoeffondrementducirc agrave la congestion srsquoexplique par le gaspillage des ressources utiliseacutees en amont du point

11

de perte du paquet La solution agrave lrsquoeffondrement ducirc agrave la congestion reacuteside en lrsquoalignementdu deacutebit de lrsquoeacutemetteur agrave la capaciteacute drsquoeacutecoulement du canal de communication offert parle reacuteseau afin de ne produire aucune perte Ainsi les objectifs assigneacutes au controcircle decongestion de TCP sont drsquoeacuteviter lrsquoeacutetat drsquoeffondrement ducirc agrave la congestion drsquoallouer eacutequi-tablement les ressources du reacuteseau entres les flux concurrents et drsquooptimiser les perfor-mances obtenues par chaque flux [RFC2914]

Le controcircle de congestion de TCP fonctionne sur le principe de la boucle fermeacutee avecle reacuteseau vu comme une boicircte noire ainsi preacutesenteacute par la figure 12 Apregraves une stimu-lation sous la forme de lrsquoenvoi de paquets lrsquoobservation du comportement de la boicirctenoire agrave ce stimulus sera analyseacute par le controcircleur situeacute dans lrsquoeacutemetteur Le controcircleur rap-proche lrsquoobservation faite en retour du stimulus (feedback) par rapport agrave lrsquoobjectif affecteacuteau controcircleur Celui-ci par reacutetro-action ajustera le nombre des paquets suivants envoyeacutesCet ajustement est le reacutesultat drsquoune fonction de controcircle qui se base sur une perceptionbinaire des retours agrave savoir absence ou preacutesence de congestion

FIGURE 12 ndash Boucle fermeacutee du CC de TCP

Dans [Gevros2001] lrsquoauteur liste les moyens pour effectuer les observations que lrsquoonnomme en fait des notifications dans le contexte des reacuteseaux Les notifications de lacongestion dans le reacuteseau peuvent ecirctre implicites ou explicites Dans le premier caselles sont deacuteduites par lrsquoabsence drsquoACK Lrsquoaugmentation des deacutelais et les pertes des don-neacutees sont des causes possibles pour la non-reacuteception de lrsquoACK A lrsquoinverse lrsquoabsence decongestion est deacuteduite par la reacuteception drsquoun ACK Cette reacuteception autorise lrsquoenvoi drsquounnouveau paquet comme le montre [Jacobson1988-1] Les notifications peuvent ecirctre ex-plicites si les paquets veacutehiculent une marque mise par lrsquoeacuteleacutement congestionneacute commecrsquoest le cas avec la proposition Explicit Congestion Notification (ECN) [RFC3168] Nous re-viendrons sur cette proposition dans la sous-section 113 Lorsque le controcircleur deacuteduitla preacutesence de congestion il reacuteduit le deacutebit drsquoeacutemission de la source Le deacutebit est controcircleacuteagrave lrsquoaide drsquoune fenecirctre appeleacutee la fenecirctre de congestion (Congestion Window (CWND) ω)Elle indique la quantiteacute de donneacutees qui peut ecirctre eacutemise sur un RTT Autrement dit elleindique combien de donneacutees non acquitteacutees peut recevoir le canal de communicationSa taille eacutevolue dans le temps en fonction de lrsquoeacutetat du reacuteseau et selon une fonction decontrocircle Additive Increase and Multiplicative Decrease (AIMD) La fenecirctre drsquoeacutemission uti-liseacutee par un eacutemetteur TCP est le minimum entre la fenecirctre de congestion et la fenecirctreglissante du controcircle de flux Le controcircle de congestion comporte deux phases distinctes[Gevros2001]

mdash La premiegravere phase se nomme eacutevitement de la congestion (congestion avoidance) et sesitue autour du point drsquoinflexion de la figure 11

mdash La seconde phase se nomme reacutesolution de la congestion (congestion recovery) Ellese deacuteclenche quand lrsquoeacutetat du reacuteseau se situe au delagrave du point drsquoinflexion

Dans la phase de congestion avoidance le controcircle de congestion de TCP utilise deux al-gorithmes le deacutemarrage en douceur (slow-start (SS)) et lrsquoeacutevitement de congestion (conges-tion avoidance (CA)) Au deacutebut de la connexion TCP nrsquoa aucune connaissance de lrsquoeacutetat dureacuteseau autrement dit de lrsquoeacutetat du canal de communication entre lrsquoeacutemetteur et le reacutecep-teur TCP utilise lrsquoalgorithme du deacutemarrage en douceur pour sonder le canal Lrsquoobjectif

12

est drsquoatteindre le point drsquoinflexion rapidement et sans risquer de congestionner le canalpar des rafales Pour cela lrsquoalgorithme du deacutemarrage en douceur va eacutetaler sur plusieursRTT la croissance de la taille fenecirctre de congestion jusqursquoagrave atteindre une estimation dupoint drsquoinflexion Ainsi lrsquoeacutemetteur commence avec une fenecirctre de congestion assez pe-tite et lrsquoouvre au fur et agrave mesure et de plus en plus vite avec lrsquoarriveacutee des acquittementsPlus preacuteciseacutement le rythme de croissance de la taille de la fenecirctre de congestion est surle doublement tous les RTT Quant la fenecirctre de congestion atteint un certain seuil noteacuteslow-start threshold (ssthresh) le deacutemarrage en douceur srsquoarrecircte et lrsquoalgorithme drsquoeacutevite-ment de congestion est maintenant utiliseacute Cet algorithme augmente lineacuteairement et pluslentement que le deacutemarrage en douceur la taille de la fenecirctre de congestion En lrsquoabsencedrsquoindication explicite par le reacuteseau du deacutebit disponible sur le canal de communicationlrsquoeacutemetteur TCP continue de faire le sondage du canal et veacuterifie si le deacutebit eacutecouleacute peut ecirctreencore augmenteacute Pour lrsquoauteur de [Sallantin2014] lorsque la connexion TCP utilise lrsquoal-gorithme drsquoeacutevitement de congestion elle entre alors dans un eacutetat stable Dans cet eacutetat laconnexion doit se deacuterouler avec un deacutebit eacutecouleacute eacuteleveacute Crsquoest une indication que le pointdrsquoinflexion est atteint

La figure 13 donne une repreacutesentation simplifieacutee des eacutetats du controcircle de congestionde TCP Elle indique que lrsquoeacutetat stable peut ecirctre quitteacute si la connexion est libeacutereacutee ou si ily a un eacuteveacutenement de congestion TCP assimile les pertes implicitement agrave un eacuteveacutenementde congestion Lrsquoeacuteveacutenement de congestion fait basculer le controcircle de congestion de TCPdans la phase de reacutesolution de la congestion Dans cette phase la reprise de la perte oudes pertes est effectueacutee et la taille de la fenecirctre de congestion est diminueacutee et ceci afin dediminuer le deacutebit drsquoeacutemission

On distingue deux faccedilons de deacutetecter un eacuteveacutenement de congestion Une meacutethodesrsquoappuie sur la reprise de perte de TCP par retransmission des donneacutees perdues sur ex-piration drsquoun temporisateur (Retransmission TimeOut (RTO)) Une autre meacutethode utilisela caracteacuteristique de TCP qui consiste agrave ce que le reacutecepteur envoie un acquittement agravechaque segment de donneacutees reccedilu en seacutequence Ce segment porte le numeacutero des derniegraveresdonneacutees reccedilues seacutequentiellement Ainsi la reacuteception de donneacutees entraicircnant une rupturede la numeacuterotation en seacutequence geacutenegravere lrsquoeacutemission drsquoun acquittement dupliqueacute (Dupli-cate Acknowledgement (DupAck)) par le reacutecepteur Agrave la reacuteception de trois DupAck parlrsquoeacutemetteur les donneacutees indiqueacutees par la rupture de seacutequencement sont consideacutereacutees per-dues et retransmises sans attendre lrsquoexpiration du RTO Ce principe de retransmissionrapide porte le nom de fast retransmit (FR) Lrsquoalgorithme de reacutecupeacuteration rapide (fast reco-very (FR)) va maintenir la quantiteacute de donneacutees en transit dans le canal de communicationpour eacuteviter lrsquoeacutemission drsquoune rafale lorsqursquoun nouvel acquittement sera reccedilu En lrsquoabsencedu fast recovery agrave la reacuteception drsquoun nouvel acquittement la fenecirctre pourrait se vider parune rafale correspondant agrave des eacutemissions de paquets de donneacutees dos agrave dos sur un deacute-bit supeacuterieur agrave celui du deacutebit drsquoeacutecoulement du canal Ceci aurait pour effet de saturer lecanal et de renvoyer la connexion TCP dans une phase de reacutesolution de la congestion

Lorsque les eacutemissions de lrsquoeacutemetteur sont bloqueacutees par des donneacutees eacutemises et jamaisacquitteacutees le blocage est rompu par le RTO et ceci quel que soit lrsquoeacutetat Les deacutetails dela mise en œuvre des algorithmes du controcircle de congestion TCP sont deacutecrits par le[RFC5681]

Historiquement la version deacutenommeacutee TCP Tahoe incorporait la fonction de controcirclede congestion deacuteveloppeacutee en 1888 Elle comportait les algorithmes de slow-start conges-tion avoidance et de fast retransmit [Jacobson1988-1] La reprise de perte par fast retransmitsouffrait drsquoinefficaciteacute elle a eacuteteacute corrigeacutee avec lrsquoalgorithme du fast recovery Cette versionagrave quatre algorithmes est la version connue sous le nom de Reno et publieacutee la premiegraverefois en 1997 par le [RFC2001] Le couplage fast retransmit - fast recovery souffrait de deacutefauts

13

Deacutebut13

de13

connexion

Deacutemarrage13

en13

douceur

Etat13

stable

FRFR

Fin13

de13

connexion

3 Dupack

nouvel 13

ack

RTO

RTO

cwnd gt ss

tresh

SYN13

SYNACK

FIN-FINACK

FIGURE 13 ndash Etats du controcircle de congestion de TCP

lorsqursquoun eacuteveacutenement de congestion comportait plusieurs pertes Le [RFC2582] apportaitun correctif en 1999 On parla alors de version NewReno du controcircle de congestion En2005 une eacutetude montra que crsquoeacutetait la version du controcircle de congestion de TCP la plusutiliseacutee sur lrsquoInternet [Medina2005] Depuis de nouvelles versions ont eacuteteacute deacuteployeacutees dansles systegravemes drsquoexploitation tels que Windows et Linux appeleacutes respectivement C-TCP[Tan2006] et CUBIC [Ha2008] Dans la section 112 ces versions seront deacutetailleacutees

Le fonctionnement caracteacuteristique du controcircle de congestion de TCP est illustreacute parla figure 14 extraite de [Huston2000] Elle montre lrsquoeacutevolution de la fenecirctre de conges-tion dans le temps (exprimeacutee en terme de RTT) sur un canal de communication virtuelentre 2 stations Il srsquoagit ici drsquoun sceacutenario ideacutealiseacute dans lequel la connexion TCP nrsquoest pasen concurrence avec drsquoautres connexions La congestion se produit toujours agrave la mecircmevaleur de fenecirctre et pour laquelle la file drsquoattente deacuteborde Cette figure montre les deuxcaracteacuteristiques du controcircle de congestion de TCP qui deacutecoulent de la phase drsquoeacutevitementde congestion et de reacutesolution de la congestion et qui sont

mdash Lrsquoagressiviteacute elle provient du sondage du canal de communication LrsquoeacutemetteurTCP va chercher agrave accroicirctre le deacutebit eacutecouleacute en augmentant graduellement son deacutebitdrsquoeacutemission par lrsquoagrandissement de la taille de la fenecirctre de congestion

mdash La reacuteactiviteacute lorsque le canal de communication est plein et qursquoil deacuteborde quandcette perte est deacutetecteacutee lrsquoeacutemetteur TCP reacuteagit et diminue la taille de sa fenecirctre afinde diminuer son deacutebit drsquoeacutemission

Ces deux caracteacuteristiques donnent cette figure en dents de scie de la fenecirctre de conges-tion

112 La probleacutematique de lrsquoutilisation drsquoun reacuteseau agrave grande capaciteacute de sto-ckage

Un reacuteseau agrave forte capaciteacute de stockage est un reacuteseau avec un produit deacutelai-bandepassante (Bandwidth Delay Product (BDP)) eacuteleveacute Dans lrsquoouvrage [Peterson2007] lrsquoauteureffectue une analogie du produit deacutelai-bande passante avec un tuyau Le deacutelai corres-pond agrave la longueur du tuyau et la bande passante au diamegravetre du tube Ainsi le BDPest le volume du tube Dans le cas drsquoun reacuteseau informatique le volume du tuyau srsquoex-prime en bits Ainsi lorsqursquoun canal de communication entre un eacutemetteur et un reacutecepteurpreacutesente un produit deacutelai-bande passante important un volume important de bits (autre-ment dit de donneacutees) peut ecirctre eacutemis avant de recevoir une notification Du point de vue

14

FIGURE 14 ndash Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP

de lrsquoeacutemetteur TCP ce volume de donneacutees injecteacute dans le reacuteseau sont des donneacutees nonencore acquitteacutees Les reacuteseaux qui offrent des canaux de communication avec un pro-duit deacutelai-bande passante important sont nommeacutes en anglais Long Fat Network (LFN) Le[RFC1072] preacutecise qursquoun LFN agrave un produit deacutelai-bande passante supeacuterieur agrave 12 5 Ko

Sachant que le controcircle de congestion de TCP srsquoappuie sur une reacutetro-action selon unepeacuteriode de RTT et que le deacutebit eacutecouleacute maximal est atteint lorsque la fenecirctre drsquoeacutemissionest au moins supeacuterieure au produit deacutelai(RTT)-bande passante du canal de communica-tion lrsquoutilisation de TCP sur un reacuteseau LFN a des conseacutequences neacutegatives sur la perfor-mance Les causes sont agrave chercher du cocircteacute du RTT et du produit deacutelai-bande passante quiprennent tous les deux des valeurs importantesDans le cas du RTT crsquoest le deacutelai de reacuteactiviteacute de TCP qui est impacteacute En effet quandle RTT est eacuteleveacute la dynamique de TCP est ralentie car lrsquoeacutemetteur TCP doit attendre pluslongtemps pour recevoir un ACK et savoir quoi faire par la suite

Pour ce qui concerne le produit deacutelai-bande passante crsquoest le deacutebit eacutecouleacute qui peutecirctre faible par rapport au deacutebit du canal de communication (sa bande passante) La fe-necirctre drsquoeacutemission de TCP nrsquoatteint pas la valeur du produit deacutelai-bande passante lrsquoeacutemet-teur se trouve alors bloqueacute en attente de lrsquoACK pour eacutemettre de nouvelles donneacutees Cespeacuteriodes de blocage concourent agrave faire chuter le taux drsquoutilisation du canal de communi-cation

Par la suite nous allons deacutetailler les conseacutequences de la faible reacuteactiviteacute et drsquoune fe-necirctre drsquoeacutemission importante agrave atteindre sur lrsquoefficaciteacute de TCP La probleacutematique se poseen terme de deacutemarrage de connexion et son implication pour le transfert des flots courtsde taille maximale possible de la fenecirctre de congestion et de reacutesolution de la congestion

Le deacutemarrage de connexion

Le deacutebut des connexions de TCP se fait agrave lrsquoaide de lrsquoalgorithme du deacutemarrage en dou-ceur Nous avons vu preacuteceacutedemment que ce meacutecanisme double la fenecirctre de congestionen un RTT Lorsque la fenecirctre de congestion atteint la valeur seuil ssthresh lrsquoalgorithmedrsquoeacutevitement de congestion est utiliseacute La valeur initiale du seuil est fixeacutee arbitrairementce qui soumet TCP agrave deux problegravemes Le doublement de la fenecirctre de congestion quandelle atteint des valeurs importantes constitue des increacutements avec une granulariteacute de plusen plus grosse Si la valeur de ssthresh est trop grande par rapport au BDP avec un grosincreacutement le deacutepassement du BDP peut conduire agrave eacutemettre trop de paquets causantdes pertes multiples induisant une augmentation de la latence et une reacuteduction du deacute-bit eacutecouleacute Dans le cas ougrave la valeur du ssthresh est trop basse par rapport au BDP la

15

connexion TCP va utiliser preacutematureacutement lrsquoalgorithme drsquoeacutevitement de congestion avecune increacutementation lineacuteaire Ce changement preacutematureacute aura pour conseacutequence une sous-utilisation de lrsquoalgorithme de deacutemarrage en douceur speacutecialement dans le cas ougrave le BDPest tregraves eacuteleveacute [Wang2004]

Le deacutemarrage de connexion est particuliegraverement important pour les flots courts TCP(short lived TCP flow) Un flot court TCP se deacutefinit comme un flot dont la taille est in-feacuterieure ou eacutegale agrave 10 segments TCP [Sallantin2014] La probleacutematique des flots courtsprovient du fait qursquoils nrsquoont pas assez de donneacutees pour quitter lrsquoeacutetape du deacutemarrage endouceur En effet la taille de la fenecirctre de congestion nrsquoa pas le temps drsquoatteindre la va-leur du produit deacutelai-bande passante que la totaliteacute des donneacutees ont eacuteteacute transmises Laconseacutequence est qursquoils ont fonctionneacute avec une fenecirctre de congestion qui est resteacutee rela-tivement petite Dans le cas drsquoun LFN le rapport de la taille de la fenecirctre de congestionsur le produit deacutelai-bande passante tend vers zeacutero et neacutecessite plusieurs RTT Il srsquoensuitque le deacutebit eacutecouleacute est extrecircmement faible De plus si le flot court souffre drsquoun eacuteveacutene-ment de congestion il sera particuliegraverement peacutenaliseacute Il a de fortes chances que la reprisesrsquoeffectue avec un RTO avec un deacutelai maximum de 1 agrave 3 secondes [RFC6298] Ce genrede flots nrsquoa pas toujours assez de donneacutees eacutemises apregraves la perte pour geacuteneacuterer trois Du-pAck et proceacuteder agrave une reprise par fast retransnmit Comme ces flots repreacutesentent drsquoapregraves[Ciullo2009] 90 des flux preacutesents dans lrsquoInternet leur sous-performance sur les LFN estprobleacutematique

La reacutesolution de la congestion

TCP deacutetecte une perte par lrsquoexpiration du RTO ou par la reacuteception de trois DupAckTCP va reacuteagir en deux temps en renvoyant le paquet perdu et en divisant par deux lafenecirctre de congestion Si la taille de la fenecirctre est importante la division par deux vaentraicircner une chute significative de la capaciteacute drsquoenvoi Par rapport au produit deacutelai-bande passante cette division par deux peut entraicircner une sur-reacuteaction de lrsquoeacutemetteur Ledeacutebit eacutecouleacute apregraves un eacuteveacutenement de congestion peut devenir faible et se pose le problegravemede la dynamique de sondage

Dynamique du sondage

TCP a un objectif de performance en terme de deacutebit eacutecouleacute et drsquoutilisation des capa-citeacutes de transmission du reacuteseau TCP possegravede un comportement conservateur Avec lafonction de controcircle AIMD TCP aura besoin drsquoun cycle eacutegal agrave ω2 RTT pour reacutecupeacutererune taille de fenecirctre eacutegale agrave celle avant reacuteduction Dans les reacuteseaux agrave forte capaciteacute destockage TCP tend agrave ecirctre trop prudent agrave ouvrir sa fenecirctre de congestion trop lentementLa capaciteacute de stockage importante demande un nombre de cycles important pour quela fenecirctre de congestion puisse couvrir le BDP Durant ce temps il est important de nepas avoir de pertes Lrsquoexemple donneacute par le [RFC3649] preacutesente un reacuteseau agrave une capa-citeacute de 10 Gbits un deacutelai de 100 ms et une taille de paquets drsquoun maximum de 1500octets Cela demanderait un eacutechange drsquoune dureacutee de deux heures environ De plus la to-taliteacute des paquets devront ecirctre transmis dans la dureacutee indiqueacutee preacuteceacutedemment Le tauxde perte maximal permettant lrsquousage de la totaliteacute de la bande passante est de lrsquoordrede 10minus10 Crsquoest un taux de perte irreacutealiste Il faut donc appliquer une autre fonction decontrocircle pour utiliser efficacement la capaciteacute des liens et pour reacutepondre rapidement auxchangements drsquoeacutetats du reacuteseau

16

113 Un controcircle de congestion de TCP adapteacute aux LFN

Pour rappel dans la partie 111 nous avons vu que le controcircle de congestion de TCPse deacutecoupait en deux phases La premiegravere phase de congestion avoidance comporte les al-gorithmes de sondage alors que la seconde phase dite de congestion recovery comporte lesalgorithmes de reacutesolution de la congestion Nous preacutesentons les propositions qui visentagrave changer le controcircle de congestion de TCP sur ces deux phases pour les adapter auxcontraintes des LFN et donc traiter les problegravemes que nous avons mis en eacutevidence dansla sous-section 112 Lrsquoutilisation de TCP sur des reacuteseaux agrave forte capaciteacute de stockage asusciteacute des propositions qui sont classeacutees dans le tableau 11 Ces propositions vont ecirctredeacutetailleacutees dans la suite de ce manuscrit

TABLE 11 ndash Tableau de synthegravese des propositions

Phase Problegraveme SolutionsCongestion avoidance Deacutemarrage de

connexionInitial Spreading Reacuteduc-tion du RTO Quick-startJump Start

Congestion recoveryReacutesolution decongestion

MulTCP

Dynamique dusondage

HighSpeed TCP C-TCPBIC CUBIC

Le deacutemarrage de connexion

Lrsquoideacutee de la premiegravere solution est de reacuteduire le nombre de cycles au deacutemarrage drsquounflot Le doublement de la taille lorsque la fenecirctre de congestion vaut 2 segments parexemple conduit agrave un increacutement qui reste faible sur un RTT Le principe de la premiegraveresolution est drsquoaugmenter la taille initiale de la fenecirctre de congestion (Initial Window (IW))[RFC6928] Avec une taille initiale de fenecirctre de congestion eacutequivalent agrave 10 Maximun Seg-ment Size (MSS) lrsquoeacutemetteur peut transmettre degraves le deacutebut de connexion une rafale de 10segments Parmi les avantages de cette solution on peut citer la reacuteduction de la latencedu transfert de donneacutees en consideacuterant que le canal ne sera pas congestionneacute Un des in-conveacutenients de cette solution est la possibiliteacute de congestionner la file drsquoattente du goulotdrsquoeacutetranglement Afin de reacutesoudre ce problegraveme [Sallantin2014] propose lrsquoInitial SpreadingCette proposition combine lrsquoaugmentation de la fenecirctre drsquoeacutemission et le meacutecanisme drsquoes-pacement meacutecanisme limitant la preacutesence de rafales Ces travaux ont fait lrsquoobjet drsquouneproposition aupregraves de lrsquoInternet Engineering Task Force (IETF) [Arnal2014]

La deacutetection drsquoune perte au deacutepart du deacutemarrage en douceur se fait agrave travers lrsquoex-piration du RTO soit trois secondes Pour ameacuteliorer la reprise sur erreur le [RFC6298]propose de reacuteduire la dureacutee du RTO agrave une seconde Cette reacuteduction du RTO autorise uneretransmission plus rapide des paquets perdus et apporte un gain relativement importantpour des flots qui ont une latence tregraves faible comme celle des flots courts

Une autre solution eacutevalueacutee par [Scharf2008-1] et deacutecrite par le [RFC4782] se nommeQuick-start Lrsquoeacutemetteur eacutemet une requecircte contenant le deacutebit drsquoeacutemission qursquoil souhaite uti-liser Chaque nœud traverseacute peut alors accepter rejeter ignorer ou modifier la requecircteen fonction de son deacutebit disponible Pour bien fonctionner ce meacutecanisme de neacutegociationneacutecessite que lrsquoensemble des routeurs traverseacutes aient reacutepondu agrave la requecircte La figure 15compare les performances du deacutemarrage en douceur (en rouge) et de Quick-start sur unteacuteleacutechargement vu depuis le serveur Le serveur a eacutemis deux requecirctes la premiegravere agrave undeacutebit de 8192 Mbits (en vert) et lrsquoautre pour un deacutebit drsquoune valeur de 512 Mbits (en

17

bleu) Lrsquoaxe des abscisses repreacutesente la latence (dureacutee de la connexion) depuis lrsquoeacutemissionde la demande drsquoeacutetablissement de connexion et en ordonneacutee le deacutebit drsquoeacutemission Les deacute-bits ont eacuteteacute calculeacutes agrave partir de la quantiteacute de donneacutees moyenne eacutemises en un RTT Les reacute-sultats montrent des performances supeacuterieures de Quick-start par rapport au deacutemarrageen douceur En effet une requecircte de Quick-start avec un deacutebit suffisamment eacuteleveacute per-met drsquoatteindre rapidement lrsquoutilisation maximale de la bande passante disponible Ledeacutemarrage en douceur limite la croissance du deacutebit drsquoeacutemission On remarque eacutegalementque si la valeur seuil du deacutemarrage est trop basse le deacutebit drsquoeacutemission croicirct beaucoupmoins rapidement (lien en pointilleacute sur la figure 15) Quick-start reste performant sur lesflots courts en appliquant un deacutebit drsquoeacutemission qui sera eacutequivalent agrave un flot long

FIGURE 15 ndash Principe de Quick-Start (Source [Scharf2008-1])

Dans lrsquoarticle [Liu2007] lrsquoauteur preacutesente Jump Start Cette proposition reacutealise uneestimation des donneacutees precirctes agrave ecirctre envoyeacutees ainsi que du RTT Lrsquoobjectif est drsquoeacutemettreles segments de faccedilon reacuteguliegravere en un RTT Ce meacutecanisme srsquoavegravere trop agressif dans lesenvironnements congestionneacutes Le nombre de segments envoyeacutes en un RTT peut ecirctreimportant et ainsi causer de seacutevegraveres deacutegradations de performance

La reacutesolution de la congestion

Quand TCP a atteint lrsquoeacutetat stable et qursquoune perte est deacutetecteacutee la fenecirctre de conges-tion va ecirctre diviseacutee par deux Cette reacuteduction diminuera le deacutebit eacutecouleacute Il est importantpour TCP drsquoecirctre reacuteactif vis agrave vis des pertes Pour cela de nouveaux algorithmes doiventecirctre mis en place dans la phase drsquoeacutevitement de congestion Ces algorithmes devront ecirctrereacuteactifs aux pertes mais sans sur-reacuteagir Ces nouveauteacutes doivent permettre de retrouverrapidement un deacutebit eacutecouleacute important

Lorsque plusieurs flux TCP empruntent une route congestionneacutee ils sont soumis aumecircme taux de pertes Le but eacutetant de reacutepartir eacutequitablement la bande passante dispo-nible Une approche de diminution moins agressive de la fenecirctre de congestion consistea reacutealiser des connexions TCP parallegraveles Lrsquoobjectif est drsquoavoir un flux TCP se comportantcomme lrsquoagreacutegation de plusieurs flux

Dans lrsquoarticle [Crowcroft1998] les auteurs proposent une version du controcircle de conges-tion de TCP qui se comporte drsquoune maniegravere eacutequivalente agrave N sessions TCP parallegraveles Ilsrsquoagit de MulTCP MulTCP geacutenegravere un flux TCP unique ougrave les sessions virtuelles sont reacute-parties uniformeacutement afin drsquoobtenir le reacutesultat maximal en terme de deacutebit Le controcircle decongestion de TCP change lorsqursquoil utilise lrsquoalgorithme drsquoeacutevitement de congestion et qursquoil

18

deacutetecte un eacuteveacutenement de congestion (par deacutetection drsquoau moins une perte drsquoun segmentdans une fenecirctre de congestion) Les eacutequations suivantes sont utiliseacutees dans chacun descas MulTCP

ACK ω larr ω +N

ω

DROP ω larr ω times (1minus 1

2N)

(12)

En eacutevitement de congestion lorsqursquoun ACK est reccedilu MulTCP augmente sa fenecirctre decongestion (ω) de N segments par RTT Lors de la perte de segments (DROP) MulTCPreacuteduit sa fenecirctre de ω(2N) plutocirct que la valeur par deacutefaut de ω2 La figure 16 montrelrsquoeacutevolution de la fenecirctre de congestion de MulTCP par rapport agrave TCP On voit sur la fi-gure 16 que MulTCP a de meilleures performances qursquoun flux TCP normal Lorsque lesperformances sont combineacutees le reacutesultat est supeacuterieur agrave un flux unique

FIGURE 16 ndash Simulation de MulTCP avec N=5 (Source [Huston2006])

Dynamique du sondage

Lrsquoobjectif de lrsquoeacutemetteur de TCP est drsquoenvoyer le plus de donneacutees le plus vite possibleMais agrave condition qursquoelles arrivent sans produire de la congestion sinon les donneacutees se-ront perdues et il faudra les reacute-eacutemettre Il faut eacutegalement tenir compte des autres flotsen partageant eacutequitablement les ressources du reacuteseau Une approche pour traiter le pro-blegraveme de la dynamique du sondage consiste agrave changer la fonction de controcircle de TCP

Lrsquoobjectif de HighSpeed-TCP (HS-TCP) est drsquoatteindre les hauts deacutebits en ayant desperformances comparables agrave TCP classique dans les environnements agrave faible BDP [RFC3649]La version du controcircle de congestion HighSpeed-TCP utilise le meacutecanisme drsquoAdditive In-crease and Multiplicative Decrease combineacute agrave un facteur calculeacute en fonction de la taille dela fenecirctre de congestion tel qursquoindiqueacute par les eacutequations 13 En deccedila drsquoun certain seuilde ω la reacuteponse de HighSpeed-TCP est eacutequivalente agrave TCP Reno HS-TCP est limiteacute durantla phase de deacutemarrage en douceur Durant cette phase HS-TCP peut normalement en-voyer un grand nombre de paquets Lrsquoenvoi drsquoun trop grand nombre de donneacutees risquedrsquooccasionner de la congestion Le [RFC3742] propose de limiter agrave 100 paquets la capaciteacutedrsquoenvoi drsquoHS-TCP durant la phase de deacutemarrage en douceur

ACK ω larr ω +α(ω)

ωDROP ω larr (1minus β(ω))times ω

(13)

19

La figure 17 illustre le comportement de la fenecirctre de congestion de HighSpeed-TCPLorsqursquoune perte est deacutetecteacutee la diminution de la fenecirctre est moins importante gracircceau facteur β Le retour a la valeur preacuteceacutedente se fait beaucoup plus rapidement qursquoavecReno ou NewReno (en gris clair sur la figure) gracircce au facteur α Ainsi HS-TCP offre unemeilleure utilisation de la capaciteacute disponible sur le lien

FIGURE 17 ndash Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source [Afanasyev2010])

Dans [Tan2006] lrsquoauteur propose une version de TCP alliant lrsquoapproche pro-activeet reacuteactive Une approche pro-active utilise les variations du RTT pour estimer lrsquoeacutetat dureacuteseau Alors qursquoune approche reacuteactive agit quand lrsquoeacuteveacutenement de congestion srsquoest pro-duit Lrsquoobjectif est de maintenir de bonnes performances sur reacuteseaux avec un haut deacutebitet un grand RTT Compound-TCP (C-TCP) maintient deux fenecirctres de congestion Lrsquounecroicirct de faccedilon lineacuteaire mais deacutecroicirct via un certain coefficient en cas de perte La secondefenecirctre est lieacutee agrave lrsquoapproche pro-active de TCP-Vegas [Brakmo1994] La taille de la fenecirctrede congestion reacuteellement utiliseacutee est la somme des deux fenecirctres Lrsquoeacutequation 14 illustrecette addition

ACK ω larr ωreno + ωfast (14)

Si le RTT est bas alors la fenecirctre ωfast va croicirctre rapidement Si C-TCP rencontre uneperte alors ωreno diminuera rapidement pour compenser lrsquoaugmentation preacuteceacutedente deωfast Ce systegraveme cherche agrave garder une valeur constante de la fenecirctre drsquoeacutemission C-TCPutilise efficacement des liens sur les reacuteseaux agrave forte capaciteacute de stockage C-TCP est sujetau mecircme deacutefaut que TCP-Vegas sur lrsquoexactitude des mesures RTT Si les flux en concur-rence les uns avec les autres dans le reacuteseau observent des valeurs RTT minimales diffeacute-rentes le flux se voyant un RTT plus eacuteleveacute sera beaucoup plus agressif et injuste pourlrsquoautre flux La figure 18 illustre le fonctionnement de la fenecirctre de congestion de C-TCPLa partie convexe de la courbe repreacutesente un fonctionnement plus proche de TCP RenoCela indique donc une valeur de ωfast faible Nous remarquons qursquoapregraves une perte TCPessaye de reacutecupeacuterer rapidement la valeur preacuteceacutedente Lors de pertes multiples la fenecirctrede congestion suit une forme proche agrave ce moment de la courbe de HighSpeed-TCP (voirfigure 17) Ce comportement est la conseacutequence drsquoune valeur eacuteleveacutee de ωfast C-TCP per-met ainsi drsquoatteindre le deacutebit maximum disponible sur le lien tout en lissant sa capaciteacutedrsquoenvoi en se basant sur le RTT C-TCP est la version de TCP installeacutee nativement sur lesystegraveme drsquoexploitation Windows de Microsoft

Lrsquoalgorithme de controcircle de congestion de TCP connu sous le nom Binary IncreaseCongestion control (BIC) vise agrave une convergence rapide [Xu2004] La fenecirctre doit atteindrela taille maximale possible sans qursquoil y ait de pertes Pour cela il met en œuvre une nou-velle fonction du controcircle de la taille de la fenecirctre de congestion La fonction de controcircle

20

FIGURE 18 ndash Comportement de la fenecirctre de congestion de Compound-TCP (Source [Afanasyev2010])

de BIC est structureacutee en trois phases (Additive Increase Binary Search Max Probing) tellesqursquoillustreacutees par la figure 19a Au deacutemarrage de la connexion BIC va increacutementer lineacuteai-rement la fenecirctre de congestion Crsquoest la phase drsquoAdditive Increase

Durant la phase Binary Search BIC va essayer de deacutecouvrir la taille optimale de lafenecirctre de congestion La taille optimale est la taille permettant drsquoeacutemettre le maximum dedonneacutees sans essuyer de pertes Elle se base sur lrsquoeacutetude entre la valeur minimale (ωmin)et la valeur maximale (ωmax) de la fenecirctre de congestion Ces variables vont permettredrsquoaffiner la valeur de la fenecirctre de congestion Au deacutebut de la connexion ωmin est mise agrave1 et ωmax est mis arbitrairement agrave une valeur eacuteleveacutee

Lorsqursquoune perte est deacutetecteacutee la fenecirctre de congestion va ecirctre reacuteduite et prendre pourvaleur la moyenne entre ωmin et ωmax ωmin prend alors pour valeur la taille de la fenecirctrede congestion apregraves reacuteduction et ωmax la valeur de la fenecirctre de congestion avant la perteSi lrsquoeacutecart entre la valeur de la fenecirctre de congestion avant et apregraves la perte est supeacuterieuragrave une constante Smax alors la fonction de controcircle de BIC entre en phase dite AdditiveIncrease Durant cette phase Smax va servir de valeur drsquoincreacutementation pour la fenecirctrede congestion agrave chaque RTT Par la suite et si aucune perte nrsquoest de nouveau deacutetecteacuteela fonction de controcircle de BIC retourne en phase de Binary Search Lrsquoobjectif est de stabi-liser la taille de la fenecirctre aux alentours de la valeur de ωmax rencontreacutee avant la pertepreacuteceacutedente

Lorsque cette valeur est deacutepasseacutee BIC entre dans la phase dite Max Probing Lrsquoaug-mentation de la fenecirctre de congestion est alors lineacuteaire Lrsquoobjectif eacutetant la recherche drsquounnouvel ωmax La figure 19b illustre le fonctionnement de la fenecirctre de congestion dansle temps Lors du deacutebut de connexion BIC se comporte comme Reno avec le meacutecanismedu deacutemarrage en douceur Degraves qursquoune perte est deacutetecteacutee la diminution de la fenecirctre estalors moins agressive qursquoavec Reno Au centre de la courbe nous remarquons la fonctiondrsquoaccroissement avec les trois phases

BIC est un controcircle de congestion performant dans les reacuteseaux agrave forte capaciteacute destockage Neacuteanmoins BIC peut ecirctre trop agressif pour les flux qui ont des courts deacutelaisCela a pour conseacutequence un partage ineacutequitable de la bande passante disponible avec lesflux qui ont des longs deacutelais

Afin de reacutesoudre le problegraveme drsquoiniquiteacute lieacute au RTT lrsquoalgorithme CUBIC propose dechanger la fonction de controcircle de la taille de la fenecirctre de congestion pour la rendreplus agressive La fonction retenue est cubique et son eacutevolution est repreacutesenteacutee par la fi-gure 110a Contrairement agrave la figure drsquoaccroissement de BIC (fig 19a) qui comporte troisphases la fonction drsquoaccroissement de CUBIC nrsquoen compte que deux (fig 110a) Sur lafigure 110b on constate que ces deux phases sont preacutesentes tout au long de lrsquoeacutevolutionde la fenecirctre de congestion de CUBIC Ces deux phases ne sont pas forceacutement conseacute-cutives lrsquoune de lrsquoautre Apregraves la deacutetection drsquoune perte CUBIC va essayer de croicirctre le

21

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez BIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deBIC-TCP (Source [Afanasyev2010])

FIGURE 19 ndash Fonctionnement de BIC TCP

plus rapidement possible jusqursquoagrave ωMax Lorsque ωMax est atteint la taille de la fenecirctre vasrsquoincreacutementer lentement Mais plus la valeur drsquoω est eacuteloigneacutee en taille de ωMax plus lacroissance va srsquoacceacuteleacuterer Lrsquoavantage de CUBIC sur BIC est le remplacement la fonction decontrocircle lineacuteaire par une fonction cubique pour plus drsquoagressiviteacute Lrsquoalgorithme CUBICest deacutecrit par le [RFC8312]

(a) Fonction drsquoaccroissement de la fenecirctrede congestion chez CUBIC-TCP (Source [NCSUNRL])

(b) Eacutevolution de la fenecirctre de congestion deCUBIC-TCP (Source [Afanasyev2010])

FIGURE 110 ndash Fonctionnement de CUBIC

114 Controcircle de congestion avec implication des routeurs

Drsquoautres approches ont eacuteteacute eacutetudieacutees pour aider le controcircle de congestion de TCP Cesapproches impliquent les routeurs et ne reposent plus que sur le principe de bout-en-boutpropre agrave TCP

Explicit Congestion Notification (ECN) vise agrave renforcer lrsquoindication drsquoun eacuteveacutenement decongestion [RFC3168] Avec ECN la congestion est signaleacutee avant que la perte drsquoun pa-quet ne se produise Lors de la reacuteception drsquoun paquet indiquant une congestion lrsquoeacutemet-teur va alors reacuteduire sa fenecirctre de congestion et sa fenecirctre drsquoeacutemission La reacuteduction dela capaciteacute drsquoeacutemission de lrsquoeacutemetteur eacutevitera pertes et retransmissions et une reacuteductiondes deacutelais de reprise Lrsquousage de cette option neacutecessite que lrsquoeacutemetteur le reacutecepteur et lesrouteurs du chemin soient capables de geacuterer les notifications explicites Avec ECN lrsquoin-formation de congestion est transmise agrave lrsquoeacutemetteur Aucune indication sur le lieu preacutecisde la congestion est indiqueacutee

eXplicit Control Protocol (XCP) est un protocole de controcircle de congestion utilisantles notifications explicites de deacutebit [Katabi2002] En cela il reprend lrsquoideacutee de Quick-startCependant il se diffeacuterencie par le deacutecouplage opeacutereacute entre la probleacutematique du partageeacutequitable entre les flots et celle de lrsquoefficaciteacute du transfert Dans lrsquoarchitecture de proto-coles XCP se situe entre TCP et IP XCP repose sur un en-tecircte qui va servir aux routeurs

22

traverseacutes pour indiquer le deacutebit drsquoeacutemission pour le flot La valeur drsquoadaptation de la fe-necirctre de congestion est calculeacutee agrave partir des informations contenues dans lrsquoen-tecircte XCPXCP propose un controcircle de congestion qui fonctionne sur un reacuteseau 100 XCP Uneseconde limite est lrsquoiniquiteacute avec les autres protocoles de transport Les performancessont fortement deacutegradeacutees si diffeacuterents protocoles de bout en bout sont exeacutecuteacutes dans lemecircme reacuteseau tels que TCP XCP possegravede de mauvaises performances si des routeurs IPclassiques (non-XCP) se trouvent au niveau du goulot drsquoeacutetranglement

Afin de reacutesoudre le problegraveme drsquointeropeacuterabiliteacute Dans [Lopez2006] lrsquoauteur proposeXCP-interoperable (XCP-i) une version XCP qui garde les meacutecanismes de controcircle XCPsans ajouter drsquoeacutetat de flux Lrsquoobjectif drsquoXCP-i est de deacuteployer XCP sur un reacuteseau com-prenant des routeurs XCP et non-XCP Pour cela XCP-i va fonctionner en deux phasesDans une premiegravere phase il va deacutecouvrir les nuages non-XCP Un nuage non-XCP est unensemble de routeurs non capables de traiter XCP En comparant les champs Time-To-Live(TTL) drsquoIP et drsquoXCP le nombre de routeurs non-XCP preacutesents dans le reacuteseau peut ecirctredeacuteduit La seconde phase consiste agrave deacuteterminer les ressources du nuage non-XCP En ra-joutant un champ last_xcp_routeur XCP-i garde en meacutemoire lrsquoadresse du dernier routeurXCP traverseacute Agrave partir drsquoalgorithmes drsquoestimation de bande passante la bande passantedu nuage non-XCP sera estimeacutee entre les deux nœuds XCP La derniegravere phase pour reacutea-liser une inter-opeacuterabiliteacute complegravete entre routeurs classiques et routeurs XCP consiste agraveprendre en consideacuteration la bande passante estimeacutee dans les calculs du feedback de XCPLe protocole XCP-i va creacuteer un routeur XCP virtuel agrave la place du nuage non-XCP Gracirccea ces meacutecanismes un reacuteseau heacuteteacuterogegravene devient virtuellement homogegravene pour XCP Lesperformances de XCP-i sont comparables agrave celle de XCP [Lopez2006] XCP-i reacutesout leproblegraveme drsquointer-opeacuterabiliteacute de XCP sur des reacuteseaux non 100 XCP

Ces solutions preacutesentent le deacutesavantage de devoir ecirctre deacuteployeacutees eacutegalement au seindes routeurs Le principal avantage de ces solutions est une indeacutependance au deacutelai Lesprobleacutematiques lieacutees au deacutelai que lrsquoon a preacutesenteacutees preacuteceacutedemment sont alors inopeacute-rantes Dans le cadre de La Reacuteunion les deacutelais peuvent ecirctre importants

115 Caracteacuterisation de La Reacuteunion

Lrsquoaugmentation des deacutebits drsquoaccegraves srsquoaccompagne de lrsquoaugmentation de la capaciteacute desliens drsquointerconnexion comme celles des cacircbles sous-marins Malgreacute cette augmentationdes deacutebits le temps de propagation reste inchangeacute Dans cette partie nous deacuteterminonsagrave partir de quel deacutebit un accegraves Internet agrave La Reacuteunion peut ecirctre sujet aux problegravemes ren-contreacutes sur les LFN

Dans la section 21 nous avons vu que La Reacuteunion est raccordeacutee agrave Internet par deuxaccegraves reposant sur des cacircbles sous-marins le SAFE et le LION Le cacircble SAFE est prolongeacutepar le cacircble SAT-3WASC Le temps de propagation (tp) sur un cacircble peut ecirctre estimeacutepar la formule matheacutematique 15 dans laquelle d repreacutesente la distance et c la vitesse depropagation du signal sur le support

tp =d

c(15)

Si nous retenons la route directe entre La Reacuteunion et la France hexagonale qui passepar le plus long des accegraves constitueacute par les cacircbles SAFE et SAT-3WASC Sachant que lecacircble SAFE a une longueur totale de 13 500 km pour aller de lrsquoAfrique du Sud agrave lrsquoAsie Sion fait lrsquohypothegravese que lrsquoicircle de La Reacuteunion se situe agrave une distance eacutequivalente agrave la moitieacutedu cacircble SAFE La longueur du cacircble pour La Reacuteunion est de 6 750 Km La vitesse de

23

propagation du signal pour une fibre optique est eacutegale agrave la vitesse de la lumiegravere (299 792Kms) Lrsquoapplication de la formule 15 donne tp1 avec

tp1 = 12times dSAFEc = 22 52ms (16)

tp1 approxime le temps de propagation entre La Reacuteunion et le point de sortie du cacircbleSAFE en Afrique du Sud ou en Asie Pour obtenir le RTT ce temps est agrave doubler Onobtient alors la valeur RTT1 = 45 04 ms

La seconde partie du trajet de lrsquoAfrique du Sud jusqursquoen Europe emprunte le cacircbleSAT-3WASC Drsquoapregraves [Cablesmap] la longueur du cacircble est de 14 350 Km Le temps depropagation entre lrsquoAfrique du Sud et lrsquoEurope noteacute tp2 srsquoexprime comme

tp2 = (dSATminus3WASC)c = 47 87ms (17)

Le RTT sur ce cacircble est de RTT2 = 95 74 msAu total le RTT incompressible pour joindre lrsquoEurope en passant par les cacircbles SAFESAT-3WASC consiste agrave additionner le RTT de chaque cacircble agrave savoir RTT1 et RTT2 Le RTTincompressible est donc minimal de 140 78ms Ce deacutelai comme nous venons de le calcu-ler ne prend en compte que la propagation Il neacuteglige le temps de transmission du paquetainsi que les temps drsquoattente avant la transmission

Lrsquoeacutetude preacutesenteacutee dans[Anelli2012] a mesureacute un RTT minimal pour les paquets quit-tant lrsquoicircle de La Reacuteunion de 185 ms Ce reacutesultat a eacuteteacute obtenu par une eacutetude de mesuresdepuis les locaux de lrsquoUniversiteacute de La Reacuteunion La figure 111 repreacutesente la Probabi-lity Density Function (PDF) des RTT mesureacutes Cette fonction est compareacutee agrave celle qui estobtenue depuis la France hexagonale et de Paris en particulier On constate une forte si-militude sur la forme des courbes La courbe de La Reacuteunion enregistre un deacutecalage dansle temps de 185 ms par rapport agrave celle de Paris Ce deacutecalage repreacutesente le RTT minimummesureacute pour rejoindre la meacutetropole et acceacuteder agrave lrsquoInternet

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

FIGURE 111 ndash Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

Si lrsquoon considegravere la valeur de BDP de 12 5 Ko indiqueacutee par le [RFC1072] comme lalimite basse drsquoun LFN et si nous reprenons les diffeacuterentes TAI preacutesenteacutees dans la section21 nous pouvons calculer le produit deacutelai-bande passante drsquoun canal de communica-tion entre La Reacuteunion et la meacutetropole Il est fait lrsquohypothegravese pour ce calcul que le goulotdrsquoeacutetranglement est donneacute par lrsquoaccegraves agrave Internet Le tableau 12 preacutesente les reacutesultats ob-tenus

24

TABLE 12 ndash Approximation du produit deacutelai bande passante de la connectiviteacute de LaReacuteunion agrave lrsquoInternet

NomhhhhhhhhhhhhhhhhhhhBande passante

RTT (en secondes)Estimeacute 0141

Mesureacute 0185

Modem56 Kbits 987 o 130 Ko128 Kbits 226 Ko 296 Ko512 Kbits 902 Ko 118 Ko

ADSL1 Mbits 176 Ko 231 Ko8 Mbits 141 Ko 185 Ko20 Mbits 353 Ko 463 Ko

VDSL 50 Mbits 881 Ko 116 Mo

Fibre

35 Mbits 617 Ko 809 Ko100 Mbits 176 Mo 231 Mo200 Mbits 353 Mo 463 Mo

1 Gbits 176 Mo 231 Mo

Le tableau preacutesente en gras les produits deacutelai-bande passante deacutepassant la limite des12 5 Ko Ainsi les reacutesultats sont assez eacuteloquents Degraves que lrsquoon arrive sur un accegraves ADSLavec un deacutebit minimal drsquo1 Mbits nous avons un BDP supeacuterieur agrave la limite fixeacutee par le[RFC1072] Ainsi rapidement lrsquoeacutevolution des deacutebits proposeacutes sur lrsquoicircle et les capaciteacutes descacircbles sous-marins associeacutes agrave un deacutelai eacuteleveacute ont fait de lrsquoInternet reacuteunionnais un reacuteseauqui a les caracteacuteristiques drsquoun LFN

Nous avons vu que TCP est un protocole de transport dont la performance est deacutepen-dante du RTT et du BDP Les deacutelais sont une des caracteacuteristiques des LFN La Reacuteunionest un reacuteseau agrave forte capaciteacute de stockage due agrave des deacutelais importants Il est important demesurer pour comprendre lrsquoimpact de cette caracteacuterisation sur les performances de TCP

12 Meacutetrologie du trafic Internet

Avec lrsquoInternet qui devient de plus en plus gros et de plus en plus complexe la meacutetro-logie est une activiteacute qui vise agrave mieux comprendre le fonctionnement de lrsquoInternet Nousallons dans cette partie du manuscrit preacutesenter les techniques de meacutetrologie appliqueacuteesagrave lrsquoInternet

121 Deacutefinition

Meacutetrologie est un mot composeacute de deux termes grecs Le premier metron signifie lamesure tandis que logos fait reacutefeacuterence agrave la science Par deacutefinition la meacutetrologie deacutesignela science de la mesure Par la suite le terme meacutetrologie fera uniquement reacutefeacuterence agrave la meacute-trologie appliqueacutee aux reacuteseaux informatiquesLa meacutetrologie signifie donc la mesure des caracteacuteristiques drsquoun reacuteseau sous de nombreuxaspects Cette science est devenue un outil indispensable pour avoir une compreacutehensionde divers aspects de lrsquoInternet On peut citer la complexiteacute la qualiteacute de service et laqualiteacute utilisateur la performance du reacuteseau la performance des protocoles le fonction-nement ou encore la validation des modegravelesLa meacutetrologie Internet englobe deux types drsquoactiviteacutes La premiegravere est lrsquoeacutetude des para-megravetres physiques de la qualiteacute de service La seconde consiste a mettre en eacutevidence lesproblegravemes lieacutes agrave lrsquoInternet [Larrieu2010]

25

Dans [Paxson2001] lrsquoauteur preacutesente lrsquoapproche research driven et lrsquoapproche measure-ment driven pour deacutefinir les objectifs drsquoune eacutetude de meacutetrologie Le choix drsquoune approcheva aider une personne souhaitant faire de la meacutetrologie sur la bonne faccedilon drsquoaborderlrsquoeacutetude qursquoelle veut mettre en place

Lrsquoexpression research driven peut ecirctre traduite par axeacutee sur la recherche Elle consisteagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires de lancer les campagnes de mesures et drsquointerpreacuteter les reacute-sultats Une meacutetrique se deacutefinit comme une grandeur mesurable et speacutecifieacutee de maniegravererigoureuse Une bonne meacutetrique doit pouvoir se mesurer de faccedilon reproductible ecirctreutile en pratique pour les utilisateurs et les administrateurs du reacuteseau [RFC2330] Cetteapproche est celle geacuteneacuteralement utiliseacutee par les opeacuterateurs et les groupes de recherchesElle est deacuteveloppeacutee par le groupe de travail IP Performance Metrics (IPPM) de lrsquoIETF Cegroupe de travail a produit de nombreux documents pour deacutefinir les mesures de per-formances Lrsquoapproche research driven comporte un deacutefaut principal En laissant de cocircteacutecertaines meacutetriques des aspects du comportement du reacuteseau ne sont pas eacutetudieacutes Parexemple une eacutetude restreinte aux deacutelais ne peut indiquer les raisons de la variation desdeacutelais dans le temps

Lrsquoapproche measurement driven peut se traduire en la mesure pour la mesure Cettemeacutethode consiste agrave mettre en place une infrastructure de mesures afin de reacutecupeacuterer lemaximum drsquoinformations puis effectuer toutes les analyses possibles sur les traces col-lecteacutees et interpreacuteter les reacutesultats obtenus Une telle meacutethode peut srsquoutiliser lorsque lrsquoonsouhaite mettre en avant le comportement geacuteneacuteral drsquoun lien Cette approche permet agrave ladiffeacuterence de la preacuteceacutedente drsquoanalyser agrave plusieurs reprises une mecircme source de donneacuteesen fonction des reacutesultats obtenus

Le tableau 13 reacutesume les deux approches de conduite de projet en meacutetrologie

TABLE 13 ndash Comparatif entre les approches de meacutetrologie

Research Driven Measurement Driven1 - Meacutetriques deacutefinies preacutealablement2 - Utilisation drsquoun outil adapteacute

1 - Collecte des donneacutees2 - Analyse exhaustive

Ces deux approches sont compleacutementaires lrsquoune de lrsquoautre et srsquoappliquent dans lesdeux classes de techniques de mesures les techniques de mesures actives et les tech-niques de mesures passives

122 Meacutetrologie active

La meacutetrologie active consiste agrave injecter un trafic speacutecifique et agrave mesurer en reacuteceptionlrsquoeffet sur le reacuteseau agrave eacutetudier Lrsquohypothegravese faite par la meacutetrologie active est que la mesurefaite de bout en bout est reacuteveacutelatrice de la performance du service du reacuteseau telle qursquoellepeut ecirctre perccedilue par une application Les paquets eacutemis sont des sondes qui en emprun-tant la route entre la source et la destination expeacuterimentent la performance du canal decommunication Il convient de limiter le trafic des sondes afin qursquoil ne vienne pas pertur-ber le trafic et donc fausser la mesure Les meacutetriques mesureacutees par les mesures activessont geacuteneacuteralement des meacutetriques associeacutees agrave la topologie du reacuteseau ou au trafic commeles routes ou les deacutelais Dans le cas de la meacutetrologie active il se peut que lrsquoeacutemetteur soiteacutegalement le collecteur La figure 112 illustre ce principe

La meacutetrologie active est opeacutereacutee agrave lrsquoaide drsquooutils speacutecifiques de geacuteneacuteration et de collectede sondes Le tableau 14 indique les meacutetriques obtenues avec les outils de meacutetrologiepreacutesenteacutes par la suite

26

FIGURE 112 ndash Principe de la meacutetrologie active

TABLE 14 ndash Classement des outils

XXXXXXXXXXXOutilMeacutetriques

RTT Routes Deacutebits

Ping XTraceroute X XParis Traceroute X XReverse-traceroute X XTraceIXroute X XPathchar XClink XIperf X

La mesure du RTT est geacuteneacuteralement obtenue par lrsquooutil ping (Packet Internet Groper)Cet outil se preacutesente sous la forme drsquoune commande dans un systegraveme de type Unix Ellesert en premier lieu agrave veacuterifier la connectiviteacute agrave Internet et lrsquoaccessibiliteacute drsquoun nœud Ensecond lieu avec cette veacuterification le RTT et la longueur de la route exprimeacutee en nombrede sauts sont deacutetermineacutes Elle utilise le protocole Internet Control Message Protocol (ICMP)pour effectuer la mesure Un message ICMP Echo request est eacutemis Le destinataire renvoieagrave lrsquoeacutemetteur un message ICMP Echo reply La peacuteriode qui seacutepare lrsquoeacutemission de la reacuteceptiondu coteacute eacutemetteur est mesureacutee

Pour en savoir plus sur la connectiviteacute drsquoun nœud et notamment sur la route emprun-teacutee pour atteindre une destination donneacutee lrsquooutil traceroute offre le moyen de cette deacute-couverte [Jacobson1989-1] Cet outil se preacutesente comme pour ping sous la forme drsquounecommande de type Unix Son principe de fonctionnement est baseacute sur un envoi successifde messages avec un champ TTL du paquet IP qui va croissant Le routeur qui reccediloit unmessage dont le TTL du paquet a atteint la valeur zeacutero envoie un message ICMP TimeExceeded pour reporter lrsquoerreur agrave lrsquoeacutemetteur Par ce message il indique en adresse sourcelrsquoadresse IP de son interface qui a rejeteacute le paquet Ainsi si un paquet ayant un TTL posi-tionneacute agrave n est envoyeacute vers une destination donneacutee le routeur situeacute agrave n sauts de la sourceva faire connaicirctre son adresse IP et ceci tant que le chemin vers la destination est supeacute-rieur agrave n sauts [Crovella2006] Le reacutesultat est lrsquoensemble des nœuds traverseacutes reacutepondantau protocole ICMP De nouveaux outils utilisant le principe de traceroute furent deacutevelop-peacutes pour reacutepondre agrave drsquoautres probleacutematiques comme la preacutesence des points drsquoeacutechangeou encore lrsquoasymeacutetrie des liens

La reacuteponse afficheacutee par la commande traceroute nrsquoest pas la seule route existanteEn exeacutecutant agrave plusieurs reprises la mecircme commande traceroute les reacuteponses obtenuespeuvent ecirctre diffeacuterentes A cause de lrsquoeacutequilibrage de charge (load-balancing) la sortie drsquounrouteur ne sera pas toujours la mecircme Lrsquoeacutequilibrage des charges sert agrave reacutepartir le traficsur diffeacuterents liens Ainsi il est possible que deux paquets provenant de la mecircme sourcevers la mecircme destination nrsquoempruntent pas la mecircme route Sur la figure 113 les liensphysiques entre les diffeacuterents nœuds sont indiqueacutes en rouge Les traits en pointilleacute repreacute-sentent le chemin emprunteacute par les messages ICMP envoyeacutes par la source La figure 113amontre le reacutesultat trouveacute par traceroute La route emprunteacutee est SRC A D DST

27

Traceroute va envoyer 3 paquets avec un champ TTL eacutegal agrave 2 Dans le cas de cet exemplelrsquoensemble des paquets est dirigeacute vers B Ainsi malgreacute lrsquoabsence de liaison physique di-recte entre les nœuds A et D traceroute nous indique la preacutesence drsquoune route entre ceuxdeux eacutequipements Lrsquooutil Paris-traceroute vise agrave traiter ce problegraveme [Augustin2006]La figure 113b montre la route deacutecouverte par Paris-traceroute La route afficheacutee estSRC A C DST On remarque que la route obtenue existe physiquement Pour obte-nir ce reacutesultat Paris-traceroute change le numeacutero drsquoidentification du flux agrave lrsquoeacutemission despaquets ICMP Cette modification oblige les routeurs agrave suivre une seule et unique routeParis-traceroute autorise eacutegalement lrsquoaffichage des numeacuteros de voies logiques MPLS

(a) Traceroute

(b) Paris-traceroute

FIGURE 113 ndash Illustration du pheacutenomegravene drsquoeacutequilibrage des charges

MultiProtocol Label Switch (MPLS) est un meacutecanisme de commutation rapide de pa-quets fondeacute sur des adresses de format fixe et sans structure hieacuterarchique [RFC3031]Ces adresses sont des numeacuteros de voies logiques appeleacutees des eacutetiquettes ou labels (paranglicisme) Dans le cas de lrsquoutilisation de traceroute avec MPLS il faut que le routeurMPLS puisse envoyer un message ICMP Le [RFC4950] documente une simple extensionagrave ICMP pour retourner de lrsquoinformation speacutecifique agrave MPLS autrement dit pour qursquounrouteur MPLS puisse indiquer des informations speacutecifiques agrave MPLS dans le paquet ICMPeacutemis en cas de problegraveme [Donnet2012] a eacutetudieacute les possibiliteacutes offertes par des routeursMPLS

Dans les explicit tunnels la structure interne du tunnel est entiegraverement visible et chaquenœud dans le Label Switched Path (LSP) est marqueacute comme nœud MPLS Dans ce type detunnel le champ ttl-propagate qui est dans lrsquoen-tecircte MPLS des paquets et le [RFC4950] sontappliqueacutes Cela signifie que le champ TTL du datagramme IP est deacutecreacutementeacute agrave chaquerouteur rencontreacuteDans les implicit tunnels le LER drsquoentreacutee active lrsquooption ttl-propagate mais les LSR nrsquoim-pleacutementent pas le [RFC4950] La deacutecreacutementation du TTL est effective mais aucune infor-mation de routeur MPLS nrsquoest visibleDans les opaque tunnels crsquoest lrsquoinverse de lrsquoimplicit tunnels Les routeurs impleacutementent le[RFC4950] Le nœud drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Le TTL est alors deacutecreacute-menteacute agrave la sortie du tunnel MPLS Le paquet ICMP-reply indique quand mecircme lrsquoexistencedrsquoun tunnel MPLSPour les invisible tunnels le LER drsquoentreacutee nrsquoactive pas lrsquooption ttl-propagate Dans ce casle TTL est deacutecreacutementeacute uniquement lors du dernier routeur du tunnel Le [RFC4950] nrsquoestpas impleacutementeacute par le dernier routeur du LSP Cela implique lrsquoabsence drsquoinformation

28

sur le meacutecanisme MPLS au sein des paquets ICMP On nrsquoa alors pas drsquoinformations surlrsquoexistence drsquoun tunnel ICMP sur la route emprunteacutee

Avec lrsquoacheminement avec MPLS des mauvaises valeurs de TTL peuvent ecirctre obte-nues agrave cause du type de tunnel mis en œuvre Il est donc important que le [RFC4950] soitimpleacutementeacute dans les routeurs

FIGURE 114 ndash Taxonomie des configurations de tunnels MPLS et des comportements detraceroute correspondants (Source [Donnet2012] )

Paris-traceroute propose lrsquoaffichage des informations MPLS lorsque celles-ci sont dis-ponibles [Augustin2007] La texte ci-dessous illustre les reacutesultats obtenus par Paris-traceroutesur un Explicit tunnel On y voit lrsquoaffichage des marques MPLS avec le TTL associeacute agravechaque nœud

traceroute [(412131413533456) -gt (818216615733457)]protocol icmp algo hopbyhop duration 3 s1 4121314133 23266 ms 2542 ms 3696 ms2 4121313397 6811 ms 5613 ms 4635 ms3 10322161 5779 ms 6841 ms 4073 msMPLS Label 16445 TTL=1 | 2129964 1032237 2223 ms 2249 ms 2264 msMPLS Label 16386 TTL=2 | 2129965 4121312850 2185 ms 2245 ms 2097 msMPLS Label 16442 TTL=3 | 2129966 10322193 3551 ms 9330 ms 7775 ms7 41213133158 2337 ms 3088 ms 2250 ms8 4121312854 195439 ms 195555 ms 195512 ms9 213242121233 211737 ms 211724 ms 212013 ms10 469148181 234190 ms 234271 ms 234323 ms11 4687222 236854 ms 236798 ms 237063 ms12 213224250110 237108 ms T0 236580 ms T0 236570 msT013 2132242502 237213 ms 236631 ms 236694 ms14 213224201252 239100 ms 239461 ms 238680 ms15 8182166157 250874 ms 249608 ms 248057 ms

Avec traIXroute lrsquoobjectif est de deacutecouvrir les diffeacuterents points de peering (IXP) sur unchemin vers une destination [Nomikos2016] Pour lrsquoidentification des nœuds drsquoeacutechangecette version de traceroute combine deux bases de donneacutees compleacutementaires qui sontPeeringDB [PeeringDB] et Packet Clearing House [PCH] Avec une geacuteolocalisation desadresses retourneacutees la liste des pays traverseacutes peut ecirctre eacutetablie

29

Drsquoapregraves [Steenbergen2009] laquo lrsquooutil de deacutepannage numeacutero 1 pour veacuterifier la connec-tiviteacute drsquoun nœud reste traceroute raquo pour les administrateurs reacuteseaux mais laquo les liens asy-meacutetriques sont les fleacuteaux numeacutero un de lrsquooutil raquo car laquo le chemin de retour est entiegraverementmasqueacute raquo Afin de corriger cela lrsquooutil reverse-traceroute propose drsquoobtenir une routenon pas entre la source et la destination mais entre la destination et la source [Katz2010]pour cela lrsquooutil va utiliser lrsquoenregistrement des adresses IP des routeurs sur le chemindu retour agrave lrsquoaide des options drsquoen-tecircte Record-Route et Timestamp drsquoIP

Pour deacuteterminer le deacutebit pathchar [Jacobson1997] vise agrave donner le deacutebit saut par sautvers une destination Aussi il reprend le principe de traceroute en eacutemettant des sondesavec le champ TTL avec une valeur croissante Lorsqursquoil injecte le trafic de sondes vers unnœud du chemin il le fait avec des paquets de taille variable Ainsi pathchar deacuteterminela bande passante disponible entre chaque nœud rencontreacute

Lrsquooutil Clink [Downey1999] est similaire agrave pathchar La diffeacuterence se fait au niveausur le nombre de paquets envoyeacutes Clink envoie un nombre de paquets plus importantque Pathchar Ainsi les mesures reacutealiseacutees par Clink auront une meilleure preacutecision

Iperf [Tirumala2005] est un outil pour mesurer la bande passante et la qualiteacute drsquounlien reacuteseau Ce dernier est deacutelimiteacute par deux machines sur lesquelles est installeacute IperfUne machine tient le rocircle de serveur tandis que la seconde machine sera parameacutetreacuteecomme client

Pour des mesures plus repreacutesentatives il est neacutecessaire drsquoaugmenter les points decollectes Des outils de meacutetrologie active ont eacuteteacute conccedilus pour ecirctre reacutepartis sur plusieursnœuds Ces outils se preacutesentent sous la forme de plates-formes de meacutetrologie active deacute-ployeacutees agrave travers le monde De nos jours on compte de nombreuses plates-formes demeacutetrologie active Comme chaque plate-forme a un objectif preacutecis et pour identifier laplate-forme approprieacutee pour reacutealiser une eacutetude preacutecise lrsquoauteur de [Bajpai2015-1] effec-tue une comparaison des diffeacuterentes plates-formes selon 5 critegraveres qui sont

1 lrsquoeacutechelle la couverture et la dureacutee de vie de la plate-forme

2 le mateacuteriel physique utiliseacute pour la sonde

3 les meacutetriques disponibles

4 lrsquoarchitecture de mesure de la plate-forme

5 lrsquoimpact de son utilisation pour la recherche

De cette comparaison nous avons gardeacute 4 plates-formes que sont Atlas RIPE NCC BIS-Mark DASU SamKnows Ces plates-formes ont eacuteteacute gardeacutees car elles autorisent lrsquoeacutetudedes performances des reacuteseaux drsquoaccegraves Nous y avons ajouteacute les plates-formes Archipe-lago et Planet-Lab Ces deux plates-formes ne font pas partie du document drsquoorigine maisfont lrsquoobjet drsquoune utilisation par de nombreux participants tel que lrsquoindique le nombrede sondes actives de ces deux plates-formes

En 2007 le CAIDA a deacuteployeacute sa propre plate-forme de mesures [Archipelago] Atravers le deployement de nœuds (des sondes dans le vocabulaire de Archipelago) surlrsquoensemble de la planegravete lrsquoobjectif est drsquooffrir des accegraves pour effectuer des mesures avecdes outils tels que ping et traceroute Archipelago est composeacutee agrave la date du 1er Mars2017 de 170 sondes reacuteparties dans 59 pays et sur tous les continents

Dans le courant de lrsquoanneacutee 2010 le Regional Internet Registry (RIR) europeacuteen RIPENCC a deacutemarreacute la distribution de sondes pour la creacuteation de la plate-forme Atlas [Ripe2010]Cette plate-forme vise agrave creacuteer un reacuteseau de sondes pour lrsquoeacutetude de la connectiviteacute de lrsquoIn-ternet Composeacutee actuellement de pregraves de 10 000 sondes reacuteparties agrave travers le monde elleest capable drsquoeffectuer des tests de meacutetrologie active autour des commandes ping DNSHTTP NTP traceroute et Paris-traceroute

30

Agrave lrsquoinitiative de Georgia Tech la plate-forme Broadband Internet Service Benchmark (BIS-Mark) a vu le jour en 2010 Lrsquoobjectif est la reacutealisation drsquoun eacutetat des lieux des performancesdes accegraves Internet [Sundaresan2011] La plate-forme est composeacutee de 405 routeurs instru-menteacutes avec OpenWrt laquo Le projet OpenWrt est un systegraveme drsquoexploitation Linux ciblantles appareils embarqueacutes OpenWrt fournit un systegraveme de fichiers entiegraverement inscriptibleavec gestion des modules drsquoinstallation de logiciels Cela libegravere la seacutelection et la configu-ration des applications fournies par le fournisseur et permet de personnaliser lrsquoappareilgracircce agrave lrsquoutilisation de progiciels adapteacutes agrave nrsquoimporte quelle application raquo [OpenWrt] Lessondes sont distribueacutees dans 34 pays agrave travers le monde

DASU est un utilitaire deacuteveloppeacute en 2010 agrave lrsquoUniversiteacute de Northwestern Le logicielcouple meacutetrologie active et passive avec pour objectif de caracteacuteriser les performancesdes utilisateurs Lrsquooutil fut deacuteveloppeacute comme une extension drsquoun logiciel peer-to-peer Bit-Torrent [Sanchez2013] Depuis Juillet 2010 plus de 90 000 personnes reacuteparties agrave travers147 pays utilisent DASU

En 2003 des chercheurs ameacutericains ont deacuteployeacute une plate-forme de test Planet-Lab[Chun2003] En 2008 une extension europeacuteenne [PlanetLabEurope] a vu le jour Planet-Lab deacutepasse le seul objectif de meacutetrologie elle vise aussi de tester des nouveaux servicesde communication en situation reacuteelle Les nœuds Planet-Lab ont pour Operating System(OS) Fedora Il est possible drsquoinstaller nrsquoimporte quel logiciel du moment qursquoil est com-patible avec cet OS Avec une certaine liberteacute il est possible drsquoeffectuer des tests et desmesures depuis 425 sites reacutepartis sur tous les continents

La plate-forme SamKnows a vu le jour en 2008 [SamKnows] SamKnows sert agrave lrsquoeacutetudedes performances des connexions des particuliers et des entreprises Elle est composeacuteede pregraves de 440 000 sondes Cette infrastructure est partenaire de 36 Fournisseurs drsquoAccegravesInternet (FAI) de tous les continents

Le tableau 15 reacutesume les possibiliteacutes offertes par les plates-formes La colonne Impactsur la recherche est deacutetermineacutee agrave partir du nombre de citations par des articles scientifiquessuivis par le site Google Scholar

La plate-forme de mesures Atlas RIPE NCC [Ripe2010] a eacuteteacute utiliseacutee dans le contexteinsulaire de Cuba Dans lrsquoarticle [Bischof2015] lrsquoauteur cherche agrave caracteacuteriser lrsquoaccegraves In-ternet cubain Dans ses reacutesultats lrsquoauteur a montreacute une forte asymeacutetrie des routes in-ternationales pour le trafic cubain Drsquoun point de vue de la topologie physique cette icirclepossegravede une connectiviteacute qui peut par certains aspects ressembler agrave de celle de lrsquoicircle de LaReacuteunion

Lrsquoicircle de La Reacuteunion bien que Franccedilaise est rattacheacutee administrativement au RIR dela zone Afrique (AfriNIC) LrsquoAfriNIC est le dernier RIR creacuteeacute et les eacutetudes de meacutetrolo-gie concernant cette zone sont peu nombreuses Nous pouvons citer [Gupta2014] qui sepenche sur lrsquointerconnexion des FAI sur le continent africain Cette eacutetude montre que leseacutechanges de paquets ne se font pas au sein du continent africain mais en Europe La rai-son avanceacutee par lrsquoauteur est un coucirct drsquointer-connexion infeacuterieur en Europe Ces regravegles deroutage on des conseacutequences sur les deacutelais et donc sur les performances sur le servicede transport rendu par TCP Ces reacutesultats ont eacuteteacute confirmeacutes par [Fanou2015] Cette eacutetudesrsquointeacuteresse en plus agrave la stabiliteacute des routes Les reacutesultats ont montreacute que les chemins afri-cains restent stables sur une longue dureacutee Pour les auteurs lrsquoeacutemergence de nouveauxpoints drsquoeacutechanges sur le continent doit aider agrave la reacuteduction des deacutelais agrave conditions queles coucircts drsquointerconnexion soient proches de ceux pratiqueacutes en Europe

Enfin lrsquoarticle [Chavula2017] publieacute en 2017 preacutesente la latence pour les transferts defichiers agrave partir de 53 pays africains diffeacuterents Ces mesures srsquoappuient sur la plate-formeRIPE Atlas [Ripe2010] et Speedchecker [Speechecker] Agrave partir des mesures reacutealiseacutees les

31

TABLE 15 ndash Tableau des plates-formes de mesures de meacutetrologie active

Nom Nombre desondes deacuteployeacutees

Meacutetriques dispo-nibles

Impact sur la re-cherche

Archipelago ~200 Longueur duchemin RTTDNS Autono-mous System(AS)

109

Atlas RIPE NCC ~12 000 RTT RouteHTTP GET etrequecirctes SSL

38

BISMark ~420 RTT taux depertes deacutebiteacutecouleacute tempsde chargementdrsquoune page web

304

DASU ~100 000 Informations surles flux TCP RTTroutes emprun-teacutees reacutesolutionDNS HTTP GETdeacutebit eacutecouleacute

84

PlanetLab ~400 1218SamKnows ~70 000 RTT deacutebit

eacutecouleacute deacutebitutile giguetaux de perteperformance decertains services

154

auteurs avancent que lrsquoAfrique est un continent ineacutegalitaire en terme de latence intra etinter pays Ils ont conclu que lrsquoexistence drsquoune faible latence entre deux FAI drsquoun mecircmepays provient drsquoaccord de peering au sein drsquoun IXP heacutebergeacute soit par le pays concerneacutesoit par un pays voisin

123 Meacutetrologie passive

La meacutetrologie passive a pour objectif la mesure des flots de paquets agrave partir drsquounpoint particulier du reacuteseau appeleacute le point de collecte Elle consiste agrave eacutecouter captureret analyser les paquets IP La figure 115 illustre le principe de la meacutetrologie passiveElle montre que le point de collecte nrsquoest pas forceacutement localiseacute du coteacute eacutemetteur oureacutecepteur Les paquets IP transitant par le point de collecte sont captureacutes et sauvegardeacutesOn appelle alors les fichiers contenant les paquets IP collecteacutes des traces Les mesurespassives peuvent ecirctre effectueacutees agrave diffeacuterents niveaux de granulariteacute

Au niveau microscopique les mesures passives tendent agrave eacutetudier les flots au niveaude la connexion de transport On peut par exemple eacutetudier le nombre de paquets per-dus durant une connexion TCP Au niveau macroscopique les mesures passives sonteffectueacutees sur des meacutetriques agreacutegeacutees comme le deacutebit eacutecouleacute total ou le nombre total deconnexions

32

FIGURE 115 ndash Principe de la meacutetrologie passive

La meilleure faccedilon de reacutealiser des mesures passives au niveau microscopique est decapturer tous les paquets traversant le point de collecte Mais comme il est difficile decapturer tous les paquets lorsque le deacutebit du lien est eacuteleveacute il faut avoir recours agrave lrsquoeacutechan-tillonnage du trafic Dans ce cas les mesures ne sont pas faites sur la totaliteacute des pa-quets traversant le point de collecte mais sur un sous-ensemble bien speacutecifique de cespaquets Le groupe de travail Packet Sampling (PSAMP) de lrsquoIETF travaille sur un algo-rithme drsquoeacutechantillonnage adapteacute au trafic Internet [PSAMP]

Une combinaison entre lrsquoanalyse des deux granulariteacutes est capable de donner uneeacutevaluation reacuteelle du trafic Les informations que lrsquoon peut obtenir par la meacutetrologie pas-sive sont nombreuses Elles reposent sur lrsquoeacutetude des informations contenues dans le da-tagramme IP que ccedila soit dans lrsquoen-tecircte du datagramme IP ou dans celle du message duprotocole de transport Les meacutetriques sont eacutegalement deacutependantes des outils utiliseacutes Onpeut classer les meacutetriques en deux cateacutegories que sont la supervision et la performance

La supervision donne des informations sur le fonctionnement du reacuteseau et la carac-teacuterisation du trafic On peut ainsi eacutetudier les diffeacuterents services et protocole de transportutiliseacutesLa performance se rapporte agrave celle du protocole de transport crsquoest-agrave-dire son fonction-nement ou sur lrsquoanalyse des flots par rapport soit agrave la composante temporelle ou soit agravela composante seacutemantique On peut alors comparer le deacutebit drsquoaccegraves theacuteorique et le deacutebitmesureacute Pour cela on va eacutetudier le taux de perte le RTT et la MSS

La meacutethode de capture peut reposer sur des eacutequipements mateacuteriels deacutedieacutes ou par unsystegraveme logiciel fonctionnant sur un eacutequipement standard Le logiciel srsquoappuie majori-tairement sur la bibliothegraveque Libpcap [Jacobson1989-2] Cette bibliothegraveque capture lespaquets reccedilus mais elle srsquoutilise eacutegalement en lisant des traces de paquets preacutealablementcaptureacutes Le problegraveme principal des solutions logicielles viennent de la vitesse des liensPlus le lien a un deacutebit eacuteleveacute plus la capture au niveau logiciel devient difficile Il fautalors se tourner vers des solutions de mateacuteriels deacutedieacutes La carte DAG [Graham1997] deacute-veloppeacutee par lrsquoeacutequipe [WAND] de lrsquoUniversiteacute de Waikato en Nouvelle Zeacutelande en est unparfait exemple Cette carte de capture est capable de capter les paquets sur des liens detregraves haut deacutebit Ce mateacuteriel se charge drsquoextraire les entecirctes des paquets de les estampillersuivant une horloge synchroniseacutee et de les stocker sur un disque dur

Lrsquoanalyse des donneacutees est reacutealiseacutee selon deux techniques temps reacuteels ou Batch Leprincipe du temps reacuteel est de pouvoir reacutecupeacuterer extraire et restituer de lrsquoinformation entemps reacuteel sur des flux continus de donneacutees Le mode Batch va englober tous les traite-ments de donneacutees neacutecessitant un temps de calcul plus conseacutequent Le premier proceacutedeacutese propose drsquoanalyser agrave la voleacutee ce qui se passe dans le reacuteseau par le branchement drsquouneacutequipement drsquoeacutecoute sur le reacuteseau On se concentre alors sur la performance du lien Desoutils comme Tstat [Mellia2005] ou Netflow [Claise2004] reacutealisent ce genre drsquoanalyse La

33

seconde technique se deacutecompose en deux phases distinctes que sont la capture et lrsquoana-lyse La premiegravere eacutetape est de reacutealiser la capture du trafic appeleacutee des traces Des outilscomme TCPDump [Jacobson1989-1] ou Wireshark [Chappell2010] peuvent enregistrerdes traces sous format DUMP ou PCAP La seconde phase consiste agrave analyser les tracescollecteacutees Les formats de sortie des donneacutees analyseacutees sont deacutependants des outils Lesinformations peuvent ecirctre retranscrites au format texte ou graphique Des outils commeTCPTrace [Ostermann2000] ou TCPStat [Herman2001] peuvent effectuer ce genre drsquoana-lyse de donneacutees Crsquoest avec cette technique qursquoil est possible drsquoeacutetudier les performancesdrsquoun protocole

Il nrsquoexiste pas de plate-forme drsquoaccegraves publique reacutealisant des captures de trafic au ni-veau international Malgreacute cela des traces collecteacutees sont disponibles sur Internet agrave desfins de recherche Dans [Allman2007] les auteurs preacutesentent les regravegles agrave respecter avantde publier des traces Un point est agrave souligner et concerne les adresses IP des paquets Lanon-anonymisation des adresses IP constitue une violation de la vie priveacutee de plus ellepreacutesente un risque drsquoinseacutecuriteacute pour les machines impliqueacutees par les paquets captureacutesCAIDA gegravere un deacutepocirct de partage et propose drsquoacceacuteder agrave des traces collecteacutees agrave traversplusieurs points drsquoeacutechange ameacutericains Pour y acceacuteder il faut indiquer la finaliteacute de lrsquouti-lisation des traces demandeacutees Drsquoautres plates-formes deacutedieacutees agrave des projets ont eacuteteacute misesen place agrave travers le monde

Le projet IPMon de lrsquoopeacuterateur ameacutericain SPRINT consiste agrave identifier les problegravemesdrsquoun reacuteseau deacutejagrave deacuteployeacute afin de pouvoir anticiper son eacutevolution future[IPMon] Danslrsquoarticle [Fraleigh2001] lrsquoauteur preacutesente lrsquoinfrastructure de mesure qui est deacuteployeacutee endivers points du reacuteseau de lrsquoopeacuterateur Les premiers reacutesultats publieacutes dans [Fraleigh2003]ont montreacute une utilisation de plus en plus importante par du trafic multimeacutedia sur le pro-tocole TCP De plus les flots TCP preacutesentent des performances eacuteleveacutees avec des taux dedeacute-seacutequencement faibles et un deacutelai minimal proche du temps de propagation

Le projet METROPOLIS srsquoest inspireacute du projet IPMon Il srsquoagit drsquoun projet franccedilaisavec des points de mesures sur deux types de reacuteseaux Internet diffeacuterents RENATER etle reacuteseau ADSL de France Teacuteleacutecom laquo Lrsquoobjectif de METROPOLIS eacutetait de concevoir denouvelles meacutethodologies pour la meacutetrologie des reacuteseaux IP raquo [METROPOLIS] Dans lecadre de ce projet un outil de caracteacuterisation et drsquoanalyse des traces fut deacuteveloppeacute Cenouvel outil srsquointitule ZOO Une preacutesentation de lrsquooutil sera reacutealiseacutee dans la sous-section322 Les reacutesultats ont mis une eacutevidence lrsquousage preacutedominant du protocole de transportTCP Les applications de type peer-to-peer repreacutesentaient plus de 80 du trafic eacutetudieacute

La position geacuteographique de La Reacuteunion et son rattachement au RIR AfriNIC attirentnotre attention sur les travaux de meacutetrologie passive africains La carte [AfterFibre] preacute-sente les reacuteseaux fibres terrestres et maritimes lieacutes au continent africain On voit ainsi queles reacuteseaux sont ineacutegalement reacutepartis sur le territoire La grandeur du continent et les in-terconnections preacutesentes font du territoire un espace drsquoeacutetude inteacuteressant Crsquoest pourquoide nombreux chercheurs privileacutegient lrsquoeacutetude de la connectiviteacute et des performances delrsquoInternet africain

Dans lrsquoarticle [Johnson2011] une eacutetude sur une zone rurale connecteacutee par satelliteest reacutealiseacutee Les reacutesultats ont montreacute que le trafic est principalement composeacute de fluxweb dont une forte proportion pourrait ecirctre mise en cache Au niveau des deacutelais le RTTmoyen sur la peacuteriode de mesure varie entre 3 et 10 secondes Ce deacutelai rend lrsquoutilisationdes applications temps-reacuteel difficile Le dernier reacutesultat notable de cette analyse est lapreacutesence de trafic geacuteneacutereacute par des logiciels malveillants (malware) Des attaques pour listerles ports UDP et TCP ouverts ont eacuteteacute remarqueacutees

En 2015 les auteurs de [Zheleva2015] ont eacutetudieacute les performances du reacuteseau et le com-portement des usagers apregraves une augmentation de la bande passante en Zambie Lrsquoun des

34

premiers reacutesultats indique une augmentation de plus de 58 de la quantiteacute des donneacuteeseacutechangeacutees Au niveau des performances ils ont pu eacutegalement remarquer une tregraves leacutegegraveredeacutegradation du canal de communication avec un taux de retransmission en hausse Cepourcentage est passeacute de 1 12 agrave 1 16 Le dernier reacutesultat noteacute porte sur lrsquoaugmenta-tion du RTT moyen de plus de 100 passant de 0 1436 s agrave 0 3190 s Lrsquoaugmentation dela bande passante a permis lrsquoaccegraves agrave de nouveaux services entraicircnant des changementspour les usagers

Dans [Fanou2016] lrsquoauteur srsquointeacuteresse aux services proposeacutes et compare la localisa-tion des serveurs Le premier reacutesultat montre lrsquoexternalisation continentale de nombreuxserveurs Ceci a pour conseacutequence drsquoaugmenter les deacutelais et de deacutegrader la performancedu service de communication Il faut pour lrsquoauteur arrecircter de raisonner en terme drsquoin-frastructure mais plus en terme de service et mettre lrsquoutilisateur au centre du systegravemePour cela il propose de rapatrier les services sur le territoire et drsquoaugmenter les accordsdrsquoeacutechanges entre les opeacuterateurs continentaux

Enfin dans [Johnson2016] les auteurs srsquointerrogent sur les faibles performances deTCP en Afrique La preacutesence de zone reculeacutees avec des accegraves satellitaires poussent lesdeacutelais vers des valeurs allant au delagrave des 400 ms Ces longs deacutelais sont agrave rapprocher desdeacutebits faibles De plus une expeacuterimentation sur les performances de TCP en fonction dusystegraveme drsquoexploitation a eacuteteacute meneacutee Les reacutesultats ont mis en eacutevidence que le systegraveme Li-nux avec la version TCP CUBIC est moins sensible au long deacutelais La solution proposeacutee auproblegraveme de la diffeacuterence de connectiviteacute agrave travers le continent est la creacuteation drsquoune ingeacute-nierie reacuteseau (liaison physique protocole de transport nouveau service) tenant comptedu contexte Africain

124 Comparatif entre mesures actives et mesures passives

La meacutetrologie active et la meacutetrologie passive preacutesentent des points communs et despoints de divergences Une fois des objectifs fixeacutes et au moment du choix de la meacutethodeil est important de connaicirctre les avantages et les inconveacutenients lieacutes agrave chaque type demesure Le tableau 16 reacutecapitule syntheacutetiquement ce qui vient drsquoecirctre preacutesenteacute

TABLE 16 ndash Comparatif entre mesures actives et mesures passives

Meacutetrologie Active Meacutetrologie Passive

Avantages

1 - Pour la mesure directe des pa-ramegravetres de QoS principalementle deacutelai le taux de pertes et lagigue

1 - Non intrusives2 - Permettent une mesure directedes paramegravetres utiliseacutes dans lrsquoin-geacutenierie des reacuteseaux

Inconveacutenients

1 - Intrusives le trafic de mesurepeut dans certains cas fausser lesmesures elles-mecircmes2 - Le fait que certains adminis-trateurs et entreprises bloquentou limitent le trafic ICMP peutfausser les reacutesultats obtenus parles techniques actives car ces der-niegraveres font souvent usage de ceprotocole

1 - Elles sont locales (relatives agraveun lien) et il est difficile de leseacutetendre agrave la globaliteacute du reacuteseau2 - Elles ne permettent pas la me-sure directe des paramegravetres deQoS3 - Elles neacutecessitent des ressourcesdisque et meacutemoire vive impor-tantes

35

13 Synthegravese

Ce chapitre a rappeleacute le fonctionnement du controcircle de congestion de TCP Le controcirclede congestion de TCP vise agrave maximiser lrsquoutilisation des ressources et agrave maximiser le deacute-bit utile eacutecouleacute de la connexion Ce controcircle est reacutegi par une boucle fermeacutee caracteacuteriseacuteepar un RTT Plus le deacutelai est eacuteleveacute moins TCP est susceptible de reacuteagir dynamiquementaux eacuteveacutenements de congestion Lorsque le produit du RTT et de la capaciteacute du canalde communication est trop important TCP peine agrave atteindre les objectifs preacuteceacutedemmentpreacutesenteacutes Lrsquoaugmentation progressive de la bande passante sans diminution des deacutelais apour effet lrsquoaugmentation de la capaciteacute de stockage des liens Cet accroissement a uneffet neacutegatif sur les performances de TCP Cet effet neacutegatif impacte le deacutemarrage deconnexion les flots courts la reacutesolution de la congestion et la dynamique du sondagePour diminuer lrsquoeffet de la capaciteacute de stockage des liens sur les performances de TCPde nouveaux controcircles de congestion furent deacuteveloppeacutes Chaque nouvelle version ducontrocircle de congestion ambitionne de reacutesoudre une agrave plusieurs probleacutematiques des reacute-seaux agrave forte capaciteacute de stockage Le deacutemarrage de connexion et les flots courts ont dessolutions communes comme une augmentation de la capaciteacute drsquoeacutemission de TCP agrave lrsquoini-tialisation de la connexion ou la reacuteduction du RTO Les probleacutematiques de reacutesolution decongestion et de dynamique de sondage ont permis la creacuteation de nouvelles versions ducontrocircle de congestion de TCP Ces versions de TCP sont des solutions de bout-en-boutDrsquoautres solutions neacutecessitent un changement de paradigme et lrsquointeraction avec les rou-teurs Ces solutions ont lrsquoavantage drsquoecirctre reacuteactives mais neacutecessitent la mise agrave jour deseacutequipements intermeacutediaires du reacuteseau

Le localisation geacuteographique de La Reacuteunion au milieu de lrsquooceacutean indien place lrsquoicircledans une situation ougrave la capaciteacute de stockage du reacuteseau peut ecirctre importante Nous avonsainsi estimeacute cette capaciteacute agrave lrsquoaide des deacutebits theacuteoriques des accegraves et les deacutelais de propa-gation estimeacutes et mesureacutes Les reacutesultats obtenus ont mis en eacutevidence une capaciteacute destockage autorisant la caracteacuterisation de lrsquoInternet reacuteunionnais comme un reacuteseau agrave fortecapaciteacute de stockage Lrsquoimpact de cette capaciteacute de meacutemorisation nrsquoa pas encore eacuteteacute me-sureacute Crsquoest pourquoi nous nous sommes concentreacutes sur la meacutetrologie Internet

La meacutetrologie active est une science invasive en injectant des paquets dans le reacuteseauLa meacutetrologie active mesure directement des paramegravetres de qualiteacute de service comme lesdeacutelais les routes le taux perte et la gigue Nous avons vu que des outils sont en capa-citeacute de mesurer deux meacutetriques simultaneacutement Certains outils peuvent ecirctre distribueacuteset ainsi former des plates-formes de mesure Ces plates-formes offrent la possibiliteacute auxpersonnes inteacuteresseacutees du monde entier de geacuteneacuterer des donneacutees de mesure agrave travers lemonde Les performances de TCP sont deacutependantes du deacutelai Les deacutelais sont eux-mecircmedeacutependants des routes physiques et logiques emprunteacutees Il est donc important drsquoeacutetudierces deux paramegravetres Connaissant nos besoins nous utiliserons lrsquoapproche research drivenpour lrsquoeacutetude de meacutetrologie active Lrsquoapproche research driven est une approche consistantagrave deacutefinir en premier lieu les meacutetriques rechercheacutees avant de mettre en place lrsquoinfrastruc-ture et les outils neacutecessaires agrave lrsquoeacutetude Notre eacutetude de meacutetrologie active est preacutesenteacutee dansle chapitre 2

La meacutetrologie passive permet une mesure directe des paramegravetres utiliseacutes Cette classede meacutetrologie est centreacutee sur un lien de mesure Elle utilise lrsquoeacutecoute et la capture desdatagrammes IP La meacutetrologie passive eacutetudie la caracteacuterisation du trafic et la perfor-mance des protocoles Nous avons vu que des outils sont en capaciteacute de reacutealiser les deuxeacutetudes en parallegravele Ne pouvant reacutealiser des eacutetudes de meacutetrologie passive agrave distance denombreux chercheurs ont mis agrave disposition de la communauteacute scientifique des donneacuteespubliques La litteacuterature scientifique propose un grand nombre de meacutetriques pour lrsquoeacutetudedes performances du protocole de transport TCP et de la supervision du trafic Afin de

36

ne pas nous concentrer sur une meacutetrique en particulier nous faisons le choix de ne pasdresser une liste de meacutetriques Notre eacutetude de meacutetrologie passive que nous preacutesente-rons dans le chapitre 3 utilisera lrsquoapproche measurement driven Cette approche consiste agravemettre en place une infrastructure de mesures afin de reacutecupeacuterer le maximum drsquoinforma-tions puis drsquoeffectuer toutes les analyses possibles sur les donneacutees collecteacutees Neacuteanmoinsla meacutetrologie passive souffre de deux faiblesses essentielles (1) elle reste locale et il estdifficile drsquoeacutetendre les reacutesultats agrave la globaliteacute du reacuteseau (2) au niveau microscopique lescaptures aboutissent tregraves rapidement agrave des volumes de traces colossaux

37

38

Chapitre 2

Caracteacuterisation de la connectiviteacute deLa Reacuteunion

Le rapport [Mediametrie2018-2] sur lrsquoaccegraves Internet agrave La Reacuteunion a montreacute que 856de la population reacuteunionnaise de plus de 13 ans srsquoest deacutejagrave connecteacutee agrave Internet 747 deces personnes sont des usagers reacuteguliers En comparaison le rapport [Mediametrie2018-1]montre qursquoaux alentours de 68 de la population franccedilaise meacutetropolitaine se connectequotidiennement Ces sondages montrent lrsquointeacuterecirct pris par lrsquoInternet pour la populationreacuteunionnaise

En 2013 une eacutetude de meacutetrologie reacutealiseacutee par BinarySec vise a effectuer un classementdes fournisseurs drsquoaccegraves Internet de La Reacuteunion Dans le rapport associeacute [Vergoz2013] 9meacutetriques sont preacutesenteacutees Parmi elles le deacutebit descendant moyen est mesureacute agrave 9 36MbsEn comparaison le deacutebit descendant moyen en France meacutetropolitaine mesureacute par[Akamai2015] srsquoeacutelegraveve agrave 8 2 Mbits Akamai utilise la plate-forme Intelligent PlatformTM

pour reacutecolter des donneacutees dont le deacutebit reacuteel La Reacuteunion posseacutedait ainsi un meilleurdeacutebit descendant que la France meacutetropolitaine Le deacutebit moyen franccedilais preacutesenteacute par[Akamai2017] est de 10 75 Mbits Le deacutebit descendant minimum reacuteunionnais mesureacutepar [nPerf2017] est de 18 63 Mbits Ainsi lrsquoeacutecart entre les deacutebits franccedilais et reacuteunionnaissrsquoest accentueacute Malgreacute un deacutebit plus eacuteleveacute La Reacuteunion preacutesente des deacutelais plus eacuteleveacutesque la France

Lrsquoeacutevolution des deacutebits pose la question sur lrsquoeacutevolution des deacutelais depuis la derniegraverecampagne de mesure La figure 111 montre des deacutelais plus importants agrave La Reacuteunion qursquoagraveParis Lrsquoobjectif de ce chapitre est drsquoeacutetudier lrsquoeacutevolution des deacutelais depuis 2012 On srsquointeacute-resse eacutegalement agrave la connectiviteacute de La Reacuteunion en terme de deacutelai et de routes Lrsquoasymeacute-trie des liens est une chose courante dans lrsquoInternet Les questions que lrsquoon se pose de-puis La Reacuteunion doivent eacutegalement ecirctre poseacutees lorsque lrsquoon essaye de joindre lrsquoicircle Dansce chapitre nous allons explorer la connectiviteacute de La Reacuteunion Pour cela nous avonsmis en place un protocole de mesures se basant sur notre propre plate-forme de mesuresrespectant la reacutepartition des destinations Notre plate-forme a pour objectif lrsquoeacutetude desroutes et des deacutelais speacutecifiques de lrsquoicircle par rapport agrave son accegraves Internet via les cacircblessous-marins

Une seconde question est alors apparue Est-ce que ces speacutecificiteacutes sont uniquementcelles de La Reacuteunion ou alors communes aux icircles de la Zone Oceacutean Indien

Dans la section 21 nous preacutesentons les objectifs de notre eacutetude de meacutetrologie et lescontraintes associeacutees Afin de reacutepondre agrave ces contraintes un cahier des charges est preacute-senteacute dans la section 22 Le protocole drsquoeacutetude est deacutecrit dans la section 23 Les reacutesultatsobtenus pour La Reacuteunion suivis de ceux des icircles de lrsquoOceacutean Indien sont preacutesenteacutes dansla section 24

39

21 Objectifs

En 2012 [Anelli2012] a reacutealiseacute une campagne de mesure des deacutelais depuis La Reacuteunionet Paris Cette campagne de meacutetrologie active baseacutee sur la commande ping a pour ob-jectif de deacutemontrer la diffeacuterence de deacutelai et de deacutebit entre La Reacuteunion et Paris Le premierobjectif de nos travaux consiste agrave la mise jour des donneacutees par une nouvelle eacutetude desdeacutelais Nous ferons par la suite reacutefeacuterence agrave cet objectif par le titre Evolution

Le second objectif est lrsquoanalyse de la connectiviteacute Internet de La Reacuteunion Pour arri-ver agrave obtenir une analyse preacutecise de la connectiviteacute Internet reacuteunionnaise une eacutetude surles routes emprunteacutees par les paquets IP en provenance et agrave destination de La Reacuteunionsera reacutealiseacutee Pour cela on utilisera un outil de type traceroute On utilisera les donneacuteesreacutecolteacutees pour lrsquoidentification des portes de lrsquoInternet reacuteunionnais La reacutefeacuterence utiliseacuteepour cet objectif dans le suite du manuscrit est Connectiviteacute

Ayant cibleacute les meacutetriques nous avons fait le choix de la meacutethode research-driven Cettemeacutethode preacutesenteacutee dans la section 121 a lrsquoavantage de se concentrer uniquement surdes meacutetriques deacutecideacutees preacutealablement Dans le cas de notre eacutetude ce sont les deacutelais et lesroutes

22 Cahier des charges

Deux paramegravetres doivent ecirctre pris en consideacuteration lors de la reacutedaction du cahier descharges lrsquooutil de mesure et lrsquooutil drsquoanalyse

221 Evolution

Pour reacutepondre agrave lrsquoobjectif nous allons effectuer une reprise de lrsquoexistant Lrsquooutil demesure sera la commande ping associeacutee agrave la plate-forme Planet-Lab [PlanetLabEurope]Lrsquooutil drsquoanalyse sera identique agrave celui utiliseacute par [Anelli2012]

222 Connectiviteacute

Identification des besoins

Dans le tableau 14 nous avons vu que diffeacuterents outils sont capables de mesurer lesroutes et les deacutelais Lrsquooutil retenu devra limiter les erreurs lieacutees aux meacutecanismes de lrsquoeacutequi-librage de charge et de MPLS Cet outil devra reacutealiser des mesures depuis des nœudsreacutepartis sur lrsquoensemble de lrsquoicircle Pour cela il est neacutecessaire drsquoeffectuer un choix de plate-forme de meacutetrologie active Ce choix se fera sur 2 points la distribution geacuteographiquedes nœuds de mesure et la couverture des diffeacuterents fournisseurs drsquoaccegraves internet

Lrsquooutil drsquoanalyse devra ecirctre en capaciteacute drsquoidentifier les portes de lrsquoInternet reacuteunion-nais agrave travers la geacuteolocalisation des adresses IP drsquoidentifier les marques MPLS preacutesentesdans les donneacutees pour une meilleure compreacutehension des regravegles de routage geacuteneacuterer unecarte des relations entre pays agrave travers les eacutechanges de paquets envoyeacutes et reacutealiser desstatistiques sur les diffeacuterents nœuds emprunteacutes

Mise en œuvre drsquoune infrastructure de meacutetrologie active

Dans la section preacuteceacutedente nous avons vu que notre cahier des charges devra respec-ter 3 principaux critegraveres outil de mesure plate-forme de mesure et outil drsquoanalyse

40

Paris-traceroute

Nous avons vu dans la partie 122 que lrsquoeacutetude des routes et des deacutelais peut se faire agravelrsquoaide drsquoun seul outil traceroute Or cet outil est sujet agrave des impreacutecisions lieacutees agrave lrsquoeacutequili-brage des charges par exemple Souhaitant limiter lrsquoimpact de ces aleacuteas dans nos donneacuteesnous faisons le choix de Paris-traceroute Pour rappel une preacutesentation de lrsquooutil et deses meacutecanismes est faite agrave la section 122

La plate-forme RunPL

Les plates-formes disponibles Similairement dans la section 122 nous avons preacute-senteacute des plates-formes de meacutetrologie active La plate-forme seacutelectionneacutee devra respecterles critegraveres preacutesenteacutes preacuteceacutedemment

Parmi les plates-formes seules Atlas et Planet-Lab ont des sondes preacutesentes sur lrsquoicirclerespectivement 21 et 2 Ces sondes sont reacuteparties de maniegravere ineacutequitable sur lrsquoicircle Lareacutegion Est de lrsquoicircle ne compte qursquoune sonde quand le minimum est de 6 dans les autresreacutegions De plus certains des Fournisseurs drsquoAccegraves Internet (FAI) nrsquoheacutebergent pas de sondede mesure Le reacutesumeacute de notre comparaison est indiqueacute dans le tableau 21

TABLE 21 ndash Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet

Archipelago Atlas BISMark DASU Planet-Lab SamKnowsParis-traceroute

Oui Oui Oui Non Oui Non

Disponibiliteacutesur lrsquoicircle

Non Oui Non Non Oui Non

Couverturede lrsquoicircle

Non Oui Non Non Non Non

Reacutepartitionfournis-seurs

Non Non Non Non Non Non

On constate ainsi qursquoaucune des plates-formes preacutesenteacutees ne remplit la totaliteacute descritegraveres de seacutelection Nous avons souhaiteacute deacuteployer notre propre infrastructure Cettenouvelle plate-forme reacutepondra agrave nos critegraveres en offrant une meilleure couverture de lrsquoicirclesur les aspects geacuteographiques FAI et Technologies drsquoAccegraves agrave Internet (TAI) Lrsquoeacutechantillon depopulation est repreacutesenteacute par un ensemble drsquoeacutetudiants Notre plate-forme nous autoriseeacutegalement agrave ecirctre maicirctre de lrsquoinfrastructure de mesures que lrsquoon souhaite mettre en placeAfin de seacutelectionner les outils (physiques et logiciels) les plus adapteacutes agrave nos objectifsnous avons deacutecideacute des speacutecificiteacutes de notre plate-forme

Creacuteation et deacuteploiement de la plate-forme RunPL La plate-forme que lrsquoon souhaitedeacuteployer devra respecter un scheacutema de connectiviteacute bien preacutecis repreacutesenteacute par la figure21 La Sonde de mesure est le cœur de la plate-forme La Destination correspond agrave uneadresse IP ou un nom de domaine agrave joindre pour obtenir des informations sur les routesemprunteacutees et les deacutelais associeacutes Le Serveur de stockage est preacutesent pour deacutelester la sondede mesure LrsquoOrdinateur distant repreacutesente lrsquoadministrateur de la plate-forme Ne pouvantse deacuteplacer pour configurer la sonde un accegraves distant doit ecirctre reacutealiseacute Il est illustreacute parle train en pointilleacute sur la figure Le trait plein entre la sonde et la destination correspondagrave lrsquointeraction entre la sonde et la destination Cette interaction repreacutesente les mesuresque lrsquoon obtiendra sur les performances des liens Les sondes de mesure devront pou-voir effectuer les mesures sans limitation de destinations Elles devront afin de limiter

41

le stockage effectuer un deacutelestage des mesures collecteacutees sur un serveur de stockage Ceserveur de stockage tout comme la sonde de mesure devra pouvoir ecirctre joint par lrsquoordi-nateur distant Cette communication a un double objectif Le premier est la reacutecupeacuterationdes donneacutees pour les analyses Le second est la mise agrave jour du protocole de mesure sineacutecessaire Une interaction seacutecuriseacutee est eacutetablie entre lrsquoordinateur distant la sonde et leserveur de stockage Cette liaison est caracteacuteriseacutee par les pointilleacutes sur la figure 21

FIGURE 21 ndash Scheacutema drsquointerconnexion de la plate-forme

Les speacutecificiteacutes de notre plate-forme se deacutecomposent en deux grandes parties quesont la partie mateacuterielle et la partie systegraveme

Mateacuterielle Un cahier des charges speacutecifique agrave notre plate-forme de mesure doit ecirctrereacutealiseacute La premiegravere partie concerne le choix du mateacuteriel physique

La partie mateacuterielle de la plate-forme de mesure est formeacutee de deux composants lasonde de mesure et le serveur de stockage des donneacutees Le serveur de stockage serafourni par le Laboratoire drsquoInformatique et de Matheacutematiques (LIM) Seule la sonde de me-sure sera indiqueacutee dans le cahier des charges Le mateacuteriel seacutelectionneacute devra respecter lescritegraveres preacutecis Ces critegraveres ont eacuteteacute deacutecideacutes en eacutetudiant les solutions proposeacutees par lesplates-formes preacuteceacutedemment eacutetudieacutees

mdash Peu encombrant de nombreuses sondes proposeacutees par les diffeacuterentes plates-formessont tregraves discregravetes Notre sonde devra eacutegalement ecirctre peu visible Nous souhaitonsque la sonde soit directement connecteacutee sur le routeur de lrsquousager

mdash Peu coucircteux le coucirct unitaire de chaque kit ne devait pas deacutepasser 50D afin que lrsquoonpuisse avoir un nombre de nœuds conseacutequent Un kit sera composeacute de la sonde deson cacircble alimentation drsquoune carte meacutemoire et drsquoun cacircble reacuteseau

mdash Peu eacutenergivore la facture drsquoeacutelectriciteacute eacutetant agrave la charge de lrsquousager nous souhai-tions une solution agrave faible consommation drsquoeacutenergie

mdash Diversiteacute du systegraveme drsquoexploitation (OS) Le systegraveme drsquoexploitation choisi devrasupporter lrsquoinstallation de Paris-traceroute

La seconde partie du cahier des charges de notre plate-forme se concentre sur le choixdu systegraveme drsquoexploitation

Pour rappel sur la figure 21 nous avons repreacutesenteacute en pointilleacute des interactions seacute-curiseacutees Ces eacutechanges concernent lrsquoaccegraves distant agrave la sonde au serveur de stockage et agravela sauvegarde des donneacutees de mesures sur le serveur Le systegraveme drsquoexploitation devracorrespondre aux critegraveres de seacutelection suivants

42

mdash Paris-traceroute Le systegraveme drsquoexploitation devra inteacutegrer Paris-traceroute dans seslibrairies drsquoinstallations ou supporter lrsquoinstallation du code source

mdash Licence GNU-GPL Des modifications du systegraveme seront potentiellement neacuteces-saires

mdash Accegraves distant Le mateacuteriel devant ecirctre geacutereacute agrave distance Un accegraves Secure SHell (SSH)devra donc ecirctre configureacute Le protocole SSH [RFC4250] fut deacuteveloppeacute pour per-mettre lrsquoaccegraves agrave distance de terminaux

mdash Transmission seacutecuriseacutee Lrsquoaccegraves au diffeacuterents composants de la plate-forme devrase faire drsquoune faccedilon seacutecuriseacutee La restriction se fera agrave travers un systegraveme drsquoidentifi-cation

Seacutelection du mateacuteriel [Maksimovic2014] reacutealise une comparaison de diffeacuterents micro-ordinateurs tels que Arduino [Arduino] BeagleBone [Beaglebone] Phidgets [Phidgets]Udoo [Udoo] et RaspberryPi [RaspberryPi] Dans ce comparatif les critegraveres utiliseacutes sontproches de ceux que lrsquoon a seacutelectionneacutes Le tableau 22 reacutesume lrsquoensemble des critegraveres deseacutelection du mateacuteriel Il provient directement de lrsquoarticle [Maksimovic2014]

TABLE 22 ndash Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

Critegraveres Arduino BeagleBone Phidegts Raspberry Pi UdooEncombrement(en mm)

7553 863533 813533 8565398 11085

Coucirct (en $ parnœud

30 45 50-200 25-35 99-135

Eacutenergie (en V) 7-12 5 6-15 5 6-15

Systegraveme

drsquoexploitation

Linux ang-strom

Linux

RaspbianUbuntuAndroidArchLinuxFreeBSDFedoraRISC OS

UbuntuAn-droidLinuxArchLi-nux

Nous avons mis en eacutevidence les valeurs respectant les critegraveres Nous faisons le choixdu Raspberry Pi car il possegravede le plus de critegraveres respecteacutes

Seacutelection du systegraveme drsquoexploitation Le premier critegravere de seacutelection est lrsquoinstalla-tion de Paris-traceroute Drsquoapregraves [Paris-traceroute] lrsquooutil est disponible sur les systegravemesRaspbian Ubuntu ArchLinux et FreeBSDConcernant les licences lrsquoensemble des OS ne sont pas eacutequivalents Ainsi seul RaspbianUbuntu et ArchLinux proposent une licence General Public Licence (GPL) RISC OS est as-socieacute agrave une licence proprieacutetaire Android FreeBSD et Fedora sont sous licence de logiciellibre et open source Les licences de distribution open source vont nous autoriser agrave ajou-ter modifier voire supprimer des parties du code pour qursquoil corresponde plus facilementagrave nos besoinsDe nombreux OS proposent nativement la version cliente du protocole SSH La versionserveur peut ecirctre activeacutee lors de lrsquoinstallation du systegraveme drsquoexploitation Lrsquoaccegraves distantnous permettra eacutegalement la mise agrave jour des outils et des OS pour des raisons de seacutecu-riteacuteLa seacutecurisation des eacutechanges se fera au travers drsquoun Virtal Private Network (VPN) Un

43

VPN est un systegraveme permettant de creacuteer un lien direct entre des ordinateurs distants[Coonjah2015] reacutealise une comparaison entre deux outils permettant la creacuteation de VPNOpenSSH et OpenVPN OpenSSH propose de meilleures performances qursquoOpenVPN auniveau de lrsquoutilisation de la bande passante et des temps de transferts de fichiers Malgreacutecela nous avons pris le parti drsquoutiliser OpenVPN car crsquoest un outil majoritairement uti-liseacute par les entreprises [Coonjah2015] Cet utilitaire nous propose la mise en place drsquouneconnexion seacutecuriseacutee baseacutee sur lrsquoidentification agrave travers un certificat drsquoauthentificationLe VPN permet de joindre agrave travers un adressage priveacute les diffeacuterentes sondes qui se-ront distribueacutees sur lrsquoicircle de La Reacuteunion Drsquoapregraves le site officiel drsquo[OpenVPN] lrsquooutil peutsrsquoinstaller facilement sur les distributions Rapsbian Ubuntu et Fedora

Le choix du systegraveme drsquoexploitation va deacutependre des critegraveres de seacutelection Nous reacuteca-pitulons les critegraveres preacutesenteacutes preacuteceacutedemment dans le tableau 23

TABLE 23 ndash Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur RaspberryPi

Critegraveres Raspbian Ubuntu Android ArchLinux FreeBSD Fedora RISC OSParis-traceroute

Oui Oui Non Oui Oui Non Non

Licence GPL GPL ASL GNULinux

BSD CreativeCom-mons

CastleTechno-logiesLtdLicence

Accegraves dis-tant (SSH)

Oui Oui Oui Oui Oui Oui Oui

OpenVPN Oui Oui Non Non Non Oui Non

Deux systegravemes disponibles pour Raspberry Pi reacutepondent agrave nos critegraveres Raspbian etUbuntu Nous faisons le choix du systegraveme Raspbian Cet OS est une distribution Linuxentiegraverement revue pour des performances optimales sur la carte Raspberry Pi Fortementinspireacutee par la distribution Linux Debian elle propose les mecircmes caracteacuteristiques que ladistribution dite de Bureau Les sondes nrsquoeacutetant pas eacutequipeacutees drsquoun systegraveme drsquoaffichagenous optons pour lrsquoinstallation la plus leacutegegravere possible avec uniquement les paquets neacute-cessaires agrave notre eacutetude

Lrsquooutil drsquoanalyse rTraceroute

Dans la section 21 nous avons preacutesenteacute les contraintes lieacutees agrave la seacutelection drsquoun outildrsquoanalyse des donneacutees de type traceroute Pour rappel ces contraintes sont les suivantes la geacuteolocalisation des adresses IP lrsquoidentification des liens MPLS la geacuteneacuteration drsquounecarte des liens logiques et la geacuteneacuteration drsquoun fichier comportant des statistiques sur lesdiffeacuterents nœuds rencontreacutes

Les outils disponibles Il existe diffeacuterents outils drsquoanalyse des routes que lrsquoon peut ran-ger en trois cateacutegories les geacuteneacuterateurs de donneacutees brutes les plates-formes de mesures etles outils drsquoanalyse graphiques Lrsquooutil que lrsquoon souhaite utiliser entre dans la troisiegravemecateacutegorie La litteacuterature autour drsquooutils graphiques pour lrsquoanalyse des routes nrsquoest pasaussi complegravete que lrsquoon pourrait croire

Gtrace est un outil creacuteeacute par [Periakaruppan1999] Cet outil reproduit graphiquementles reacutesultats obtenus par Traceroute Le logiciel geacutenegravere ses propres donneacutees avant de les

44

repreacutesenter sous forme graphique La geacuteolocalisation ne se fait pas sur les adresses IPmais sur le nom Domain Name System (DNS) des nœuds rencontreacutes La localisation drsquounnœud nrsquoest valideacutee qursquoapregraves croisement des informations entre les abreacuteviations des villeset aeacuteroports drsquoinformations contenues dans deux bases de donneacutees Une derniegravere veacuteri-fication est reacutealiseacutee agrave lrsquoaide de la commande nslookup Actuellement cet outil nrsquoest plusmaintenu Il nrsquoimpleacutemente pas le [RFC4950] permettant lrsquoidentification des nœuds MPLSdans les routes

[Aben2015] preacutesente un outil drsquoanalyse des routes inteacutegreacute agrave Atlas RIPE NCC Cet outildrsquoanalyse se nomme OpenIPMap Il utilise la base de donneacutees de RIPE pour effectuer lageacuteolocalisation des donneacutees Les routes sont ensuite traceacutees sur une carte interactive Lesmesures geacuteneacutereacutees par Atlas sont directement visibles et peuvent srsquointeacutegrer dans OpenIP-Map Lrsquoidentification des nœuds MPLS ainsi que la partie statistique ne sont pas inclusesdans les sorties proposeacutees par OpenIPMap

Dans [Yang2016] lrsquoauteur preacutesente un outil drsquoanalyse des routes centreacute sur le conti-nent africain African Visual Route Le design de lrsquooutil srsquoinspire largement du projetOpenIPMap [Aben2015] Lrsquooutil possegravede un deacutefaut important Il lit uniquement les fi-chiers provenant de la plate-forme Atlas

Le tableau 24 preacutesente les possibiliteacutes offertes par chaque outil preacutesenteacute preacuteceacutedem-ment

TABLE 24 ndash Fonctions disponibles dans les outils graphiques drsquoanalyse des routes

African Visual Route Gtrace OpenIPMapGeacuteolocalisation Oui Oui OuiIdentificationdes liens MPLS

Non Non Non

Cartographie Oui Oui OuiStatistiques Non Non Non

On peut constater que par rapport agrave nos besoins les outils listeacutes preacutesentent des la-cunes Les critegraveres drsquoaffichage des liens MPLS et la partie statistique sur les nœuds inter-meacutediaires nrsquoont pu ecirctre remplis Pour ces raisons nous avons deacuteveloppeacute un outil drsquoana-lyse rTraceroute

Deacuteveloppement de rTraceroute

Geacuteolocalisation Dans le cadre de nos travaux la geacuteolocalisation drsquoadresse IP consi-degravere la position geacuteographique de lrsquoadresse les informations sur le deacutetenteur de lrsquoadresseet lrsquoAutonomous System (AS) associeacutes Un AS est un ensemble drsquoeacutequipements et de reacuteseauxsous une mecircme autoriteacute rTraceroute geacuteolocalise les adresses IP rencontreacutees agrave travers unebase de donneacutees impleacutementeacutee au sein du LIM Cette base de donneacutees est remplie au furet agrave mesure que de nouvelles adresses IP sont remonteacutees par les mesures Lrsquoidentificationdes nouvelles adresses se fait par un script deacuteveloppeacute en python sous ma direction parun eacutetudiant de Licence 3eme anneacutee [LanYanFock2015] Cet outil nommeacute rgeoloc utiliseles commandes de lrsquoApplication Programming Interface (API) de RIPE NCC En interro-geant une base de donneacutees drsquoun RIR nous espeacuterons limiter les erreurs lieacutees agrave la geacuteoloca-lisation Pour nos besoins nous limitons les informations lieacutees agrave la localisation et au FAICes informations sont Pays Latitude Longitude Nom du FAI Numeacutero de lrsquoASLes informations (pays longitude latitude) seront utiliseacutees par la suite pour effectuer

45

des calculs de distance entre deux adresses IP Le nom du FAI autorise le suivi des ac-cords drsquoeacutechanges de paquets sur les routes Le numeacutero de lrsquoAS nous offre la possibiliteacutede suivre les diffeacuterents chemins emprunteacutes en termes drsquoAS diffeacuterents

rgeoloc est capable drsquoextraire les informations de deacutelais et de longueurs de routesdrsquoun fichier traceroute Il peut eacutegalement deacutecouper un fichier contenant plusieurs don-neacutees traceroute en fichier unitaire

La geacuteolocalisation des adresses associeacutees agrave lrsquoidentification des liens MPLS va aider agravela compreacutehension des routes de lrsquoInternet dans le monde

Identification des liens MPLS Paris-traceroute indique dans ses sorties les liensMPLS rencontreacutes [Augustin2007] indique que lrsquoidentification des liens se fait par la lec-ture des informations contenues dans les paquets reccedilus par lrsquooutil rTraceroute va identi-fier les marques MPLS et les repreacutesenter en un coloris diffeacuterent sur les cartes

Cartographie Lors de la geacuteolocalisation des adresses IP lrsquoinformation neacutecessaire agravela cartographie est le pays Lors de cette identification deux nouvelles informations sontassocieacutees agrave lrsquoIP Ce sont les coordonneacutees du pays pour la carte passeacutee en paramegravetre Agravepartir de ces nouvelles coordonneacutees rTraceroute va geacuteneacuterer une nouvelle carte affichantlrsquoensemble des liens logiques (entre pays) preacutesents dans les traces analyseacutees

Statistique rTraceroute geacutenegravere des statistiques sur chaque nœud rencontreacute La cleacutedrsquoidentification drsquoun nœud est son adresse IP et sa position sur la route analyseacutee Les sta-tistiques geacuteneacutereacutees sont lrsquooccurrence de la paire drsquoidentification le deacutelai minimal obtenupour joindre ce nœud agrave cette position et le pays rattacheacute agrave lrsquoadresse IP

Notre outil est actuellement disponible sur le site du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrrtraceroute [rtraceroute] Cet outil est distribueacute sous licencelibre pour une large diffusion dans la communauteacute scientifique

23 Protocole de mesure

La connectiviteacute particuliegravere de lrsquoicircle par les deux cacircbles sous-marins provoque un in-teacuterecirct de lrsquoeacutetude des routes emprunteacutees Lrsquoun des objectifs de nos mesures est drsquoeacutetudierlrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012 et 2016 Le second objec-tif est lrsquoeacutetude de la connectiviteacute en terme de routes de deacutelais et des accegraves logiques delrsquoInternet reacuteunionnais

Notre protocole de mesure se divise en 3 parties La premiegravere partie preacutesente lespoints communs entre les deux objectifs La seconde consiste agrave effectuer une comparai-son de lrsquoeacutetat actuel avec le travail effectueacute preacuteceacutedemment par [Anelli2012] Le troisiegravemepoint concerne les mesures drsquoidentification des portes de lrsquoaccegraves Internet de La Reacuteunion

231 Eacutechantillon de mesure

Lrsquoeacutechantillon drsquoadresses IP que lrsquoon va utiliser dans nos eacutetudes se doit drsquoecirctre repreacute-sentatif et preacutecis La preacutecision srsquoobtient par la taille drsquoun eacutechantillon La repreacutesentativiteacutepar le respect de la distribution des adresses IP dans lrsquoInternet

Il existe 232 adresses IPv4 avec une reacutepartition bien speacutecifique Drsquoapregraves les [RFC3232RFC5735 RFC6761] 592 708 865 adresses sont reacuteserveacutees On peut citer en exemple lesadresses de type 1921680016 Ce bloc est reacuteserveacute aux reacuteseaux priveacutes Son utilisationpreacutevue est documenteacutee dans le [RFC1918] Telles que deacutecrites dans ce standard les adresses

46

de ce bloc nrsquoapparaissent pas leacutegitimement sur lrsquoInternet publicApregraves soustraction il ne reste que 3 702 258 431 adresses agrave reacutepartir dans les diffeacuterentspays et FAI Ces IP sont distribueacutees par preacutefixes par les RIR dont RIPE NCC pour lrsquoEu-rope et AfriNIC pour le continent africain Afin drsquoavoir un eacutechantillon preacutecis nous avonsgeacuteneacutereacute aleacuteatoirement 1 000 000 drsquoadresses non reacuteserveacutees Ces adresses ont eacuteteacute testeacutees parle protocole ICMP Ce test nous assure que les adresses IP sont des adresses que nouspourrons utiliser par la suite Nous avons ainsi valideacute 84 000 adresses Neacuteanmoins nousnrsquoavons aucune garantie sur la modification des attributions des adresses IP au fil dutemps

Pour que notre jeu de destinations soit repreacutesentatif nous avons geacuteolocaliseacute les adressesvalides Nous avons regroupeacute les reacutesultats par continent pour une meilleure lisibiliteacute Lereacutesultat obtenu est illustreacute par la figure 22a

Nous pouvons constater une forte dispariteacute entre les diffeacuterents continents LrsquoOceacuteanieet lrsquoAfrique ont moins de 1 de preacutesence dans notre jeu On constate eacutegalement une fortepreacutesence drsquoadresse de type BOGONS Ces adresses font parti de blocs encore non alloueacutespar les RIR ou alors reacuteserveacutees par lrsquoInternet Assigned Numbers Authority (IANA) maispreacutesentes au sein de lrsquoInternet On peut citer lrsquoadresse 10012016100 en exemple Cetteadresse est marqueacutee comme reacuteserveacutee par lrsquoIANA par RIPE NCC Ce nombre drsquoadressesest en diminution avec lrsquoattribution des blocs restant aux diffeacuterents FAI Pour validerce reacutesultat nous lrsquoavons compareacute agrave la distribution datant de Mai 2016 du site CountryIP-Blocks 1 Le regroupement est illustreacute par la figure 22b On remarque un certain eacutequilibreentre lrsquoEurope et lrsquoAsie et une domination de lrsquoAmeacuterique du Nord

Notre reacutepartition est diffeacuterente en de trop nombreux points agrave celle de CountryIP-Blocks Les donneacutees communiqueacutees par CountryIPBlocks proviennent des RIR Cettedistribution est donc plus proche de la reacutepartition reacuteelle Crsquoest pourquoi agrave partir de notreensemble drsquoadresses initales nous seacutelectionnerons un sous ensemble en respectant la dis-tribution preacutesenteacutee par la figure 22b

232 Eacutevolution

En 2012 [Anelli2012] a effectueacute une campagne de ping depuis Paris et La ReacuteunionCette campagne reacutealiseacutee sur le FAI RENATER avait pour objectif la mise en eacutevidence dela diffeacuterence des deacutelais entre Paris et La Reacuteunion Afin drsquoeacutetudier lrsquoeacutevolution des deacutelaiset de la longueur des routes depuis lrsquoeacutetude preacuteceacutedente nous avons reacutealiseacute une nouvellecampagne de ping depuis Paris et La Reacuteunion Cette campagne a mis a contribution lesnœuds [PlanetLabEurope] de lrsquoUniversiteacute de La Reacuteunion et de lrsquoUniversiteacute Pierre et Ma-rie Curie

Agrave partir du jeu drsquoadresses preacutepareacute preacutesenteacute preacuteceacutedemment nous avons tireacute le maxi-mum drsquoadresses IP possibles tout en respectant la reacutepartition geacuteographique de la figure22b Nous avons obtenu un jeu de 40 000 adresses Nous avons fait le choix drsquoutiliserun eacutechantillon drsquoadresses diffeacuterentes par rapport agrave la premiegravere eacutetude Cette deacutecision pro-vient de notre volonteacute drsquoobtenir des donneacutees repreacutesentatives de lrsquoeacutetat actuel de lrsquoInterneten terme de reacutepartition des adresses Chaque mesure sera indeacutependante lrsquoune de lrsquoautreEn effet pour qursquoune mesure se lance il faut que la preacuteceacutedente soit finie

Lrsquoanalyse se deacuteroulera agrave lrsquoidentique de ce qui srsquoest fait pour lrsquoeacutetude preacuteceacutedente agravelrsquoexception drsquoune modification Nous y ajouterons la comparaison de la longueur desroutes Les reacutesultats associeacutes agrave cette eacutetude seront preacutesenteacutes dans la section 241

1 Source httpswww countryipblocks net

47

(a) IP seacutelectionneacutee au hasard (b) CountryIPBlocks

FIGURE 22 ndash Distribution geacuteographique des adresses IPv4 publiques

233 Connectiviteacute

La seconde eacutetude de meacutetrologie active concerne lrsquoeacutetude de la connectiviteacute de La ReacuteunionPour reacutepondre agrave notre objectif nous mettons en place deux protocoles de mesure Unprotocole eacutetudiant la connectiviteacute Depuis La Reacuteunion et un protocole dans le sens Vers LaReacuteunion

Depuis La Reacuteunion

Notre eacutetude de meacutetrologie se compose de plusieurs phases

1 la preacuteparation du jeu de destinations

2 la reacutealisation des mesures par les sondes

3 la quantification des perturbations de nos mesures sur lrsquoaccegraves des usagers

4 la collecte des reacutesultats obtenus par les sondes

5 lrsquoanalyse des reacutesultats

Preacuteparation La reacutepartition geacuteographique preacutesenteacutee dans la figure 22b ne peut pas srsquoap-pliquer agrave lrsquointeacutegraliteacute de notre ensemble de deacutepart Afin de pouvoir garder cette reacutepar-tition nous avons reacuteduit notre jeu de destinations agrave 10 000 adresses Cette reacuteduction estneacutecessaire afin que lrsquoensemble de nos mesures puissent ecirctre reacutealiseacutees en un deacutelai de 24heures Bien que le nombre drsquoadresses seacutelectionneacutees repreacutesente moins de 1 des adressesIP publiques de lrsquoInternet il est neacuteanmoins suffisant pour que notre jeu reste preacutecis

48

Reacutealisation Chaque sonde eacutetant indeacutependante lrsquoautomatisation du lancement des me-sures degraves le deacutemarrage est neacutecessaire De fait une proceacutedure a eacuteteacute implanteacutee au seinde lrsquoOS Cette proceacutedure va autoriser le deacutemarrage des mesures degraves la fin de la phasedrsquoinitialisation de lrsquoensemble des services de Raspbian La mise en place des mesures estdiviseacutee en 2 eacutetapes

La premiegravere consiste pour chaque sonde agrave creacuteer ses propres sceacutenarios de mesuresUn sceacutenario est un fichier contenant deux colonnes destination et intervalle de temps Lapremiegravere colonne contient les 10 000 adresses IP de destination La seconde colonne re-groupe des valeurs qui serviront drsquoeacutecart entre deux mesures Ces valeurs ont eacuteteacute geacuteneacutereacuteessuivant une loi exponentielle de taux 864 Ce taux provient de lrsquoeacutequation 21 ci-dessous

taux = nombre de secondes par journombre dprimeadresses IP = 8640010000 = 8 64(21)

Les valeurs obtenues seront identiques sur lrsquoensemble des sondes de mesures Chaquesceacutenario sera creacuteeacute en tirant aleacuteatoirement une adresse IP et un eacutecart Une fois que lrsquoen-semble des sceacutenarios est eacutecrit et numeacuteroteacute de 1 agrave 28 la sonde va programmeacute dans le tempslrsquoexeacutecution de la seconde eacutetape gracircce agrave la commande at

La seconde eacutetape consiste agrave lire le sceacutenario du jour et agrave joindre la destination par lrsquooutilde mesure La commande exacte exeacutecuteacutee par chaque test est

Paris-traceroute -m 255 -n -p icmp ip

Dans laquelle les options indiquent

mdash -m 255 la valeur du champ TTL du paquet est mise agrave sa valeur maximale (255)Nous faisons le choix drsquoautoriser lrsquooutil agrave essayer de joindre la destination jusqursquoagraveeacutepuisement de la valeur maximale autoriseacutee par le protocole pour identifier certainsproblegravemes de routage

mdash -n pas de reacutesolution de DNS Afin drsquooptimiser les mesures nous avons eacutelimineacute lareacutesolution des noms des routeurs Seules les adresses IP seront afficheacutees

mdash -p icmp le protocole utiliseacute pour la mesure [Wenwei2006] effectue une eacutetude com-parative entre les protocoles ICMP et TCP pour les mesures de deacutelai Ils ont montreacuteque dans certaines conditions les reacutesultats sont similaires Quand le ratio α calculeacuteentre le RTT moyen et le RTT minimal tend agrave ecirctre important (supeacuterieur agrave 20) TCPest moins stable que son concurrent Crsquoest pour cette raison que nous avons fait lechoix de lrsquoICMP

mdash ip adresse IP de destination que la commande va essayer de joindre

Veacuterification La sonde va consommer de la bande passante de chaque connexion Inter-net Lrsquoestimation du deacutebit de la mesure deacutepend du nombre moyen de paquets eacutemis parmesure et de la dureacutee moyenne drsquoune mesure Agrave lrsquoaide drsquoune peacuteriode de test nous avonspu calculer divers paramegravetres drsquoune mesure reacutealiseacutee avec Paris-traceroute Les informa-tions obtenues concernent la dureacutee drsquoune mesure et le nombre de paquets eacutechangeacutes Lesreacutesultats obtenus montrent qursquoune mesure dure en moyenne 28 secondes et se composede 54 paquets de 64 octets Une mesure geacutenegravere donc un deacutebit drsquoeacutemission de 987 bitss agravelrsquoentreacutee de lrsquointerface reacuteseau Le deacutebit geacuteneacutereacute effectif (au niveau du support) est de 1265bitss Le deacutebit geacuteneacutereacute par rapport au deacutebit drsquoaccegraves drsquoun accegraves ADSL est alors neacutegli-geable

49

Drsquoapregraves le rapport [Vergoz2013] le deacutebit montant le plus faible mesureacute est de 128 33KbsLa charge calculeacutee repreacutesente pregraves de 1 de la capaciteacute du lien drsquoaccegraves Comme il yaura en moyenne 4 mesures simultaneacutees la capaciteacute consommeacutee correspond donc agrave 4Cette situation correspond au pire cas Dans la situation courante drsquoun accegraves theacuteorique enMbits nous pouvons avancer que la sonde nrsquoaura aucun impact sensible sur la connec-tiviteacute du participant

Collecte Une phase de collecte des donneacutees de mesures est reacutealiseacutee Le but de cetteeacutetape est de libeacuterer de lrsquoespace disque sur la sonde Chaque jour agrave minuit un nouveausceacutenario est lanceacute Une fois que 7 sceacutenarios ont eacuteteacute lus la sonde va creacuteer une archive Lenom de lrsquoarchive sera composeacute de la date de creacuteation de lrsquoarchive du nom de la sonde etde la TAI Le nom propose un classement rapide des donneacutees que ccedila soit par TAI ou pardate Lrsquoarchive contiendra les mesures des 7 jours preacuteceacutedents Lrsquoarchive est envoyeacutee sur leserveur de stockage localiseacute au sein du laboratoire Une comparaison de lrsquoempreinte MD5de lrsquoarchive preacutesente sur le serveur et sur la sonde de mesure sera reacutealiseacutee Si les deuxempreintes sont identiques alors la suppression de lrsquoarchive heacutebergeacutee sur le RaspberryPi est reacutealiseacutee Le jour drsquoenvoi des donneacutees sur le serveur aucune mesure nrsquoest effectueacuteeafin de ne pas geacuteneacuterer de bruit suppleacutementaire sur le lien Le lendemain de la copiedes donneacutees la sonde va amorcer 7 nouveaux jours de mesures Un cycle de mesuresest composeacute de 7 jours de mesures conseacutecutifs et drsquoun jour drsquoenvoi des donneacutees versle serveur de stockage Ce cycle est reacutepeacuteteacute 4 fois par mois La figure 23 scheacutematise lefonctionnement drsquoune sonde de mesure sur une dureacutee de 32 jours soit 4 cycles de mesureet de collecte

La plate-forme reacutealise des mesures en continue jusqursquoagrave lrsquoarrecirct complet de lrsquoappareil demesures Nous nrsquoavons pour lrsquoinstant pas programmeacute drsquoarrecirct des mesures Dans le cadrede lrsquoanalyse reacutealiseacutee dans ce manuscrit nous avons pris un cycle complet de mesure soit32 jours Nous nrsquoeffectuons pas drsquoanalyse comparative temporelle de nos mesures

Analyse La plate-forme reacutealise les mesures par cycle de 7 jours Lrsquoanalyse des tracesreacutecolteacutees se fait en plusieurs eacutetapes Le processus drsquoanalyse commence par la deacutecoupedu fichier de donneacutees en fichiers atomiques Chaque fichier atomique contiendra uni-quement le reacutesultat drsquoune mesure Chaque fichier de donneacutees reacutecolteacutees par jour va doncecirctre deacutecouper en 10 000 fichiers atomiques Cette deacutecoupe est reacutealiseacutee par lrsquooutil rgeolocLrsquoanalyse des fichiers atomiques diffegravere selon lrsquoobjectif

Lrsquoextraction des deacutelais srsquoeffectue agrave lrsquoaide de rgeoloc Lors de lrsquoextraction les informa-tions sur les deacutelais sont accompagneacutees de la longueur du chemin et des adresses IP sourceet destination

Nous souhaitons deacuteterminer si les routes Internet provenant de La Reacuteunion sont sy-meacutetriques ou non Pour cela une eacutetude des deacutelais et des routes vers La Reacuteunion est effec-tueacutee

Vers La Reacuteunion

Les routes asymeacutetriques sont freacutequentes et principalement dues agrave des politiques deroutage et agrave lrsquoingeacutenierie de trafic Des meacutecanismes comme lrsquoeacutequilibrage de charge (load-balancing) Hot Potato Routing ou encore BGP (Border Gate Protocol) peuvent eacutegalementgeacuteneacuterer un pheacutenomegravene drsquoasymeacutetrie des liensHot Potato Routing est un pheacutenomegravene lieacute au routage sans regraveglement Le routeur transfegraverele paquet aussi vite que possible vers un routeur situeacute en aval sur la route [Feige1992Wang2018]

50

FIGURE 23 ndash Fonctionnement de la sonde

BGP est protocole de routage inter-AS deacutefini dans le [RFC1105] En fonction des informa-tions eacutechangeacutees deux paquets peuvent ne pas suivre la mecircme chemin IP mais suivre unchemin AS identique

Afin de veacuterifier la preacutesence des liens asymeacutetriques nous avons mis en place le proto-cole suivant en utilisant la plate-forme Atlas RIPE NCC [Ripe2010]

Preacuteparation Pour notre eacutetude et en accord avec les Conditions Geacuteneacuterales drsquoUtilisation(CGU) drsquoAtlas nous avons seacutelectionneacute le nombre maximal de sondes autoriseacutees soit1 000 Ces sondes serviront de sources pour nos mesures La seacutelection des sondes srsquoestfaite selon deux critegraveresLe premier est le fait que la sonde soit active En effet mecircme si la sonde nrsquoest pas joi-gnable Atlas continue drsquoindiquer la sonde dans ses donneacuteesLa seconde indication neacutecessaire agrave la seacutelection drsquoune sonde est son pays drsquoheacutebergementIl est neacutecessaire de garder la mecircme reacutepartition geacuteographique que les destinations seacutelec-tionneacutees pour lrsquoeacutetude preacuteceacutedente (voir Figure 22b)

La seacutelection des destinations srsquoest effectueacutee sur les critegraveres drsquoidentification des FAI etdes TAI disponibles sur lrsquoicircle Tout comme notre plate-forme de mesure de la section 233

51

il est pour nous important que nos destinations respectent une pariteacute sur ces critegraveres deseacutelection Afin de nous assurer que nos destinations soient physiquement heacutebergeacutees surlrsquoicircle nous avons pris la deacutecision de seacutelectionner des sondes de mesure de lrsquoeacutetude preacuteceacute-dente Lrsquoutilisation drsquoAtlas eacutetant reacutegi par un systegraveme drsquoutilisation et de creacuteation de creacuteditnous avons ducirc limiter le nombre de nos destinations agrave 10 IP publiques de la plate-formeRunPL Nous avons pleinement conscience que ce nombre nrsquoest pas forceacutement repreacute-sentatif du nombre drsquoadresse IP disponibles sur lrsquoIcircle de La Reacuteunion mais nous sommesrestreint par les CGU drsquoAtlas

Reacutealisation Atlas propose deux possibiliteacutes de programmation des sondes La premiegraveresrsquoeffectue agrave travers son interface graphique Le second choix est drsquoutiliser une API Commeil est fastidieux de programmer un nombre important de mesures agrave travers lrsquointerfacegraphique nous faisons le choix drsquoutiliser lrsquoAPI Pour effectuer 10 000 mesures par journous avons fait le choix de garder le taux de la loi exponentielle de lrsquoeacutetude preacuteceacutedentesoit 8 64 secondes Afin de limiter les pheacutenomegravenes de synchronisation le calendrier demesures a eacuteteacute geacuteneacutereacute aleacuteatoirement Nous nous sommes assureacutes que chaque sonde demesures allait effectivement joindre lrsquoensemble des destinations par jour

Veacuterification La veacuterification des perturbations se fait sur la bande passante descendanteEn effet ce sont les sondes de la plate-forme RunPL qui geacutenegraverent du trafic en continu Ilne faut pas que les mesures de la section 233 soient impacteacutees par lrsquoarriveacutee des paquetsentrants Le nombre maximal de paquets arrivant jusqursquoau routeur de lrsquoheacutebergeur estde 3 Un paquet possegravede un poids maximal de 64 octets Un poids total de 1536 bitsest envoyeacute agrave la destination Une mesure eacutetant programmeacutee toutes les 8 secondes nousutilisons cette valeur comme variable pour calculer le deacutebit Nous avons donc un deacutebitde 192 bits

Drsquoapregraves le rapport [Vergoz2013] le deacutebit descendant le plus faible mesureacute est de 1 58Mbits Notre mesure impact repreacutesente donc approximativement 0 12 de la capaciteacutedu lien Cet impact est neacutegligeable agrave un instant donneacute

Collecte La plate-forme Atlas stocke automatiquement les reacutesultats lieacutes agrave ses expeacuteri-mentations sur son propre serveur Une fois lrsquoensemble des mesures reacutealiseacutees nous avonsreacutecupeacutereacute les reacutesultats Un total de 300 000 fichiers correspondant aux 300 000 mesuresont eacuteteacute teacuteleacutechargeacutes du serveur drsquoAtlas

Analyse Cette partie de lrsquoeacutetude est fortement similaire agrave lrsquoanalyse effectueacutee pour lrsquoeacutetudedes routes et deacutelais depuis La Reacuteunion Une seule partie diffegravere En effet comme indiqueacutedans la section preacuteceacutedente chaque fichier collecteacute repreacutesente une mesure Nous nrsquoavonsdonc pas la neacutecessiteacute drsquoeffectuer une phase de deacutecoupage de nos donneacutees en fichiersatomiques

Reacutecapitulatif

Afin de pouvoir effectuer une comparaison entre les deux protocoles de mesures surlrsquoeacutetude des routes et des deacutelais associeacutes le tableau 25 reacutesume les deux protocoles sur lemois de mesure analyseacute

Nous constatons une diffeacuterence notable en terme de sources et de destinations Cettediffeacuterence impacte le nombre de fichiers atomiques que lrsquoon a obtenus Le nombre defichiers atomiques provient de la multiplication entre le nombre de sources le nombre dedestinations et le nombre de jours de mesures Cela correspond au nombre maximal de

52

TABLE 25 ndash Reacutesumeacute des caracteacuteristiques du jeu de donneacutees

Depuis VersSondes de mesures Raspberry Pi Atlas RIPE NCC

Nombres de Destinations 10 000 IP 10 raspberry-piNombres de sources 27 1 000

Nombres de jours de mesures 28 30Outil de mesure Paris-traceroute

Nombres de fichiers atomiques 7 560 000 300 000

Nombres de fichiers analyseacutes 1 015 180 38 714

fichiers que lrsquoon peut obtenir La derniegravere ligne du tableau indique le nombre de fichiersque lrsquoon a pu analyser apregraves veacuterification des mesures et nettoyage des fichiers erroneacutesCe nettoyage se fait par lrsquooutil drsquoanalyse rTraceroute Dans la section 233 nous avons puanalyser 13 43 des donneacutees De la section 233 12 91 des donneacutees ont eacuteteacute exploiteacutesNous avons dans les deux cas un taux de pertes de donneacutees important

24 Reacutesultats

Dans la suite de notre manuscrit et pour des raisons pratiques nous avons reacuteduit lenom des continents agrave deux lettres La correspondance entre lrsquoacronyme et le nom completest indiqueacutee dans le tableau 26

TABLE 26 ndash Correspondance entre acronymes et noms des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

Cette correspondance provient de lrsquoutilisation des deux premiegraveres lettres de chaquecontinent en version anglophone

241 Eacutevolution

La comparaison avec lrsquoexistant fut diviseacutee en deux Dans un premier temps nousavons compareacute les deacutelais Par la suite nous avons utiliseacute une partie des donneacutees nonencore exploiteacutees pour reacutealiser une comparaison de la longueur des routes

Distribution du RTT

Les mesures obtenues ont permis drsquoeffectuer une comparaison avec les donneacutees reacute-colteacutees en 2012 par [Anelli2012] Nous avons effectueacute une campagne de ping en 2016 afindrsquoeacutetudier lrsquoeacutevolution des deacutelais depuis Paris et La Reacuteunion La figure 24 illustre lrsquoeacutevolu-tion de la distribution du RTT en 4 ans

Entre 2012 et 2016 le jeu drsquoadresses IP de destination fut diffeacuterent En 2012 aucunereacutepartition geacuteographique ne fut eacutetablie En 2016 la distribution des adresses est cellepreacutesenteacutee dans la partie 231 Malgreacute ces diffeacuterences nous remarquons que les courbesont les mecircmes tendances en 2012 et en 2016 Des pics sont preacutesents aux environs desvaleurs 005 01 et 03 secondes pour Paris en 2012 Des pics sont identifieacutes aux valeurs02 035 et 05 secondes pour La Reacuteunion en 2012 Les pics sont preacutesents aux alentours desmecircmes valeurs sur les deux campagnes de mesure Nous eacutemettons lrsquohypothegravese que ces

53

pics correspondent aux 3 continents les plus repreacutesenteacutes dans nos eacutechantillons agrave savoirlrsquoAmeacuterique du Nord lrsquoAsie et lrsquoEurope Nous veacuterifierons cela par la suite

Malgreacute un eacutecart de 4 ans entre les deux campagnes de mesures on constate une sta-biliteacute du deacutelai minimal aux alentours de 02 secondes La stabiliteacute du deacutelai srsquoest elle ac-compagneacutee drsquoune stabiliteacute de la longueur des routes

0

0001

0002

0003

0004

0005

0006

0007

0008

0009

001

0 01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(a) 2012

0

0002

0004

0006

0008

001

0012

0014

0016

01 02 03 04 05 06 07 08 09 1

Pro

b

RTT (in sec)

From Paris

From Reunion

(b) 2016

FIGURE 24 ndash Comparaison des deacutelais entre Paris et La Reacuteunion

Longueur du chemin

Dans le section preacuteceacutedente nous avons constateacute que le deacutelai minimal pour quitter lrsquoicircleest resteacute stable en 4 ans Nous allons essayer de corroborer cette stabiliteacute du deacutelai par unestabiliteacute de la longueur des routes sur la mecircme peacuteriode

La longueur des routes fut obtenue par lrsquoanalyse inverse du TTL Le [RFC1700] preacute-conise une valeur de deacutepart de 64 Or le site Wikipeacutedia [WikiPing] indique que le TTLinitial peut varier Les valeurs les plus communes sont 64 128 voire 255 dans certains casNous avons donc en fonction de la valeur du TTL soustrait une valeur de deacutepart agrave la va-leur indiqueacutee pour obtenir la longueur de la route Dans les donneacutees datant de 2012 leslongueurs de certaines routes sont eacutegales agrave 127 Ne pouvant deacutecider de la valeur de TTLde deacutepart nous avons fait le choix de ne garder que les reacutesultats dont le TTL afficheacute parping est supeacuterieur ou eacutegal agrave 128 Pour les donneacutees de 2016 nous nrsquoavons pas reacutepertorieacutede valeurs comprises dans lrsquointervalle [ 120 208] De fait nous avons gardeacute lrsquoensembledes valeurs obtenues

La figure 25 illustre lrsquoeacutevolution des routes entre les deux jeux de reacutesultats En 2012la longueur des routes eacutevolue entre 10 et 40 nœuds avec un pic agrave 24 nœuds En 2016les routes ont une longueur qui varie entre 5 et 30 sauts avec un pic agrave 17 Un eacutecart de 7nœuds repreacutesenteacute sur notre figure

Les deacutelais entre La Reacuteunion et Paris sont resteacutes stables entre 2012 et 2016 Sur la mecircmepeacuteriode la longueur des routes depuis La Reacuteunion a diminueacute

242 Connectiviteacute de La Reacuteunion

La section 241 a montreacute lrsquoeacutevolution des deacutelais et de la longueur des routes entre 2012et 2016 Malgreacute ces eacutetudes aucune caracteacuterisation de la connectiviteacute de La Reacuteunion nrsquoaeacuteteacute reacutealiseacutee Dans cette section nous allons effectuer cette caracteacuterisation en termes dedeacutelais et des routes emprunteacutees

54

FIGURE 25 ndash Eacutevolution de la longueur des routes entre 2012 et 2016

Geacuteneacuteraliteacutes

Nous avons en plus des informations sur les deacutelais et la longueur des routes desinformations sur les adresses IP rencontreacutees tout au long des mesures Ainsi nous avonsdeacutecideacute de reacutepartir notre analyse sur 4 principales meacutetriques que sont

mdash La longueur du chemin est deacutetermineacutee par le nombre de nœuds rencontreacute par Paris-traceroute

mdash Le deacutelai analyseacute est le RTT Il est associeacute agrave la destination jointe

mdash La localisation des adresses IP avant (resp apregraves) le passage par les cacircbles sous-marins quand nos donneacutees arrivent (resp quittent) agrave La Reacuteunion

mdash La distance geacuteographique correspond agrave la distance reacuteelle (en Km) entre la source etla destination Pour cela on utilise lrsquoeacutequation (22) Ils srsquoagit de lrsquoeacutequation de calculde distance entre deux points sur une sphegravere

d = arccos[cos(x)times cos(y)times cos(m)times cos(n) ++ cos(x)times sin(y)times cos(m)times sin(n) ++ sin(x)times sin(m)]times 6371 1 [km]

(22)

ougrave

mdash (xy) (mn) sont respectivement la latitude et la longitude de la source et de la des-tination (en radians)

mdash 63711 km est la reacutefeacuterence en radius de la Terre

Les coordonneacutees geacuteographiques des adresses IP ont eacuteteacute obtenues par notre outil degeacuteolocalisation Nous avons ainsi pu calculer la distance geacuteographique entre deux adressesIP Si nous prenons lrsquoexemple de la reacutepartition geacuteographique des adresses IP des sondesatlas et des destinations seacutelectionneacutees nous obtenons la figure 26 Les deux courbes sontsimilaires en terme de reacutepartition des distances La diffeacuterence des valeurs de lrsquoaxe des

55

ordonneacutees provient du nombre plus important drsquoeacutechantillons pour la figure 26a Surcette figure il est difficile de visualiser la distance des adresses relatives au continentoceacuteanique La faible eacutepaisseur de la probabiliteacute des adresses oceacuteaniques est eacutegalementpreacutesente sur la figure 26b On constate sur cette figure une preacutesence plus importantedrsquoadresses IP africaines et asiatiques

(a) Depuis (b) Vers

FIGURE 26 ndash Distribution de la distance geacuteographique par continent

La reacutepartition des adresses IP dans le monde et leur distance geacuteographique ont-ellesun impact sur la distribution des deacutelais Crsquoest agrave cette question que nous allons essayerde reacutepondre dans la section suivante

Distribution du RTT par continent

La figure 27 repreacutesente la distribution des deacutelais obtenus par nos mesures incluantla reacutepartition par continent Nous avons utiliseacute un regroupement des deacutelais par eacutecart de10 ms On constate rapidement que les deux figures nrsquoont pas la mecircme tendance Dans lasection 241 nous avions eacutemis lrsquohypothegravese que les pics preacutesents sur les courbes des deacutelaiseacutetaient associeacutes aux continents les plus preacutesents dans la geacuteolocalisation des adresses IP

La comparaison que lrsquoon peut effectuer avec les donneacutees de lrsquoexistant est celle delrsquoeacutetude Depuis Ainsi on remarque que la figure garde la mecircme forme avec la preacutesencedes 3 pics Sur la figure 27a nous pouvons identifier ces pics Ces pics repreacutesentent lrsquoEu-rope lrsquoAmeacuterique du Nord et lrsquoAsie On constate que le deacutelai minimal est stable avec unevaleur proche des 200 ms

Dans lrsquoexpeacuterimentation Vers La Reacuteunion nous constatons la preacutesence de non pas 3mais de 2 pics Le pic relatif au continent asiatique a disparu De plus les deacutelais associeacutesagrave ce continent sont moins concentreacutes Pour les autres continents la distribution des deacute-lais est relativement identique agrave lrsquoexpeacuterimentation preacuteceacutedente Nous pouvons remarquerla preacutesence de deacutelais africains vers La Reacuteunion aux alentours des 100 ms Les deacutelais de-puis lrsquoEurope sont sensiblement eacutequivalents agrave ceux de lrsquoeacutetude Depuis avec des deacutelaiscompris entre 180 et 190ms

Agrave la lecture des reacutesultats nous pouvons confirmer que lrsquohypothegravese avanceacutee preacuteceacute-demment est juste

Nous avons connaissance drsquoune relation entre la distance et le temps mis pour parcou-rir cette distance Ayant constateacute lrsquoeacutevolution des deacutelais nous allons maintenant eacutetudierlrsquoeacutevolution de la distance parcourue

56

(a) Depuis (b) Vers

FIGURE 27 ndash Distribution du RTT par continent

Longueur du chemin par continent

Nous avons pu dans la section 241 constater une diminution des routes entre 2012et 2016 Les figures 28 indiquent la reacutepartition de la longueur des routes obtenues enfonction des continents La premiegravere constatation est la forte similitude entre les deuxcourbes

Sur la figure 28a on remarque la preacutesence drsquoun pic pour une longueur de 18 nœudsCela indique que peu importe le continent de destination la probabiliteacute drsquoavoir une routedrsquoune longueur de 18 sauts est importante

Dans le sens Vers le pic est quasiment identique selon le continent de deacutepart Lavaleur geacuteneacuterale se situe agrave une valeur de 15 nœuds pour lrsquoAmeacuterique du Nord lrsquoOceacuteanieet lrsquoAmeacuterique du Sud et agrave une valeur de 16 sauts pour les autres continents

Avec un eacutecart de 2 agrave 3 sauts selon le sens on peut donc consideacuterer que la longueur duchemin reste identique pour lrsquoInternet reacuteunionnais

(a) Depuis (b) Vers

FIGURE 28 ndash Distribution de la longueur des routes par continent

Longueur du chemin et distance geacuteographique

Le premier reacutesultat analyseacute concerne la distance logique par rapport agrave la distancephysique Dans lrsquoarticle [Leguay2004] lrsquoauteur a calculeacute la moyenne des chemins dans

57

lrsquoInternet agrave partir drsquoun jeu incluant plus de 7 000 000 de donneacutees La valeur obtenue estde 15 57 sauts

Dans nos reacutesultats la valeur moyenne calculeacutee est de 17 11 eacutequipements traverseacutesavant de joindre la destination Cette valeur regroupe lrsquoensemble de nos donneacutees sansaucune distinction de la localisation de la source drsquoeacutemission En eacutetudiant uniquementles donneacutees Depuis les routes ont une longueur moyenne de 17 37 sauts Si on analysela longueur des routes des donneacutees entrant sur lrsquoicircle on obtient une moyenne de 16 85eacutequipements On observe deacutejagrave une premiegravere asymeacutetrie des routes selon que lrsquoon quitteou que lrsquoon joint lrsquoicircle de La Reacuteunion

Les figures 29a et 29b illustrent les reacutesultats obtenus Chaque figure est diviseacutee endeux On a inseacutereacute en bas de chaque figure la PDF de la longueur du chemin en fonctionde la distance entre sources et destinations Tandis qursquoen haut les aires dessineacutees parles ellipses contiennent 95 des eacutechantillons rattacheacutes agrave chaque continent Les barresdrsquoerreurs repreacutesentent quant agrave elles la moyenne et lrsquoeacutecart-type de la longueur du cheminassocieacutes agrave chaque continent

Nous remarquons que depuis La Reacuteunion la majoriteacute des distance sont situeacutees danstrois grandes reacutegions Le premier regroupement se situe entre 8 000 et 12 000 km Cebloc inclus lrsquoAsie lrsquoOceacuteanie lrsquoEurope et lrsquoAmeacuterique du sud Le second bloc comporteque lrsquoAmeacuterique du Nord et se situe au delagrave des 14 000 km Reste le cas africain Ce conti-nent est tregraves proche de La Reacuteunion Les destinations et sources africaines sont toutesinfeacuterieures agrave 10 000 km

Lrsquoanalyse geacuteneacuterale des reacutesultats obtenus montre que le nombre de sauts nrsquoest pas deacute-pendant de la distance geacuteographique Sur la figure 29a on constate des chemins aussilongs sur la boucle locale que pour joindre certaines destinations lointaines On a eacutegale-ment repreacutesenteacute sur les figures PL(d) = α times d + β qui est la fonction lineacuteaire de la lon-gueur du chemin comme fonction de la distance geacuteographique Le tableau 27 regroupeles eacutequations obtenues selon lrsquoexpeacuterimentation

TABLE 27 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

Expeacuterimentation Eacutequation PL(d)Depuis La Reacuteunion 1 58 lowast 10minus5 timesD + 16 65

Vers La Reacuteunion 7 50 lowast 10minus5 timesD + 18 32

La valeur obtenue pour α qui est le coefficient directeur de la droite possegravede unmultiplicateur eacutegal agrave 10minus5 Cette valeur indique le nombre de sauts suppleacutementaires pourchaque kilomegravetre Les valeurs de α proches de zeacutero indiquent clairement que la distancegeacuteographique nrsquoimpacte pas la longueur du chemin quelle que soit lrsquoexpeacuterimentation

Impact de la longueur du chemin sur le RTT

Les figures 210a et 210b repreacutesentent la distribution du RTT comme fonction dunombre de sauts ainsi que la meacutediane et les PDF Est eacutegalement preacutesente en bas dechacune des figures la probabiliteacute de densiteacute de la longueur du chemin

Les figures montrent une croissance du deacutelai avec lrsquoaugmentation du nombre denœuds jusqursquoagrave une certaine limite Sur la figure 210a repreacutesentant lrsquoeacutetude Depuis nousremarquons des deacutelais importants deacutepassant les 3 secondes Cette valeur des 3 secondespeut ecirctre atteinte degraves que lrsquoon deacutepasse le 9eme saut Agrave lrsquoinverse sur lrsquoeacutetude Vers illustreacuteepar la figure 210b nous constatons une certaine stabiliteacute du deacutelai Les valeurs restent

58

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 29 ndash Relation entre la longueur de la route et la distance geacuteographique

majoritairement infeacuterieures agrave 2 secondes Lrsquoeacutetude de la meacutediane nous indique des routesplus courtes lorsque lrsquoon essaye de joindre La Reacuteunion Il y a une forte variation de lameacutediane agrave la fin de la figure due au nombre drsquoeacutechantillons pour chaque valeur de lalongueur des routes Afin drsquoidentifier le deacutelai associeacute agrave chaque nouveau nœud la fonc-tion lineacuteaire D(d) = α times d + β du deacutelai comme fonction de la longueur du chemin esteacutegalement repreacutesenteacutee

Le tableau 28 indique les eacutequations obtenues lors de lrsquoanalyse des donneacuteesLa variable drsquoajustement β ne sera pas analyseacutee bien qursquoelle repreacutesente un deacutelai mi-

nimal Nous avons vu dans la partie preacuteceacutedente que ce deacutelai eacutetait eacutequivalent peu importe

59

(a) Depuis lrsquoicircle de La Reacuteunion

(b) Agrave destination de La Reacuteunion

FIGURE 210 ndash Relation entre la longueur de la route et les deacutelais

TABLE 28 ndash Formule de correacutelation du deacutelai en fonction de la longueur du chemin

Expeacuterimentation Eacutequation D(PL)Depuis La Reacuteunion 11 11times PL+ 204 92

Vers La Reacuteunion 6 22times PL+ 249 66

lrsquoexpeacuterimentation La pente de la droite repreacutesenteacutee par le coefficient α indique la valeurassocieacutee agrave chaque nouvel eacutequipement Cette valeur diffegravere fortement selon lrsquoexpeacuterimen-tation mise en place Ainsi le temps accordeacute agrave chaque eacutequipement est beaucoup pluslong lorsque nos donneacutees quittent La Reacuteunion que dans le sens inverse avec un coef-ficient proche du double Cela signifie que pour chaque saut suppleacutementaire un deacutelaiadditionnel de 6 22ms (resp 11 11ms) doit ecirctre pris en compte lorsque lrsquoon joint (resp

60

quitte) La Reacuteunion On passe quasiment du simple au double

Nous avons preacuteceacutedemment analyseacute les Cumulative Density Function (CDF) des lon-gueurs des routes logiques par continent Nous avions constateacute pour certains continentsune forte similitude entre les diffeacuterentes courbes Cette observation est de nouveau preacute-sente ici Les deux PDF sur la longueur des chemins emprunteacutes sont similaires Neacutean-moins le fait drsquoavoir un plus grand nombre drsquoeacutechantillons sur lrsquoexpeacuterimentation Depuisa permis un lissage de la courbe

Correacutelation entre deacutelai et distance geacuteographique

Dans [Krajsa2011] les auteurs se sont inteacuteresseacutes agrave lrsquoimpact de la distance sur le RTTLes reacutesultats ont eacuteteacute obtenus a partir drsquoune eacutetude de meacutetrologie active reacutealiseacutee dans despays agrave forte connectiviteacute en terme de liaisons sous-marines Les auteurs ont deacutetermineacuteune fonction lineacuteaire repreacutesenteacutee par lrsquoeacutequation suivante

y = 0 0128times x (23)

Cette eacutequation preacutedit le deacutelai en fonction drsquoune distance geacuteographique donneacutee Nousallons eacutetudier la pertinence de ce modegravele dans le cas de lrsquoicircle de La Reacuteunion On se reacutefegravereagrave ce modegravele par la notation Expected Internet RTT for a given geographical Distance (EIRD)

La figure 211 est composeacuteee de trois parties En haut nous avons repreacutesenteacute les dis-tances couvertes par chaque continent La figure 211a (resp fig 211b) graphe la fonctionExpected RTT (ER) pour le cas Depuis (resp Vers) et le modegravele EIRD Le modegravele ER(d) vientde la repreacutesentation sous forme lineacuteaire de lrsquoimpact de la distance geacuteographique sur lesdeacutelais obtenus Nous avons eacutegalement repreacutesenteacute les 5eme 10eme 25eme 75eme 90eme et95eme percentiles Les points preacutesents agrave lrsquointeacuterieur des barres drsquoerreurs indiquent le 50eme

percentile Au bas de chaque figure la PDF de la distance geacuteographique est repreacutesenteacutee

Lrsquoeacutetude de la reacutepartition de nos destinations (resp sources) pour notre eacutetude montreque les distances vont drsquoune valeur infeacuterieure agrave 10 km jusqursquoagrave pregraves de 20 000 km Nousconstatons un regroupement des continents entre 5 000 et 10 000 km pour lrsquoeacutetude DepuisLe regroupement se fait agrave une distance plus grande (comprise en 7 500 et 14 000 km)pour Vers Ces valeurs sont remarqueacutees dans la PDF de chaque eacutetude Malgreacute la preacutesenceseule du continent Nord Ameacutericain apregraves 15 000 km la densiteacute de probabiliteacute drsquoavoir unedestination prise dans cet ensemble est importante

Les figures montrent une complegravete opposition entre le modegravele EIRD et nos reacutesul-tats Afin drsquoeffectuer une meilleure comparaison nous avons traduit nos reacutesultats sousla forme ER(d) = αtimes d+ β fonction lineacuteaire du deacutelai en fonction de la distance geacuteogra-phique Une repreacutesentation graphique de ER(d) est indiqueacutee sur les figures Les eacutequa-tions obtenues sont indiqueacutees dans le tableau 29

TABLE 29 ndash Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique

Expeacuterimentation Eacutequation d(t) R2

EIRD y = 0 0128times t 0 9794

ER(d) (Depuis La Reacuteunion) y = minus62 92 lowast 10minus4 times t+ 477 6 16 80 lowast 10minus3ER(d) (Vers La Reacuteunion) y = minus29 4 lowast 10minus5 times t+ 358 1 14 81 lowast 10minus5

Les coefficients de deacutetermination (R2) entre les fonctions lineacuteaires et nos donneacutees in-diquent que nous nrsquoavons pas pu trouver de modegravele de preacutediction suffisamment preacuteciscontrairement au modegravele EIRD Nous constatons eacutegalement que les pentes de nos mo-degraveles ER(d) sont toutes deux neacutegatives Cela signifie que le deacutelai sera plus court pour

61

(a) Depuis La Reacuteunion

(b) Vers La Reacuteunion

FIGURE 211 ndash Relation entre les deacutelais et la distance geacuteographique

joindre une distance eacuteloigneacutee physiquement degraves que lrsquoon emprunte les cacircbles sous-marins La preacutesence du GIX Reunix sur lrsquoicircle permet drsquoavoir des deacutelais courts du mo-ment que lrsquoon reste sur la boucle locale Gazelle (cf section 21) Par exemple le deacutelai pourjoindre un pays europeacuteen est plus court que le deacutelai pour joindre les pays de la ZOI Cereacutesultat est contraire agrave lrsquoanalyse EIRD Il peut srsquoexpliquer en partie par le fait lrsquoeacutetude preacute-senteacute dans [Krajsa2011] est reacutealiseacutee dans des lieux ougrave la connectiviteacute (en terme de liaisonssous-marines) est importante

La partie drsquoanalyse des routes emprunteacutees va nous aider agrave valider ou infirmer lrsquohy-pothegravese suivante Les coefficients α obtenus sur nos eacutequations ER(d) proviennent du routage

Analyse des routes

Dans la section 22 nous avons montreacute lrsquoexistence de liens physiques reliant lrsquoen-semble des icircles de la ZOI Nous cherchons agrave caracteacuteriser lrsquoefficaciteacute des routes emprunteacutees

62

drsquoun point de vue geacuteographique La figure 212 repreacutesente les diffeacuterents points drsquoentreacuteeset de sorties logiques de lrsquoInternet reacuteunionnais que nous avons extraits de nos donneacutees

Des donneacutees obtenues de lrsquoeacutetude Depuis nous avons extrait le pays du premier nœudbaseacute agrave lrsquoexteacuterieur de lrsquoicircle Cette information nous permet drsquoeacutetudier les sorties logiques delrsquoInternet reacuteunionnais Le reacutesultat obtenu est indiqueacute par la figure 212a La taille du lienest proportionnelle au nombre drsquoeacutechantillons passant par ce pays Nous deacutenombrons4 sorties dont 3 en Europe Malgreacute lrsquoabsence de lien direct avec lrsquoAmeacuterique du Norddepuis La Reacuteunion nous avons identifieacute une sortie dans la moitieacute ouest des Eacutetats-UnisLes sorties physiques directes de La Reacuteunion qui sont baseacutees en Afrique Asie et sur lesicircles de la ZOI ne sont pas utiliseacutees La majoriteacute du routage de nos donneacutees avec pregraves de97 srsquoeffectue en France

Dans la figure 212b nous indiquons le dernier eacutequipement localiseacute en dehors deLa Reacuteunion pour une destination finale localiseacutee sur lrsquoicircle Ce sont les entreacutees logiquesde lrsquoInternet reacuteunionnais que nous avons pu obtenir des donneacutees provenant de lrsquoeacutetudeVers Le nombre drsquoentreacutees est double par rapport au nombre de sorties et plus reacuteparti enterme de continent Quatre continents sont directement relieacutes agrave notre icircle lrsquoAfrique lrsquoAsielrsquoEurope et lrsquoAmeacuterique du Sud Le continent europeacuteen est largement repreacutesenteacute dans nosdonneacutees avec 99 51 transitant sur ce territoire La France hexagonale capte 99 33 desdonneacutees soit la quasi-totaliteacute de nos donneacutees Nous avons tout de mecircme pu identifier desliaisons minimales avec lrsquoAfrique du Sud lrsquoInde le Sri Lanka et le Paraguay Ce dernierest le seul agrave ne pas ecirctre directement relieacute agrave lrsquoicircle par un cacircble sous-marin

Le tableau 210 reacutesume les informations contenues dans les figures 212a et 212b Leslignes sont rangeacutees par taux drsquoutilisation deacutecroissant

TABLE 210 ndash Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunionnais

Depuis La Reacuteunion Vers La Reacuteunion

France (9699) 18101 msAllemagne (1 03) 299 26 msEacutetat-Unis (1 03) 293 15 msItalie (1 03) 289 46 ms

France (9933) 18330 msAfrique du Sud (0 45) 66 42 msBelgique (0 1) 197 48 msItalie (0 04) 202 59 msSloveacutenie (0 04) 205 50msInde (0 01) 161 45 msParaguay (0 01) 454 36 msSri Lanka (0 01) 207 88 ms

La preacutesence de liens directs entre La Reacuteunion et des pays beaucoup plus eacuteloigneacutestels que les Eacutetats-Unis ou le Paraguay sans cacircbles physiques directs est symptomatiquede lrsquoabsence drsquoinformations ou drsquoerreurs de geacuteolocalisation Nous pouvons preacutesenter etexpliquer quelques points preacutesents dans nos reacutesultats

1 Les erreurs de geacuteolocalisation Les erreurs de geacuteolocalisation sont principalementdues agrave une mauvaise utilisation des blocs drsquoadresses IP par les opeacuterateurs Ils preacute-fegraverent utiliser des adresses qui leur ont deacutejagrave eacuteteacute attribueacutees que drsquoeffectuer une de-mande drsquoadresse IP aupregraves drsquoun RIR Un exemple est lrsquoadresse IP rsquo19416714221rsquoCette adresse est attribueacutee agrave lrsquoopeacuterateur franccedilais RENATER Comme RENATERpossegravede la nationaliteacute franccedilaise le pays de localisation de lrsquoadresse est rsquoFRANCErsquoOr il srsquoavegravere que cette adresse est utiliseacutee comme adresse publique de lrsquoUniversiteacutede La Reacuteunion Elle est donc localiseacutee sur lrsquoicircle Un raisonnement similaire peut srsquoef-fectuer sur les autres reacutegions drsquooutre-mer posseacutedant des relations avec lrsquoopeacuterateurRENATER Les filiales drsquoopeacuterateur meacutetropolitain comme Orange peuvent eacutegale-ment utiliser ce systegraveme sur lrsquoensemble de leur reacuteseau Pour reacutesoudre ce problegraveme

63

(a) Sorties

(b) Entreacutees

FIGURE 212 ndash Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais

nous avons effectueacute une analyse du deacutelai Si le deacutelai associeacute agrave certaines adresses IPcorrespond au deacutelai theacuteorique associeacute au continent nous avons consideacutereacute que lageacuteolocalisation est correcte Dans les cas contraires nous nrsquoavons pas la possibiliteacutedrsquoecirctre sucircrs agrave 100 de la bonne localisation

2 Les accords de peering se font dans un pays avant que le paquet nrsquoemprunte le cacircblesous-marin Lrsquoexemple illustreacute par la figure 213 montre que les eacutechanges entre deuxadresses IP srsquoeffectuent au sein drsquoun IXP Ces eacutechanges peuvent se faire entre deuxpays distants au sein drsquoun troisiegraveme pays Dans notre exemple lrsquoeacutechange entre LaReacuteunion et les USA se fait en France

3 Lrsquoencapsulation des donneacutees au sein du systegraveme MPLS geacutenegravere eacutegalement des in-coheacuterences au sein de nos analyses Lrsquoexemple que lrsquoon peut indiquer est lrsquoanalysede la mesure numeacuteroteacutee 4178740 2 chez Atlas RIPE NCC Cette trace est composeacuteede 5 sauts entre le Paraguay et La Reacuteunion avec un lien direct Or il nrsquoexiste aucuncacircble physique entre ces deux points du monde Une encapsulation au niveau In-

2 httpsatlasripenetmeasurements4178740

64

Internet InternetUtilisateur DestinationIXP (FR)

RE US

FIGURE 213 ndash Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dansun pays tiers

visible des donneacutees nrsquoindique pas le parcours preacutecis des donneacutees tel que lrsquoindiquelrsquoauteur de lrsquoarticle [Donnet2012]

Ces explications ne sont pas les seules mais potentiellement les plus freacutequemmentrencontreacutees Dans notre cas les points 2 et 3 semblent ecirctre les raisons preacutedominantesLes marques du systegraveme MPLS sont dues agrave la division de la capaciteacute des cacircbles pour lesdiffeacuterents opeacuterateurs et agrave la connexion en diffeacuterents points pour reacutegeacuteneacuterer le signal

Des reacutesultats de nos eacutetudes nous deacuteplorons lrsquoabsence de peering reacutegional Cette ano-malie est la principale cause de la tendance des courbes obtenues dans le tableau 29 Eneacutetudiant les diffeacuterents IXP nous constatons lrsquoabsence drsquoopeacuterateurs communs entre les 3icircles comme lrsquoillustre la figure 214 Ces informations proviennent directement des sitesinternet officiels des IXP [MIXP2017 MGIX2017 REUNIX2017] On peut neacuteanmoins no-ter la preacutesence des filiales de lrsquoopeacuterateur Orange agrave Madagascar et agrave La Reacuteunion Il srsquoagitdans le cas drsquoOrange Madagascar de lrsquoexploitation du nom sans ecirctre dirigeacutee par lrsquoen-treprise Orange De cette figure on peut deacuteduire que les eacutechanges drsquoinformations et dedonneacutees se font dans une reacutegion eacuteloigneacutee de la ZOI et agrave un niveau plus eacuteleveacute On peutsupposer que ce sont des Tiers-1 qui se chargent du peering de cette zone Afin de vali-der cette hypothegravese nous avons deacuteployeacute des sondes de mesures de RunPL sur les icirclesvoisines

FIGURE 214 ndash FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien

243 Connectiviteacute des icircles de la Zone Oceacutean Indien

Nous avons vu dans la section 22 que les icircles de la ZOI partagent des routes phy-siques en commun Nous avons constateacute dans la section 242 que La Reacuteunion possegravede

65

une connectiviteacute Internet particuliegravere Nous sommes donc en droit de nous demander sicette connectiviteacute est commune agrave lrsquoensemble des icircles de la ZOI ou non Nous avons pu deacute-ployer un minimum de deux sondes par pays eacutetudieacute Le protocole de mesure et drsquoanalysemis en place est en tout point identique agrave celui utiliseacute pour lrsquoeacutetude de la connectiviteacute deLa Reacuteunion Ainsi nous avons utiliseacute les mecircmes meacutetriques pour valider la comparaison

Distribution du RTT par pays eacutetudieacute

La figure 215 illustre la reacutepartition des deacutelais des icircles de la ZOI selon le pays drsquooriginedes mesures (215a) et du continent de destination (215b) Comme pour La Reacuteunion nousremarquons la preacutesence des trois pics

Drsquoapregraves la figure 215b ces pics ont la mecircme signification que dans la situation preacute-ceacutedente crsquoest-agrave-dire la preacutesence des deacutelais pour joindre lrsquoEurope lrsquoAmeacuterique du Nord etlrsquoAsie

Sur la figure 215a on remarque eacutegalement des valeurs minimales et maximales dif-feacuterentes selon le pays Ainsi les Seychelles ont les deacutelais les plus courts de la ZOI Agravelrsquoinverse crsquoest La Reacuteunion qui possegravede le plus de deacutelais au delagrave des 800 ms

Le comportement des deacutelais eacutetant communs agrave lrsquoensemble de la ZOI nous allons main-tenant eacutetudier la longueur des routes pour chaque icircle eacutetudieacutee

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 215 ndash Distribution des deacutelais des icircles de la ZOI

Longueur des routes par pays eacutetudieacute

La figure 216 repreacutesente la densiteacute de probabiliteacute de la longueur des routes En confon-dant les destinations nous pouvons eacutetudier la reacutepartition de la distance en fonction delrsquoicircle source (216a) Nous avons appliqueacute le mecircme raisonnement en meacutelangeant les icirclessources pour se concentrer sur la destination (216b) Les figures eacutetudieacutees nrsquoont pas lamecircme forme que celles uniquement deacutedieacutees agrave La Reacuteunion En effet la courbe 216 pos-segravede 2 pics

Sur la figure 216a on remarque que cette diffeacuterence est fortement accentueacutee par lapreacutesence des donneacutees reacuteunionnaises

Sur la figure 216b on voit une diffeacuterence de comportement en fonction du contientjoint Ainsi lrsquoAfrique lrsquoAsie et lrsquoEurope ont la preacutesence drsquoun seul pic Cela signifie queces continents seront majoritairement joints par des routes comprises entre 10 en 20 sautsPour les Ameacuteriques et lrsquoOceacuteanie il y a deux pics Cela sous-entend la preacutesence de deuxgrandes routes avec lrsquoune plus courte que lrsquoautre La plus petite est composeacutee de 13sauts La seconde route est quant agrave elle drsquoune longueur de 16 sauts

66

Cette diffeacuterence peut srsquoexpliquer par la preacutesence de routes emprunteacutees diffeacuterentes enfonction des pays de destinations Pour corroborer cela nous allons poursuivre lrsquoeacutetudeen fonction des meacutetriques preacutesenteacutees dans la section 242

0

003

006

009

012

0 5 10 15 20 25 30 35 40

P [

X=

x]

Longueur du chemin (en noeuds)

Mayotte

Seychelles

Reunion

Maurice

Madagascar

(a) En fonction de lrsquoicircle source (b) En fonction du continent de destination

FIGURE 216 ndash Longueur des routes emprunteacutees

Longueur du chemin et distance geacuteographique

Dans cette section on va eacutetudier la relation entre la longueur du chemin et la distancegeacuteographique On a vu agrave travers le reacutesultat preacuteceacutedent que le choix du continent avaitun impact sur la longueur du chemin Pour plus de lisibiliteacute nous avons repreacutesenteacute lesreacutesultats sous la forme drsquoeacutequations lineacuteaires repreacutesenteacutes par lrsquoeacutequation 24

PL(d) = αtimes d+ β (24)

Les eacutequations obtenues sont indiqueacutees dans le tableau 211 et repreacutesenteacutees graphique-ment par la figure 217

TABLE 211 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation PL(d)Madagascar y = minus0 000303631times d+ 26 1771

Maurice y = minus0 000183807times d+ 18 4231

Reacuteunion y = minus9 18819 lowast 10minus5 times d+ 17 1201

Seychelles y = minus0 000183362times d+ 18 9892

Mayotte y = minus7 15288 lowast 10minus5 times d+ 18 4781

Nous pouvons seacuteparer nos reacutesultats en 3 groupes Drsquoun cocircteacute les deacutepartements fran-ccedilais avec La Reacuteunion et Mayotte Dans un second groupe lrsquoicircle Maurice et les SeychellesEt dans un troisiegraveme groupe Madagascar Les reacutesultats de La Reacuteunion et de Mayotte sontsimilaires La pente α est quasi-nulle et lrsquoeacutecart sur le coefficient β est de 1 saut Ce reacutesul-tat est similaire agrave celui obtenu preacuteceacutedemment Maurice et les Seychelles ont eacutegalementdes coefficients proches Les pentes sont leacutegegraverement neacutegatives Cela implique une petitedeacutependance du nombre de sauts en fonction de la distance geacuteographique Le cas le plusinteacuteressant est Madagascar Nous allons nous inteacuteresser plus en deacutetail agrave son comporte-ment

Madagascar possegravede les coefficients α et β les plus eacuteleveacutes Cela signifie que le payspossegravede une route minimale plus longue que les autres icircles Son coefficient α neacutegatif

67

10

20

30

0 5000 10000 15000 20000

Pat

h L

ength

PL

(N

um

ber

of

hops)

Distance d (Km)

MGMURESCYT

FIGURE 217 ndash Relation entre la longueur de la route et la distance geacuteographique

est presque deux fois plus eacuteleveacute que pour Maurice et les Seychelles Lrsquoimpact de la dis-tance sur le nombre de sauts est donc plus fort La figure 218 a eacuteteacute reacutealiseacutee selon le mecircmescheacutema que les figures 28 La repreacutesentation de la PDF de la distance des destinations parrapport aux sondes deacuteployeacutees agrave Madagascar montre deux grands groupes Le premiersitueacute entre 5 000 et 10 000 kilomegravetres Ce groupe regroupe Asie Europe Oceacuteanie et Ameacute-rique du Sud Le second groupe eacutevoluant aux alentours des 15 000 kilomegravetres englobe latotaliteacute des adresses IP geacuteolocaliseacutees en Ameacuterique du Nord Le nombre drsquoadresses prove-nant du continent africain est compris entre 0 et 10 000 La pente neacutegative suggegravere doncque les routes vers les continents eacuteloigneacutes sont plus courtes que les routes vers des desti-nations proches geacuteographiquement Neacuteanmoins la lecture des cercles montre des routesglobalement aussi longues quel que soit le continent

Impact de la longueur du chemin sur le RTT

Tout comme la section preacuteceacutedente nous avons repreacutesenteacute les reacutesultats sous formedrsquoeacutequations lineacuteaires Le tableau 212 regroupe les eacutequations obtenues tandis que la fi-gure 219 les repreacutesente graphiquement

TABLE 212 ndash Formule de correacutelation de la longueur du chemin en fonction de la distancegeacuteographique

icircle de deacutepart Eacutequation D(PL)Madagascar y = 13 5709times t+ 119 717

Maurice y = 14 296times t+ 171 69

Reacuteunion y = 14 2259times t+ 166 84

Seychelles y = 17 3953times t+ 35 3596

Mayotte y = 16 3138times t+ 90 9087

Comme on pouvait srsquoy attendre le deacutelai srsquoaccroicirct avec le nombre de sauts Les coef-ficients α obtenus sont proches les uns des autres La diffeacuterence se fait plus sur la valeurdrsquoajustement β Cette valeur correspond au deacutelai minimal Les Seychelles ont la pente

68

FIGURE 218 ndash Relation entre la longueur de la route et la distance geacuteographique pourMadagascar

la plus eacuteleveacutee et la valeur drsquoajustement la plus basse Cela signifie que malgreacute un deacute-lai minimal faible le temps mis par un paquet dans chaque routeur est plus importantque pour les autres icircles Mayotte est sensiblement dans le mecircme cas Pour Maurice et LaReacuteunion les pentes sont proches et la valeur de β eacutegalement Ces deux icircles auraient doncun comportement similaire

0

50

100

150

200

250

300

350

400

10 20 30

RT

T D

elay

(m

s)

Path Length PL (Number of hops)

MGMURESCYT

FIGURE 219 ndash Relation entre la longueur de la route et les deacutelais

69

Correacutelation entre deacutelai et distance geacuteographique

Nous avions vu que pour La Reacuteunion il y avait une incoheacuterence sur la relation entrele deacutelai et la distance geacuteographique En effet nous avions comme reacutesultat le fait que ledeacutelai deacutecroissait avec la distance Ce scheacutema se reproduit eacutegalement pour les autres icirclesde la ZOI tel qursquoillustreacute par la figure 220 Les eacutequations associeacutees agrave chaque pays sontpreacutesenteacutees dans le tableau 213

TABLE 213 ndash Formule de correacutelation de la distance geacuteographique et du RTT

icircle de deacutepart Eacutequation PL(t)Madagascar y = minus0 0053913times t+ 476 626

Maurice y = minus0 00418997times t+ 438 177

Reacuteunion y = minus0 00370839times t+ 440 249

Seychelles y = minus0 00344991times t+ 368 501

Mayotte y = minus0 0015904times t+ 397 1

On constate des pentes fortement diffeacuterentes en fonction des pays Ainsi Mayotte aune pente beaucoup plus douce que les autres icircles Malgreacute un β proche on voit que lrsquoeacutecartdes deacutelais entre La Reacuteunion et Maurice srsquoaccroicirct avec la distance La pente de Madagascarest tregraves importante Ccedila indique une forte deacutecroissance du deacutelai avec la distance Ainsi ledeacutelai pour joindre lrsquoicircle Maurice sera beaucoup plus important que pour joindre les paysdrsquoAmeacuterique du Nord

Lrsquoune des conseacutequences de ces reacutesultats est la preacutesence drsquoun deacutelai plus eacuteleveacute pourjoindre les icircles de la ZOI que pour joindre des destinations plus lointaines Et cela malgreacutedes routes toutes aussi longues Cela montre une contradiction agrave travers nos reacutesultatsPour comprendre cela il est neacutecessaire drsquoeacutetudier les portes de sorties de lrsquoInternet desicircles de la ZOI

300

350

400

450

500

0 5000 10000 15000 20000

RT

T D

elay

(m

s)

Distance d (Km)

MGMURESCYT

FIGURE 220 ndash Relation entre les deacutelais et la distance geacuteographique

Analyse des portes de sortie

Chaque icircle de la ZOI possegravede ses propres routes avec ses propres regravegles et ses propressorties Agrave la fin de la section 242 nous avons eacutemis lrsquohypothegravese suivante les eacutechanges de

70

paquets entre les FAI des icircles de la ZOI ne se font pas au sein de la ZOILa figure 221 indique le nombre de sorties que lrsquoon a pu relever durant nos mesures

(221a) et le pourcentage de leur reacutepartition geacuteographique (221b)

En analysant la figure 221b on constate que la majoriteacute des pays de sortie est situeacuteeen Europe avec 9463 On remarque lrsquoabsence de sortie au niveau Africain et drsquointer-connexion directe entre les icircles de la ZOI

Sur la figure 221a on remarque qursquoagrave lrsquoexception de Mayotte chaque pays a plus de20 sorties diffeacuterentes Pour La Reacuteunion crsquoest un reacutesultat fortement diffeacuterent de celui ob-tenu dans la section 242 Cela peut srsquoexpliquer par les mecircmes raisons que lors de lrsquoeacutetudepreacuteceacutedente pour rappel les raisons invoqueacutees sont potentiellement des erreurs de geacuteolo-calisation des accords de peering direct dans un pays tiers ou encore de lrsquoencapsulationMPLS

0

5

10

15

20

25

30

35

40

45

50

MG

MU

RE

SC YT

Num

ber

of

links

(a) Nombre de points de sorties pour chaqueicircle de la ZOI

0

20

40

60

80

100

AS

EU NA

Use

d l

inks

()

(b) En fonction du continent

FIGURE 221 ndash Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI

La figure 222 montre la reacutepartition des sorties en pourcentage selon les pays (fig222a) et les continents (222b) pour La Reacuteunion En comparaison avec les reacutesultats ob-tenus preacuteceacutedemment on constate une forte diminution du pourcentage de sorties geacuteo-localiseacutees en France hexagonale (FR) Nous sommes passeacutes de 9699 agrave une valeur de55408 Neacuteanmoins le pourcentage par continent reste extrecircmement eacuteleveacute avec 951636de sorties localiseacutees en Europe

Agrave travers lrsquoanalyse des points de sorties de lrsquoInternet des icircles de la ZOI nous validonslrsquohypothegravese preacutesenteacutee selon laquelle les accords drsquoeacutechanges entre opeacuterateurs des icircles dela ZOI se font agrave travers un Tiers-1

244 Synthegravese des reacutesultats

Lrsquoeacutetude des routes et des deacutelais meneacutee durant nos travaux de thegravese a eacuteteacute diviseacutee entrois grandes parties La premiegravere consistait agrave comparer lrsquoeacutetat actuel avec une eacutetude reacutea-liseacutee quatre ans auparavant La seconde phase de meacutetrologie active a mis en avant uneanalyse plus fine de la connectiviteacute Internet de La Reacuteunion avec lrsquoeacutetude des routes Laderniegravere partie avait pour objectif de comparer la connectiviteacute Internet de La Reacuteunionavec les autres icircles de la ZOI

La campagne de ping meneacutee agrave lrsquoUniversiteacute de La Reacuteunion au sein du LIM a montreacuteune reacuteduction de la longueur des routes depuis La Reacuteunion En deacutepit de la reacuteduction desroutes nous avons constateacute une stabiliteacute des deacutelais aux alentours des 200 ms

71

0

20

40

60

80

100

US-C

O

US

GB

FR

Use

d l

inks

()

(a) par pays

0

20

40

60

80

100

EU NA

Use

d l

inks

()

(b) par continent

FIGURE 222 ndash Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion

Notre seconde eacutetude faite agrave partir de donneacutees de type traceroute meneacutee depuis dif-feacuterents points de mesures reacutepartis sur lrsquoicircle a montreacute des reacutesultats inteacuteressants Le pre-mier reacutesultat est la correacutelation des deacutelais et de la localisation des destinations jointesdepuis lrsquoicircle de La reacuteunion Nous avions constateacute des pics sur la PDF des deacutelais Cespics correspondaient bien agrave la reacutepartition des continents dans notre jeu de destinationsLa longueur des routes est quant agrave elle moins impacteacutee par cette reacutepartition des des-tinations Nous avons tout de mecircme trouveacute une forte symeacutetrie aux courbes peu im-porte le sens de lrsquoeacutetude Agrave partir de ces donneacutees nous avons eacutetudieacute les relations sui-vantes Longueur du chemin Distance geographique Longueur du chemin RTTet RTT Distance geographique La premiegravere concordance a montreacute que la longueurdu chemin nrsquoest pas deacutependante de la distance geacuteographique La seconde correacutelation amontreacute une premiegravere asymeacutetrie des liens En effet le temps associeacute agrave chaque nœud dutrajet est tregraves diffeacuterent selon que lrsquoon quitte ou que lrsquoon essaye de joindre La Reacuteunion Ledernier rapport a mis en eacutevidence une particulariteacute de lrsquoaccegraves Internet de La Reacuteunion Agravelrsquoinverse de tout sens commun les deacutelais provenant et agrave destination de La Reacuteunion vonten deacutecroissant en fonction de la distance geacuteographique Lrsquoanalyse des routes et plus par-ticuliegraverement les points drsquoentreacutees et de sorties logiques de lrsquoInternet reacuteunionnais a permisdrsquoexpliquer ce comportement

Notre derniegravere eacutetude utilise le mecircme protocole et la mecircme plate-forme que lrsquoeacutetudepreacuteceacutedente Nous avons reacuteussi agrave distribuer des sondes sur les icircles de la ZOI Agrave traverscette eacutetude nous avons pu constater un comportement proche pour lrsquoensemble des icircleseacutetudieacutees Ainsi nous avons pu trouver des speacutecificiteacutes de lrsquoInternet de la ZOI La dis-tance geacuteographique a un impact sur la longueur de la route le deacutelai associeacute agrave chaquenœud de la route est similaire Mais surtout le deacutelai pour toute destination baseacutee agrave lrsquoex-teacuterieur drsquoune icircle est plus long pour les distances geacuteographiques courtes Ce comporte-ment srsquoexplique par une inter-connexion des FAI reacutegionaux agrave travers des Tiers-1 situeacutesmajoritairement en Europe

25 Conclusion

Dans ce chapitre nous avons eacutetudieacute la connectiviteacute de La Reacuteunion en terme de deacutelaiset de routes emprunteacutees

Lors de la premiegravere section nous avons vu que La Reacuteunion ne propose pas drsquoinfra-structure permettant la mise en place de notre eacutetude La premiegravere eacutetape fut le deacuteploie-ment de raspberry-pi sur lrsquoensemble de lrsquoicircle Ces sondes connecteacutees agrave lrsquoensemble des FAI

72

et TAI utilisent lrsquooutil Paris-traceroute pour reacutealiser des mesures de deacutelais et de routesCet outil est moins sensible au pheacutenomegravene drsquoeacutequilibrage de charges que le traceroutetraditionnel

Une fois notre plate-forme deacuteployeacutee nous avons reacutealiseacute des mesures durant plusieursmois Ces mesures actives eacutetudient la connectiviteacute depuis et vers La Reacuteunion Cette vo-lonteacute drsquoeffectuer les mesures dans les deux sens provient de la forte preacutesence de routesasymeacutetriques dans lrsquoInternet

Nos donneacutees ont montreacute que La Reacuteunion est confronteacutee agrave ce pheacutenomegravene Nous avonseffectueacute une analyse selon 4 paramegravetres le deacutelai la distance geacuteographique la longueurdu chemin et les routes emprunteacutees La litteacuterature ne proposant pas drsquooutil respectantnos critegraveres de seacutelection nous avons deacuteveloppeacute notre propre outil drsquoanalyse rTrace-route Nous avons souhaiteacute partager notre outil drsquoanalyse agrave travers une publicationDans lrsquoattente drsquoune publication scientifique un site internet deacutedieacute agrave lrsquooutil est dispo-nible [rtraceroute]

Le premier reacutesultat concerne la longueur des routes Les routes reacuteunionnaises sontplus longues que la moyenne mondiale On constate eacutegalement une diffeacuterence selon lesens de communication En eacutetudiant lrsquoimpact de la distance kilomeacutetrique sur la longueuron voit qursquoaucune correacutelation nrsquoexiste entre les deux paramegravetres Les routes Internet dela boucle locale sont aussi longues que les routes reliant des points situeacutes agrave plus de 15 000kmLorsqursquoun paquet traverse un nœud un deacutelai associeacute au traitement agrave lrsquoeacutemission et agrave lapropagation des donneacutees vers le saut suivant peut ecirctre calculeacute Cette valeur diffegravere eacutenor-meacutement selon que lrsquoon quitte ou que lrsquoon joint La Reacuteunion On a un coefficient de 1 79entre les deux valeurs Cela corrobore lrsquoasymeacutetrie des liens mais aucunement un com-portement speacutecifique agrave la connectiviteacute reacuteunionnaiseLrsquoun des reacutesultats les plus inteacuteressants concerne la relation entre la distance geacuteogra-phique et les deacutelais associeacutes Contrairement agrave ce que lrsquoon pouvait attendre la connectiviteacutereacuteunionnaise deacutecroicirct les deacutelais avec lrsquoincreacutementation de la distance lorsque le trafic em-prunte les cacircbles sous-marinsDans lrsquoanalyse des routes nous avons constateacute que lrsquointer-connexion reacutegionale se faitnon pas au sein de la ZOI mais dans une zone eacuteloigneacutee La Reacuteunion possegravede 3 sortiesphysiques que sont lrsquoAsie lrsquoAfrique et lrsquoEurope Pour autant seule la France hexagonalesemble ecirctre inteacuteressante pour les FAI locaux Plus de 97 de nos donneacutees sortent agrave traversce pays localiseacute agrave plus de 10 000 km

Nous avons confirmeacute le fait que lrsquointer-connexion se fait dans une zone eacuteloigneacutee agravetravers lrsquoeacutetude de la connectiviteacute de la ZOI Cette eacutetude a deacutemontreacute un comportementsimilaire entre La Reacuteunion et les icircles de la zone La seule diffeacuterence notable provient dunombre de portes de sorties pour les icircles Neacuteanmoins elles sont agrave une tregraves forte majoriteacutegeacuteolocaliseacutees en Europe

Le deacutelai minimal mesureacute pour La Reacuteunion et la configuration actuelle de la connec-tiviteacute Internet reacuteunionnaise peuvent avoir des conseacutequences sur les performances desprotocoles de transport comme TCP Pour veacuterifier cela une eacutetude de meacutetrologie passivea eacuteteacute reacutealiseacutee Cette eacutetude est preacutesenteacutee dans le chapitre 3

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors dela confeacuterence Asian INTernet Engineering Conference (AINTEC) en 2016 [Noordally2016]Cette publication a eacuteteacute axeacutee sur les reacutesultats reacuteunionnais Une seconde contribution deacute-dieacutee agrave la connectiviteacute des icircles de la ZOI a eacuteteacute publieacutee lors de la confeacuterence Global Informa-tion Infrastructure and Networking Symposium (GIIS) en 2017 [Nicolay2017-2]

73

74

Chapitre 3

Meacutetrologie sur le service de transportagrave La Reacuteunion

TCP est un protocole de transport dont la performance est deacutependante du RTT etdu taux de perte des segments Plus exactement ces deux paramegravetres entrent en comptepour deacuteterminer le deacutelai pris par la fenecirctre de congestion pour qursquoelle atteigne une taillequi couvre le produit deacutelai-bande passante du canal virtuel qui relie la source agrave la desti-nation Aussi TCP voit ses performances reacuteduites lorsque ce produit augmente et changede facteur drsquoeacutechelle Les reacutesultats obtenus par lrsquoeacutetude de la connectiviteacute de lrsquoicircle de LaReacuteunion ont montreacute un RTT minimal de 180 ms pour le trafic quittant lrsquoicircle de La Reacuteunion(cf tableau 210) Avec les technologies drsquoaccegraves agrave haut deacutebit il devient techniquementpossible que des connexions TCP depuis ou vers La Reacuteunion souffrent des symptocircmesque lrsquoon retrouve avec lrsquoutilisation drsquoun LFN

Dans ce chapitre nous allons eacutetudier quel peut ecirctre lrsquoimpact de la capaciteacute de stockagedes canaux de communication depuis et vers lrsquoicircle La Reacuteunion sur les performances deTCP Pour cela nous allons nous appuyer sur de la meacutetrologie passive afin de pouvoirfaire des observations sur la performance de TCP Dans ce chapitre nous preacutesentonsla meacutethode que nous avons appliqueacutee afin drsquoestimer par la meacutetrologie le service quenous obtenons agrave La Reacuteunion Lrsquoobjectif ici nrsquoest pas drsquoobtenir des reacutesultats repreacutesentatifsde lrsquoInternet applicables agrave La Reacuteunion dans sa globaliteacute mais de mener une premiegravereexpeacuterience pour valider la meacutethode et les outils que nous pourrions ensuite appliqueraupregraves des diffeacuterents opeacuterateurs locaux

Ce chapitre se compose de quatre sections La premiegravere section 31 fixe les objectifs delrsquoeacutetude de meacutetrologie Elle preacutesente les meacutetriques agrave deacuteterminer pour pouvoir atteindreces objectifs La partie 32 preacutesente la meacutethode de mise en œuvre de la plate-forme demeacutetrologie Le protocole de mesure mis en place pour la reacutealisation drsquoune eacutetude est preacute-senteacute dans la section 33 Enfin cette section est suivie par la partie 34 qui preacutesente lesreacutesultats que lrsquoon peut obtenir et lrsquointerpreacutetation qui peut en ecirctre faite

31 Objectifs

Lrsquoeacutetude des deacutelais aller-retour (RTT) et des routes Internet de lrsquoicircle de La Reacuteunion quenous avons preacutesenteacutee dans le chapitre preacuteceacutedent a mis en eacutevidence une connectiviteacute speacute-cifique Lrsquoaccegraves agrave lrsquoInternet passe principalement par la meacutetropole avec un RTT minimalde 180 ms Ce RTT multiplieacute par un deacutebit drsquoaccegraves de 1 Mbits deacutebit theacuteorique minimalproposeacute dans les diffeacuterentes offres par les FAI donne une quantiteacute de donneacutees eacutemisespar anticipation de 22 5 Ko Ce calcul prend comme hypothegravese que le goulot drsquoeacutetran-glement est le lien drsquoaccegraves de lrsquohocircte Ce produit deacutelai bande passante repreacutesente la taille

75

de la fenecirctre drsquoeacutemission agrave partir de laquelle une transmission continue de lrsquoeacutemetteur de-vient possible Avec une valeur de 22 5 Ko cela place le canal de communication de LaReacuteunion dans la cateacutegorie des reacuteseaux agrave forte capaciteacute de stockage (LFN) Dans la section21 nous avons vu que La Reacuteunion est pleinement inteacutegreacutee au plan tregraves haut deacutebit delrsquoeacutetat franccedilais Ce plan a pour objectif de deacuteployer une infrastructure de distribution enfibre optique (Fiber To The Home (FTTH)) sur lrsquoensemble du territoire franccedilais Cela aurapour conseacutequence si les deacutelais ne sont pas en diminution drsquoaugmenter la capaciteacute destockage du canal de communication

311 Les objectifs de lrsquoeacutetude

Le lien drsquoaccegraves de La Reacuteunion conduit agrave consideacuterer lrsquoInternet avec les caracteacuteristiquesdrsquoun reacuteseau agrave forte capaciteacute de stockage Ceci est ducirc agrave un deacutelai minimal eacuteleveacute Avec cedeacutelai des deacutegradations potentielles des performances de TCP sont envisageables La miseen place drsquoune eacutetude de meacutetrologie passive agrave lrsquoeacutechelle reacutegionale nrsquoa pas encore eacuteteacute reacuteali-seacutee Les opeacuterateurs ont une connaissance partielle de la situation de lrsquoicircle Afin drsquoobtenirune vision globale de lrsquousage de lrsquoInternet sur lrsquoicircle de La Reacuteunion il nous faut reacutepondreaux diffeacuterentes questions suivantes

mdash Quel est lrsquoimpact de lrsquoaugmentation de la capaciteacute de stockage sur les performancesdu protocole TCP

mdash Est-ce que lrsquoaugmentation des deacutebits theacuteoriques est reacutecupeacutereacutee dans les deacutebits me-sureacutes par TCP

Dans la section 123 nous avons preacutesenteacute lrsquoarticle [Zheleva2015] Pour rappel dans cettepublication les auteurs ont mis en avant un changement drsquoutilisation des services Internetapregraves une augmentation de la bande passante Nous allons eacutegalement reacutepondre agrave desquestions orienteacutees vers la supervision du trafic Ces questions sont les suivantes

mdash Quels sont les protocoles de transport utiliseacutes

mdash Quels sont les services les plus freacutequents

mdash Quelle est la distribution geacuteographique des services joints

Les reacuteponses agrave ces questions impliqueront lrsquoapparition drsquoautres questions

312 Les meacutetriques de lrsquoeacutetude

Le tableau 31 indique les meacutetriques que lrsquoon va eacutetudier Chaque meacutetrique eacutetudieacuteesera mise en relation avec une des questions poseacutees preacuteceacutedemment

Meacutetriques de supervision

La supervision du trafic consiste agrave analyser le flux geacuteneacuteral de paquets qui transite ausein drsquoun eacutequipement comme un routeur ou un commutateur On parle drsquoeacutetude macro-scopique telle qursquoindiqueacutee dans le rapport [Owezarski2003-1] Les informations analy-seacutees par la supervision sont geacuteneacuteralement les informations analyseacutees par un adminis-trateur Reacuteseau ou encore un FAI En reacuteponse aux questions sur la supervision nousavons seacutelectionneacute dans un premier temps lrsquoidentification des protocoles de transportLe champ protocole de lrsquoen-tecircte IP indique le protocole de niveau suivant utiliseacute dans lapartie des donneacutees du datagramme Internet [RFC760] Les valeurs des diffeacuterents proto-coles sont speacutecifieacutees en reacutefeacuterence [RFC3232 IANA-port]

76

TABLE 31 ndash Les meacutetriques de meacutetrologie passive

Meacutetriques En-tecircte Champs

Supervisiondu trafic

Caracteacuterisation des destinationsIP

Adressessources etdestinations

Protocole de transport employeacute ProtocoleService utiliseacute

TCP

Numeacutero deport

Performanceprotocolaire

Performance deTCP

Eacuteveacutenement de congestion ECNNS+ CWRNumeacutero deseacutequence

RTT TimestampPertes Numeacutero de

seacutequencedeacute-seacutequencementsRetransmissions

Deacutebits binaires

EacutecouleacuteTimestampNumeacutero deseacutequencefenecirctre

DescendantMontant

UtileCaracteacuterisationdes flots

DeacutebitDureacutee Timestamp

Longueur Nombrede paquetseacutechangeacutes

Nous avons vu preacuteceacutedemment que les services eacutevoluent dans le temps et selon lesdeacutebits [Zheleva2015] Lrsquoanalyse du champ numeacutero de port de lrsquoen-tecircte TCP aide agrave lrsquoidenti-fication du Service utiliseacute Chaque numeacutero de port est associeacute agrave un service preacutecis deacutefinidans le [RFC776]

En regravegle geacuteneacuterale le trafic Internet est diviseacute en trois cateacutegories en fonction de ladestination par rapport agrave la source Crsquoest le groupe de travail 802 de lrsquoIETF qui est encharge des caracteacuterisations

mdash Local Area Network (LAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir une zonede quelques kilomegravetres carreacutes ou moins Parce que le reacuteseau est connu pour necouvrir qursquoune petite zone des optimisations peuvent ecirctre faites dans les protocolesde signal de reacuteseau qui permettent des deacutebits de donneacutees jusqursquoagrave 100 Mbits raquo[RFC1983]

mdash Metropolitan Area Network (MAN) laquo Un reacuteseau de donneacutees destineacute agrave desservir unezone proche de celle drsquoune grande ville Ces reacuteseaux sont mis en œuvre par destechniques innovantes comme le passage de cacircbles agrave fibres optiques dans les tun-nels du meacutetro raquo [RFC1983]

mdash Wide Area Network (WAN) laquo Un reacuteseau geacuteneacuteralement construit avec des lignesseacuteries qui couvrent une large zone geacuteographique raquo [RFC1983]

La reacutepartition des adresses IP de destination va permettre drsquoidentifier le pays ougrave se si-tue lrsquoinformation Cette information peut permettre de connaicirctre la pertinence du lieudrsquoheacutebergement de lrsquoinformation par rapport au service et agrave lrsquoapplication utiliseacutee Nousutilisons pour cela la base de donneacutees associeacutee agrave lrsquooutil rTraceroute outil drsquoanalyse gra-phique des traces preacutesenteacute dans la section 222 Dans le cas ougrave une adresse IP nrsquoest pas

77

reacutepertorieacutee dans notre base de donneacutees lrsquoinformation sera extraite de la base de donneacuteesde RIPE NCC avec lrsquooutil rgeoloc [LanYanFock2015]

Meacutetriques de performance

Le groupe de travail IPPM de lrsquoIETF a deacutefini dans diffeacuterents documents des meacutetriquesde bases comme la mesure de connectiviteacute [RFC2678] le deacutelai unidirectionnel [RFC2679]le taux de perte unidirectionnel [RFC2680] Ces deux derniegraveres meacutetriques sont eacutegalementdeacutefinies dans le sens aller-retour avec le [RFC2681]

Nous avons comme objectif la comparaison du deacutebit theacuteorique et le deacutebit mesureacute Lecalcul du deacutebit mesureacute par TCP se fait agrave travers 3 meacutetriques le RTT la taille de la fe-necirctre drsquoeacutemission et la probabiliteacute de perte de paquets Le RTT est le deacutelai entre la misedu premier bit de la question sur le cacircble et la reacuteception du dernier bit de la reacuteponse[RFC2681] Il est calculeacute par la diffeacuterence de temps entre lrsquoeacutemission du paquet et la reacute-ception de lrsquoACK correspondant Si le RTT est trop important TCP peut consideacuterer unpaquet comme perdu

Une perte est deacutefinie comme laquo lrsquoeacutemission drsquoun paquet par la source mais non reccedilupar la destination raquo [RFC2680] Si le paquet est perdu alors TCP va reacuteduire la fenecirctredrsquoeacutemission

La fenecirctre drsquoeacutemission est calculeacutee agrave partir du champ Fenecirctre des segments TCP Cechamp est deacutefini dans le [RFC6528] comme le nombre drsquooctets de donneacutees commenccedilantpar celui indiqueacute dans le champ drsquoaccuseacute de reacuteception que lrsquoexpeacutediteur de ce segment estprecirct agrave accepter

Agrave lrsquoaide de la formule indiqueacutee par lrsquoeacutequation 31 il est possible de calculer le deacutebitmesureacute par TCP

Debit =FenetreRTTradic

Probabilite perte(31)

Les deacutebits mesureacutes pourront ecirctre classeacutes selon qursquoils soient montants descendantsconfondus ou utiles Cette diffeacuterenciation srsquoexplique par le fait que la comparaison avecle deacutebit theacuteorique est montant et descendant Le deacutebit eacutecouleacute (throughput) correspond laquo aunombre de paquets ou de bits par seconde raquo [RFC6201] Le deacutebit utile (goodput) corres-pond laquo au nombre de paquets ou de bits utiles (non retransmis) par seconde raquo[RFC5166]

Lrsquoeacutetude des performances du protocole TCP passe dans un premier temps par lrsquoeacutetudedes pertes et des retransmissions

Une retransmission est deacutefinie par le [RFC6298] comme eacutetant le laquo segment le plusancien qui nrsquoa pas eacuteteacute acquitteacute par le reacutecepteur TCP raquo Pour obtenir le nombre de re-transmissions on regarde les numeacuteros de seacutequences des segments TCP Si dans un flotIP un numeacutero de seacutequence apparaicirct plusieurs fois alors cela implique la retransmissiondu paquet Les retransmissions seront seacutepareacutees selon la raison de la retransmission (fastretransmit) ou retransmissions abusives (spurious retransmit)Le [RFC5681] explique le pheacutenomegravene pouvant provoquer une retransmission par le meacute-canisme de fast retransmit La retransmission drsquoun paquet due au meacutecanisme de fast re-transmit est calculeacutee en fonction du nombre drsquoacquittements dupliqueacutes et de la diffeacuterencetemporelle entre le paquet de donneacutees observeacutees et le preacuteceacutedent acquittementLes paquets spurious retransmit sont des paquets subissant des fausses retransmissions Sile numeacutero de seacutequence du paquet attendu est infeacuterieur ou eacutegal au numeacutero drsquoacquittementdu preacuteceacutedent ACK alors le paquet observeacute est un paquet retransmis abusivement

78

Lorsque le paquet est reacute-eacutemis il va se produire du deacute-seacutequencement Le deacute-seacutequencementse deacutefinit dans le [RFC6248] laquo Lrsquoarriveacutee ordonneacutee est une proprieacuteteacute que lrsquoon trouve dansles paquets qui transitent par leur chemin ougrave le numeacutero de seacutequence des paquets aug-mente avec chaque nouvelle arriveacutee et il nrsquoy a pas de reacutegression La deacutetection du reacute-ordonnancement agrave destination est baseacutee sur lrsquoordre drsquoarriveacutee des paquets par rapport agraveune valeur de reacutefeacuterence non inverseacutee raquo

Les paquets retransmis peuvent eacutegalement servir agrave lrsquoidentification des eacuteveacutenementsde congestion Pour identifier ces eacuteveacutenements deux techniques peuvent ecirctre mises enplaceLa premiegravere consiste a eacutetudier la preacutesence des drapeaux ECN et Congestion Window Re-duce (CWR) dans les en-tecirctes des paquets TCP [RFC8311]La seconde technique se propose drsquoeacutetudier les variations de la fenecirctre drsquoeacutemission de TCPCette eacutetude doit ecirctre coupleacutee avec lrsquoanalyse des pheacutenomegravenes de pertes et de retransmis-sion autour de cet eacuteveacutenement

Dans la section 112 nous avons constateacute que la capaciteacute de stockage drsquoun lien estprobleacutematique pour les flots courts Afin de poursuivre lrsquoeacutetude de lrsquoimpact de la capa-citeacute de stockage des liens de lrsquoInternet reacuteunionnais nous allons caracteacuteriser les flux Lacaracteacuterisation drsquoun flot peut se faire selon la dureacutee (temps eacutecouleacute entre le premier etle dernier paquet) la taille (nombre de paquets eacutechangeacutes) et le ratio entre la dureacutee et lataille Drsquoapregraves les travaux reacutealiseacutes par [Lan2006] un flot se caracteacuterise par la deacutefinitionsuivante laquo a flow is an unidirectional series of IP packets with same source and destinationaddresses port numbers and protocol numbers raquo Ce qui peut se traduire par la deacutefinition sui-vante laquo un flot est une seacuterie de paquets IP avec le mecircme tuple suivant (adresse IP sourceport source adresse IP destination port destination protocole IP) raquo Dans ce cas preacutecisune connexion TCP de par son coteacute bi-directionnel est constitueacutee de deux flots

32 Mise en oeuvre drsquoune plate-forme de meacutetrologie

La mise en place drsquoune eacutetude de meacutetrologie passive au sein du territoire reacuteunionnaissoulegraveve trois contraintes

La premiegravere est la mise en place drsquoun accord de partenariat avec un ou plusieurs FAILrsquoobjectif de ce partenariat est la mise en place drsquoun systegraveme drsquoeacutecoute et de capture dedonneacutees au sein de leur infrastructure tout en garantissant une confidentialiteacute maximaleagrave leur clients et agrave lrsquoentreprise

Une seconde contrainte est la seacutelection drsquoun outil de mesure Cet outil sera capablenon seulement drsquoeacutecouter les donneacutees circulant sur une interface mais eacutegalement de cap-turer les donneacutees sous diverses extensions

La derniegravere contrainte est lieacutee agrave la seacutelection drsquoun outil drsquoanalyse Cet outil sera ca-pable drsquoapporter un support de reacuteponses aux questions poseacutees preacuteceacutedemment Il devrareacutepondre agrave des critegraveres que lrsquoon deacutetaillera par la suite

Le trafic eacutetant variable drsquoun instant t agrave lrsquoinstant t+1 nous allons mettre en place un sys-tegraveme de capture de donneacutees Ce systegraveme permettra lrsquoanalyse a posteriori des meacutetriquesEn fonction des reacutesultats drsquoautres meacutetriques pourront ecirctre extraites des donneacutees Deplus la capture nous autorise apregraves quelques deacutemarches administratives de partagerles traces aupregraves de la communauteacute scientifique

321 Pour la capture du trafic

Nous avons vu dans le chapitre 1 que les outils neacutecessaires agrave la reacutealisation drsquoeacutetudes demeacutetrologie passive sont nombreux Notre analyse sera la plus large possible en terme de

79

meacutetriques Nous devrons en fonction des reacutesultats obtenus eacutetudier drsquoautres meacutetriquesque celles choisies en premier lieu Pour ces raisons nous faisons le choix de reacutealiser descaptures du trafic Dans la section 123 nous avons preacutesenteacute les outils disponibles pourla capture de trafic Nous allons dans un premier temps utiliser une solution logicielleDans le cas ougrave les deacutebits sur les liens seraient trop eacuteleveacutes nous basculerons alors vers unesolution mateacuterielle

322 Pour analyser les traces

De nombreux outils drsquoanalyse de traces existent dans la litteacuterature Afin drsquoen choi-sir un nous allons deacutetailler des critegraveres de seacutelection Nous preacutesenterons quelques outilsdrsquoanalyse existants en mettant en avant leurs reacuteponses aux critegraveres preacutesenteacutes Nous fini-rons par la preacutesentation drsquoun outil drsquoanalyse de traces deacuteveloppeacute au sein du LIM

Deacutefinition des critegraveres

Lrsquooutil drsquoanalyse pour la plate-forme de meacutetrologie passive devra reacutepondre aux cri-tegraveres de seacutelection suivants

1 Protection de la vie priveacutee des utilisateurs Pour respecter ce critegravere une fonctiondrsquoanonymisation des traces doit ecirctre appliqueacutee La loi Informatique et Liberteacute de1978 reacuteglemente le traitement des donneacutees personnelles [LIL1978] Une trace estune eacutecoute drsquoun trafic initieacute par un utilisateur Les donneacutees transporteacutees nrsquoont pasagrave ecirctre lues En plus des donneacutees ce sont aussi les adresses IP qui ne doivent pasapparaitre en clair

2 traiter une volumeacutetrie importante Le volume des traces eacutetant variable il est neacuteces-saire que lrsquooutil soit capable de traiter des traces de grande taille Potentiellementce sont des fichiers de traces de plusieurs dizaines de Go (Giga-octets) qui peuventecirctre ameneacutes agrave ecirctre traiteacutes

3 proposer des meacutetriques adapteacutees Pour reacutealiser une analyse approfondie il fautque la liste des meacutetriques proposeacutees par lrsquooutil drsquoanalyse soit la plus large possibleAgrave ce titre nous avons preacutesenteacute dans le tableau 31 une base de meacutetriques a analyser

Les outils drsquoanalyse disponibles

Il existe de nombreux outils drsquoanalyse de donneacutees de meacutetrologie passive Nous pro-posons une classification selon les possibiliteacutes offertes par chaque outil CAIDA pro-pose sur son site internet une partie deacutedieacutee aux diffeacuterents outils de meacutetrologie passive[CAIDA-Tools]

BRO est un outil pour la deacutetection drsquointrus sur le reacuteseau en temps-reacuteel agrave partir demeacutetrologie passive Il est preacutesenteacute pour la premiegravere fois dans lrsquoarticle [Paxson1999] Agravepartir drsquoun systegraveme de script il accepte en entreacutee des fichiers de taille importante Leprincipal deacutefaut de Bro par rapport agrave nos critegraveres de seacutelection est le non-respect de la viepriveacutee

CoralReef [Moore2001] est une suite logicielle deacuteveloppeacutee par CAIDA en 1999 Cetoutil reacutealise des analyses de donneacutees que ccedila soit en temps reacuteel ou sur des traces Le critegraverede respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pas respecteacuteLrsquooutil est plus adapteacute agrave lrsquoeacutetude des caracteacuteristique du trafic qursquoau performance de TCPAinsi les meacutetriques lieacutees agrave lrsquoeacutetude des performances ne sont pas incluses dans le code delrsquooutil

Netflow est un outil proprieacutetaire Il neacutecessite lrsquoutilisation drsquoun mateacuteriel de la marqueCISCO plus la licence du logiciel Lrsquooutil reacutealise principalement la supervision du trafic

80

transitant sur le mateacuteriel Le respect de la vie priveacutee est ici respecteacute mais les meacutetriques deperformance protocolaire ne sont pas inclues

TCPStat [Herman2001] rapporte certaines statistiques du trafic transitant agrave traversune interface reacuteseau Crsquoest un outil qui peut travailler sur un flot en temps reacuteel ou enanalysant un fichier de trace Cet outil ne permet pas lrsquoanonymisation des adresses IPPeu de meacutetriques sont ainsi renseigneacutees On pourrait obtenir les deacutebits et la volumeacutetriedes paquets IPv4 eacutechangeacutes

TCPTrace [Ostermann2000] est un logiciel qui permet le traitement de traces drsquoeacutecouteOutil tregraves complet il a deacutejagrave fait ses preuves sur drsquoautres projets de meacutetrologie passive Lecritegravere de respect de la vie priveacutee tel que nous lrsquoavons deacutefini preacuteceacutedemment nrsquoest pasrempli La meacutetrique de caracteacuterisation des destinations et la reacutepartition geacuteographique nesont pas incluses dans les meacutetriques proposeacutees par lrsquooutil

Tstat [Mellia2003-1] est un outil qui peut reacutealiser la collecte et lrsquoanalyse du trafic Cetteanalyse se fait sur diffeacuterents niveaux passant des paquets agrave la couche applicative Cetteanalyse reacutealise une anonymisation des adresses IP Les meacutetriques de caracteacuterisations desdestinations et de reacutepartitions geacuteographiques ne sont pas inteacutegreacutees dans lrsquooutil

Wireshark [Orebaugh2006] est un outil graphique drsquoanalyse reacuteseau tregraves reacutepandu Cetoutil permet de filtrer et drsquoanalyser des donneacutees entrantes et sortantes drsquoun point entemps reacuteel ou sur des traces collecteacutees Il autorise eacutegalement la capture et la lecture detraces Lrsquooutil preacutesente des lacunes sur les trois critegraveres preacutesenteacutes

ZOO est un outil deacuteveloppeacute dans le cadre du projet Metropolis Creacuteeacute par le Labora-toire drsquoAnalyse et drsquoArchitecture des Systegravemes (LAAS) le logiciel essaie de trouver un moyende mesurer la qualiteacute du service de trouver des paramegravetres pour deacutefinir le processus detrafic et drsquoaider agrave eacutemettre un modegravele adapteacute pour le trafic [Owezarski2004] Au niveaudes meacutetriques preacutesenteacutees ce sont principalement des statistiques et des informations desupervision qui sont disponibles Lrsquoanonymisation des adresses IP nrsquoest pas incluse dansles caracteacuteristiques de lrsquooutil

Le tableau 31 sert de base pour la reacuteponse aux critegraveres deacutedieacutes des meacutetriques Netflowpossegravede un catalogue de meacutetriques restreint agrave la supervision du trafic TCPTrace et Tstatsont des outils qui auraient pu correspondre agrave nos besoins mais les meacutetriques de caracteacute-risation des destinations et la reacutepartition geacuteographiques sont absentes Nrsquoayant pu faireun choix sur un outil pouvant reacutepondre agrave la totaliteacute des critegraveres nous nous orientons versle deacuteveloppement drsquoun analyseur de traces

Deacuteveloppement de Xanalyse

Lrsquoanalyse des traces de meacutetrologie passive peut srsquoeffectuer avec de nombreux outilsDans la section preacuteceacutedente nous avons preacutesenteacute les critegraveres de diffeacuterenciation de cesoutils Tstat et TCPTrace sont des outils tregraves complets Ces deux outils auraient pu nousconvenir Neacuteanmoins le temps de traitement des fichiers de volumeacutetrie importante estbeaucoup trop important Ducirc agrave cela nous avons pris le parti de deacutevelopper un nouveloutil drsquoanalyse de traces Xanalyse

Le premier critegravere concerne le respect de la vie priveacutee Une approche simple pouranonymiser une adresse IP est de la faire correspondre avec une adresse IP aleacuteatoireUne telle meacutethode rend la trace inutilisable dans des situations utilisant la logique desadressages IP Lrsquoanonymisation drsquoadresse est performante si elle preacuteserve le mecircme preacute-fixe Autrement dit si deux adresses IP partagent k-bits de preacutefixes leurs eacutequivalencesanonymiseacutees conserveront ces k-bits de preacutefixes en commun La meacutethode crypto-pan deacute-crite dans lrsquoarticle [Xu2002] sert de base agrave la fonction drsquoanonymisation mise en œuvreLrsquoanonymisation srsquoappliquera que lors de lrsquoaffichage des reacutesultats Nous avons besoin de

81

lrsquoadresse pour deux meacutetriques de supervision que sont la reacutepartition du trafic et la geacuteo-localisation Concernant le champ Donneacutees des paquets TCP il nrsquoest pas utiliseacute Lrsquoeacutetudene recommande que les en-tecirctes

Sur lrsquoaspect du traitement drsquoune volumeacutetrie importante Xanalyse fut deacuteveloppeacute avecla volonteacute de maximiser lrsquoutilisation des ressources de la machine hocircte Pour cela nousavons eu lrsquoideacutee drsquoutiliser la programmation parallegravele (thread) La paralleacutelisation permetlrsquoexeacutecution de plusieurs instructions simultaneacutement

Le calcul des meacutetriques fut directement reacutealiseacute en consideacuterant leurs deacutefinitions dansles diffeacuterents RFC tel que nous lrsquoavons deacutecrit dans la section 312 Une partie statistiquefut eacutegalement inteacutegreacutee agrave notre outil Des calculs de moyenne de variance et drsquoeacutecart-typefurent inteacutegreacutes Ces calculs se font agrave la toute fin du programme Durant le deacuteveloppe-ment nous avons corroboreacute lrsquoensemble de nos reacutesultats avec les reacutesultats de TCPTraceCette comparaison a eacuteteacute mise en place pour veacuterifier lrsquoexactitude de nos reacutesultats Le deacuteve-loppement de lrsquooutil fut reacutealiseacute sous ma direction dans le cadre drsquoun stage de fin drsquoeacutetudede Master 2 [Ravoavahy2017]

Pour finir nous avons reacutealiseacute une validation par comparaison entre Xanalyse et TCP-Trace Le tableau 32 montre le bilan de cette comparaison

TABLE 32 ndash Comparaison de performances

TCPTrace XanalyseTemps drsquoanalyse sur une trace de 20 Go 10 jours 7 joursTemps drsquoanalyse sur une trace de 1 Go 1 Heure 3 Min

Xanalyse se reacutevegravele ecirctre un outil beaucoup plus rapide que TCPTrace avec des reacutesul-tats identiques sur le calcul des meacutetriques Cet outil est actuellement disponible sur lesite du laboratoire agrave lrsquoadresse suivante httplimuniv-reunionfrxanalyse

33 Protocole de mesure

Le protocole de mesure preacutesente les diffeacuterentes phases que lrsquoon souhaite mettre enplace durant lrsquoeacutetude Elles sont ainsi au nombre de cinq les contraintes reacuteglementairesla veacuterification des perturbations la capture du trafic la collecte et lrsquoanalyse Ce protocolefut reacutedigeacute en prenant en consideacuteration les conseils indiqueacutes dans [John2010] Dans cetarticle les auteurs deacutelivrent diffeacuterents conseils et indications baseacutes sur lrsquoexpeacuterience deplusieurs acteurs de meacutetrologie passive

Notre protocole a eacuteteacute mis en place dans le but de rassurer lrsquoensemble des acteurs Ceprotocole fut testeacute dans le cadre drsquoune eacutetude de meacutetrologie passive du LIM

Contraintes reacuteglementaires Avant toute eacutetude de meacutetrologie Internet passive au seinde lrsquoUniversiteacute de La Reacuteunion il faut obtenir lrsquoautorisation du preacutesident de lrsquoeacutetablisse-ment Le preacutesident consultera le Correspondant Informatique et Liberteacutes (CIL) et le Respon-sable Seacutecuriteacute et Systegravemes drsquoInformation (RSSI) de lrsquouniversiteacute Ces personnes deacutefiniront enfonction des objectifs de lrsquoeacutetude les limites de notre eacutetude en accord avec les lois fran-ccedilaises Les limites imposeacutees par la preacutesidence de lrsquoUniversiteacute indiqueacutees par le CIL et leRSSI furent celles autour de la vie priveacutee Agrave ce titre nous nrsquoavions pas le droit drsquoeacutetudierle trafic en temps reacuteel nrsquoy drsquoeacutetudier le champ Donneacutees des paquets TCP Nous avionseacutegalement lrsquoobligation drsquoanonymiser lrsquoensemble des adresses IP priveacutees rencontreacutees Laderniegravere obligation fut la restriction de nos eacutecoutes au LIM Ces obligations furent res-pecteacutees dans le deacuteveloppement de lrsquooutil drsquoanalyse

82

Afin de ne capturer que le trafic du Laboratoire nous avons travailleacute en collaborationavec la Direction des Services Informatiques (DSI) de lrsquoUniversiteacute Ce partenariat a pourobjectif drsquoisoler le trafic du LIM dans un Virtual Local Area Network (VLAN) speacutecifique UnVLAN est laquo un meacutecanisme par lequel les hocirctes qui reacutesident dans la mecircme infrastructurephysique commuteacutee mais des domaines de diffusion virtuelle seacutepareacutes sont adresseacutes agravepartir du mecircme sous-reacuteseau IPv4 et partagent une adresse IP de passerelle par deacutefautcommune supprimant ainsi lrsquoexigence drsquoun sous-reacuteseau IP deacutedieacute pour chaque reacuteseaulocal virtuel (Local Area Network (LAN) ou MAN) raquo [RFC3069] Les VLAN seacuteparent lesusagers selon leur autorisations et les types de connexion Par exemple un enseignant-chercheur a plus de droits qursquoun eacutetudiant Une personne connecteacutee par connexion filairea des droits diffeacuterents drsquoune personne connecteacutee par agrave un reacuteseau sans fil Le RSSI delrsquoUniversiteacute ne souhaitant pas obliger les membres du LIM agrave participer agrave cette eacutetudeune campagne de preacutevention fut organiseacutee Les personnes ayant explicitement eacutemis lesouhait de ne pas participer agrave notre eacutetude seraient de facto connecteacutees agrave un autre VLANpar la DSI Au sein du laboratoire tout le personnel a accepteacute de participer agrave notre eacutetude

Veacuterification des perturbations La figure 31 illustre lrsquointer-connectiviteacute mise en placepour lrsquoeacutecoute du LIMChaque ordinateur du laboratoire geacutenegravere un trafic Internet qui passe par le VLAN dulaboratoire Par le systegraveme de port-mirroring le routeur va creacuteer une copie des paquetstransitant par le port du VLAN laboratoire Le paquet copieacute sera alors redirigeacute vers lasonde de capture La sonde de capture aura deux interfaces reacuteseaux La premiegravere (Eth0)sera deacutedieacutee agrave la capture des paquets provenant de la technique de port-mirroring La se-conde carte reacuteseau (Eth1) servira pour lrsquoaccegraves distant agrave la sonde de captureLrsquoordinateur drsquoaccegraves possegravede une cleacute priveacutee permettant lrsquoaccegraves agrave distance agrave la sonde decapture Cette porte drsquoentreacutee seacutecuriseacutee permet une gestion agrave distance de la sonde Lestraces collecteacutees seront transfeacutereacutees sur un serveur de stockage deacutedieacute au sein du LIM Letransfert se fera agrave lrsquoaide de la commande SCP et lrsquoaccegraves seacutecuriseacute preacutesenteacute preacuteceacutedemmentLrsquoaccegraves distant et le transfert des traces font partie inteacutegrante du trafic geacuteneacutereacute par lesmembres du laboratoire Les perturbations peuvent survenir agrave deux niveaux au routeuret agrave la sonde Au niveau de la sonde drsquoeacutecoute le deacutebit affecteacute en entreacutee-sortie du VLANdu laboratoire est eacutegal agrave 1 000 Mbits Ce deacutebit est devenu freacutequent sur les cartes reacuteseauxvendues sur les ordinateurs grand public Les caracteacuteristiques de la carte reacuteseau deacutedieacuteeagrave la capture accepte un deacutebit maximum eacutegal au deacutebit du VLAN du LIM On considegraverealors que le taux de pertes occasionneacute par la carte de capture peut ecirctre neacutegligeableAu niveau du routeur la fonction port-mirroring copie lrsquointeacutegraliteacute des segments IP en-trant sur un port Le paquet original est redirigeacute vers lrsquoadresse de destination incluse dansle champ destination de lrsquoen-tecircte IP Le paquet forgeacute au sein du routeur est dirigeacute versun port deacuteclareacute lors de la programmation de lrsquoeacutequipement La fonction de port-mirroringfait partie des techniques deacuteveloppeacutees dans le but drsquoeacutetudier le comportement drsquoun reacute-seau [Zhang2007] a eacutetudieacute les deacuterives lieacutes agrave la fonction port-mirroring Cette fonctionneacutecessite la mise en meacutemoire tampon des paquets provenant du lien eacutetudieacute jusqursquoagrave ceqursquoils puissent ecirctre transmis sur le lien miroir Cette mise en meacutemoire tampon joue sur lasynchronisation des paquets entre le lien eacutetudieacute et le lien miroir Lors de la transmissiondes paquets sur le lien miroir est-ce que la transmission srsquoest faite dans lrsquoordre drsquoarriveacuteesur le port eacutetudieacute Il y a donc une question drsquoordonnancement des paquets agrave eacutetudier Lameacutemoire tampon du routeur nrsquoest pas infinie Il existe donc des cas ougrave la meacutemoire estremplie occasionnant agrave ce moment lagrave des pertes Les reacutesultats de [Zhang2007] ont misen avant une diffeacuterence de synchronisation entre les paquets du lien eacutetudieacute et les paquetsdu lien miroir La diffeacuterence de synchronisation implique eacutegalement des erreurs dans lereacute-ordonnancement des paquets Ces erreurs auront pour conseacutequences des erreurs dans

83

lrsquoanalyse des performances de TCP Pour reacutesoudre ces problegravemes les auteurs preacuteconisentlrsquousage drsquoune carte physique speacutecifique agrave lrsquoeacutetude passive comme les cartes DAG

FIGURE 31 ndash Scheacutema de distribution de la plate-forme de mesure

Capture du trafic La mise en place des mesures se fait degraves la mise sous tension de lasonde et la fin du chargement du systegraveme drsquoexploitation La capture des donneacutees auraune dureacutee comprise entre 1 et 23 heures Elle srsquoeffectue agrave lrsquoaide de la commande

tcpdump -i eth0 -w trace-$timestamptrace amp

Dans laquelle les options indiquent

mdash -i eth0 indique lrsquointerface de capture Nous avons preacutevu une seconde interfacereacuteseau pour lrsquoaccegraves distant seacutecuriseacute

mdash -w trace-$timestamptrace cette option deacutesigne le fichier drsquoeacutecriture Les fichiers sontnommeacutes par le timestamp de deacutebut

Une fois la capture finie la sonde va deacutecider du temps avant la prochaine eacutecouteCette dureacutee nrsquoexceacutedera pas 24 heures Lrsquoobjectif est drsquoavoir des mesures quotidiennesmais programmeacutees de maniegravere aleacuteatoire sur la dureacutee drsquoeacutecoute et sur lrsquoeacutecart entre deuxmesures

Le paragraphe de veacuterifications des perturbations a deacutemontreacute qursquoil est difficile demettre en place une capture de la totaliteacute des paquets Une solution de capture est lrsquoeacutechan-tillonnage Dans notre cas nous avons reacutealiseacute un eacutechantillonnage indeacutependant du contenu[RFC5475] Cet eacutechantillonnage est reacutealiseacute sans prendre en consideacuteration le contenu dupaquet Ayant une volonteacute drsquoobtenir un grand nombre de donneacutees nous avons mis enplace une dureacutee de capture maximale de 23 heures et un eacutecart entre deux captures de 24heures

Collecte Une phase de collecte des traces est reacuteguliegraverement reacutealiseacutee Lrsquoobjectif est delibeacuterer de lrsquoespace disque au niveau de la sonde de capture Lorsque la sonde a fini dereacutealiser sa capture elle va envoyer le fichier de capture vers un serveur de stockage ausein du LIM Nous avons vu que le fichier de capture est nommeacute selon une nomenclaturespeacutecifique Pour rappel cette nomenclature comporte la date (au format timestamp) dudeacutebut de lrsquoeacutecoute La deacutenomination du fichier autorise un classement des traces par datede capture Ce classement peut permettre une eacutetude temporelle du trafic

Lrsquoenvoi du fichier se fait agrave travers lrsquointerface eth1 La technique utiliseacutee pour le trans-fert est la commande SCP Lrsquoutilisation de lrsquoempreinte MD5 du fichier nous assure que letransfert des donneacutees srsquoest reacutealiseacute correctement En cas de diffeacuterence entre les empreintes

84

le transfert srsquoeffectue agrave nouveau Lrsquoobjectif est de veacuterifier lrsquointeacutegriteacute des donneacutees transfeacute-reacutes

Le scheacutema 32 scheacutematise le fonctionnement de notre sonde de mesure Nous consi-deacuterons que la fonction de port-mirroring est deacutejagrave programmeacutee sur le routeur DSI

Degraves que la sonde est alimenteacutee eacutelectriquement et que lrsquoOS est chargeacute la sonde vaveacuterifier qursquoune capture est programmeacutee Si aucune capture de trace nrsquoest programmeacuteela sonde va en planifier une dans les prochaines 24 heures Si la sonde a connaissancedrsquoune programmation elle va alors reacutealiser la capture La sonde va enregistrer le traficsur une dureacutee allant entre 1 et 23 heures Lorsque la capture est finie la sonde va alorsprogrammer le prochain enregistrement La sonde va eacutegalement envoyer la trace vers leserveur de stockage

Capture

Alimentation

eacutelectrique

Veacuterification

dune capture

Programmation

dune capture

Collecte

PreacutesenteAbsente

24 heures maximum

1 - 23 heures maximum

FIGURE 32 ndash Scheacutema de fonctionnement de la plateforme de mesure

Analyse Lrsquoanalyse des donneacutees obtenues se fait en deux eacutetapes La premiegravere consiste agraveutiliser lrsquooutil Xanalyse pour obtenir les reacutesultats bruts La seconde eacutetape est lrsquoextractiondes donneacutees pour les repreacutesenter sous forme graphique

34 Reacutesultats

Notre eacutetude se cantonne agrave mesurer les performances du trafic au sein du LIM Le LIMfait partie inteacutegrante de lrsquoUniversiteacute de La Reacuteunion et agrave ce titre les usages de lrsquoInternetau sein de lrsquoeacutetablissement sont reacuteglementeacutes Ainsi lrsquoeacutetude des meacutetriques de supervisionpourraient ne pas correspondre agrave un usage plus libeacuteral de lrsquoInternet Pour rappel lesmeacutetriques eacutetudieacutees sont indiqueacutees dans le tableau 31

Nous avons fait le choix de seacuteparer notre eacutetude en deux La partie supervision donneun aperccedilu de lrsquousage du reacuteseau Internet au sein du LIM Nous essaierons dans la mesuredu possible de faire des extrapolations avec lrsquousage de lrsquoInternet agrave La Reacuteunion La sectionperformance est celle qui est la plus inteacuteressante Crsquoest elle qui va nous indiquer les deacutegra-dations occasionneacutees par les longs deacutelais pour La Reacuteunion

85

341 Supervision du trafic

Le tableau 33 montre la distribution des 4 protocoles de transport rencontreacutes

TABLE 33 ndash Distribution des protocoles encapsuleacutes dans IP

Protocole ICMP IGMP TCP UDPPourcentage 572 001 9249 178

La preacutesence du protocole ICMP agrave plus de 5 srsquoexplique par la preacutesence des sondesde mesures de RunPL Pour rappel lrsquoobjectif de cette plate-forme est drsquoeacutetudier la connec-tiviteacute de La Reacuteunion et des icircles de la Zone Oceacutean Indien agrave travers de la meacutetrologie activeNous avons dans le chapitre 2 preacutesenteacute des reacutesultats lieacutes agrave ces eacutetudes Lrsquousage du pro-tocole ICMP est freacutequent au sein de lrsquoInternet Une eacutetude du trafic reacuteunionnais mettraiteacutegalement lrsquousage de ce protocole

Le protocole Internet Group Management Protocol (IGMP) deacutefini dans le [RFC3376] estun protocole utiliseacute par les systegravemes IPv4 (hocirctes et routeurs) pour signaler leur appar-tenance agrave un groupe de multidiffusion IP agrave tout routeur multicast voisin Son usage estrestreint au sein drsquoun reacuteseau priveacute

Le protocole User Datagram Protocol (UDP) a une preacutesence infeacuterieure agrave 2 Son rocircleest la transmission de donneacutees simples sans fiabiliteacute Son usage est geacuteneacuteralement li-miteacute au service DNS Reacutecemment lrsquoentreprise Google a deacuteveloppeacute lrsquooption QUIC QUICpermet au navigateur Google Chrome drsquoeffectuer des requecirctes HyperText Transfer Protocol(HTTP)HyperText Transfer Protocol Secured (HTTPS) sur le protocole UDP [Carlucci2015]a eacutetudieacute les performances de ce systegraveme Les reacutesultats obtenus ont montreacute un meilleurgoodput que TCP-CUBIC malgreacute un taux de perte plus important Lrsquousage de QUIC estlimiteacute au navigateur Google Chrome navigateur le plus reacutepandu agrave La Reacuteunion drsquoapregraves[GSCounter] Neacuteanmoins cette option est deacutesactiveacutee par deacutefaut

Les reacutesultats de TCP sont en accord avec lrsquoeacutetude reacutealiseacutee par [EQUINIX] Avec unpourcentage de 92 49 TCP est majoritaire Les services proposeacutes par TCP sont plusnombreux que ceux offerts par les autres protocoles de transport

Le tableau 34 indique les services utiliseacutes Les services ont eacuteteacute rangeacutes par pourcentagereleveacute

TABLE 34 ndash Reacutepartition des services utiliseacutes par TCP

Service SSH DNS Mail Non identi-fieacutes

Autres HTTPS HTTP

Percent 002 163 491 721 945 3297 4379

La preacutesence du service Secure SHell (SSH) srsquoexplique par les accegraves distants agrave diffeacuterentsoutils propres au laboratoire On peut citer les nœuds Planet-Lab [PlanetLab] agrave traversle monde les sondes de la plate-forme RunPL lrsquoaccegraves agrave la sonde de capture pour cetteeacutetude lrsquoaccegraves agrave des serveurs distants etc

163 des paquets eacutechangeacutes dans nos traces sont des requecirctes de DNS Ces paquetspermettent de convertir un nom de domaine en adresse IP Lrsquoutilisation du DNS avec leprotocole TCP a eacuteteacute restreint aux transferts de zone et aux reacuteponses dont la taille est tropimportante pour UDP [RFC5936 RFC6691 RFC7766]

Le service intituleacute Mail regroupe les services identifieacutes par les ports numeacuteroteacutes 25110 143 465 995 et 993 Ces ports correspondent respectivement agrave Simple Mail TransfertProtocol (SMTP) Post Office Protocol (POP) Internet Message Access Protocol (IMAP) et leursversions seacutecuriseacutees SMTPs POPs IMAPs Lrsquoutilisation de ces ports est faite par les agents

86

de messagerie comme Windows Live Mail Mozilla Thunderbird ou Mail Lrsquoeacutechange decourriel repreacutesente 4 91 des paquets eacutechangeacutes Ce pourcentage est fausseacute par lrsquoutilisa-tion des interfaces web des messageries Par exemple on peut utiliser la page web duservice de message Gmail de Google pour envoyer directement des mails Le service uti-liseacute est alors un service web HTTP ou HTTPS

Le service nommeacute Non identifieacutes est une connexion dont le numeacutero de port nrsquoest pasrattacheacute agrave un service en particulier Ce sont geacuteneacuteralement des numeacuteros supeacuterieurs agrave 1 000

La partie Autres regroupe plusieurs services Ces services sont assez divers On peutainsi y retrouver lrsquoutilisation du port numeacuteroteacute 139 correspondant agrave netbios-ssn Ce servicede NetBIOS autorise lrsquoeacutechange de message en mode connecteacute On peut eacutegalement citerlrsquousage du service Hyper Text Caching Protocol (HTCP) [RFC2756] Ce service est utiliseacutepour partager et deacutecouvrir les contenus des caches (anteacutemeacutemoires) HTTP entre serveursmandataires

Nous avons deacutecideacute de garder la seacuteparation entre les services HTTP et HTTPS HTTPSest lrsquousage de HTTP avec un chiffrement Ce chiffrement permet au visiteur de veacuterifierlrsquoidentiteacute du site web gracircce agrave un certificat Ces services sont preacute-dominants au sein duLIM

Lrsquousage de ces services peut ecirctre deacutegradeacute si lrsquoon quitte La Reacuteunion Le tableau 35 in-dique la reacutepartition du trafic selon le type drsquoadresse de destination

TABLE 35 ndash Distribution du trafic

Trafic LAN MAN WANPourcentage 2165 0 7835

La reacutepartition srsquoest faite selon la geacuteolocalisation des adresses IP Le trafic LAN cor-respond agrave des eacutechanges entre adresses priveacutees Le trafic identifieacute MAN correspond agrave deseacutechanges entre adresses geacuteolocaliseacutees agrave La Reacuteunion On constate ainsi qursquoaucune infor-mation chercheacutee par les utilisateurs nrsquoest geacuteolocaliseacutee agrave La Reacuteunion Le trafic Wide AreaNetwork (WAN) repreacutesente le trafic transitant par les cacircbles sous-marins Ce deacutecoupageest rendu possible par lrsquointer-connexion des opeacuterateurs au sein du GIX Reunix Ce deacutecou-page ne serait pas le mecircme si on eacutetudiait la totaliteacute du trafic de La Reacuteunion Ainsi onconstate qursquoil nrsquoy a aucun service dont la destination finale serait La Reacuteunion

Le tableau 37 indique la reacutepartition des destinations de type WAN Le tableau 36rappelle la correspondance entre lrsquoacronyme et le nom complet de chaque continent

TABLE 36 ndash Correspondance entre acronymes et nom des continents

Nom Afrique Asie Europe Ameacuterique du Nord Oceacuteanie Ameacuterique du SudAcronyme AF AS EU NA OC SA

TABLE 37 ndash Distribution geacuteographique des destinations WAN

Continent AF AS EU NA OC SAPourcentage 019 168 4850 4867 064 032

On constate que la reacutepartition des continents est fortement ineacutegale LrsquoEurope et lrsquoAmeacute-rique du Nord concentrent plus de 97 des destinations reacuteunies Lrsquoeacutetude reacutealiseacutee par[Fanou2016] a montreacute une incoheacuterence dans lrsquoaccegraves aux contenus Les reacutesultats ont ainsiprouveacute que malgreacute la preacutesence drsquoune infrastructure web deacuteveloppeacutee sur le continent afri-cain la majoriteacute du contenu eacutetait stockeacute sur les continents europeacuteen et nord-ameacutericain

87

Dans le cadre de La Reacuteunion les regravegles de routage vues dans le chapitre preacuteceacutedent sonten coheacuterence avec la reacutepartition des continents

342 Performance de TCP

Un flot peut ecirctre caracteacuteriseacute selon sa longueur (nombre de paquets ou octets eacutechan-geacutes) sa dureacutee (dureacutee des eacutechanges entre le premier et le dernier paquet captureacute) et sonratio Chaque caracteacuterisation est associeacutee agrave deacutenomination selon que le flux est court oulong Il existe plusieurs deacutefinitions de limites de chaque caracteacuterisation Dans le tableau38 nous indiquons le nom associeacute agrave chaque flux selon sa caracteacuterisation ainsi que desexemples de limites

Pour rappel nous avons deacutefini un flot comme laquo une seacuterie de paquets IP avec le mecircmetuple suivant ldquoadresse IP source port source adresse IP destination port destinationprotocole IPrdquo raquo Dans notre eacutetude nous consideacutererons un flot TCP sans tenir compte desmeacutecanismes drsquoeacutetablissement et de fermeture de connexion Ainsi un flot pourra conteniruniquement des paquets de donneacutees et drsquoacquittement

TABLE 38 ndash Tableau de deacutenomination des flux selon [Lan2006]`````````````Meacutetrique

Taille des fluxCourts Longs limites

Longueur Souris Eacuteleacutephant 10 paquets [Sallantin2014]1 de lrsquoutilisation du lien[Estan2001] 100 Ko[Lan2006]

Dureacutee Libellule Tortue 2 secondes[Brownlee2002] 15 mi-nutes [Lan2006]

Deacutebit Gueacutepard Escargot 100 Kos [Lan2006]

Les limites varient selon les eacutetudes Pour notre eacutetude les limites seront choisies enfonction des reacutesultats Nous comparerons nos limites avec celles indiqueacutees dans le ta-bleau ci-dessus Dans notre preacutesentation la caracteacuterisation des flux confond flux montantet flux descendant Drsquoapregraves la loi de Pareto environ 80 des effets sont le produit de 20des causes Dans lrsquoInternet 80 du trafic est reacutealiseacute par seulement 20 de flux eacuteleacutephants[Paxson1995] Nous regarderons si cette loi est respecteacutee par les limites proposeacutees

Dans la figure 33 nous avons repreacutesenteacute les CDF de la longueur des flux selon lespaquets (33a) et le nombre drsquooctets (33b) Les traits verticaux repreacutesentent les limitesindiqueacutees dans le tableau 38 Sur la figure 33a le trait vertical repreacutesente la limite des10 paquets de [Sallantin2014] Sur la figure 33b le trait vertical drsquoune valeur de 10 000octets repreacutesente la limite indiqueacutee par [Lan2006] Le trait de droite repreacutesente les 1 dela capaciteacute du lien drsquoaccegraves soit 107 octets (100 Ko)

Sur la figure 33a plus de 50 des flux sont des flux mono-paquet Les flux infeacuterieursagrave la limite proposeacutee par [Sallantin2014] de 10 paquets ont une probabiliteacute de 0 67 Notretrafic est donc constitueacute drsquoune majoriteacute de flots courts sur les paquets La seacuteparation de80 du trafic se fait agrave partir de 18 paquets

Lrsquoaxe des abscisses de la figure 33b deacutemarre agrave 500 octets avec une probabiliteacute de 0 28La valeur de deacutepart de lrsquoaxe des abscisses repreacutesente le pas utiliseacute pour le calcul de laCDF Le premier axe vertical repreacutesenteacute agrave 10 000 octets seacutepare 79 27 des flux sont desflux courts La limite proposeacutee par [Estan2001] est repreacutesenteacutee agrave 107 octets Cette seacutepara-tion indique que 99 des flux sont des flux courts Aucune des deux limites proposeacutees

88

ne permet une eacutetude fine de la seacuteparation des flux La limite proposeacutee par [Lan2006]approche la reacutepartition de Pareto

(a) Paquets (b) Octets

FIGURE 33 ndash Longueur des flux

La dureacutee drsquoun flot TCP correspond au deacutelai qui seacutepare la capture du premier et dudernier paquets du flot La figure 34 repreacutesente la PDF pour la dureacutee des flots en se-condes Le pas utiliseacute pour effectuer le traceacute est de 1 seconde Ce pas srsquoexplique par lavaleur minimale que peut prendre le RTO comme deacutefini dans le [RFC6298] La ligne ver-ticale repreacutesente la limite de [Brownlee2002] eacutegale agrave 2 secondes

La dureacutee maximale enregistreacutee pour un flot est de 61 192 secondes soit plus de 10heures drsquoeacutechange Au delagrave des 60 secondes la probabiliteacute drsquoavoir un flot supeacuterieur agravecette dureacutee est eacutegale agrave 0 081 Nous consideacuterons cette probabiliteacute neacutegligeable Plus de 59de nos flux sont infeacuterieurs agrave la limite repreacutesenteacutee par lrsquoexpiration du RTO (1 seconde) Lalimite des deux secondes indique que 64 des flux eacutechangeacutes sont des flux courts Pouratteindre la reacutepartition indiqueacutee par la loi de Pareto la seacuteparation devrait atteindre les 10secondes

Les figures 35 repreacutesentent la reacutepartition du deacutebit utile moyen de chaque flux selonle nombre de paquets par seconde (35a) et le nombre drsquooctets par seconde (35b) Laligne verticale sur la figure 35a repreacutesente la limite seacuteparant les flux courts et les fluxlongs Drsquoune valeur de 10 paquetsseconde elle est deacuteduite de la limite de 10 paquetsde la longueur des flux preacutesenteacutes preacuteceacutedemment La limite de 100 Ko de [Lan2006] suitle mecircme raisonnement Ils sont partis de la limite de la longueur des flux pour choisir lalimite de caracteacuterisation des flux sur les deacutebits

La figure 35a deacutemarre avec des deacutebits peu eacuteleveacutes mais nombreux Ainsi les flux infeacute-rieurs agrave la limite des 10 paquetsseconde repreacutesentent plus de 90 des flux rencontreacutesOn peut donc en deacuteduire que le trafic analyseacute a tregraves forte majoriteacute de flux agrave tregraves bas deacutebit

La figure 35b est calculeacutee avec le mecircme pas que pour la longueur des flux soit 500 oc-tets En analysant la figure on remarque ainsi que les flux infeacuterieurs ou eacutegaux agrave 500 octetsont une probabiliteacute drsquoexister proche de 09 La limite preacutesenteacutee par [Lan2006] autorise unecaracteacuterisation de 99 de nos flux en tant que flux courts

Tout comme lrsquoindiquaient [Paxson1995 Ciullo2009] le trafic est constitueacute en majoriteacutede flots courts Dans les trois caracteacuterisations effectueacutees (longueur dureacutee deacutebit) le traficeacutetudieacute est constitueacute agrave plus 50 voire 90 comme pour les deacutebits de flots courts

TCP est un protocole srsquoappuyant sur les deacutelais et le systegraveme drsquoacquittement pouradapter ses eacutemissions On a vu dans le chapitre 2 que lrsquoicircle de La Reacuteunion possegravede un

89

FIGURE 34 ndash Flux TCP - Densiteacute de la dureacutee de communication

(a) Paquetsseconde (b) Octetsseconde

FIGURE 35 ndash Deacutebits des flux

comportement particulier vis-agrave-vis de ce paramegravetre Nous faisons lrsquohypothegravese qursquoune desconseacutequences de ce fonctionnement est que La Reacuteunion possegravede une forte sensibiliteacute auxeacuteveacutenements de congestions Nous avons deux outils permettant de confirmer ce postulat

1 Le premier est lrsquoidentification des diffeacuterentes options preacutesentes dans lrsquoen-tecircte TCPplus particuliegraverement les options ECN Echo (ECE) Explicit Congestion Notification(ECN)Nonce Sum (NS) et CWR Le passage du bit de ces options agrave 1 indique unegestion des eacuteveacutenements de congestion

2 La seconde possibiliteacute est de repeacuterer les reacuteductions de la fenecirctre de TCP et les typesde retransmissions qui ont lieu aux alentours de cette diminution

Avec la premiegravere meacutethode nous nrsquoavons trouveacute aucun paquet avec une option degestion de la congestion (ECN) agrave 1 Cela indique que les eacuteveacutenements de congestion nepeuvent ecirctre identifieacutes par la lecture des drapeaux Les auteurs de [Trammell2015] ontmontreacute que le nombre de serveurs reacutepondant agrave la neacutegociation de lrsquooption ECE agrave traversle monde a augmenteacute ces derniegraveres anneacutees Lrsquoabsence de paquets deacutebutant la neacutegociation

90

donc provenant des utilisateurs du reacuteseau du laboratoire peut srsquoexpliquer par 3 hypo-thegravesesLa premiegravere est lrsquoobsolescence des ordinateurs du Laboratoire drsquoInformatique et de Ma-theacutematiques En effet il faut un systegraveme drsquoexploitation reacutecent pour que la version de TCPpuisse marquer les paquets avec lrsquooption Cette hypothegravese est vite abandonneacutee sachantque plusieurs participants agrave notre eacutetude possegravedent des ordinateurs acheteacutes agrave partir delrsquoanneacutee 2014La seconde hypothegravese est la suppression de lrsquooption par un eacutequipement reacuteseau traverseacute agravelrsquoUniversiteacute de La Reacuteunion Cette piste fut abandonneacutee apregraves un test de mesures Ce testconsistait agrave envoyer des paquets avec lrsquooption ECN agrave 1 et agrave regarder leurs options agrave leurarriveacutee au point de capture Les reacutesultats obtenus ont montreacute que lrsquooption eacutetait inchan-geacuteeLa derniegravere possibiliteacute est que le systegraveme drsquoexploitation ne marque pas lrsquoensemble despaquets avec le drapeau de neacutegociation Certains routeurs ou pare-feux incompatiblespeuvent bloquer le trafic entre deux hocirctes impleacutementant ECN [Bauer2011] Crsquoest pourcette raison qursquoelle est deacutesactiveacutee implicitement sur la plupart des systegravemes drsquoexploita-tion contemporains Nous avons confirmeacute cette hypothegravese agrave travers une demande drsquouti-lisation de la commande sysctl et des options de TCP des systegravemes drsquoexploitation DebianUbuntu et Mac OS X Les reacutesultats ont ainsi montreacute que les systegravemes drsquoexploitation eacutetu-dieacutes nrsquoactivaient pas cette option de TCP

Dans tous les cas lrsquoabsence des options ECE ECNNS et CWR est neacutefaste pour lesperformances de TCP Les travaux reacutealiseacutes par [Mellia2003-2] ont montreacute que les per-formances de TCP sont accrues lorsque les paquets sont marqueacutes avec ces options Sanselles les eacuteveacutenements de congestion sont plus difficiles agrave identifier

La seconde faccedilon drsquoidentifier les eacuteveacutenements de congestion est plus compliqueacutee agravemettre en place Il srsquoagit drsquoidentifier les reacuteductions de fenecirctre et drsquoeacutetudier des pertes etoudes retransmissions de paquets Elle provoque des incertitudes Sur un total de 42 386 540paquets nous avons identifieacute 21 022 400 paquets indiquant une diminution de fenecirctreSoit pregraves drsquoun paquet sur deux

Le tableau 39 indique les pourcentages des paquets retransmis etou perdus

TABLE 39 ndash Reacutepartition des paquets

fast retrans-mit

spurious retrans-mit

Paquetsperdus

Non retransmiset non perdus

Pourcentage 5 2times 10minus3 7 8times 10minus3 14times10minus3 99 97

On constate que le pourcentage des paquets retransmis ou perdus sont ridicules avecmoins de 1 des paquets eacutechangeacutes Ces pourcentages sont en deccedilagrave des valeurs que TCPpeut produire dans certaines zones Aux Eacutetat-Unis [Gettys2011] a eacutetudieacute le taux de pertesur un lien montant agrave 2 Mbits lors drsquoun transfert de fichiers drsquoun poids de 20 Go Letaux de perte est tregraves eacuteleveacute avec 33 de moyenne En comparaison avec ces eacutetudes reacuteali-seacutees lrsquoicircle de La Reacuteunion possegravede des performances de TCP que lrsquoon pourrait qualifier denormales

343 Synthegravese des reacutesultats

Lrsquoanalyse mise en place a pour objectif de tester en conditions reacuteelles notre plate-forme de mesure et la chaicircne drsquoanalyse

Lrsquoeacutetude du trafic du LIM a eacuteteacute deacutecoupeacutee en deux parties La premiegravere concerne lasupervision du trafic et traite de la composition La seconde partie se concentre sur les

91

performances du protocole de transport TCP sur le trafic agrave destination de lrsquoexteacuterieur delrsquoicircle de La ReacuteunionLrsquoeacutetude des donneacutees collecteacutees a mis en avant la preacutedominance drsquoun trafic empruntantles cacircbles sous-marins agrave destination de lrsquoEurope et de lrsquoAmeacuterique du Nord Ces deuxdestinations heacutebergent de nombreux serveurs de donneacutees scientifiquesLrsquointerrogation de ces serveurs se fait agrave partir du protocole TCP en utilisant les servicesHTTP ou HTTPS Le protocole TCP est majoritaire dans les protocoles rencontreacutes toutcomme les services preacutesenteacutes

Sur lrsquoeacutetude des performance du protocole TCP nous avons effectueacute une caracteacuteri-sation des flots en terme de longueur (paquets eacutechangeacutes) de dureacutee et de vitesse Lamajoriteacute de nos flots sont des flots courts contenant peu de donneacutees

35 Conclusion

Dans ce chapitre nous avons preacutesenteacute la meacutethode mise en place pour la reacutealisationdrsquoune eacutetude de meacutetrologie passive sur lrsquoicircle de La Reacuteunion

La Reacuteunion est une icircle dont la connectiviteacute en terme de deacutelais et de routes est par-ticuliegravere telle que le chapitre 2 preacutesente Lrsquoaugmentation progressive des deacutebits drsquoaccegravesa pour conseacutequence lrsquoaugmentation de la capaciteacute de stockage des liens On considegravereqursquoun lien possegravede une forte capaciteacute de stockage quand le produit deacutelai bande passante(BDP) associeacute agrave ce lien deacutepasse la limite de 12 5 Ko Pour La Reacuteunion la capaciteacute destockage minimale calculeacutee est de 22 5 ko Cette capaciteacute de stockage entraicircne des deacutegra-dations sur les performances du protocole TCP Nous avons souhaiteacute eacutetudier lrsquoimpact dela capaciteacute de stockage des liens sur les performances du protocole TCP agrave La ReacuteunionLrsquoaugmentation de la capaciteacute des liens entraicircne eacutegalement un changement des usagesNous souhaitons eacutegalement eacutetudier les diffeacuterents services utiliseacutes dans lrsquoInternet agrave LaReacuteunion

Le cahier des charges fut preacutesenteacute dans la section 31 Le cahier mis en place preacutesenteles meacutetriques de lrsquoeacutetude Ces meacutetriques ont eacuteteacute seacutelectionneacutees afin de reacutepondre aux objec-tifs preacutesenteacutes ci-dessus Elles couvriront un aspect supervision du trafic pour lrsquoeacutetude desservices et la reacutepartition geacuteographique Lrsquoaspect des performances du protocole TCP seraanalyseacute agrave travers les deacutebits les deacutelais les pertes les retransmissions et la preacutesence deseacuteveacutenements de congestion

Pour obtenir ces meacutetriques il est neacutecessaire de mettre en place une infrastructure demesure et une chaicircne drsquoanalyse La section 32 preacutesente lrsquoinfrastructure mise en place Lavariabiliteacute du trafic dans le temps nous a encourageacutes agrave mettre en place une plate-formede capture de trafic Le choix de lrsquooutil de capture nrsquoest pas deacutefinitif Il est deacutependant dudeacutebit associeacute au lien de capture Diffeacuterents outils drsquoanalyses de donneacutees passives existentDans le paragraphe 322 nous avons reacutealiseacute une comparaison des diffeacuterents outils selondes critegraveres de seacutelection Ces critegraveres sont au nombre de 3 protection de la vie priveacutee trai-tement drsquoune volumeacutetrie de donneacutees importante et le calcul des meacutetriques seacutelectionneacuteesAucun des outils preacutesenteacutes ne reacutepondait agrave la totaliteacute des critegraveres A la suite de ce constatnous avons fait le choix de deacutevelopper un outil reacutepondant agrave ces 3 critegraveres Lrsquoavantage decet outil est qursquoil pourra eacutevoluer en parallegravele agrave lrsquoeacutevolution de lrsquoeacutetude

Ces outils furent mis en place au sein du Laboratoire drsquoInformatique et de Matheacutematiquesdans le cadre drsquoune phase de test Les reacutesultats obtenus ont eacuteteacute compareacutes avec les reacutesultatsobtenus par TCPTrace afin de nous assurer de lrsquoexactitude de nos reacutesultats Le protocolede mesure mis en place pour cette eacutetude est deacutecrit dans la section 33 Dans ce protocolenous avons preacutesenteacute les contraintes reacuteglementaires imposeacutees par lrsquoUniversiteacute Nous nous

92

sommes ensuite assureacutes que le systegraveme mis en place pour la capture du trafic nrsquoeacutetaitsoumis agrave aucune perturbation Le systegraveme choisi pour eacutecouter le lien fut celui de port-mirroring Cette fonction des routeurs permet de copier lrsquoensemble des paquets entrantsur un lien vers un second lien Cette recopie est soumise agrave la limitation de la capaciteacutede meacutemoire des eacutequipements Elle peut entraicircner des erreurs au niveau de la datationdes paquets et dans lrsquoordre de reacute-eacutemission des paquets vers le lien miroir Dans cetteeacutetude la capture du trafic srsquoest faite agrave lrsquoaide du logiciel TCPDump Reacuteguliegraverement unephase de deacutelestage de la meacutemoire de la sonde de capture vers un serveur de stockage dulaboratoire a eacuteteacute mise en place

Les reacutesultats preacutesenteacutes dans la section 34 nous donnent une vision biaiseacutee du com-portement de lrsquoInternet reacuteunionnais Ces reacutesultats ne peuvent correspondre au compor-tement de TCP pour lrsquoensemble de lrsquoInternet de La Reacuteunion Ces reacutesultats nous donnentdes indications sur le comportement de TCP dans le cadre drsquoune connexion agrave forte capa-citeacute de meacutemorisation

Dans la partie supervision on a vu la preacutedominance du protocole TCP des servicesHTTP et HTTPS Ces usages srsquoaccompagnent drsquoune reacutepartition geacuteographique tregraves in-eacutegale LrsquoEurope et lrsquoAmeacuterique du Nord sont les deux continents avec lesquels les interac-tions sont les plus nombreuses (plus de 48 du trafic pour chaque continent)

Au niveau des performances de TCP nous avons pu voir que la majoriteacute des flotseacutetudieacutes sont des flots courts que ccedila soit en longueurs en dureacutees et en deacutebits Aucun eacuteveacute-nement de congestion ne fut releveacute Cela indique que la capaciteacute drsquoenvoi des eacutemetteursnrsquoa pas couvert le BDP du lien Cela srsquoest ressenti au niveau de la reacutepartition des paquetsRetransmissions et pertes nrsquoont repreacutesenteacute pregraves de 0 03 des paquets eacutechangeacutes

Les contributions de ce chapitre ont fait lrsquoobjet drsquoune publication scientifique lors de laconfeacuterence Next Generation Computing Applications (NextComp) en 2017 [Noordally2017]

93

94

Conclusion amp Perspectives

1 Synthegravese des travaux

Les travaux de cette thegravese sont placeacutes dans le cadre reacutegional de lrsquoaccegraves de lrsquoicircle de LaReacuteunion agrave lrsquoInternet Ils visent agrave identifier les caracteacuteristiques qui ont une influence sur lesperformances de lrsquoInternet agrave La Reacuteunion La Reacuteunion est un deacutepartement drsquooutre-mer si-tueacute dans lrsquoOceacutean Indien Lrsquoicircle est connecteacutee agrave Internet agrave travers deux cacircbles sous-marins le SAFE et le LION Le SAFE relie lrsquoAfrique agrave lrsquoAsie Le LION interconnecte Madagascarlrsquoicircle Maurice et La Reacuteunion Lrsquoarriveacutee de ces cacircbles sur lrsquoicircle a permis le deacuteveloppement duhaut deacutebit et du tregraves haut deacutebit sur lrsquoicircle avec lrsquoarriveacutee des technologies ADSL VDSL etFTTH Des extensions agrave ces cacircbles permettent de remonter jusqursquoen Europe La Reacuteunionpossegravede REUNIX un point drsquointer-connexion (IXP) pour les opeacuterateurs locaux Ce typedrsquoaccegraves agrave Internet est speacutecifique aux icircles de la zone oceacutean indien Dans un premier tempsnous avons eacutetudieacute la connectiviteacute de lrsquoicircle sous lrsquoangle des deacutelais et des routes Dans unsecond temps lrsquoeacutetude a porteacute sur les flots TCP

TCP est le protocole de transport majoritaire dans lrsquoInternet qui rend un service detransport fiable et efficace de donneacutees Lrsquoefficaciteacute srsquoappreacutecie en terme de deacutebit eacutecouleacutepour le service rendu et drsquoutilisation des capaciteacutes de transmission du reacuteseau Lrsquoobjectifdrsquoefficaciteacute est du ressort du controcircle de flux et du controcircle de congestion Ces fonctionsagissent selon une peacuteriode correspondant au RTT de la connexion On voit alors que laperformance de TCP est deacutependante du deacutelai que va expeacuterimenter la connexion TCP

Nous avons dans un premier temps eacutetudieacute lrsquoeacutevolution du deacutelai et de la longueur desroutes entre 2012 et 2016 Cette eacutetude a mis en eacutevidence une stabiliteacute des deacutelais malgreacuteune reacuteduction de la longueur des routes Cette eacutetude a eacuteteacute reacutealiseacutee depuis un seul pointde mesure Afin drsquoeacutetudier en deacutetail la connectiviteacute de La Reacuteunion nous avons deacuteployeacuteune plate-forme de meacutetrologie active speacutecifique agrave lrsquoeacutetude Durant plusieurs mois nousavons mesureacute les deacutelais et les routes depuis et vers La Reacuteunion agrave lrsquoaide de lrsquooutil Paris-traceroute Lrsquoanalyse des reacutesultats a eacuteteacute reacutealiseacutee agrave partir de deux outils deacuteveloppeacutes pourle besoin de lrsquoeacutetude rgeoloc et rtraceroute rgeoloc sert agrave la geacuteolocalisation des adressesIP et agrave lrsquoextraction des deacutelais et de la longueur des routes depuis un fichier de sortiede traceroute rtraceroute est un outil drsquoanalyse graphique des routes Il va utiliser lesdonneacutees obtenues depuis rgeoloc pour placer sur une carte les diffeacuterents pays traverseacutespar les donneacutees collecteacutees

Les reacutesultats ont eacuteteacute eacutetudieacutes selon quatre critegraveres les deacutelais la longueur des routesla distance geacuteographique entre la source et la destination et lrsquoidentification des portesde lrsquoInternet reacuteunionnais Nous avons ainsi pu mettre en eacutevidence lrsquoindeacutependance de lalongueur de la route en fonction de la distance geacuteographique Nous avons calculeacute le deacutelaineacutecessaire agrave chaque noeud traverseacute Cette valeur est fortement deacutependante du sens decirculation de lrsquoinformation La relation entre le deacutelai et la distance geacuteographique a misen eacutevidence une incoheacuterence Le deacutelai neacutecessaire pour joindre une destination ou ecirctrejoint depuis lrsquoexteacuterieur de lrsquoicircle est inversement proportionnel agrave la distance geacuteographiqueCela signifie donc que plus la distance est importante moins le deacutelai est eacuteleveacute Nous

95

avons eacutetudieacute ce comportement vis agrave vis des portes de lrsquoInternet reacuteunionnais et mis enavant le fait que plus de 97 du trafic reacuteunionnais passe par la France hexagonale sanstenir compte si crsquoest du trafic montant ou descendant Ce comportement a eacutegalement eacuteteacuteeacutetudieacute pour les icircles de la ZOI dans le sens montant Le deacutelai minimal mesureacute accompagneacutedu routage analyseacute peut avoir des conseacutequences sur les performances drsquoun protocole detransport deacutependant au deacutelai comme lrsquoest TCP

Lrsquoaugmentation de la bande passante sur le reacuteseau de distribution de lrsquoicircle et sur lesliens reliant lrsquoIle agrave lrsquoInternet nrsquoont pas permis la reacuteduction des deacutelais Cela a pour conseacute-quence lrsquoaugmentation de la capaciteacute de stockage des canaux de communication La ca-paciteacute de stockage est calculeacutee agrave partir de la bande passante et du RTT On parle de Pro-duit Deacutelai-Bande passante (BDP) Si le BDP deacutepasse la valeur seuil de 12 5 Ko alors lecanal est consideacutereacute comme un reacuteseau agrave forte capaciteacute de stockage (LFN) Si on considegravereque le deacutebit drsquoaccegraves theacuteorique fourni par les FAI est le goulot drsquoeacutetranglement alors uncanal de communication sur lrsquoInternet depuis La Reacuteunion possegravede un BDP minimal eacutegalagrave 22 5 Ko Lorsque le transport des donneacutees srsquoeffectue avec TCP en passant par un LFNceci agrave des implications sur les performances du service rendu par TCP Lrsquoobjectif a eacuteteacute deconcevoir un systegraveme meacutetrologique pour pouvoir eacutetudier le service et analyser le fonc-tionnement du protocole Nous avons mis en place et expeacuterimenteacute une infrastructure demeacutetrologie passive interne au laboratoire En parallegravele nous avons conccedilu un outil drsquoana-lyse de traces drsquoeacutecoute speacutecifiques agrave notre eacutetude Lrsquoensemble de la chaicircne de mesure etdrsquoanalyse a eacuteteacute testeacute durant un mois au sein du LIM Les reacutesultats obtenus ont eacuteteacute valideacutespar comparaison agrave ceux fournis par drsquoautres outils

2 Perspectives

icircle de La Reacuteunion

La mise en place drsquoune eacutetude de meacutetrologie passive en collaboration avec les diffeacute-rents FAI permettrait drsquoeacutetudier le reacuteel impact de lrsquoeacuteloignement de La Reacuteunion sur lesperformances du protocole de transport TCP De plus lrsquoanalyse de supervision permet-trait drsquoidentifier des leviers pour limiter le rapatriement de trafic commun par les cacircblessous-marins

Zone Oceacutean Indien

Cette thegravese a mis en eacutevidence une connectiviteacute particuliegravere en terme de deacutelais et deroutes depuis lrsquoicircle de La Reacuteunion et les icircles de la Zone Oceacutean Indien dans le sens De-puis Lrsquoasymeacutetrie des routes est freacutequente dans lrsquoInternet Crsquoest pourquoi une eacutetude desdeacutelais et des routes depuis le monde agrave destination des sondes de la plate-forme RunPLbaseacutees sur les icircles de la ZOI peut ecirctre pertinente

Par la suite une eacutetude de meacutetrologie passive similaire agrave celle que lrsquoon veut mettreen place sur le territoire reacuteunionnais pourrait ecirctre reacutealiseacutee Lrsquoobjectif est de mettre eneacutevidence un comportement speacutecifique en terme drsquousage et de performance protocolairepour lrsquoensemble des usagers de la zone Cette eacutetude aura eacutegalement comme but le calculde la volumeacutetrie eacutechangeacutee et des services utiliseacutes entre les diffeacuterents territoires Si lesreacutesultats montrent une preacutedominance des trafics de consultation (accegraves agrave un serveur)la technique drsquooffloading pourrait ecirctre envisageacutee Cette meacutethode inspireacutee des travaux de[Baron2016] impliquerait lrsquousage des transports aeacuteriens pour charger des caches locauxDrsquoautres solutions seront eacutegalement eacutetudieacutees comme lrsquoimpleacutementation de serveurs departage de contenus localiseacutes sur lrsquoicircle

96

Territoires ultra-marins franccedilais

La Reacuteunion et Mayotte sont deux territoires franccedilais localiseacutes dans la ZOI Mais drsquoautresreacutegions ultra-marines peuvent ecirctre soumises agrave des comportements similaires Pour veacuteri-fier cette hypothegravese des eacutetudes de meacutetrologie active et passive pourraient venir validerou non cette hypothegravese Pour reacutepondre agrave cela nous privileacutegierons lrsquoenvoi de sondes dela plate-forme RunPL

Zone Isoleacutee

La derniegravere perspective que lrsquoon souhaite mettre en avant est le concept de ZoneIsoleacutee Si plusieurs reacutesultats des perspectives preacuteceacutedentes sont en adeacutequation avec lesreacutesultats obtenus et preacutesenteacutes dans cette thegravese nous aimerions deacutefinir ce concept Unepremiegravere deacutefinition serait axeacutee sur les trois points suivants

mdash Un routage limiteacute Un maillage important est un standard dans les zones bienconnecteacutees Les routes et les possibiliteacutes de trouver le plus court chemin sont nom-breuses Une faible valeur signifie de faibles alternatives ce qui sous-entend que laroute prise nrsquoest pas forceacutement la plus courte mais celle par deacutefaut

mdash Peering reacutegional et trafic interne Lrsquoensemble du trafic drsquoune zone va vers un GIXdrsquoautres pays pour des raisons de coucirct Lrsquoabsence drsquoaccords de peering entre lesFAI drsquoun mecircme pays ou ceux drsquoune mecircme zone geacuteographique ne permet pas ladiversiteacute des routes et augmente ainsi le deacutelai [Obar2012]

mdash Forts deacutelais Le deacutelai est un paramegravetre important de lrsquoaccegraves Internet Les forteslatences peuvent impacter les autres paramegravetres des connexions TCP [RITE2014-1]

97

98

Table des figures

1 Carte des points drsquoatterrissement du cacircble SAT-3WASCSAFE (Source [Pretet2000]) 2

2 Plan de cacircblage du reacuteseau Gazelle en 2006 (Source [Pretet2000]) 33 Carte des deacutebits agrave La Reacuteunion 44 Frise chronologique du deacuteveloppement de lrsquoInternet agrave La Reacuteunion 55 Cartes des cacircbles sous-marins dans la Zone de lrsquoOceacutean Indien (Source

[Cablesmap]) 76 Carte des points drsquoeacutechange preacutesents actuellement et dans un futur proche

dans la ZOI 7

11 Performance du reacuteseau en fonction de la charge appliqueacutee (Source [Chiu1989]) 11

12 Boucle fermeacutee du CC de TCP 1213 Etats du controcircle de congestion de TCP 1414 Eacutevolution caracteacuteristique de la fenecirctre de congestion de TCP 1515 Principe de Quick-Start (Source [Scharf2008-1]) 1816 Simulation de MulTCP avec N=5 (Source [Huston2006]) 1917 Comportement de la fenecirctre de congestion de HighSpeed-TCP (Source

[Afanasyev2010]) 2018 Comportement de la fenecirctre de congestion de Compound-TCP (Source

[Afanasyev2010]) 2119 Fonctionnement de BIC TCP 22110 Fonctionnement de CUBIC 22111 Reacutepartition des deacutelais depuis Paris et lrsquoicircle de La Reacuteunion (Source [Anelli2012])

24112 Principe de la meacutetrologie active 27113 Illustration du pheacutenomegravene drsquoeacutequilibrage des charges 28114 Taxonomie des configurations de tunnels MPLS et des comportements de

traceroute correspondants (Source [Donnet2012] ) 29115 Principe de la meacutetrologie passive 33

21 Scheacutema drsquointerconnexion de la plate-forme 4222 Distribution geacuteographique des adresses IPv4 publiques 4823 Fonctionnement de la sonde 5124 Comparaison des deacutelais entre Paris et La Reacuteunion 5425 Eacutevolution de la longueur des routes entre 2012 et 2016 5526 Distribution de la distance geacuteographique par continent 5627 Distribution du RTT par continent 5728 Distribution de la longueur des routes par continent 5729 Relation entre la longueur de la route et la distance geacuteographique 59210 Relation entre la longueur de la route et les deacutelais 60211 Relation entre les deacutelais et la distance geacuteographique 62

99

212 Entreacutees Sorties logiques de lrsquoInternet reacuteunionnais 64213 Exemple de peering entre deux pays agrave travers un point drsquoeacutechange baseacute dans

un pays tiers 65214 FAI preacutesents dans chacun des 3 IXP de la Zone Oceacutean Indien 65215 Distribution des deacutelais des icircles de la ZOI 66216 Longueur des routes emprunteacutees 67217 Relation entre la longueur de la route et la distance geacuteographique 68218 Relation entre la longueur de la route et la distance geacuteographique pour

Madagascar 69219 Relation entre la longueur de la route et les deacutelais 69220 Relation entre les deacutelais et la distance geacuteographique 70221 Reacutepartition des sorties de lrsquoInternet des icircles de la ZOI 71222 Reacutepartition des sorties de lrsquoInternet pour La Reacuteunion 72

31 Scheacutema de distribution de la plate-forme de mesure 8432 Scheacutema de fonctionnement de la plateforme de mesure 8533 Longueur des flux 8934 Flux TCP - Densiteacute de la dureacutee de communication 9035 Deacutebits des flux 90

100

Liste des tableaux

11 Tableau de synthegravese des propositions 1712 Approximation du produit deacutelai bande passante de la connectiviteacute de La

Reacuteunion agrave lrsquoInternet 2513 Comparatif entre les approches de meacutetrologie 2614 Classement des outils 2715 Tableau des plates-formes de mesures de meacutetrologie active 3216 Comparatif entre mesures actives et mesures passives 35

21 Reacutepartitions des sondes chez les Fournisseurs drsquoAccegraves Internet 4122 Tableau de comparaison des micro-ordinateurs (source [Maksimovic2014])

4323 Reacutecapitulatif de la comparaison des Systegravemes drsquoexploitation sur Raspberry

Pi 4424 Fonctions disponibles dans les outils graphiques drsquoanalyse des routes 4525 Reacutesumeacute des caracteacuteristiques du jeu de donneacutees 5326 Correspondance entre acronymes et noms des continents 5327 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 5828 Formule de correacutelation du deacutelai en fonction de la longueur du chemin 6029 Formule drsquoestimation du deacutelai en fonction de la distance geacuteographique 61210 Tableau reacutecapitulatif des points drsquoentreacuteessorties de lrsquoInternet reacuteunion-

nais 63211 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 67212 Formule de correacutelation de la longueur du chemin en fonction de la distance

geacuteographique 68213 Formule de correacutelation de la distance geacuteographique et du RTT 70

31 Les meacutetriques de meacutetrologie passive 7732 Comparaison de performances 8233 Distribution des protocoles encapsuleacutes dans IP 8634 Reacutepartition des services utiliseacutes par TCP 8635 Distribution du trafic 8736 Correspondance entre acronymes et nom des continents 8737 Distribution geacuteographique des destinations WAN 8738 Tableau de deacutenomination des flux selon [Lan2006] 8839 Reacutepartition des paquets 91

101

102

Bibliographie

[ANRTIC2016] ANRTIC Autoriteacute Nationale de Reacutegulation des TIC 2016

[ARCEP2004] Autoriteacute de Reacutegulation des Teacuteleacutecommunications Deacutecision n04-375 delrsquoautoriteacute de reacutegulations des teacuteleacutecommunications en date du 4 mai 2004 seprononccedilant sur un diffeacuterent opposant mobius agrave france teacuteleacutecom 2004

[ARTEC2016] Autoriteacute de Reacutegulation des TEchnologies de Communication Artec 2016

[AXIS] African internet exchange system project 2016

[Aben2015] Emile Aben Infrastructure geolocation - plan of action 2015

[Afanasyev2010] A Afanasyev N Tilley P Reiher and L Kleinrock Host-to-hostcongestion control for tcp IEEE Communications Surveys amp Tutorials 12(3)Third quarter 2010

[Africa1] Telegeography Submarine Cable Submarine cable map 2018

[AfterFibre] Steve Song African undersea and terrestrial fibre optic cables Last visit 09262017

[Akamai2015] Akamai Akamairsquos [state of the internet] 2015

[Akamai2017] Akamai Akamairsquos [state of the internet] 2017

[Allman2007] Mark Alllman and Vern Paxson Issues and etiquette concerning use ofshared measurement data In Proceedings of the 7th ACM SIGCOMM confe-rence on Internet measurement pages 135ndash140 ACM 2007

[Anelli2012] Pascal Anelli Des aleacuteas de la communication de la transmission au trans-port Habilitation agrave diriger des recherches en informatique Universiteacute deLa Reacuteunion 2012

[Archipelago] Kimberly Claffy Young Hyun Ken Keys Marina Fomenkov and DmitriKrioukov Internet mapping from art to science In Conference For Home-land Security 2009 CATCHrsquo09 Cybersecurity Applications amp Technology pages205ndash211 IEEE 2009

[Arduino] Arduino AG Arduino home

[Arnal2014] F Arnal E Dubois E Chaput and A Beylot Internet-draft r sallantin in-tended status Proposed standard e bouttier expires April 30 2015 cnes-tastesa c baudoin 2014

[Augustin2006] Brice Augustin Xavier Cuvellier Benjamin Orgogozo Fabien Viger Ti-mur Friedman Matthieu Latapy Cleacutemence Magnien and Renata TeixeiraAvoiding traceroute anomalies with paris traceroute In Proceedings of the 6thACM SIGCOMM conference on Internet measurement pages 153ndash158 ACM2006

[Augustin2007] Brice Augustin Timur Friedman and Renata Teixeira Multipath tracingwith paris traceroute In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

103

[Bajpai2015-1] Vaibhav Bajpai and Juumlrgen Schoumlnwaumllder A survey on internet perfor-mance measurement platforms and related standardization efforts IEEECommunications Surveys amp Tutorials 17(3) 1313ndash1341 2015

[Baron2016] Benjamin Baron Transport intermodal de donneacutees massives pour le deacutelestage desreacuteseaux drsquoinfrastructure PhD thesis Paris 6 2016

[Bauer2011] Steven Bauer Robert Beverly and Arthur Berger Measuring the state of ecnreadiness in servers clients and routers In Proceedings of the 2011 ACM SIG-COMM conference on Internet measurement conference pages 171ndash180 ACM2011

[Beaglebone] BeagleBoardorg Foundation Beagleboardorg - community supportedopen hardware computers for making

[Bischof2015] Zachary S Bischof John P Rula and Fabiaacuten E Bustamante In and out ofCuba Characterizing Cubarsquos connectivity In Proceedings of the 2015 ACMConference on Internet Measurement Conference pages 487ndash493 ACM 2015

[Brakmo1994] Lawrence S Brakmo Sean W OrsquoMalley and Larry L Peterson TCP Vegas New techniques for congestion detection and avoidance volume 24 ACM 1994

[Brownlee2002] Nevil Brownlee and KC Claffy Understanding internet traffic streams dragonflies and tortoises Communications Magazine IEEE 40(10) 110ndash1172002

[CAIDA-Tools] Center for Applied Internet Data Analysis Caida tools - overview

[Cablesmap] Telegeography Submarine cable map

[Carlucci2015] Gaetano Carlucci Luca De Cicco and Saverio Mascolo Http over udp An experimental investigation of quic In Proceedings of the 30th Annual ACMSymposium on Applied Computing SAC rsquo15 pages 609ndash614 New York NYUSA 2015 ACM

[Chappell2010] Laura Chappell and G Combs Wireshark network analysis the officialWireshark certified network analyst study guide Protocol Analysis InstituteChappell University 2010

[Chavula2017] Josiah Chavula Amreesh Phokeer Agustin Formoso and Nick FeamsterInsight into africarsquos country-level latencies In AFRICON 2017 IEEE pages938ndash944 IEEE 2017

[Chiu1989] Dah-Ming Chiu and Raj Jain Analysis of the increase and decrease algo-rithms for congestion avoidance in computer networks Computer Networksand ISDN systems 17(1) 1ndash14 1989

[Chun2003] Brent Chun David Culler Timothy Roscoe Andy Bavier Larry PetersonMike Wawrzoniak and Mic Bowman PlanetLab An overlay testbed forbroad-coverage services SIGCOMM Comput Commun Rev 33(3) 3ndash12July 2003

[Ciullo2009] D Ciullo M Mellia and M Meo Two schemes to reduce latency in shortlived TCP flows IEEE Communications Letters 13(10) October 2009

[Claise2004] Benoit Claise Cisco systems netflow services export 2004

[Comores2002] Mwezinet Lrsquoarriveacutee drsquointernet aux comores Last Seen 09062017

[Coonjah2015] Irfaan Coonjah Pierre Clarel Catherine and KMS Soyjaudah Perfor-mance evaluation and analysis of layer 3 tunneling between openssh andopenvpn in a wide area network environment In Computing Communica-tion and Security (ICCCS) 2015 International Conference on pages 1ndash4 IEEE2015

104

[Crovella2006] Mark Crovella and Balachander Krishnamurthy Internet Measurement Infrastructure Traffic and Applications John Wiley amp Sons Inc New YorkNY USA 2006

[Crowcroft1998] Jon Crowcroft and Philippe Oechslin Differentiated end-to-end in-ternet services using a weighted proportional fair sharing tcp ACM SIG-COMM Computer Communication Review 28(3) 53ndash69 1998

[DICT2017] Government of Seychelles Office of the president Department of informa-tion communication technology 2016

[Donnet2012] Benoit Donnet Matthew Luckie Pascal Meacuterindol and Jean-Jacques Pan-siot Revealing mpls tunnels obscured from traceroute ACM SIGCOMMComputer Communication Review 42(2) 87ndash93 2012

[Downey1999] Allen B Downey Using pathchar to estimate internet link characteristicsIn ACM SIGCOMM Computer Communication Review volume 29 pages 241ndash250 ACM 1999

[EQUINIX] CAIDA Chicago passive network monitor Last visit 12012018

[Estan2001] Cristian Estan and George Varghese New directions in traffic measurementand accounting volume 32 ACM 2002

[Fanou2015] Rodeacuterick Fanou Pierre Francois and Emile Aben On the diversity of in-terdomain routing in africa In Passive and Active Measurement pages 41ndash54Springer 2015

[Fanou2016] Rodeacuterick Fanou Gareth Tyson Pierre Francois and Arjuna SathiaseelanPushing the frontier Exploring the african web ecosystem In Proceedingsof the 25th International Conference on World Wide Web pages 435ndash445 Inter-national World Wide Web Conferences Steering Committee 2016

[Feige1992] Uriel Feige and Prabhakar Raghavan Exact analysis of hot-potato routingIn Foundations of Computer Science 1992 Proceedings 33rd Annual Symposiumon pages 553ndash562 IEEE 1992

[Fraleigh2001] Chuck Fraleigh Christophe Diot Bryan Lyles Sue Moon Philippe Owe-zarski Dina Papagiannaki and Fouad Tobagi Design and deployment ofa passive monitoring infrastructure In Thyrrhenian Internatinal Workshop onDigital Communications pages 556ndash575 Springer 2001

[Fraleigh2003] Chuck Fraleigh Sue Moon Bryan Lyles Chase Cotton Mujahid KhanDeb Moll Rob Rockell Ted Seely and SC Diot Packet-level traffic measu-rements from the sprint IP backbone Network IEEE 17(6) 6ndash16 2003

[France2017] Mission Tregraves Haut Deacutebit Plan france tregraves haut deacutebit Last seen 09062017

[GOTICOM2011] Groupement des Opeacuterateurs en Technologies de lrsquoInformation et de laCommunication Goticom Last Seen 09062017

[GSCounter] StatCounter Statcounter global stats - browser os search engine includingmobile usage share Last visit 13102017

[Gettys2011] Jim Gettys and Kathleen Nichols Bufferbloat Dark buffers in the InternetQueue 9(11) 40 2011

[Gevros2001] Panos Gevros Jon Crowcroft Peter Kirstein and Saleem Bhatti Conges-tion control mechanisms and the best effort service model IEEE network15(3) 16ndash26 2001

[Graham1997] Ian Graham Murray Pearson Jed Martens and Stephen Donnelly DAG- a cell capture board for ATMmeasurement systems 1997

105

[Gupta2014] Arpit Gupta Matt Calder Nick Feamster Marshini Chetty Enrico Calan-dro and Ethan Katz-Bassett Peering at the internetrsquos frontier A first lookat isp interconnectivity in africa In Passive and Active Measurement pages204ndash213 Springer 2014

[Ha2008] Sangtae Ha Injong Rhee and Lisong Xu Cubic A new tcp-friendly high-speed tcp variant SIGOPS Oper Syst Rev 42(5) 64ndash74 July 2008

[Herman2001] Paul Herman The tcpstat tool Publicly available at http wwwfrenchfriesnetpaultcpstat 2001

[Huston2000] Geoff Hutson Tcp performance The Internet Protocol Journal 3 2000

[Huston2006] Geoff Huston Gigabit tcp Internet Protocol Journal 9 2006

[IANA-port] IANA Service Name and Transport Protocol Port Number Registry Lastvisit 06202018

[ICTA2017] Information and Communication Technologies Authority of Mauritius IctaLast Seen 09062017

[IOX] Government Information Service Iox submarine cable to drive the newdigital economy of mauritius 2018

[IPMon] ATL Sprint Ipmon project

[Jacobson1988-1] V Jacobson Congestion avoidance and control ACM Computer Com-munications Review 18(4) 314ndash329 August 1988

[Jacobson1989-1] Van Jacobson Craig Leres and S McCanne The tcpdump manualpage Lawrence Berkeley Laboratory Berkeley CA 1989

[Jacobson1989-2] Van Jacobson Craig Leres and Steven McCanne pcap-packet capturelibrary UNIX man page 2001

[Jacobson1997] Van Jacobson Pathchar A tool to infer characteristics of internet paths1997

[Jain1990] Raj Jain Congestion Control in Computer Networks Issues and TrendsIEEE Network Magazine May 1990

[John2010] Wolfgang John Sven Tafvelin and Tomas Olovsson Passive internet mea-surement Overview and guidelines based on experiences Computer Com-munications 33(5) 533ndash550 2010

[Johnson2011] David L Johnson Veljko Pejovic Elizabeth M Belding and Gertjan vanStam Traffic characterization and internet usage in rural Africa In Pro-ceedings of the 20th International Conference Companion on World Wide WebWWW rsquo11 pages 493ndash502 New York NY USA 2011 ACM

[Johnson2016] David L Johnson and Gertjan van Stam The shortcomings of globalisedinternet technology in southern africa 2016

[Katabi2002] Dina Katabi Mark Handley and Charlie Rohrs Congestion control for highbandwidth-delay product networks In Proceedings of the 2002 Conference onApplications Technologies Architectures and Protocols for Computer Communi-cations SIGCOMM rsquo02 pages 89ndash102 New York NY USA 2002 ACM

[Katz2010] Ethan Katz-Bassett Harsha V Madhyastha Vijay Kumar Adhikari ColinScott Justine Sherry Peter Van Wesep Thomas E Anderson and ArvindKrishnamurthy Reverse traceroute In NSDI volume 10 pages 219ndash2342010

[Krajsa2011] Ondrej Krajsa and Lucie Fojtova RTT measurement and its dependence onthe real geographical distance In Telecommunications and Signal Processing(TSP) 2011 34th International Conference on pages 231ndash234 IEEE 2011

106

[LIL1978] Loi numeacutero 78-17 du 6 janvier 1978 relative agrave lrsquoinformatique aux fichiers etaux liberteacutes Last modification on 19 March 2014

[Lan2006] Kun-chan Lan and John Heidemann A measurement study of correlationsof internet flow characteristics Computer Networks 50(1) 46ndash62 2006

[LanYanFock2015] Jean-Christophe Lan-Yan-Fock Geacuteolocalisation drsquoadresses IP 2015

[Larrieu2010] Nicolas Larrieu and Philippe Owezarski Metrology of internet networksDigital Cognitive Technologies Epistemology and the Knowledge Economy pages101ndash117 2010

[Leguay2004] Jeremie Leguay Matthieu Latapy Timur Friedman and Kaveacute SalamatianDescribing and simulating internet routes CoRR csNI0411051 2004

[Leiner1997] Barry M Leiner Vinton G Cerf David D Clark Robert E Kahn LeonardKleinrock Daniel C Lynch Jon Postel Lawrence G Roberts and Stephen SWolff The past and future history of the Internet Communications of theACM 40(2) 102ndash108 1997

[Lemauricien] Le Mauricien Projet cacircble metiss le contrat deacutecrocheacute par alcatel subma-rine networks et electra tlc spa 2018

[Liu2007] Dan Liu Mark Allman Shudong Jin and Limin Wang Congestion controlwithout a startup phase In Workshop on Protocols for Fast Long-Distance Net-works (PFLDnet) 2007

[Lopez2006] Dino Martin Loacutepez-Pacheco Congduc Pham and Laurent Lefevre Nxg03-4 Xcp-i explicit control protocol for heterogeneous inter-networking ofhigh-speed networks In Global Telecommunications Conference 2006 GLO-BECOMrsquo06 IEEE pages 1ndash6 IEEE 2006

[METROPOLIS] Philippe Owezarski Metropolis meacutetrologie pour lrsquointernet et les ser-vices

[MGIX2017] Madagascar Internet Exchange Point Mgix Mauritius internet exchangepoint 2017

[MIXP2017] Mauritius Internet Exchange Point Mixp Mauritius internet exchangepoint 2017

[Maksimovic2014] Mirjana Maksimovic Vladimir Vujovic Nikola Davidovic VladimirMiloševic and Branko Perišic Raspberry pi as internet of things hardware performances and constraints design issues 3 8 2014

[Mediametrie2018-1] Benoit David Lrsquoanneacutee Internet 2017 Internet meacuteta-meacutedia Lastvisit 20042018

[Mediametrie2018-2] Benoit David Lrsquoobservatoire des Usages Digitaux Antilles-Guyane et Reacuteunion - Panorama 2017 Last visit 20042018

[Medina2005] Alberto Medina Mark Allman and Sally Floyd Measuring the evolutionof transport protocols in the internet ACM SIGCOMM Computer Communi-cation Review 35(2) 37ndash52 2005

[Mellia2003-1] Marco Mellia Andrea Carpani and Renato Lo Cigno Tstat Tcp statisticand analysis tool In International Workshop on Quality of Service in Multiser-vice IP Networks pages 145ndash157 Springer 2003

[Mellia2003-2] M Mellia I Stoica and H Zhang TCP-aware packet marking in net-works with diffserv support Elsevier Computer Networks 42(1) 81ndash100 2003

[Mellia2005] Marco Mellia R Lo Cigno and Fabio Neri Measuring ip and tcp behavioron edge nodes with tstat Computer Networks 47(1) 1ndash21 2005

107

[Moore2001] David Moore Ken Keys Ryan Koga Edouard Lagache and K C ClaffyThe coralreef software suite as a tool for system and network administra-tors In Proceedings of the 15th USENIX Conference on System AdministrationLISA rsquo01 pages 133ndash144 Berkeley CA USA 2001 USENIX Association

[NCSUNRL] North Caroline State University - Networking Research Lab Last seen 27022018

[Nagle1984] John Nagle Congestion control in iptcp internetworks 1984

[Nicolay2017-2] Xavier Nicolay Reacutehan Noordally Pascal Anelli Nour Mohammad Mu-rad and Tahiry Razafindralambo Where is my next hop the case of indianocean islands In 2017 Global Information Infrastructure and Networking Sym-posium (GIIS) (GIISrsquo17) St Denis Reunion October 2017

[Nomikos2016] George Nomikos and Xenofontas Dimitropoulos traixroute Detectingixps in traceroute paths In International Conference on Passive and ActiveNetwork Measurement pages 346ndash358 Springer 2016

[Noordally2016] Reacutehan Noordally Xavier Nicolay Pascal Anelli Richard Lorion andPierre Ugo Tournoux Analysis of internet latency The reunion island caseIn Proceedings of the 12th Asian Internet Engineering Conference AINTEC rsquo16pages 49ndash56 New York NY USA 2016 ACM

[Noordally2017] Reacutehan Noordally Yassine Gangat Arnaud Ravoavahy Pascal Anelliand Xavier Nicolay How long delays impact tcp performance for a connec-tivity from reunion island In Next Generation Computing Applications (Next-Comp) 2017 1st International Conference on page 103ndash108 IEEE 07 2017

[ONU2013] ONU The millennium development goals report 2013 Technical reportOrganisation Nations United 2013

[Obar2012] Jonathan A Obar and Andrew Clement Internet surveillance and boome-rang routing A call for Canadian network sovereignty In TEM 2013 Pro-ceedings of the Technology amp Emerging Media Track-Annual Conference of theCanadian Communication Association (Victoria) 2012

[OpenVPN] OpenVPN Openvpn - open source vpn Last visit 09102017

[OpenWrt] OpenWrt Openwrt project Welcome to the openwrt project Last visit 12062018

[Orebaugh2006] Angela Orebaugh Gilbert Ramirez and Jay Beale Wireshark amp Etherealnetwork protocol analyzer toolkit Syngress 2006

[Ostermann2000] Shawn Ostermann Tcptrace A TCP connection analysis tool URL http www tcptrace org 2000

[Owezarski2003-1] Philippe Owezarski Meacutetrologie de la qualiteacute de service Ecole drsquoeacuteteacutetemps reacuteel (ETR2003)-Systemes Reacuteseauxet Applications 2003

[Owezarski2004] Philippe Owezarski and Nicolas Larrieu Internet trafficcharacterizationndashan analysis of traffic oscillations High Speed Networks andMultimedia Communications pages 96ndash107 2004

[PCH] Packet Clearing House Internet exchange directory 2014

[PSAMP] The Internet Engineering Task Force Packet sampling (psamp) 2017

[Paris-traceroute] Paris Traceroute Team Paris traceroute Last visit 09292017

[Paxson1995] Vern Paxson and Sally Floyd Wide area traffic the failure of poissonmodeling IEEEACM Transactions on Networking (ToN) 3(3) 226ndash244 1995

[Paxson1999] Vern Paxson Bro a system for detecting network intruders in real-timeComputer networks 31(23) 2435ndash2463 1999

108

[Paxson2001] Vern Paxson Some not-so-pretty admissions about dealing with internetmeasurements In Workshop on Network-Related Data Management (NRDM2001) 2001

[PeeringDB] Peering DB Peeringdb facilitates the exchange of information related topeering

[Periakaruppan1999] Ram Periakaruppan Evi Nemeth et al GTrace A graphical trace-route tool In LISA volume 99 pages 69ndash78 1999

[Peterson2007] Larry L Peterson and Bruce S Davie Computer networks a systems ap-proach Elsevier 2007

[Phidgets] Phidgets Phidgets products for usb sensing and control

[PlanetLab] PlanetLab an open platform for developing deploying and accessingplanetary-scale services

[PlanetLabEurope] PlanetLab PlanetLab europe an open platform for developing de-ploying and accessing planetary-scale services last visit 09102017

[Pretet2000] Thierry Prete and Olivier Mas Avancement du projet SAFE Technicalreport 16 Janvier 2000

[REUNIX2017] RENATER RENATER Connecteur de savoirs - reunix Last visit 09102017

[RFC1072] V Jacobson and R Braden TCP extensions for long-delay paths RFC 1072October 1988

[RFC1105] K Lougheed and Y Rekhter Border Gateway Protocol (BGP) RFC 1105June 1989

[RFC1700] J Reynolds and J Postel Assigned numbers RFC 1700 October 1994

[RFC1918] Y Rekhter B Moskowitz D Karrenberg G J de Groot and E Lear Ad-dress Allocation for Private Internets RFC 1918 February 1996

[RFC1983] G Malkin (Ed) Internet Usersrsquo Glossary RFC 1983 (Informational) August1996

[RFC2001] W Richard Stevens TCP Slow Start Congestion Avoidance Fast Retrans-mit and Fast Recovery Algorithms RFC 2001 January 1997

[RFC2330] Dr Guy T Almes Jamshid Mahdavi Matt Mathis and Dr Vern PaxsonFramework for IP Performance Metrics RFC 2330 May 1998

[RFC2582] Tom Henderson and Sally Floyd The NewReno Modification to TCPrsquos FastRecovery Algorithm RFC 2582 April 1999

[RFC2678] J Mahdavi and V Paxson IPPM Metrics for Measuring Connectivity RFC2678 (Proposed Standard) September 1999

[RFC2679] G Almes S Kalidindi and M Zekauskas A One-way Delay Metric forIPPM RFC 2679 (Proposed Standard) September 1999 Obsoleted by RFC7679

[RFC2680] G Almes S Kalidindi and M Zekauskas A One-way Packet Loss Metricfor IPPM RFC 2680 (Proposed Standard) September 1999 Obsoleted byRFC 7680

[RFC2681] G Almes S Kalidindi and M Zekauskas A Round-trip Delay Metric forIPPM RFC 2681 (Proposed Standard) September 1999

[RFC2756] P Vixie and D Wessels Hyper Text Caching Protocol (HTCP00) RFC2756 (Experimental) January 2000

109

[RFC2914] Sally Floyd Congestion Control Principles RFC 2914 September 2000

[RFC3031] E Rosen Viswanathan A and R Callon Multiprotocol Label SwitchingArchitecture RFC 3031 January 2001

[RFC3069] D McPherson and B Dykes VLAN Aggregation for Efficient IP AddressAllocation RFC 3069 (Informational) February 2001

[RFC3168] Sally Floyd Dr K K Ramakrishnan and David L Black The Addition ofExplicit Congestion Notification (ECN) to IP RFC 3168 September 2001

[RFC3232] J Reynolds Assigned Numbers RFC 1700 is Replaced by an On-line Da-tabase RFC 3232 January 2002

[RFC3376] B Cain S Deering I Kouvelas B Fenner and A Thyagarajan InternetGroup Management Protocol Version 3 RFC 3376 (Proposed Standard)October 2002 Updated by RFC 4604

[RFC3649] Sally Floyd HighSpeed TCP for Large Congestion Windows RFC 3649December 2003

[RFC3742] S Floyd Limited Slow-Start for TCP with Large Congestion Windows RFC3742 (Experimental) March 2004

[RFC4250] Chris M Lonvick and Sami Lehtinen The Secure Shell (SSH) Protocol As-signed Numbers RFC 4250 January 2006

[RFC4782] Pasi Sarolahti Amit Jain Sally Floyd and Mark Allman Quick-Start forTCP and IP RFC 4782 January 2007

[RFC4950] R Bonica D Gan D Tappan and C Pignataro ICMP extensions for mul-tiprotocol label switching RFC 4950 August 2007

[RFC5166] S Floyd (Ed) Metrics for the Evaluation of Congestion Control Mecha-nisms RFC 5166 (Informational) March 2008

[RFC5475] T Zseby M Molina N Duffield S Niccolini and F Raspall Sampling andFiltering Techniques for IP Packet Selection RFC 5475 (Proposed Standard)March 2009

[RFC5681] Ethan Blanton Dr Vern Paxson and Mark Allman TCP CongestionControl RFC 5681 September 2009

[RFC5735] Michelle S Cotton and Leo Vegoda Special Use IPv4 Addresses RFC 5735January 2010

[RFC5936] E Lewis and A Hoenes (Ed) DNS Zone Transfer Protocol (AXFR) RFC5936 (Proposed Standard) June 2010

[RFC6077] Ed D Papadimitriou M Welzl M Scharf and Bob J Briscoe Open Re-search Issues in Internet Congestion Control RFC 6077 February 2011

[RFC6201] R Asati C Pignataro F Calabria and C Olvera Device Reset Characteri-zation RFC 6201 (Informational) March 2011

[RFC6248] A Morton RFC 4148 and the IP Performance Metrics (IPPM) Registry ofMetrics Are Obsolete RFC 6248 (Informational) April 2011

[RFC6298] Vern Paxson Mark Allman Jerry Chu and Matt Sargent Computing TCPrsquosretransmission timer RFC 6298 June 2011

[RFC6528] F Gont and S Bellovin Defending against Sequence Number Attacks RFC6528 February 2012

[RFC6691] D Borman TCP Options and Maximum Segment Size (MSS) RFC 6691(Informational) July 2012

110

[RFC6761] Marc Krochmal and Stuart Cheshire Special-Use Domain Names RFC6761 February 2013

[RFC6928] J Chu N Dukkipati Y Cheng and M Mathis Increasing TCPrsquos InitialWindow RFC 6928 (Experimental) April 2013

[RFC7414] M Duke R Braden W Eddy and E Blanton and TCP Extensions for HighPerformance RFC 7414 February 2015

[RFC760] DoD standard Internet Protocol RFC 760 January 1980

[RFC776] J Postel Assigned numbers RFC 776 (Historic) January 1981 Obsoletedby RFC 790

[RFC7766] J Dickinson S Dickinson R Bellis A Mankin and D Wessels DNS Trans-port over TCP - Implementation Requirements RFC 7766 (Proposed Stan-dard) March 2016

[RFC793] Information Sciences Institute Transmission Control Protocol RFC 793September 1981

[RFC8311] D Black Relaxing Restrictions on Explicit Congestion Notification (ECN)Experimentation RFC 8311 (Proposed Standard) January 2018

[RFC8312] I Rhee L Xu S Ha A Zimmermann and L Eggert CUBIC for Fast Long-Distance Networks RFC 8312 February 2018

[RITE2014-1] Bob Briscoe Anna Brunstrom Andreas Petlund David Hayes David RosIng-Jyh Tsang Stein Gjessing Gorry Fairhurst Carsten Griwodz and Mi-chael Welz Reducing internet latency A survey of techniques and theirmerits In IEEE Communications Surveys amp Tutorials IEEE 2014 (To appear)

[RITE2014-2] RITE | Reducing Internet Transport Latency Slow internet -more band-with is not the answer 2014

[RaspberryPi] RASPBERRY PI FOUNDATION Raspberry Pi official website Last visit 09102017

[Ravoavahy2017] Arnaud Ravoavahy Meacutetrologie Reacuteseaux 2017

[Ripe2010] RIPE NCC RIPE atlas 2010

[Ros2005] David Ros Protocole de Transport TCP Ed Techniques Ingeacutenieur 2005

[SDTAN2013] Reacutegion Reunion Sphegravere Public and TACTIS Schema directeur drsquoamena-gement numerique du territoire de la reunion Technical report 2013

[Sallantin2014] Renaud Sallantin Optimisation de bout-en-bout du deacutemarrage des connexionsTCP PhD thesis 2014

[SamKnows] SamKnows Ltd Samknowscom 2017

[Sanchez2013] Mario A Saacutenchez John S Otto Zachary S Bischof David R ChoffnesFabiaacuten E Bustamante Balachander Krishnamurthy and Walter WillingerDasu Pushing experiments to the internetrsquos edge In NSDI pages 487ndash4992013

[Scharf2008-1] Michael Scharf Simon Hauger and Jochen Koumlgel Quick-start tcp Fromtheory to practice In Proc 6th Intern Workshop on Protocols for FAST Long-Distance Networks (PFLDnet) Manchester 2008

[Speechecker] Speedchecker Ltd Internet Performance Monitoring | Speedchecker LtdLast visit 29032018

[Steenbergen2009] Richard A Steenbergen A practical guide to (correctly) troubleshoo-ting with traceroute North American Network Operators Group pages 1ndash492009

111

[Sundaresan2011] Srikanth Sundaresan Walter De Donato Nick Feamster RenataTeixeira Sam Crawford and Antonio Pescapegrave Broadband internet perfor-mance a view from the gateway In ACM SIGCOMM computer communica-tion review volume 41 pages 134ndash145 ACM 2011

[Tan2006] Kun Tan Jingmin Song Qian Zhang and Murad Sridharan A compoundtcp approach for high-speed and long distance networks In Proceedings-IEEE INFOCOM 2006

[Tirumala2005] Ajay Tirumala Feng Qin Jon Dugan Jim Ferguson and Kevin GibbsIperf The tcpudp bandwidth measurement tool htt p dast nlanr net-Projects 2005

[Trammell2015] Brian Trammell Mirja Kuumlhlewind Damiano Boppart Iain LearmonthGorry Fairhurst and Richard Scheffenegger Enabling internet-wide de-ployment of explicit congestion notification In International Conference onPassive and Active Network Measurement pages 193ndash205 Springer 2015

[Udoo] UDOO All you need mini pc android + linux + arduino | udoo

[Vergoz2013] Michael Vergoz Classement des opeacuterateurs Internet reacuteunionnais Techni-cal report BinarySec 2013

[WAND] WAND Wand network research group Last visit 09252017

[Wang2004] Ren Wang Giovanni Pau Kenshin Yamada MY Sanadidi and Mario GerlaTcp startup performance in large bandwidth networks In INFOCOM 2004Twenty-third AnnualJoint Conference of the IEEE Computer and CommunicationsSocieties volume 2 pages 796ndash805 IEEE 2004

[Wang2018] Jessie Hui Wang and Changqing An A study on geographic properties ofinternet routing Computer Networks 133 183ndash194 2018

[Wenwei2006] Li Wenwei Zhang Dafang Yang Jinmin and Xie Gaogang On evalua-ting the differences of TCP and ICMP in network measurement ComputerCommunications 30(2) 428ndash439 2007

[WikiPing] Wikipedia ping (logiciel) Last visit 06102017

[Xu2002] Jun Xu Jinliang Fan Mostafa H Ammar and Sue B Moon Prefix-preservingIP address anonymization Measurement-based security evaluation and anew cryptography-based scheme In Network Protocols 2002 Proceedings10th IEEE International Conferenceon pages 280ndash289 IEEE 2002

[Xu2004] Lisong Xu Khaled Harfoush and Injong Rhee Binary increase congestioncontrol (bic) for fast long-distance networks In INFOCOM 2004 Twenty-third AnnualJoint Conference of the IEEE Computer and Communications Socie-ties volume 4 pages 2514ndash2524 IEEE 2004

[Yang2016] Chantal Yang Hussein Suleman and Josiah Chavula A topology visuali-sation tool for national research and education networks in Africa In IST-Africa Week Conference 2016 pages 1ndash11 IIMC 2016

[Zhang2007] Jian Zhang and Andrew Moore Traffic trace artifacts due to monitoringvia port mirroring In End-to-End Monitoring Techniques and Services 2007E2EMONrsquo07 Workshop on pages 1ndash8 IEEE 2007

[Zheleva2015] Mariya Zheleva Paul Schmitt Morgan Vigil and Elizabeth Belding In-ternet bandwidth upgrade implications on performance and usage in ru-ral zambia Information Technologies amp International Development 11(2) ppndash12015

[nPerf2017] nperf awards broadband reunion 2017

112

[rtraceroute] Reacutehan Noordally Arnaud Ravohavay and Xavier Nicolay rtraceroute Lastvisit 18102017

113

Pocircle Recherche Ecoles doctorales

LETTRE DrsquoENGAGEMENT DE NON-PLAGIAT

Je soussigneacute(e) NOORDALLY Reacutehan

en ma qualiteacute de doctorant(e) de

lrsquoUniversiteacute de La Reacuteunion deacuteclare ecirctre conscient(e) que le plagiat est un acte deacutelictueux

passible de sanctions disciplinaires Aussi dans le respect de la proprieacuteteacute intellectuelle et du

droit drsquoauteur je mrsquoengage agrave systeacutematiquement citer mes sources quelle qursquoen soit la forme

(textes images audiovisuel internet) dans le cadre de la reacutedaction de ma thegravese et de toute

autre production scientifique sachant que lrsquoeacutetablissement est susceptible de soumettre le texte

de ma thegravese agrave un logiciel anti-plagiat

Fait agrave Saint-Denis le 06072018

Signature

Extrait du Regraveglement inteacuterieur de lUniversiteacute de La Reacuteunion (valideacute par le Conseil drsquoAdministration en date du 11 deacutecembre 2014)

Article 9 Protection de la proprieacuteteacute intellectuelle ndash Faux et usage de faux contrefaccedilon plagiat

Lrsquoutilisation des ressources informatiques de lrsquoUniversiteacute implique le respect de ses droits de proprieacuteteacute intellectuelle ainsi que ceux de ses partenaires et plus geacuteneacuteralement de tous tiers titulaires de tes droits En conseacutequence chaque utilisateur doit - utiliser les logiciels dans les conditions de licences souscrites - ne pas reproduire copier diffuser modifier ou utiliser des logiciels bases de donneacutees pages Web textes images photographies ou autres creacuteations proteacutegeacutees par le droit drsquoauteur ou un droit privatif sans avoir obtenu preacutealablement lrsquoautorisation des titulaires de ces droits

La contrefaccedilon et le faux Conformeacutement aux dispositions du code de la proprieacuteteacute intellectuelle toute repreacutesentation ou reproduction inteacutegrale ou partielle drsquoune œuvre de lrsquoesprit faite ans le consentement de son auteur est illicite et constitue un deacutelit peacutenal Lrsquoarticle 444-1 du code peacutenal dispose laquo Constitue un faux toute alteacuteration frauduleuse de la veacuteriteacute de nature agrave cause un preacutejudice et accomplie par quelque moyen que ce soit dans un eacutecrit ou tout autre support drsquoexpression de la penseacutee qui a pour objet ou qui peut avoir pour effet drsquoeacutetablir la preuve drsquoun droit ou drsquoun fait ayant des conseacutequences juridiques raquo Lrsquoarticle L335_3 du code de la proprieacuteteacute intellectuelle preacutecise que laquo Est eacutegalement un deacutelit de contrefaccedilon toute reproduction repreacutesentation ou diffusion par quelque moyen que ce soit drsquoune œuvre de lrsquoesprit en violation des droits de lrsquoauteur tels qursquoils sont deacutefinis et reacuteglementeacutes par la loi Est eacutegalement un deacutelit de contrefaccedilon la violation de lrsquoun des droits de lrsquoauteur drsquoun logiciel (hellip) raquo

Le plagiat est constitueacute par la copie totale ou partielle drsquoun travail reacutealiseacute par autrui lorsque la source emprunteacutee nrsquoest pas citeacutee quel que soit le moyen utiliseacute Le plagiat constitue une violation du droit drsquoauteur (au sens des articles L 335-2 et L 335- 3 du code de la proprieacuteteacute intellectuelle) Il peut ecirctre assimileacute agrave un deacutelit de contrefaccedilon Crsquoest aussi une faute disciplinaire susceptible drsquoentraicircner une sanction Les sources et les reacutefeacuterences utiliseacutees dans le cadre des travaux (preacuteparations devoirs meacutemoires thegraveses rapports de stagehellip) doivent ecirctre clairement citeacutees Des citations inteacutegrales peuvent figurer dans les documents rendus si elles sont assorties de leur reacutefeacuterence (nom drsquoauteur publication date eacutediteurhellip) et identifieacutees comme telles par des guillemets ou des italiques

Les deacutelits de contrefaccedilon de plagiat et drsquousage de faux peuvent donner lieu agrave une sanction disciplinaire indeacutependante de la mise en œuvre de poursuites peacutenales

  • Eacutetude de la connectiviteacute Internet de lrsquoicircle de la Reacuteunion
  • Remerciements
  • Reacutesumeacute
  • Abstract
  • Table des matiegraveres
  • Liste des acronymes
  • Introduction
    • Contexte geacuteneacuteral
    • Contexte reacutegional
      • LInternet agrave La Reacuteunion
      • LInternet dans la Zone de lOceacutean Indien
        • Probleacutematique
        • Organisation de la thegravese
          • Eacutetat de lart
            • Le controcircle de congestion TCP et les reacuteseaux agrave grande capaciteacute de stockage
              • Controcircle de congestion de TCP
              • La probleacutematique de lutilisation dun reacuteseau agrave grande capaciteacute de stockage
              • Un controcircle de congestion de TCP adapteacute aux LFN
              • Controcircle de congestion avec implication des routeurs
              • Caracteacuterisation de La Reacuteunion
                • Meacutetrologie du trafic Internet
                  • Deacutefinition
                  • Meacutetrologie active
                  • Meacutetrologie passive
                  • Comparatif entre mesures actives et mesures passives
                    • Synthegravese
                      • Caracteacuterisation de la connectiviteacute de La Reacuteunion
                        • Objectifs
                        • Cahier des charges
                          • Evolution
                          • Connectiviteacute
                            • Protocole de mesure
                              • Eacutechantillon de mesure
                              • Eacutevolution
                              • Connectiviteacute
                                • Reacutesultats
                                  • Eacutevolution
                                  • Connectiviteacute de La Reacuteunion
                                  • Connectiviteacute des icircles de la Zone Oceacutean Indien
                                  • Synthegravese des reacutesultats
                                    • Conclusion
                                      • Meacutetrologie sur le service de transport agrave La Reacuteunion
                                        • Objectifs
                                          • Les objectifs de leacutetude
                                          • Les meacutetriques de leacutetude
                                            • Mise en oeuvre dune plate-forme de meacutetrologie
                                              • Pour la capture du trafic
                                              • Pour analyser les traces
                                                • Protocole de mesure
                                                • Reacutesultats
                                                  • Supervision du trafic
                                                  • Performance de TCP
                                                  • Synthegravese des reacutesultats
                                                    • Conclusion
                                                      • Conclusion amp perspectives
                                                        • Synthegravese des travaux
                                                          • Perspectives
                                                            • Table des figures
                                                            • Liste des tableaux
                                                              • Bibliographie
                                                                  • Table des figures
                                                                  • Liste des tableaux
                                                                  • Bibliographie
Page 7: Étude de la connectivité Internet de l'île de la Réunion
Page 8: Étude de la connectivité Internet de l'île de la Réunion
Page 9: Étude de la connectivité Internet de l'île de la Réunion
Page 10: Étude de la connectivité Internet de l'île de la Réunion
Page 11: Étude de la connectivité Internet de l'île de la Réunion
Page 12: Étude de la connectivité Internet de l'île de la Réunion
Page 13: Étude de la connectivité Internet de l'île de la Réunion
Page 14: Étude de la connectivité Internet de l'île de la Réunion
Page 15: Étude de la connectivité Internet de l'île de la Réunion
Page 16: Étude de la connectivité Internet de l'île de la Réunion
Page 17: Étude de la connectivité Internet de l'île de la Réunion
Page 18: Étude de la connectivité Internet de l'île de la Réunion
Page 19: Étude de la connectivité Internet de l'île de la Réunion
Page 20: Étude de la connectivité Internet de l'île de la Réunion
Page 21: Étude de la connectivité Internet de l'île de la Réunion
Page 22: Étude de la connectivité Internet de l'île de la Réunion
Page 23: Étude de la connectivité Internet de l'île de la Réunion
Page 24: Étude de la connectivité Internet de l'île de la Réunion
Page 25: Étude de la connectivité Internet de l'île de la Réunion
Page 26: Étude de la connectivité Internet de l'île de la Réunion
Page 27: Étude de la connectivité Internet de l'île de la Réunion
Page 28: Étude de la connectivité Internet de l'île de la Réunion
Page 29: Étude de la connectivité Internet de l'île de la Réunion
Page 30: Étude de la connectivité Internet de l'île de la Réunion
Page 31: Étude de la connectivité Internet de l'île de la Réunion
Page 32: Étude de la connectivité Internet de l'île de la Réunion
Page 33: Étude de la connectivité Internet de l'île de la Réunion
Page 34: Étude de la connectivité Internet de l'île de la Réunion
Page 35: Étude de la connectivité Internet de l'île de la Réunion
Page 36: Étude de la connectivité Internet de l'île de la Réunion
Page 37: Étude de la connectivité Internet de l'île de la Réunion
Page 38: Étude de la connectivité Internet de l'île de la Réunion
Page 39: Étude de la connectivité Internet de l'île de la Réunion
Page 40: Étude de la connectivité Internet de l'île de la Réunion
Page 41: Étude de la connectivité Internet de l'île de la Réunion
Page 42: Étude de la connectivité Internet de l'île de la Réunion
Page 43: Étude de la connectivité Internet de l'île de la Réunion
Page 44: Étude de la connectivité Internet de l'île de la Réunion
Page 45: Étude de la connectivité Internet de l'île de la Réunion
Page 46: Étude de la connectivité Internet de l'île de la Réunion
Page 47: Étude de la connectivité Internet de l'île de la Réunion
Page 48: Étude de la connectivité Internet de l'île de la Réunion
Page 49: Étude de la connectivité Internet de l'île de la Réunion
Page 50: Étude de la connectivité Internet de l'île de la Réunion
Page 51: Étude de la connectivité Internet de l'île de la Réunion
Page 52: Étude de la connectivité Internet de l'île de la Réunion
Page 53: Étude de la connectivité Internet de l'île de la Réunion
Page 54: Étude de la connectivité Internet de l'île de la Réunion
Page 55: Étude de la connectivité Internet de l'île de la Réunion
Page 56: Étude de la connectivité Internet de l'île de la Réunion
Page 57: Étude de la connectivité Internet de l'île de la Réunion
Page 58: Étude de la connectivité Internet de l'île de la Réunion
Page 59: Étude de la connectivité Internet de l'île de la Réunion
Page 60: Étude de la connectivité Internet de l'île de la Réunion
Page 61: Étude de la connectivité Internet de l'île de la Réunion
Page 62: Étude de la connectivité Internet de l'île de la Réunion
Page 63: Étude de la connectivité Internet de l'île de la Réunion
Page 64: Étude de la connectivité Internet de l'île de la Réunion
Page 65: Étude de la connectivité Internet de l'île de la Réunion
Page 66: Étude de la connectivité Internet de l'île de la Réunion
Page 67: Étude de la connectivité Internet de l'île de la Réunion
Page 68: Étude de la connectivité Internet de l'île de la Réunion
Page 69: Étude de la connectivité Internet de l'île de la Réunion
Page 70: Étude de la connectivité Internet de l'île de la Réunion
Page 71: Étude de la connectivité Internet de l'île de la Réunion
Page 72: Étude de la connectivité Internet de l'île de la Réunion
Page 73: Étude de la connectivité Internet de l'île de la Réunion
Page 74: Étude de la connectivité Internet de l'île de la Réunion
Page 75: Étude de la connectivité Internet de l'île de la Réunion
Page 76: Étude de la connectivité Internet de l'île de la Réunion
Page 77: Étude de la connectivité Internet de l'île de la Réunion
Page 78: Étude de la connectivité Internet de l'île de la Réunion
Page 79: Étude de la connectivité Internet de l'île de la Réunion
Page 80: Étude de la connectivité Internet de l'île de la Réunion
Page 81: Étude de la connectivité Internet de l'île de la Réunion
Page 82: Étude de la connectivité Internet de l'île de la Réunion
Page 83: Étude de la connectivité Internet de l'île de la Réunion
Page 84: Étude de la connectivité Internet de l'île de la Réunion
Page 85: Étude de la connectivité Internet de l'île de la Réunion
Page 86: Étude de la connectivité Internet de l'île de la Réunion
Page 87: Étude de la connectivité Internet de l'île de la Réunion
Page 88: Étude de la connectivité Internet de l'île de la Réunion
Page 89: Étude de la connectivité Internet de l'île de la Réunion
Page 90: Étude de la connectivité Internet de l'île de la Réunion
Page 91: Étude de la connectivité Internet de l'île de la Réunion
Page 92: Étude de la connectivité Internet de l'île de la Réunion
Page 93: Étude de la connectivité Internet de l'île de la Réunion
Page 94: Étude de la connectivité Internet de l'île de la Réunion
Page 95: Étude de la connectivité Internet de l'île de la Réunion
Page 96: Étude de la connectivité Internet de l'île de la Réunion
Page 97: Étude de la connectivité Internet de l'île de la Réunion
Page 98: Étude de la connectivité Internet de l'île de la Réunion
Page 99: Étude de la connectivité Internet de l'île de la Réunion
Page 100: Étude de la connectivité Internet de l'île de la Réunion
Page 101: Étude de la connectivité Internet de l'île de la Réunion
Page 102: Étude de la connectivité Internet de l'île de la Réunion
Page 103: Étude de la connectivité Internet de l'île de la Réunion
Page 104: Étude de la connectivité Internet de l'île de la Réunion
Page 105: Étude de la connectivité Internet de l'île de la Réunion
Page 106: Étude de la connectivité Internet de l'île de la Réunion
Page 107: Étude de la connectivité Internet de l'île de la Réunion
Page 108: Étude de la connectivité Internet de l'île de la Réunion
Page 109: Étude de la connectivité Internet de l'île de la Réunion
Page 110: Étude de la connectivité Internet de l'île de la Réunion
Page 111: Étude de la connectivité Internet de l'île de la Réunion
Page 112: Étude de la connectivité Internet de l'île de la Réunion
Page 113: Étude de la connectivité Internet de l'île de la Réunion
Page 114: Étude de la connectivité Internet de l'île de la Réunion
Page 115: Étude de la connectivité Internet de l'île de la Réunion
Page 116: Étude de la connectivité Internet de l'île de la Réunion
Page 117: Étude de la connectivité Internet de l'île de la Réunion
Page 118: Étude de la connectivité Internet de l'île de la Réunion
Page 119: Étude de la connectivité Internet de l'île de la Réunion
Page 120: Étude de la connectivité Internet de l'île de la Réunion
Page 121: Étude de la connectivité Internet de l'île de la Réunion
Page 122: Étude de la connectivité Internet de l'île de la Réunion
Page 123: Étude de la connectivité Internet de l'île de la Réunion
Page 124: Étude de la connectivité Internet de l'île de la Réunion
Page 125: Étude de la connectivité Internet de l'île de la Réunion
Page 126: Étude de la connectivité Internet de l'île de la Réunion
Page 127: Étude de la connectivité Internet de l'île de la Réunion
Page 128: Étude de la connectivité Internet de l'île de la Réunion