Nous abordons dans ces colonnes tous les domaines liés à l’éthique du numérique.
Or, il est un sujet dont on parle peu en ce domaine : c’est la continuité des services.
Car, à bien y réfléchir, quelle est la première chose que l’on doit attendre d’une solution informatique ?
Qu’elle fonctionne et qu’elle soit disponible.
Ce simple constat a conduit depuis toujours les DSI et les éditeurs à se creuser la tête, pour assurer la continuité de services.
Dans la gestion de la continuité, on parle de gérer un désastre, c’est-à-dire l’arrêt, le blocage, l’altération ou la destruction complète du système d’information ou même du site hébergeant l’entreprise.
Or, l’actualité vient de nous le prouver de façon fort malheureuse : un sinistre de grande ampleur est toujours possible.
Incendie OVH : comment maintenir la continuité de services ?
Un incendie a eut lieu dans la nuit du dans le centre de données de l’entreprise OVHcloud.
L’incendie a intégralement détruit un des quatre centres de données strasbourgeois (SBG2), et partiellement un autre (SBG1).
L’arrêt total ou partiel des serveurs a occasionné des interruptions de service pour des milliers d’entreprises et services publics, et des pertes de données définitives encore non estimées.
C’est probablement le pire sinistre impactant l’écosystème numérique français depuis son origine.
Mais si des milliers d’entreprises et d’organisations ont été impactées, certaines ont réussi à rétablir leurs services bien plus rapidement que d’autres.
En s’appuyant sur un outil longuement réfléchi et maintes fois testé : le PRA.
Un plan de reprise d’activité (PRA) est un ensemble de procédures (techniques, organisationnelles, sécurité) qui permet à une entreprise de prévoir par anticipation, les mécanismes pour reconstruire et remettre en route un système d’information en cas de sinistre important ou d’incident critique.
En cas de sinistre, Le PRA permet de reconstruire les serveurs en leur affectant les données répliquées et ainsi de redémarrer les applications sous quelques minutes ou quelques heures, suivant les solutions retenues.
Jamespot : un exemple de PRA bien géré
Jamespot est un acteur bien connu de la FrenchTech, notamment pour ses solutions de collaboration.
Sa défaillance aurait pu occasionner une réaction en chaine, entrainant des impacts considérables pour des milliers d’utilisateurs.
Heureusement, il n’en fût rien, grâce à un PRA mis en place de longue date. Voici quelques extraits de l’interview d’Alain Garnier par Le Mag IT.
« Un PRA est un processus qui doit être écrit et mis à jour régulièrement. C’est le cas chez nous ; nos clients les plus importants l’exigent d’ailleurs à la signature du contrat », explique au MagIT Alain Garnier, le président de Jamespot. « Ce PRA décrit l’organisation à suivre en cas d’incident, mais aussi quelle architecture utiliser pour relancer l’activité et quelle politique décider pour sauvegarder les données ».
Alain Garnier rappelle au passage qu’un PRA a deux coûts : celui des ressources matérielles et celui des procédures. « Il faut par exemple prendre en compte qu’un stockage peu cher coûtera plus cher en procédures de restauration et de tests. Mais aussi que les procédures comprennent le coût de maintenance perpétuelle du code, pour prendre en compte les évolutions régulières des packages fonctionnels », souligne-t-il.
« La réplication à chaud des données depuis un autre serveur dans le même bâtiment n’était pas possible. Donc nous devions repartir depuis des backups », raconte Alain Garnier. « Les backups que nous effectuons sont stockés sur le site de Roubaix d’OVHcloud. Nous en faisons aussi des copies de secours qui, elles, sont stockées chez un autre hébergeur, en l’occurrence Scaleway ». Alain Garnier précise que le site de Roubaix sert aussi à exécuter des instances des services Jamespot ; celles-ci sont sauvegardées encore ailleurs.
Au final, les clients de Jamespot n’aurons été impactés que quelques heures, là où certains services, y compris publics, auront subi des interruptions de plusieurs jours.
Point de vue éthique : le rappel de la CNIL
Reste la question pour certains des données disparues. Et cette question est aussi du ressort de la CNIL.
Suite à l’incendie OVH, la CNIL a été amenée a rappeler certains principes.
La destruction de données personnelles (temporaire ou définitive), y compris accidentelle, constitue une violation de données au sens du RGPD.
À ce titre, les responsables de traitement qui hébergeaient des données personnelles au sein des infrastructures touchées doivent documenter la violation (les faits, ses effets et les mesures prises pour y remédier) dans un registre tenu en interne.
Les sous-traitants doivent informer leurs clients de l’incident afin que ces derniers puissent remplir leurs propres obligations, dont celle de documentation dans le registre des violations tenu en interne par chacun d’entre eux.