Archives du mot-clef sauvegarde en ligne

Choisir une sauvegarde en ligne — Dropbox vs Wuala vs Symform

Plu­sieurs contraintes à consi­dé­rer pour le choix d’une telle solution :
  • popu­la­rité bien­tôt en berne
  • occu­pa­tion disque
  • pro­tec­tion des données
  • bande pas­sante nécessaire
  • coût
Je ne m’intéresserai ici qu’aux trois premiers.

La décep­tion arrive

Petit aver­tis­se­ment : le cloud com­pu­ting est arrivé sur la pente de la décep­tion, (voir le Cycle de la sur­vente de Gart­ner). Donc, bien­tôt les gens seront déçus par le cloud, mais ça n’aura qu’un temps. Tout ceci est très nor­mal, donc ne pas s’inquiéter — atten­dez juste avant d’investir.

Sau­ve­garde en ligne contre sto­ckage en ligne

La sau­ve­garde en ligne est la conser­va­tion d’une copie hors-site. Ça veut dire qu’il y a tou­jours une ver­sion dans l’ordinateur et que donc, vous ne gagne­rez pas de place en sau­ve­gar­dant en ligne. Pire, vous en pren­drez même davan­tage, puisque vous aurez une copie sur chaque ordi­na­teur. C’est encore plus fla­grant avec les solu­tions décen­tra­li­sées (ou P2P), où il n’y a pas de ser­veur cen­tral (Wuala et Sym­form), puisque non seule­ment il fau­dra de la place pour vos don­nées, mais en plus il en fau­dra pour celle des autres ! Ainsi :
  • Google Docs (sto­ckage en ligne) : 0 % d’espace disque (sauf le cache navigateur)
  • Drop­box (sau­ve­garde en ligne) : 100 % d’espace disque (c’est pour ça que l’on dit que Drop­box n’est pas vrai­ment sur cloud computing)
  • Wuala/Symform (sau­ve­garde en ligne P2P) : 200 % d’espace disque (idem)
Dans un contexte d’entreprise, faut y réflé­chir. Sur­tout quand les don­nées que doivent pou­voir lire les uti­li­sa­teurs sont dans leur ensemble plus grosses que leur disque dur ! Bien sûr, il y a des rai­sons à ça. Le sto­ckage en ligne (contrai­re­ment à la sau­ve­garde en ligne) néces­site soit de le réser­ver à de petits fichiers (textes), soit à avoir une très grosse bande pas­sante, soit à ne pas accé­der sou­vent aux fichiers. Et les solu­tions décen­tra­li­sées ont bien besoin de sto­cker les fichiers quelque part ; si ce n’est pas sur un ser­veur cen­tral, ça doit être sur la machine des clients. L’intégrité des don­nées dans les nuages Trois aspects à consi­dé­rer : légal, tech­nique et humain.
  • risques légaux. Si une loi (comme le Patriot Act) dit que vos don­nées doivent être acces­sibles au gou­ver­ne­ment, l’entreprise qui héberge les don­nées n’a que trois choix : obéir (et alors, le gou­ver­ne­ment peut avoir accès aux don­nées et l’entreprise aussi), refu­ser (mieux vaut alors être dans un lieu où une telle loi ne s’applique pas ; ce furent les choix d’HavenCo et The Pirate Bay, qui tous deux essayèrent de s’établir à Sea­land) ou bien plier bou­tique. Parades : prendre une société très impor­tante, qui ne peut se per­mettre la perte de confiance (on pense à Google), cryp­ter les don­nées de votre côté (c’est la fameuse solu­tion Drop­box + True­Crypt, mais qui vient au prix d’une perte de per­for­mance (ver­sion­nage peu pro­bant, même si des réflexions sont en cours avec iKrypt, une solu­tion basées sur encfs et github) et une com­plexité accrue (ins­tal­la­tion d’une couche de cryptage).
  • risques tech­niques. Des disques durs, ça tombe en panne, donc sau­ve­gardes externes et RAID sont néces­saires. Je classe aussi les risques liés à l’environnement (panne de cou­rant, catas­trophes natu­relles et cam­brio­lage) dans cette caté­go­rie. Bonne nou­velle, pré­ve­nir tout ceci fait par­tie de la rou­tine des data­cen­ters, donc ce n’est pas un pro­blème pour les ser­veurs cen­tra­li­sés (pour les ser­veurs décen­tra­li­sés, on compte sur la répli­ca­tion des don­nées pour com­pen­ser le manque de fia­bi­lité des nœud et le résul­tat est, on l’espère, simi­laire). En revanche, un pro­blème bien plus grand est celui de la cor­rup­tion silen­cieuse des don­nées (réali­gne­ment magné­tique, rayons cos­miques…). Une étude du CERN à mon­tré que ce n’est pas du tout anec­do­tique. Les solu­tions existent (ZFS), mais si elles ne sont pas implé­men­tés sur le client, ça ne sert à rien. Or, autant on peut espé­rer qu’un ser­veur (cen­tra­lisé) est à l’abri de ceci, autant on ne peut pas l’espérer avant… long­temps sur les clients. Le pro­blème est pire encore pour les ser­veurs décen­tra­li­sés (GIGO)..
  • risques humains. L’erreur humaine (sup­pres­sion acci­den­telle) peut être pré­ve­nue par le ver­sion­nage (conser­va­tion de toute dif­fé­rence, même un chan­ge­ment de vir­gule ou une sup­pres­sion, l’historique de Wiki­pe­dia est l’exemple le plus connu). Certes, un indi­vidu mal­in­ten­tionné pourra tou­jours détruire les don­nées, mais là, c’est du sabo­tage et de la ges­tion d’équipe ; on rentre dans la défense en pro­fon­deur et on quitte le champ de l’erreur humaine. Cepen­dant, un pro­blème impor­tant demeure : celui de ne se rendre compte qu’après moult modi­fi­ca­tions que quelque chose à été sup­primé acci­den­tel­le­ment ; mais avec un ver­sion­nage illi­mité, c’est juste long à réparer…
Il y a bien d’autres cri­tères, comme le prix, l’intégration, la vitesse, l’administration (pour les entre­prises)… Mais j’arrête là. Per­son­nel­le­ment, j’utilise Drop­box et j’évalue Sym­form. Ce der­nier a pour lui la trans­pa­rence et la gra­tuité de Drop­box et sur­tout dix fois plus d’espace. En revanche, il faut aussi avoir plus d’espace disque (cloud P2P), il n’y a pas de ver­sion­nage (donc, pas de pro­tec­tion contre l’erreur humaine) ou de syn­chro­ni­sa­tion sélec­tive (pour évi­ter de tout syn­chro­ni­ser ou de client mobile et il n’y a pas de syn­chro­ni­sa­tion en LAN. Enfin, Sym­form n’a pas encore fait ses preuves.