S3 contient des fichiers, mais n’est pas un système de fichiers
- Amazon S3 est la technologie cloud d’origine lancée en 2006 ; on l’appelle un « stockage objet », mais en pratique il est destiné aux fichiers.
- L’idée que S3 serait un « Amazon Cloud Filesystem » est une croyance utile pour encourager son adoption, mais en réalité S3 n’est pas un système de fichiers.
Qu’est-ce qu’un système de fichiers, et la « profondeur » d’un module
- L’API de fichiers Unix se compose de cinq fonctions de base, qui fournissent tout le nécessaire pour lire et écrire des fichiers.
- Ces fonctions gèrent de nombreux problèmes comme la mise en tampon, le cache de pages, la fragmentation, les permissions, l’ordonnancement des E/S, etc., sans les exposer à l’utilisateur.
- Les modules profonds ont l’avantage de permettre aux utilisateurs d’exploiter des fonctionnalités sans avoir à penser à cette complexité.
Les caractéristiques de S3 (cela aussi, c’est profond)
- S3 ne réimplémente pas l’API de système de fichiers Unix, et son mode d’appel fondamental est différent.
- L’API S3 est plus simple que l’API de fichiers Unix, mais elle a la limitation de ne pas permettre l’écrasement partiel d’un objet.
Les logiciels de système de fichiers, en particulier les bases de données, ne peuvent pas être déplacés vers Amazon S3
- Les bases de données ont besoin d’un endroit où stocker les données, généralement dans divers fichiers d’un système de fichiers.
- Elles dépendent fortement de la capacité à effectuer des écrasements partiels, ce qui est impossible avec S3.
Ce que S3 fait bien et ce qu’il fait mal
- Le point fort de S3 est une bande passante très élevée en lecture comme en écriture.
- En revanche, S3 ne prend pas en charge l’écrasement partiel, ni les opérations de renommage ou de déplacement, et l’énumération des fichiers est également lente.
- Malgré cela, S3 demande peu de maintenance et simplifie des tâches comme la configuration des sauvegardes, la réplication ou le provisioning.
L’importance de la profondeur des modules entre organisations
- Il n’est pas surprenant que S3 soit devenu la première API cloud populaire, car les API profondes aident à gérer la complexité entre organisations.
- Intégrer un logiciel d’entreprise complexe comme SAP est une tâche pénible, précisément parce que SAP n’est pas un module profond.
Autres informations
- Cet article ne cherche pas à suggérer que S3 est surestimé ; il explique plutôt la notion de modules profonds par opposition à des modules relativement superficiels.
- Certaines bases de données ont été conçues pour utiliser l’API S3 comme stockage ; c’est possible, mais ce n’est pas transparent.
- Avec S3, de nombreux formats de fichiers offrent des performances inférieures à celles d’un disque.
Avis de GN⁺
- Il est important de comprendre que S3 n’est pas un substitut à un système de fichiers, mais une solution de stockage optimisée pour des cas d’usage précis. Par exemple, il convient bien au stockage et au transfert de gros fichiers immuables, mais il n’est pas adapté aux applications qui nécessitent des mises à jour partielles fréquentes, comme les bases de données.
- Les performances et l’évolutivité de S3 sont très élevées, mais si l’on tient compte du coût et de la complexité de gestion, ce n’est pas forcément un bon choix pour tous les projets. Par exemple, le projet open source MinIO peut constituer une bonne alternative pour les organisations qui souhaitent mettre en place un stockage compatible S3 sur leur propre infrastructure.
- Lorsqu’on utilise S3, il faut aussi prendre en compte des éléments supplémentaires comme la cohérence des données, les coûts réseau ou le contrôle d’accès, et ces facteurs peuvent influencer la conception globale du système.
- Même si les cas d’usage de S3 peuvent être limités, c’est un outil très puissant pour certaines applications spécifiques comme les data lakes ou les solutions de sauvegarde. Sa capacité à stocker les données en toute sécurité et à les récupérer rapidement au besoin apporte une valeur importante à de nombreuses entreprises.
- En apportant une compréhension approfondie des détails techniques de S3 et de ses cas d’usage concrets, cet article peut aider à prendre de meilleures décisions techniques.
1 commentaires
Avis Hacker News
INSERT/UPDATE/DELETE.