Rook.io, un projet passé “graduate” c’est à dire mature, au sein de la CNCF.
Disclaimer
Cet article est une introduction à un outil que je trouve prometteur, mais que je n’ai pas eu l’occasion d’implémenter en production.
Important.
Rook.io est plustot simple à installer dans le cadre d’un POC ou d’un simple test, la plupart des étapes sont automatiques et on arrive vite vers une instance fonctionnelle.
Cependant, pour un maintien opérationnel, il est nécessaire d’avoir de solides compétences sur Kubernetes, les operator stateful et sur les fonctions d’administrations avancées de CEPH.
Fonctions
Rook répond à la problématique du stockage en implémentant un cluster CEPH “production-ready” dans un cluster Kubernetes. CEPH est aujourd’hui la solution Open Source la plus mature sur le marché pour implémenter du stockage distribué.
Il est possible de stocker des Pétaoctets de données et les exposer de plusieurs manières :
Pour rappel, S3 est le volume objet d’Amazon Web Services qui fait aujourd’hui référence, les concurrents s’alignent sur cette compatibilité.
Rook permet néanmoins de faire plus !
Mais ces derniers sont à l’heure où j’écris ces lignes en Alpha. A surveiller de près donc.
Sous le capot
Les explications techniques ci-dessous sont tirées de la documentation, pour plus de détails, vous pouvez vous référer au lien ci-dessous.
https://rook.io/docs/rook/v1.5/ceph-storage.html
Rook est un opérateur qui manipule CEPH en utilisant les primitives de Kubernetes.
Les objets Kubernetes manipulés par l’opérateur Rook
Le schéma ci-dessous illustre la façon dont Rook s’intègre avec Kubernetes.
L’opérateur monte dans chaque worker Kubernetes un système de fichiers XFS dans le répertoire /var/lib/rook qui contiendra un agrégat du volume total.
Les fonctions de l’opérateur :
CSI est une API standard Open Source qui permet à des systèmes de stockage de s’intégrer à Kubernetes et de mettre à disposition des volumes aux pods qui en demandent.
Lorsque l’on déploie un pilote de stockage compatible avec CSI sur un cluster Kubernetes, celui-ci peut se connecter directement au volume local du worker type /dev/xda.
Installation
L’installation s'effectue simplement via le chart Helm ou comme nous l’avons fait ci-dessous, via kubectl, les yaml nécessaires à l’installation étant disponibles sur le github du projet.
Installation des dépendances
cd cluster/examples/kubernetes/ceph
kubectl create --filename crds.yaml --filename common.yaml --filename operator.yaml
Vérifiez que l'opérateur ROOK-CEPH est dans l'état «en cours d'exécution» avant de procéder
kubectl -n rook-ceph get pod
Création du cluster
kubectl create --filename cluster.yaml
L’installation peut prendre du temps selon votre bande passante, vous pouvez suivre l’état de l’installation via cette commande :
kubectl --namespace rook-ceph get pod --watch
Tableau de bord
Un tableau de bord est fourni afin de suivre l'état du cluster et des volumes disponibles (pour le désactiver, c’est ici).
Récupérer le mot de passe
kubectl --namespace rook-ceph get secret rook-ceph-dashboard-password --output yaml | grep "password:" | awk '{print $2}' | base64 --decode
Accéder au tableau de bord
https://<ip>:<port>/#/login
L’ip étant celle du cluster Kubernetes
Le port étant celui du service rook-dashboard.
Il est aussi possible d’utiliser la fonction port-forward de kubernetes ou de placer un ingress en entrée afin de gagner en portabilité.
Outils d’administration
L’image rook/ceph inclut les outils nécessaires à la gestion du cluster.
La plupart des fonctions avancées d'administration de CEPH sont automatiquement gérées, il n’est donc pas nécessaire de les prendre en considération.
Néanmoins, il est possible de prendre en main ces fonctions avancées via les commandes CEPH fournies.
Attention toutefois sur l’utilisation de Rook en production, un expert en administration CEPH est indispensable.
Vérifier l’état du cluster
ceph status
cluster:
id: a0452c76-30d9-4c1a-a948-5d8405f19a7c
health: HEALTH_OK
Retourne la taille utilisée et la capacité du cluster
ceph df
Créer un nouveau pool de stockage
ceph osd pool create
Liste les pools de stockage
ceph osd lspools
Réparation des groupes
Dans le cas où ceph status retourne un HEALTH_ERR
ceph pg repair <group number>
Afin d’accéder aux outils d’administration CEPH
kubectl -n rook-ceph exec -it $(kubectl -n rook-ceph get pod -l "app=rook-ceph-tools" -o jsonpath='{.items[0].metadata.name}') bash
Cette commande va retrouver le pod sur lequel l’image “rook-ceph-tools” est installée et s’y connecte en mode console (bash).
Monitoring
Rook s’intègre “out-of-the-box” à Prometheus et Grafana.
Ici nous voyons les métriques liées à l’utilisation des volumes.
Un test concret
Maintenant que nous avons un stockage distribué tout neuf, essayons d’aller un peu plus loin avec un test concret. Déployons un serveur Mysql qui va persister ses données sur notre cluster CEPH le tout sur Kubernetes.
Vous trouverez ici le fichier de description de ce déploiement
https://github.com/rook/rook/blob/master/cluster/examples/kubernetes/mysql.yaml
Dans ce fichier, nous trouvons :
Dans le cas de la perte ou d’ajout d’un nœud, il suffit de redémarrer l’opérateur Rook afin qu’il re dispatche les données sur le nouveau nœud grâce au Rook Discover qui détecte les volumes attachés au nœud de stockage.
Via les commandes suivantes qui ne font que supprimer et recréer l’instance.
kubectl scale deployment rook-ceph-operator --replicas=0 -n rook-ceph-system
kubectl scale deployment rook-ceph-operator --replicas=1 -n rook-ceph-system
ou
kubectl rollout restart deployment/rook-ceph-operator
Le fait de redémarrer l’opérateur recrée automatiquement le cluster et prend en compte automatiquement les différents nœuds.
Conclusion
Quel est l'intérêt de Rook couplé avec CEPH ?
Rook et CEPH répondent à ces besoins.
Lors d’un POC ou un MVP, Rook peut répondre à un besoin de persistance pour une base de données via un stockage block.
Malgré une majorité de modules en Alpha, CEPH est lui bien en version stable. Rook.io constitue une alternative sérieuse aux solutions de stockage du marché du développement à la production.
Références