Table des matières
2022/04/30 (infra)
Présences :
- Hgo
- Célo
- Tharyrok
Météo
Moment informel durant lequel on exprime en peu de mots comment on se sent et si on a une attente forte pour la réunion. Ce n'est pas un moment de discussion mais d'expression individuelle et ce n'est pas obligatoire
Attente(s) forte(s)
Si l'une ou l'autre personne exprime une attente forte, merci de vous en occuper en priorité ou de la noter dans le hub ou dans un point approprié.
FIN : vers 17h
Attente forte : Prise de decision sur le matos
Ordre du jour
OOB via 4G
Quand on n'a plus de transit et peering (sessions BGP kaput), l'idée est d'avoir un backup 4G (env. 50 euros par an)
Cela permettrait de se connecter en ssh à topi quand tout est cassé. De manière à pouvoir réparer les edge.
Avantages :
- Ne pas avoir à se déplacer sur LouiseDC
- Pas trop cher
Inconvénients :
- Que se passe-t-il quand topi n'est plus disponible
- On va devoir aller sur place
Est-ce que c'est nécéssaire ?
- pas encore nécésaire, on sait s'en passer car LouiseDC est à 1h max de chacun·e - C'est cool a avoir mais pas urgent
On peut en rediscuter quand Chez Mémé sera lancé.
Redémarrage de Bour
TODO: Il faudrait investiguer, car le iLo de Bour signale des erreurs. Même s'il ne redémarre plus, ça pue un peu.
Commande Materiel
SSD
Lors du Neutriton sur le chiffrement, on a émis l'idée de prendre des SSD pour remplacer les HDD et garder de bonnes performances avec le chiffrement activé.
Pour l'instant on a 2 x 1T sur bour et nam (système + ceph).
Taille | Type | Prix | Lien |
—— | —- | ——- | —- |
60Gb | os | 21,18€ | https://www.creoserver.com/kingston-60gb-25-sata-6gb-s |
1Tb | osd | 192,90€ | https://fr.alternate.be/Samsung/870-EVO-1-To-SSD/html/product/1706403 |
2Tb | osd | 239,90€ | https://fr.alternate.be/Samsung/870-EVO-2-To-SSD/html/product/1706406 |
/dev/sda (60Go) de bicarbonate a remplacer
Soit on remplace tous les disques (système + ceph):
- 5x60G + 2x2T → 585.70€
- 5x60G + 4x1T → 877.50€
Soit on garde des disques plateau (hdd) pour le système et on rajoute des SSD pour ceph:
- 1x60G + 2x2T → 499.18€
- 1x60G + 4x1T → 792.78€
L'avantage d'avoir deux SSD de 1To est que cela permet de doubler la bande passante. Si on perd un SSD on ne perd que la moitié des données, donc le temps de reconstruction est un peu moins long.
De mémoire on a 8 slots de disponible: - 1 pour les backups - 2 pour l'OS - 5 pour les OSD (ceph)
Une particularité : la carte raid du serveur ne permet de faire que deux volumes (on doit autrement payer une licence - mais on peut peut-être en trouver bradée…).
La première baie qui contient 4 slots ne peut avoir que 2 volumes dessus. La deuxième baie étant directement sur la carte mère, on a accès à tous les emplacements.
Du coup, l'avantage d'avoir des SSD de 2To est de pouvoir tout mettre sur la première baie. Et c'est plus avantageux financièrement.
Pour l'instant, on consomme environ 400 Go.
On choisi l'option suivante:
- 5x60G + 2x2T → 585.70€
Mémoire
On a 64Gb (8 x 8Gb 1333MHz) de RAM sur nam et sur bour.
Est-ce qu'on rajoute 32Gb (4 x 8Gb) ou 64Gb (4 x 16 Gb), sachant qu'il reste 4 slots disponibles. Dans la deuxième option, à voir si on peut mixer les tailles des barrettes… Ou alors on remplace toute la RAM avec 8x16Gb ou 4x32Gb (128 Gb) et on en profite pour prendre du 1600Mhz.
Taille | Fréquence | Prix | Lien |
—— | ——— | —— | —- |
8Gb | 1333MHz | 18.09€ | https://www.creoserver.com/8gb-1333mhz-pc3l-10600r-ddr3-ecc-reg |
16Gb | 1333MHz | 31.46€ | https://www.creoserver.com/hynix-16gb-1333mhz-pc3l-10600r-ddr3-ecc-registered |
16Gb | 1600Mhz | 33.28€ | https://www.creoserver.com/skhynix-16gb-1333mhz-pc3l-10600r-ddr3-ecc-registered |
32Gb | 1600Mhz | 69.58€ | https://www.creoserver.com/32gb-1600mhz-pc3l-12800l-ddr3-ecc-registered |
Soit 2 x 4 x 8Gb 1333MHz → 144.72€ Soit 2 x 4 x 16Gb 1333MHz → 251.68€ Soit 2 x 8 x 16Gb 1600Mhz → 516.48€ ~~Soit 2 x 4 x 32Gb 1600Mhz → 556.64€~~
Utilisation actuelle (allocation mémoire des VM):
- 84Gb pour tous nos services - 14Gb pour nos tests
Réellement consommé actuellement:
- bour: 50Gb
- nam : 55Gb
On peut compter 4Gb utilisés par Proxmox + Ceph
Sachant qu'il faut pouvoir absorber les VM quand un des serveurs tombe : 66Gb juste pour les services (e.g. psql, ceph-s3, mattermost, un seul edge, …). Donc rajouter 14Gb pour inclure nos VMs de tests, et 4Gb pour le Proxmox : 84Gb au total.
On choisit l'option suivante:
- 2 x 4 x 16Gb 1333MHz → 251.68€
TODO: faire les commandes
Besoin serveur
Pour rapelle nous avons:
Host | Lieux | CPU | RAM | Disk | Cout/mois | Periodicité | Rôle |
—————– | ———– | — | — | —- | ————- | ———– | —- |
storage-01 | OVH | 4 | 16G | 3x2T | 21.77 € | mensuel | monitoring long terme et borg backup |
probe-01 | FirstHeberg | 2 | 1G | 20G | 0 € | neant | peering verixi |
probe-02 | OVH | 1 | 2G | 20G | 3.63 € | annuel | peering belgiumix / bnix |
monitoring | Hetzner | 2 | 4G | 40G | 7.2 € | mensuel | transit verixi |
storage box | Hetzner | 500G | 5.93 € | mensuel | storage monitoring | ||
Hetzner | 2 | 8G | 80G | 13 € | mensuel | serveur SMTP | |
pbs | Hetzner | 8 | 32G | 4x2T | 58 € | mensuel | Proxmox Backup |
Sous Total | 109.53 € | mensuel | |||||
LouiseDC | LouiseDC | 400 € | mensuel | Neutrinet | |||
Total | 509.53 € | mensuel |
Sachant que certaines VM vont disparaître:
- probe-02 est remplacé par storage-01
- monitoring et sa storage-box sont remplacés par storage-01 et une VM hetzner pas cher ?
- mail va rejoindre LouiseDC
La grande question concerne storage-01 et pbs. L'un est pour le monitoring et borg backup, l'autre est pour les Proxmox backups.
On pourrait faire de l'échange de serveurs chez domainepublic / nubo. Denis disait être intéressé, mais ça n'a pas l'air urgent. De notre côté, si on veut acheter un serveur ce serait au moins 1000 €.
Pour les probes, cela n'aura plus vraiment de sens d'être chez OVH / Hetzner car on sera en peering direct via NL-IX.
On aimerait voir pour placer des probes chez des amis de la fédé:
- ARN : 1 vCPU, 1Go RAM → 10€/mois
- Tetaneutral : 1 vCPU, 1Go RAM → 5-10€/mois
- Aquilenet :
- (All2All : 2 vCPU, 1Go RAM → 35.30€/mois)
Mais l'idée serait de faire de l'échangisme de VMs, parce qu'iels seraient peut-être intéressé·es par une VM chez nous
TODO: tharyrok va prendre contact avec les amis de la ffdn
Chiffrement serveur
Reporté a une prochaine vu que nous n'avons pas d'avis pour l'instant. Mais a faire avant de placer les nouveaux disques.
Migration Bullseye
Ce lundi 2 mai, hgo et celo vont commencer. HgO a fait un test sur runner.patata.louise.neutri.net
Il y a les boite de dialogue a faire taire lors de l'upgrade.
Pour les Proxmox, tharyrok va montrer comment faire, il fait ça tous les jours au boulot.
Pour ceph, on peut passer vers la nouvelle version Pacific. Voir le wiki de Proxmox: https://pve.proxmox.com/wiki/Ceph_Octopus_to_Pacific
TODO: fixé une date pour l'upgrade de proxmox
NL-IX
Le port nous est offert mais pas le transport Interxion → LouiseDC. La commande lien est passé chez verixi.
Split hub fourre tout
L'idée est de tuer le hub infra et de faire divers hub publics:
- hub-dev : développement d'applications pour les besoins de Neutrinet
- hub-dc : gestion du datacenter
- hub-network : gestion réseau de AS204059
- hub-services : gestion des services internes à Neutrinet
- hub-meme ? : cohousing et location de vps
- shared-DC existe déjà
- 42u existe
- hub-vps ? : location de vps
- hub-vpn ? : location de vpn
- ops (ro tout le monde, rw sur cooptation, avec réaction )
Pas clair si on veut séparer le cohousing et le vps, et doublons possibles avec hub-meme / hub-dc / hub-vps.
Est-ce qu'on aura besoin d'un hub-verixi privé pour discuter des prix ?
- Avec le CA seulement ?
- Avec cooptation et être plus strict ?
Les salons qui sont clairs:
- hub-dev
- hub-network
- hub-services
- hub-dc
- ops
Pour Chez Mémé, c'est encore assez fourre-tout mais ce n'est pas trop un problème pour le moment.
TODO: faire les channel sur matermost
Archive ~hub-infra privé
TODO: Le mettre en read-only, le renommer et nettoyer les humains présents dedans avec du savon et des frites
Message accueil Mattermost
Quand un humain arrive sur Mattermost, on peut activer un bot qui vient lui dire quels sont les canaux principaux.
TODO : celo fait une proposition sur un pad aux hub-comm
Status Page uptime-kuma
https://uptime.src.brussels cela remplace l'ancien poc. Et le dashboard https://uptime.src.brussels/dashboard
Cela permet d'envoyer des alertes sur plusieurs support (matrix, mattermost, mail, pigeon, …).
Il faut voir si c'est pas plus malin d'envoyer sur mattermost au lieu de matrix ? en plus de matrix ?
Est-ce que cela ne se chevauche pas avec grafana et altermanager ?
Venir chercher les metrics depuis alertmanager et monitorer ces metrics là ? Ainsi on peut avoir une meilleure vue sur l'état du VPN.
Peut-être plus pertinent d'avoir un grafana minimaliste.
Pour le choix du salon :
- Mattermost
- Demande plus de boulot si on passe via alertmanager
- Faisable sans effort pour uptime-kuma
- Matrix
- Distinguer les alertes grand public des autres pour alertmanager
- Faisable sans effort pour uptime-kuma
- Mastodon
- Créer un bot
Le besoin c'est de pouvoir informer les gens quand il y a un problème/maintenance, et d'envoyer des alertes. Pour l'instant, uptime-kuma permet de créer des “incidents” (avec timestamps) mais a priori ne permet pas encore de notifier les gens.
Est-ce que alertmanager / grafana permet de faire des plages de maintenance ?
TODO: HgO se renseigne sur la possibilité d'envoyer une notif pour les incidents
Objectif chez mémé
Définir ce qu'on a besoin pour permettre à des humains de louer des VM chez nous, très concrètement.
- DHCP vs static sur le reseau lan/wan
- 1 IP Wan commune pour plusieurs services web
- IP Wan/VM
- Backups
- Snapshot
- Install via ISO
- Console vs install via ssh
- live Rescue
- Resize disque
Quid du resize des disques ? Il ne faut pas partitionner le volume additionnel, faire le filesystem sur la lettre /dev/sdc par ex
Pour la RAM, elle se mutualise mal, du coup on va être limité à 200Go au total. Pour le CPU, on peut avoir 360 vCPU au total avec les trois serveurs, et ça se mutualise bien.
Prochaine réunion
Prochain Neutriton (Atelier proxmox): 07/05 à partir de 11H au Caldarium
Prochaine réunion du hub infra : 29/05 à 14:00 au caldarium et sur jitsi
Visite de LouiseDC pour installer le matériel: quelque part en juin
TODO: Rajouter les todo dans le board
Météo de fin
Moment informel durant lequel on exprime en peu de mots comment, à titre personnel, la réunion a été vécue que ce soit positif ou négatif. Si une ou plusieurs tension est née durant la réunion, il est peut-être nécessaire d'envisager l'une ou l'autre réunion pour y remédier.