Outils pour utilisateurs

Outils du site


fr:rapports:2022:04-30

2022/04/30 (infra)

Météo

Moment informel durant lequel on exprime en peu de mots comment on se sent et si on a une attente forte pour la réunion. Ce n'est pas un moment de discussion mais d'expression individuelle et ce n'est pas obligatoire 🙂

Attente(s) forte(s)

Si l'une ou l'autre personne exprime une attente forte, merci de vous en occuper en priorité ou de la noter dans le hub ou dans un point approprié.

FIN : vers 17h

Attente forte : Prise de decision sur le matos

Ordre du jour

OOB via 4G

Quand on n'a plus de transit et peering (sessions BGP kaput), l'idée est d'avoir un backup 4G (env. 50 euros par an)

Cela permettrait de se connecter en ssh à topi quand tout est cassé. De manière à pouvoir réparer les edge.

Avantages :

  • Ne pas avoir à se déplacer sur LouiseDC
  • Pas trop cher

Inconvénients :

  • Que se passe-t-il quand topi n'est plus disponible
    • On va devoir aller sur place

Est-ce que c'est nécéssaire ?

- pas encore nécésaire, on sait s'en passer car LouiseDC est à 1h max de chacun·e - C'est cool a avoir mais pas urgent

On peut en rediscuter quand Chez Mémé sera lancé.

Redémarrage de Bour

TODO: Il faudrait investiguer, car le iLo de Bour signale des erreurs. Même s'il ne redémarre plus, ça pue un peu.

Commande Materiel

SSD

Lors du Neutriton sur le chiffrement, on a émis l'idée de prendre des SSD pour remplacer les HDD et garder de bonnes performances avec le chiffrement activé.

Pour l'instant on a 2 x 1T sur bour et nam (système + ceph).

/dev/sda (60Go) de bicarbonate a remplacer

Soit on remplace tous les disques (système + ceph):

  • 5x60G + 2x2T → 585.70€
  • 5x60G + 4x1T → 877.50€

Soit on garde des disques plateau (hdd) pour le système et on rajoute des SSD pour ceph:

  • 1x60G + 2x2T → 499.18€
  • 1x60G + 4x1T → 792.78€

L'avantage d'avoir deux SSD de 1To est que cela permet de doubler la bande passante. Si on perd un SSD on ne perd que la moitié des données, donc le temps de reconstruction est un peu moins long.

De mémoire on a 8 slots de disponible: - 1 pour les backups - 2 pour l'OS - 5 pour les OSD (ceph)

Une particularité : la carte raid du serveur ne permet de faire que deux volumes (on doit autrement payer une licence - mais on peut peut-être en trouver bradée…).

La première baie qui contient 4 slots ne peut avoir que 2 volumes dessus. La deuxième baie étant directement sur la carte mère, on a accès à tous les emplacements.

Du coup, l'avantage d'avoir des SSD de 2To est de pouvoir tout mettre sur la première baie. Et c'est plus avantageux financièrement.

Pour l'instant, on consomme environ 400 Go.

On choisi l'option suivante:

  • 5x60G + 2x2T → 585.70€

Mémoire

On a 64Gb (8 x 8Gb 1333MHz) de RAM sur nam et sur bour.

Est-ce qu'on rajoute 32Gb (4 x 8Gb) ou 64Gb (4 x 16 Gb), sachant qu'il reste 4 slots disponibles. Dans la deuxième option, à voir si on peut mixer les tailles des barrettes… Ou alors on remplace toute la RAM avec 8x16Gb ou 4x32Gb (128 Gb) et on en profite pour prendre du 1600Mhz.

Soit 2 x 4 x 8Gb 1333MHz → 144.72€ Soit 2 x 4 x 16Gb 1333MHz → 251.68€ Soit 2 x 8 x 16Gb 1600Mhz → 516.48€ ~~Soit 2 x 4 x 32Gb 1600Mhz → 556.64€~~

Utilisation actuelle (allocation mémoire des VM):

- 84Gb pour tous nos services - 14Gb pour nos tests

Réellement consommé actuellement:

  • bour: 50Gb
  • nam : 55Gb

On peut compter 4Gb utilisés par Proxmox + Ceph

Sachant qu'il faut pouvoir absorber les VM quand un des serveurs tombe : 66Gb juste pour les services (e.g. psql, ceph-s3, mattermost, un seul edge, …). Donc rajouter 14Gb pour inclure nos VMs de tests, et 4Gb pour le Proxmox : 84Gb au total.

On choisit l'option suivante:

  • 2 x 4 x 16Gb 1333MHz → 251.68€

TODO: faire les commandes

Besoin serveur

Pour rapelle nous avons:

Host Lieux CPU RAM Disk Cout/mois Periodicité Rôle
—————– ———– —- ————- ———– —-
storage-01 OVH 4 16G 3x2T 21.77 € mensuel monitoring long terme et borg backup
probe-01 FirstHeberg 2 1G 20G 0 € neant peering verixi
probe-02 OVH 1 2G 20G 3.63 € annuel peering belgiumix / bnix
monitoring Hetzner 2 4G 40G 7.2 € mensuel transit verixi
storage box Hetzner 500G 5.93 € mensuel storage monitoring
mail Hetzner 2 8G 80G 13 € mensuel serveur SMTP
pbs Hetzner 8 32G 4x2T 58 € mensuel Proxmox Backup
Sous Total 109.53 € mensuel
LouiseDC LouiseDC 400 € mensuel Neutrinet
Total 509.53 € mensuel

Sachant que certaines VM vont disparaître:

  • probe-02 est remplacé par storage-01
  • monitoring et sa storage-box sont remplacés par storage-01 et une VM hetzner pas cher ?
  • mail va rejoindre LouiseDC

La grande question concerne storage-01 et pbs. L'un est pour le monitoring et borg backup, l'autre est pour les Proxmox backups.

On pourrait faire de l'échange de serveurs chez domainepublic / nubo. Denis disait être intéressé, mais ça n'a pas l'air urgent. De notre côté, si on veut acheter un serveur ce serait au moins 1000 €.

Pour les probes, cela n'aura plus vraiment de sens d'être chez OVH / Hetzner car on sera en peering direct via NL-IX.

On aimerait voir pour placer des probes chez des amis de la fédé:

Mais l'idée serait de faire de l'échangisme de VMs, parce qu'iels seraient peut-être intéressé·es par une VM chez nous 🙂

TODO: tharyrok va prendre contact avec les amis de la ffdn

Chiffrement serveur

Reporté a une prochaine vu que nous n'avons pas d'avis pour l'instant. Mais a faire avant de placer les nouveaux disques.

Migration Bullseye

Ce lundi 2 mai, hgo et celo vont commencer. HgO a fait un test sur runner.patata.louise.neutri.net

Il y a les boite de dialogue a faire taire lors de l'upgrade.

Pour les Proxmox, tharyrok va montrer comment faire, il fait ça tous les jours au boulot.

Pour ceph, on peut passer vers la nouvelle version Pacific. Voir le wiki de Proxmox: https://pve.proxmox.com/wiki/Ceph_Octopus_to_Pacific

TODO: fixé une date pour l'upgrade de proxmox

NL-IX

Le port nous est offert mais pas le transport Interxion → LouiseDC. La commande lien est passé chez verixi.

Split hub fourre tout

L'idée est de tuer le hub infra et de faire divers hub publics:

  • hub-dev : développement d'applications pour les besoins de Neutrinet
  • hub-dc : gestion du datacenter
  • hub-network : gestion réseau de AS204059
  • hub-services : gestion des services internes à Neutrinet
  • hub-meme ? : cohousing et location de vps
    • shared-DC existe déjà
    • 42u existe
  • hub-vps ? : location de vps
  • hub-vpn ? : location de vpn
  • ops (ro tout le monde, rw sur cooptation, avec réaction 🐱)

Pas clair si on veut séparer le cohousing et le vps, et doublons possibles avec hub-meme / hub-dc / hub-vps.

Est-ce qu'on aura besoin d'un hub-verixi privé pour discuter des prix ?

  • Avec le CA seulement ?
  • Avec cooptation et être plus strict ?

Les salons qui sont clairs:

  • hub-dev
  • hub-network
  • hub-services
  • hub-dc
  • ops

Pour Chez Mémé, c'est encore assez fourre-tout mais ce n'est pas trop un problème pour le moment.

TODO: faire les channel sur matermost

Archive ~hub-infra privé

TODO: Le mettre en read-only, le renommer et nettoyer les humains présents dedans avec du savon et des frites

Message accueil Mattermost

Quand un humain arrive sur Mattermost, on peut activer un bot qui vient lui dire quels sont les canaux principaux.

TODO : celo fait une proposition sur un pad aux hub-comm

Status Page uptime-kuma

https://uptime.src.brussels cela remplace l'ancien poc. Et le dashboard https://uptime.src.brussels/dashboard

Cela permet d'envoyer des alertes sur plusieurs support (matrix, mattermost, mail, pigeon, …).

Il faut voir si c'est pas plus malin d'envoyer sur mattermost au lieu de matrix ? en plus de matrix ?

Est-ce que cela ne se chevauche pas avec grafana et altermanager ?

Venir chercher les metrics depuis alertmanager et monitorer ces metrics là ? Ainsi on peut avoir une meilleure vue sur l'état du VPN.

Peut-être plus pertinent d'avoir un grafana minimaliste.

Pour le choix du salon :

  • Mattermost
    • Demande plus de boulot si on passe via alertmanager
    • Faisable sans effort pour uptime-kuma
  • Matrix
    • Distinguer les alertes grand public des autres pour alertmanager
    • Faisable sans effort pour uptime-kuma
  • Mastodon
    • Créer un bot

Le besoin c'est de pouvoir informer les gens quand il y a un problème/maintenance, et d'envoyer des alertes. Pour l'instant, uptime-kuma permet de créer des “incidents” (avec timestamps) mais a priori ne permet pas encore de notifier les gens.

Est-ce que alertmanager / grafana permet de faire des plages de maintenance ?

TODO: HgO se renseigne sur la possibilité d'envoyer une notif pour les incidents

Objectif chez mémé

Définir ce qu'on a besoin pour permettre à des humains de louer des VM chez nous, très concrètement.

  • DHCP vs static sur le reseau lan/wan
  • 1 IP Wan commune pour plusieurs services web
  • IP Wan/VM
  • Backups
  • Snapshot
  • Install via ISO
  • Console vs install via ssh
  • live Rescue
  • Resize disque

Quid du resize des disques ? Il ne faut pas partitionner le volume additionnel, faire le filesystem sur la lettre /dev/sdc par ex

Pour la RAM, elle se mutualise mal, du coup on va être limité à 200Go au total. Pour le CPU, on peut avoir 360 vCPU au total avec les trois serveurs, et ça se mutualise bien.

Prochaine réunion

Prochain Neutriton (Atelier proxmox): 07/05 à partir de 11H au Caldarium

Prochaine réunion du hub infra : 29/05 à 14:00 au caldarium et sur jitsi

Visite de LouiseDC pour installer le matériel: quelque part en juin

TODO: Rajouter les todo dans le board

Météo de fin

Moment informel durant lequel on exprime en peu de mots comment, à titre personnel, la réunion a été vécue que ce soit positif ou négatif. Si une ou plusieurs tension est née durant la réunion, il est peut-être nécessaire d'envisager l'une ou l'autre réunion pour y remédier.

fr/rapports/2022/04-30.txt · Dernière modification : 2022/07/22 13:15 de 127.0.0.1