Conservez vos scripts sbatch. Abandonnez l'entretien du groupe. BUZZ CHP héberge un environnement SLURM minimal mais solide comme le roc sur des GPU de premier plan, afin que les scientifiques et les ingénieurs puissent exécuter des tâches au lieu de réparer des nœuds.

Contrôleur + nœud de connexion préconfiguré; nœuds de calcul GPU inscrits via Ansible. SLURM 23.x CLI standard prêt à l'emploi.
Files d'attente pour les nœuds H100, B200 et A6000; planification équitable activée. Pas de remblayage ou de préemption au MVP.
Soumettez une demande et nous ajoutons ou supprimons des nœuds. Des heures, pas des semaines. Payez uniquement pour les GPU réservés.
Espace d'accueil/de projet NFS plus mémoire volatile express local de travail. Le système de fichiers parallèle et le stockage d'objets sont des éléments de la feuille de route.
Tableaux de bord Prometheus + Grafana; les opérations BUZZ reçoivent des alertes matérielles et échangent automatiquement les nœuds défaillants.
Groupe isolé par VPN; séparation des utilisateurs/groupes Unix. Intégration d'identité facultative à venir.
Vétérans CHP sur appel (9 × 5) avec escalade matérielle 24 × 7.
Inférence de grands modèles
Exécutez des modèles volumineux avec une latence prévisible. Optimisez le débit, la taille des lots et les performances par watt.
Applications d'IA génératives pour le texte, l'image et l'audio.
Adaptation de l'infrastructure ML à mesure que votre clientèle s'agrandit.
Puissance Bare metal GPU brute, aucun entretien du planificateur et des personnes qui parlent couramment SLURM. C'est le chemin le plus court entre l'idée de recherche et les résultats, sans avoir besoin de construire un centre de données.

Faites fonctionner votre groupe SLURM sur des GPU de classe mondiale en quelques jours.