Viktiga funktioner

Slurm-som-en-tjänst

Controller + inloggningsnod förkonfigurerad; GPU-beräkningsnoder registrerade via Ansible. Standard SLURM 23.x CLI ur lådan.

GPU-partitioner

Köer för noder H100, B200 och A6000; schemaläggning med rättvis delning aktiverad. Ingen återfyllning eller preemption hos MVP.

Elastisk kapacitet

Skicka in en förfrågan, och vi lägger till eller tar bort noder. Timmar, inte veckor. Betala endast för reserverade GPU:er.

Delad lagring

NFS-hem/projektutrymme plus lokal NVMe-skrapa. Parallellt filsystem och objektlagring är färdplansobjekt.

Väsentlig övervakning

Prometheus + Grafana instrumentpaneler; BUZZ-ops tar emot hårdvaruvarningar och byter misslyckade noder automatiskt.

Säker singeltenans

VPN-isolerat kluster; Unix-användar/gruppseparation. Valfri identitetsintegration kommer snart.

Expertsupport

HPC-veteraner på samtal (9 × 5) med 24 × 7 hårdvarueskalering.

Varför BUZZ HPC Managed SLURM

GPU-hästkrafter i bare metal, noll schemaläggningsunderhåll och människor som talar SLURM flytande. Det är den kortaste vägen från forskningsidé till resultat - ingen datacenteruppbyggnad krävs.

Användningsfall
Universitets- och industriell forskning
Portera befintliga SLURM-arbetsbelastningar till snabbare grafikprocessorer utan att skriva om jobbskript.
Storskalig AI-utbildning
Schemalägg PyTorch-jobb med flera noder under ett välkänt batchsystem.
Burstkapacitet för HPC på plats
Håll lokala kluster små; flöda över till BUZZ när efterfrågan ökar.
Undervisning & Workshops
Förbered en tillfällig GPU-superdator för en kurs eller hackathon och minska den sedan.

Ta bort komplexiteten i HPC.

Få ditt SLURM-kluster att köra på grafikprocessorer i världsklass på några dagar.