Conserve sus scripts sbatch. Olvídate del mantenimiento del clúster. BUZZ HPC aloja un entorno SLURM mínimo pero sólido como una roca en GPU de primer nivel, para que los científicos e ingenieros puedan ejecutar trabajos en lugar de arreglar nodos.

Controlador + nodo de inicio de sesión preconfigurado; nodos de cálculo de GPU registrados a través de Ansible. SLURM 23.x CLI estándar listo para usar.
Colas para nodos H100, B200 y A6000; programación de reparto justo habilitada. Sin relleno ni preferencia en MVP.
Envía una solicitud y añadiremos o eliminaremos nodos. Horas, no semanas. Paga solo por las GPU reservadas.
Espacio de inicio/proyecto NFS más scratch NVMe local. El sistema de archivos paralelo y el almacenamiento de objetos son elementos de la hoja de ruta.
Paneles de control de Prometheus + Grafana; las operaciones de BUZZ reciben alertas de hardware e intercambian nodos defectuosos automáticamente.
Clúster aislado por VPN; separación de usuarios/grupos de Unix. Próximamente, integración de identidad opcional.
Veteranos de HPC de guardia (9 × 5) con escalamiento de hardware 24 × 7.
Inferencia de modelos grandes
Ejecute modelos masivos con una latencia predecible. Optimice el rendimiento, el tamaño de los lotes y el rendimiento por vatio.
Aplicaciones de IA generativas para texto, imágenes y audio.
Escalar la infraestructura de aprendizaje automático a medida que crece su base de clientes.
Potencia de GPU sin sistema operativo, sin mantenimiento del programador y personas que hablan SLURM con fluidez. Es el camino más corto desde la idea de investigación hasta los resultados, sin necesidad de construir un centro de datos.

Consiga que su clúster SLURM se ejecute en GPU de primera categoría en cuestión de días.