Inférence ultra-rapide et rentable sur les essaims de GPU de BUZZ, conçus pour gérer des charges de travail exigeantes à grande échelle.