NeurIPS 2025: AI-agenter, världsmodeller och kraften i suveräna AI-moln

NeurIPS 2025 (den 39:e årliga Neural Information Processing Systems-konferensen) visade en avgörande förändring i AI-forskningstrender. Medan stora språkmodeller (LLM:er) fortfarande var framträdande, riktade många forskare sitt fokus mot AI-agenter och världsmodeller, samt nästa generations generativa modeller som diffusionstransformatorer för bilder och video.

Dessa framsteg signalerar en förskjutning från att enbart skala upp LLM:er mot AI-system som kan förstå och simulera världen omkring dem, en förmåga som kräver enorm beräkningskraft. Konferensen underströk hur tillgång till avancerad databehandling (tänk GPU:er som NVIDIA:s H200 och Blackwell B200) är avgörande för att förvandla dessa ambitiösa idéer till verklighet.

I det här inlägget sammanfattar vi NeurIPS höjdpunkter kring AI-agenter och världsmodeller och utforskar varför banbrytande GPU:er och rätt molninfrastruktur är så viktiga för dessa genombrott. Vi illustrerar också hur BUZZ HPC:s kanadensiska suveräna neo-moln, med sina avancerade GPU-kluster och avancerade AI-tjänster, ger forskare och organisationer möjlighet att rida på denna nya våg av innovation.

AI-agenter och världsmodeller står i centrum

Ett viktigt tema på NeurIPS 2025 var ett återuppväckande av intresset för världsmodeller. Vi definierar dessa som AI-system som lär sig en intern modell av miljön för att förutsäga och planera resultat. Faktum är att en hel workshop ägnades åt förkroppsligade världsmodeller för beslutsfattande, vilket betonar att världsmodeller har blivit en hörnsten i förkroppsligad AI och driver de senaste framstegen inom beslutsfattande och planering för autonoma agenter.

Genom att lära sig en rik representation av världen, oavsett om det är en fysisk miljö eller en abstrakt uppgiftsdomän, kan en AI-agent simulera möjliga framtider, resonera om konsekvenser och fatta bättre beslut. Detta visar att fältet rör sig mot målinriktad interaktion i både fysiska och simulerade världar.

Även legendariska AI-figurer upprepade denna förändring. På NeurIPS hävdade RL-pionjären Richard Sutton att fältet måste återgå till att lära sig agenter som bygger världsmodeller och lär sig kontinuerligt, och han föreslog att de senaste årens fixering på massiva data och statiska modeller kan ha förlorat dessa grundläggande idéer ur sikte. Hans uppmaning till handling understryker en gemenskapens önskan att ge AI-agenter mer kognitiv autonomi. Vi definierar det som förmågan att utforska, komma ihåg och anpassa sig som en människa eller ett djur skulle göra i sin miljö. Världsmodeller ses som en viktig ingrediens för att uppnå detta, vilket gör det möjligt för agenter att internalisera hur världen fungerar och sedan planera eller improvisera inom den.

Några av de bästa forskningsartiklarna på NeurIPS berörde relaterade områden. En av de bästa artiklarna av Wang et al. visade att om man pressar djupet i neurala nätverk till extrema skalor (t.ex. 1000 lager) kan det låsa upp nya möjligheter i förstärkta inlärningsagenter, vilket gör att de kan lära sig att nå mål utan några belöningar eller demonstrationer. Större modeller plus världsmodellering kan ge genombrott i agentbeteende om man har beräkningsresurser för att träna sådana djupa nätverk.

En annan uppsats som kom på andra plats undersökte kritiskt finjustering av LLM med förstärkt inlärning och fann att nuvarande metoder inte producerade fundamentalt nya resonemangsförmågor utöver basmodellen. Att helt enkelt bulta fast RL på en LLM räcker inte. Djupare innovationer, kanske världsmodellbaserat resonemang eller nya arkitekturer, behövs för att ge AI-agenter verkligt nya kognitiva färdigheter.

Sammantaget visade NeurIPS 2025 tydligt att AI-agenter återigen är ett hett ämne. Forskare utrustar agenter med världsmodeller, minne och planeringsförmåga. Tidiga exempel inkluderar arkitekturer som integrerar symboliskt resonemang eller dubbla sinnen för långsiktig fantasi, och metoder som EDELINE, en enhetlig världsmodell som smart kombinerar tillståndsrymdesmodeller med diffusionsgenerativa modeller.

Genom att integrera diffusionsbaserad prediktion i en världsmodell kan EDELINE bättre modellera komplexa, slumpmässiga miljöer i ett inlärt latent utrymme. Dessa hybrider som kombinerar världsmodeller med diffusions- eller transformatorkomponenter visar hur gränserna mellan modelltyper suddas ut för att skapa agenter som både förstår och skapar inom sina miljöer.

Generativa modeller i latent utrymme: bortom text till video

En annan viktig trend på NeurIPS 2025 var uppblomstringen av diffusionsmodeller och generativa transformatorer, särskilt för rika medier som bilder och video. Diffusionsmodeller har tagit maskininlärningsvärlden med storm de senaste åren för bildgenerering, och NeurIPS erkände deras inverkan.

Ett av konferensens Best Paper-pris gick till en teoretisk analys med titeln Why Diffusion Models Don't Memorize, som undersökte hur diffusionsmodellens träningsdynamik undviker överanpassning och möjliggör generalisering.

Forskare driver också diffusionsmodeller till nya domäner och gör dem mer effektiva. Flera NeurIPS-artiklar och demonstrationer tog itu med videodiffusionsmodeller, som använder transformatorbaserade diffusioner för att generera video eller förutsäga framtida ramar i en sekvens.

En demonstration av Qualcomm visade Mobile Video Diffusion Transformers som körs på en smartphone NPU efter att ha tillämpat tung modelldestillation och optimering. Att uppnå 49 bilder av högupplöst video på mindre än 8 sekunder på en telefon var en häpnadsväckande prestation, men det visar också hur beräkningsintensiva basmodellerna är. Demon beskrivs beskärning och komprimering av en gigantisk diffusionsmodell för att passa på en mobil enhet. Att träna de ursprungliga DiT-modellerna (diffusionstransformator) och många andra NeurIPS-videogenereringsmodeller skulle ha krävt massiv GPU-beräkning för att hantera sekvenser av tusentals tokens eller pixlar.

Spänningen kring latenta generativa modeller var också hög. Många imponerande verk använder latent rumsförutsägelse, vilket innebär att lära sig en komprimerad representation av verkligheten och sedan förutsäga hur det latenta tillståndet utvecklas. Världsmodeller gör ofta detta för att förutsäga nästa tillstånd i en miljö, och diffusionsmodeller gör det för att generera bilder eller videor via en latent kod.

Detta tillvägagångssätt kan dramatiskt minska beräkningen. Till exempel fann en NeurIPS-studie om latent diffusion för fysiksimulering att den förble korrekt även med 1000 gånger komprimerade tillståndsrepresentationer. Genom att förutsäga i latent utrymme kan AI-system simulera komplexa processer, såsom dynamiken i en 3D-scen eller flödet av en video, mycket mer effektivt än pixel-för-pixel-metoder.

Från dessa trender är en slutsats oundviklig. Oavsett om det är en autonom agent med en inlärd världsmodell eller en diffusionstransformator som genererar en ström av videoramar, är beräkningsbelastningen kolossal. Storskaliga träningskörningar, enorma minnesfotavtryck och snabb matrismatematik är normen. Det är här den senaste generationen AI-hårdvara kommer in och varför vi är glada över de nya GPU:erna som diskuterades i stor utsträckning på NeurIPS.

Skala upp med H200 och B200: Varför avancerade GPU:er är viktiga

För att väcka banbrytande forskningsidéer till liv behöver AI-team tillgång till lika banbrytande hårdvara som NVIDIA H200 och B200 GPU:er. Dessa GPU:er diskuterades ofta i korridorerna och samtalen på NeurIPS eftersom de lovar att hantera de ständigt växande modeller och datamängder som forskare skapar.

H200 är NVIDIA:s mest avancerade GPU baserad på Hopper-arkitekturen och den laddar generativa AI- och HPC-arbetsbelastningar genom att para ihop extra snabbt minne (HBM3E) med högre genomströmning. Den erbjuder 141 GB HBM3E-minne, nästan dubbelt så mycket kapacitet som sin föregångare H100, och 4,8 TB per sekund minnesbandbredd, vilket ger upp till 2 gånger snabbare LLM-inferensgenomströmning på modeller som Llama 2 jämfört med H100.

B200 representerar NVIDIA:s nästa generations Blackwell-arkitektur. Varje B200 har 192 GB HBM3E som körs på 6,0 TB per sekund och har uppgraderade sammankopplingar för extremt snabb GPU till GPU-kommunikation. Den är utformad för att hantera de största modellerna och kluster med flera noder.

För de typer av NeurIPS-forskning som diskuteras kan denna nivå av hårdvarukapacitet göra skillnaden mellan omöjligt och uppnåeligt. En Blackwell B200 kan ge upp till tre gånger träningshastigheten för vissa stora modeller jämfört med tidigare generationens GPU:er. Både H200 och B200 kan skalas ut till många GPU:er som är anslutna av NVIDIA:s ultrasnabba InfiniBand-struktur för ännu mer kapacitet.

Men att helt enkelt ha banbrytande GPU:er tillgängliga räcker inte om bara en handfull stora teknikföretag kan komma åt dem. Tillgänglighet till avancerad databehandling är lika avgörande. AI-framsteg trivs när innovatörer som nystartade företag, akademiska laboratorier och ideella organisationer fritt kan experimentera med stora modeller och stora datorresurser.

Det är precis här BUZZ High Performance Computing kommer in i bilden, och levererar GPU-resurser på toppnivå genom en molnmodell som kombinerar oöverträffad tillgänglighet med full suveränitet.

BUZZ HPC: Ett suveränt AI-moln som stärker innovation

BUZZ HPC är en av de första leverantörerna som bygger ett suveränt AI-moln i Kanada med all infrastruktur belägen på kanadensisk eller allierad mark.

I samarbete med nationella aktörer som Bellexpanderar BUZZ HPC Kanadas avancerade AI-infrastruktur så att organisationer kan få säker tillgång på begäran till storskaliga GPU-kluster som är helt belägna i kanadensiskt ägda anläggningar.

Detta innebär att data förblir under kanadensisk jurisdiktion och uppfyller strikta krav på bosättning och integritet. Som president och COO Craig Tavares betonar, "suverän är den nya standarden för molntjänster, och detta initiativ markerar början på en ny era för AI-innovation i Kanada."

BUZZ HPC:s moln är utformat för att kombinera HPC:s råa kraft med molnets flexibilitet och användarvänlighet. Användare kan starta H200- eller HGX B200 Blackwell-plattformar som är sammankopplade med NVIDIA Quantum InfiniBand och NVLink. Kluster kan reserveras för långa projekt eller användas på begäran för snabba experiment. Användare kan välja rå bare metal, en Slurm-schemaläggare eller fullt hanterade Kubernetes-arbetsflöden.

BUZZ HPC tillhandahåller också rådgivningstjänster för AI-projekt som täcker anpassad modellutveckling, skalbar utbildning, generering med förstärkt hämtning och agentiska AI-lösningar. Deras plattform stöder hela AI-livscykeln med säkerhet i företagsklass, Tier III+-datacenter, ISO 27001- och SOC 2-certifieringar och full-stack-kryptering.

Tillgänglig AI-superdator i aktion

FirstPrinciples, en kanadensisk ideell forskningsorganisation, samarbetade nyligen med BUZZ HPC för att bygga en "AI-fysiker" för att påskynda vetenskapliga upptäckter.

Genom att utnyttja BUZZ HPC:s suveräna moln kan de få tillgång till GPU-kluster i världsklass på begäran utan tung IT-overhead.

Företagsanvändare och akademiska användare gynnas också. Fakulteten vid Columbia University rapporterade garanterad åtkomst till nödvändig beräkning, och en annan kund minskade AI-inferenskostnaderna med sju gånger.

BUZZ HPC optimerar arbetsbelastningar med vLLM, PagedAttention och DF11-minneskomprimering för att maximera GPU-användningen och minska kostnaderna.

Slutsats: AI-innovation möter tillgänglig databehandling

NeurIPS 2025 gav en glimt av framtiden: AI-agenter som lär sig och föreställer sig världar, generativa modeller som hanterar flera modaliteter och AI-genombrott som kräver massiv datakraft.

Avancerade GPU:er som H200 och B200 är viktiga, men att göra dem tillgängliga via plattformar som BUZZ HPC är det som skapar lika villkor.

🔗 Upplev kraften i suverän AI-beräkning i företagsklass själv på buzzhpc.ai.