Intel és SambaNova: új architektúra készül az AI-inferencia gyorsítására

Az Intel és a SambaNova új, többkomponensű architektúrát jelentett be, amely a mesterséges intelligencia inferencia feladatainak hatékonyabb kiszolgálását célozza. A megközelítés lényege, hogy nem egyetlen chiptípusra épít, hanem a feladatokat különböző hardverek között osztja szét.

A rendszerben a GPU-k végzik az úgynevezett előfeldolgozási lépéseket, ahol a bemeneti promptokból kulcs-érték struktúrák készülnek. Ezt követően a SambaNova saját fejlesztésű RDUs egységei felelősek a tokenek generálásáért, alacsony késleltetés és nagy áteresztőképesség mellett. A folyamat központi irányítását az Intel Xeon 6 processzorai látják el.

A koncepció egyik kulcseleme, hogy a CPU nem háttérszereplőként jelenik meg, hanem a teljes rendszer működésének irányító rétegeként. A Xeon processzorok felelnek a feladatok elosztásáért, a kódok végrehajtásáért, valamint az egyes folyamatok közötti kommunikációért. Ide tartozik a fordítás, az eredmények ellenőrzése és az egyidejű műveletek koordinálása is.

A megközelítés különösen az úgynevezett agent-alapú AI rendszerek esetében válik fontossá, ahol egyszerre több ezer folyamat fut párhuzamosan. Ezek során különböző lekérdezések, kódgenerálási feladatok és rendszerszintű műveletek zajlanak, amelyek összehangolt működést igényelnek.

A fejlesztők szerint az új Xeon 6 processzorok jelentős teljesítménynövekedést kínálnak bizonyos feladatoknál. A mérések alapján a fordítási műveletek akár 50 százalékkal gyorsabbak lehetnek egyes Arm-alapú szerverprocesszorokhoz képest, míg vektoralapú adatbázis-kezelésnél akár 70 százalékos előnyt is elérhetnek más x86 rendszerekkel szemben.

A rendszer egyik fontos gyakorlati előnye, hogy meglévő adatközponti infrastruktúrában is használható. Nem igényel speciális hűtési megoldásokat vagy teljesen új környezetet, ami csökkentheti a bevezetés költségeit és gyorsíthatja a skálázást.

A megoldás várhatóan 2026 második felében válik elérhetővé vállalati, felhős és állami felhasználók számára. A cél, hogy alternatívát kínáljon az egyre inkább GPU-központú megközelítésekkel szemben.

A bejelentés egy olyan időszakban érkezik, amikor a mesterséges intelligencia számítási feladatai körül egyre erősebb a verseny. Az Nvidia és más szereplők a teljesítmény növelésére és a késleltetés csökkentésére koncentrálnak, miközben új architektúrák jelennek meg. Az Intel és a SambaNova együttműködése azt jelzi, hogy a jövőben a heterogén rendszerek válhatnak meghatározóvá az AI-inferencia területén.

Ha tetszett a cikk, kérlek oszd meg mással is:

Kategóriák

További cikkeink

2025.03.24.
Brutális sebesség jön az SSD-knél – a PCIe 7.0 hozza el a 512 GB/s korszakát
A technológia folyamatosan gyorsul, de a PCI Express 7.0 szabvány bevezetésével…
2025.02.27.
Kibertámadás áldozatai lettek népszerű Chrome-bővítmények – 3,2 millió felhasználó érintett
Egy nagyszabású kibertámadás során hackerek feltörtek 16 népszerű Chrome-bővítményt, köztük az…
2025.02.19.
90%-os kedvezmény: Népszerű lopakodós játék mindössze 2 dollárért a Steamen
A játékosok most hatalmas kedvezménnyel szerezhetik be az egyik legnépszerűbb ’stealth’…
2026.06.03.
Marvel’s Wolverine: véres új előzetes és Jean Grey első bemutatkozása
A Sony legutóbbi State of Play eseményén hosszabb betekintést kaptunk a…
2026.06.03.
Nvidia RTX Spark: az AI ügynökök új korszakát hozhatja el a Windows PC-kre
Az Nvidia a Computex 2026 kiállításon hivatalosan is bemutatta az RTX…
2026.06.02.
Pacific Fusion: 440 gigawattos impulzust ért el a fúziós energia felé vezető úton
A fúziós energia fejlesztésével foglalkozó Pacific Fusion új mérföldkőhöz érkezett. A…
2026.06.02.
ASUS ExpertCenter P200 AiO: új üzleti all-in-one PC érkezik AMD Ryzen processzorral
dszer a mindennapi üzleti feladatokra optimalizált teljesítményt kínál, legyen szó dokumentumkezelésről,…
MSI Claw 8 EX AI+
2026.06.01.
MSI Claw 8 EX AI+ érkezik az új Intel Arc G3 chippel
Az MSI a Computex 2026 kiállításon leleplezte a Claw 8 EX…
2026.06.01.
Nvidia RTX Spark: új Arm-alapú chip érkezik az Apple M5 kihívójaként
Az Nvidia a Computex 2026 kiállításon hivatalosan is bemutatta RTX Spark…
2026.05.22.
A Zendesk új AI-árazása teljesen átírhatja a vállalati szoftverpiacot
A Zendesk új árszabási modellt vezet be mesterséges intelligenciára épülő ügyfélszolgálati rendszereihez. A…
2026.05.22.
Vibe coding: miért nem szabad kész termékként kezelni az AI által írt kódot
Az AI-alapú kódgenerálás egyre gyorsabban terjed a szoftverfejlesztésben, sok vállalat azonban…