Intel és SambaNova: új architektúra készül az AI-inferencia gyorsítására

Az Intel és a SambaNova új, többkomponensű architektúrát jelentett be, amely a mesterséges intelligencia inferencia feladatainak hatékonyabb kiszolgálását célozza. A megközelítés lényege, hogy nem egyetlen chiptípusra épít, hanem a feladatokat különböző hardverek között osztja szét.

A rendszerben a GPU-k végzik az úgynevezett előfeldolgozási lépéseket, ahol a bemeneti promptokból kulcs-érték struktúrák készülnek. Ezt követően a SambaNova saját fejlesztésű RDUs egységei felelősek a tokenek generálásáért, alacsony késleltetés és nagy áteresztőképesség mellett. A folyamat központi irányítását az Intel Xeon 6 processzorai látják el.

A koncepció egyik kulcseleme, hogy a CPU nem háttérszereplőként jelenik meg, hanem a teljes rendszer működésének irányító rétegeként. A Xeon processzorok felelnek a feladatok elosztásáért, a kódok végrehajtásáért, valamint az egyes folyamatok közötti kommunikációért. Ide tartozik a fordítás, az eredmények ellenőrzése és az egyidejű műveletek koordinálása is.

A megközelítés különösen az úgynevezett agent-alapú AI rendszerek esetében válik fontossá, ahol egyszerre több ezer folyamat fut párhuzamosan. Ezek során különböző lekérdezések, kódgenerálási feladatok és rendszerszintű műveletek zajlanak, amelyek összehangolt működést igényelnek.

A fejlesztők szerint az új Xeon 6 processzorok jelentős teljesítménynövekedést kínálnak bizonyos feladatoknál. A mérések alapján a fordítási műveletek akár 50 százalékkal gyorsabbak lehetnek egyes Arm-alapú szerverprocesszorokhoz képest, míg vektoralapú adatbázis-kezelésnél akár 70 százalékos előnyt is elérhetnek más x86 rendszerekkel szemben.

A rendszer egyik fontos gyakorlati előnye, hogy meglévő adatközponti infrastruktúrában is használható. Nem igényel speciális hűtési megoldásokat vagy teljesen új környezetet, ami csökkentheti a bevezetés költségeit és gyorsíthatja a skálázást.

A megoldás várhatóan 2026 második felében válik elérhetővé vállalati, felhős és állami felhasználók számára. A cél, hogy alternatívát kínáljon az egyre inkább GPU-központú megközelítésekkel szemben.

A bejelentés egy olyan időszakban érkezik, amikor a mesterséges intelligencia számítási feladatai körül egyre erősebb a verseny. Az Nvidia és más szereplők a teljesítmény növelésére és a késleltetés csökkentésére koncentrálnak, miközben új architektúrák jelennek meg. Az Intel és a SambaNova együttműködése azt jelzi, hogy a jövőben a heterogén rendszerek válhatnak meghatározóvá az AI-inferencia területén.

Ha tetszett a cikk, kérlek oszd meg mással is:

Kategóriák

További cikkeink

2025.03.24.
Brutális sebesség jön az SSD-knél – a PCIe 7.0 hozza el a 512 GB/s korszakát
A technológia folyamatosan gyorsul, de a PCI Express 7.0 szabvány bevezetésével…
2025.02.27.
Kibertámadás áldozatai lettek népszerű Chrome-bővítmények – 3,2 millió felhasználó érintett
Egy nagyszabású kibertámadás során hackerek feltörtek 16 népszerű Chrome-bővítményt, köztük az…
2025.02.19.
90%-os kedvezmény: Népszerű lopakodós játék mindössze 2 dollárért a Steamen
A játékosok most hatalmas kedvezménnyel szerezhetik be az egyik legnépszerűbb ’stealth’…
2026.05.09.
A Fujifilm X-T6 nagy nyomás alatt érkezhet, az X-T5 még mindig az egyik legjobb APS-C kamera
A Fujifilm X-T5 több mint három évvel a megjelenése után is…
2026.05.09.
Az AI teljesen átalakítja a vállalatvezetést az IBM szerint
Az IBM friss kutatása szerint a mesterséges intelligencia már nem csupán…
2026.05.08.
Új vállalati RackStation NAS-okkal bővít a Synology
A Synology három új RackStation rendszert mutatott be, amelyek kifejezetten nagyvállalati…
2026.05.08.
Apple új A18 Pro chipeket rendel a MacBook Neo gyártásának felpörgetéséhez
Az Apple a jelek szerint újabb A18 Pro lapkákat rendelt a…
2026.05.06.
DLSS 4.5 érkezik új játékokba: NVIDIA tovább erősíti az RTX platformot
Az NVIDIA újabb játékokkal bővíti a DLSS 4.5 technológiát támogató címek…
2026.05.06.
Synology FS6420 és FS3420: új all-flash rendszerek nagyvállalati terhelésre
A Synology két új all-flash tárolórendszert mutatott be, az FS6420 és…
A RAM válság az AI robbanásszerű fejlődése miatt egyre súlyosabb
2026.05.05.
RAM válság: az AI miatt tartós memóriahiány jöhet
A RAM válság nemhogy enyhülne, hanem az iparági szereplők szerint még…
2026.05.05.
Elon Musk OpenAI per: „Terminator-forgatókönyvvel” érvel a bíróságon
Az Elon Musk és az OpenAI közötti jogi vita új szakaszba lépett, ahol Musk tanúvallomásában…