Inception 50 millió dollárt vont be kódfókuszú és szöveges diffúziós modellek fejlesztésére
Inception 50 millió dollárt vont be kódfókuszú és szöveges diffúziós modellek fejlesztésére
Az AI-startupok tőkebeáramlása új rekordokat dönt, és jelenleg kiemelkedően kedvező időszakot élnek azok a kutatók, akik merész, új technológiai irányokkal állnak elő. Ebbe a lendületbe érkezik az Inception, egy frissen induló vállalat, amely a diffúziós modellek szövegre és kódra való adaptálását tűzte ki célul – és ehhez 50 millió dollárnyi seed befektetést biztosítottak számára.
A finanszírozási kört a Menlo Ventures vezette, további befektetők között pedig ott találjuk a Mayfieldet, az Innovation Endeavorst, a Microsoft M12-t, a Snowflake Ventures-t, a Databricks Investmentet és az Nvidia NVentures alapját. Emellett Andrew Ng és Andrej Karpathy is csatlakozott angyalbefektetőként.
Diffúziós modell, de nem a megszokott módon
A projekt vezetője, Stefano Ermon, a Stanford Egyetem professzora, hosszú évek óta foglalkozik diffúziós modellekkel – azokkal az algoritmusokkal, amelyek iteratív finomítással készítenek generált tartalmakat, és olyan rendszereket működtetnek, mint a Stable Diffusion, a Midjourney vagy a Sora.
Ermon célja, hogy a technológiát túlmutassa a képgeneráláson, és olyan területekre vigye át, mint a szoftverfejlesztés, a nagyméretű szövegfeldolgozás és a komplex adatműveletek gyorsítása.
Mercury: diffúziós modell fejlesztőknek
A finanszírozási körrel együtt az Inception bejelentette a Mercury legújabb verzióját – egy olyan diffúziós modellt, amelyet kifejezetten kódolási feladatokra optimalizáltak. A Mercury már integrálásra került több fejlesztői eszközbe, például:
- ProxyAI
- Buildglare
- Kilo Code
Ermon szerint a diffúziós megközelítés egyik legnagyobb előnye a lényegesen alacsonyabb késleltetés (latency) és a jóval kisebb számítási költség, összehasonlítva a klasszikus autoregresszív, tokenről tokenre haladó modellekkel (mint amilyen a GPT-5 vagy a Gemini).
Miért lehet gyorsabb a diffúzió, mint az autoregresszió?
A hagyományos nyelvi modellek soronként építik fel a választ, minden új token az előző alapján jön létre. Ez a folyamat szigorúan szekvenciális, vagyis nehezen párhuzamosítható.
Ezzel szemben a diffúziós modellek:
- egész szekvenciákat finomítanak iteratívan,
- a számítások nagy része párhuzamosítható,
- így a válaszadás drasztikusan felgyorsul.
Ermon szerint a rendszer már most „1000+ token/másodperc” sebességgel működik, ami jóval meghaladja az autoregresszív LLM-ek általános teljesítményét.
A diffúzió előnyei nagy kódbázisoknál
Amikor egy modellnek:
- összetett kódstruktúrákat kell átlátnia,
- nagy mennyiségű szöveget kell egyben manipulálnia,
- vagy komoly hardverkorlátok mellett kell működnie,
a diffúziós paradigma jelentős előnyt kínál. A nagyobb párhuzamosíthatóság miatt még a komplex fejlesztői feladatok is alacsony késleltetéssel, stabil költséggel futtathatók.
Tovább olvasom (ajánlott):
- A 6. számú Purdue jobb kezdést keres a Marquette meccsen
- Az ENSZ felügyelete szerint a csernobili sugárpajzs „elvesztette biztonsági funkcióját” dróntámadás után
- Hamdan sejk dubaji herceg jóváhagyta a lakhatási, a családjóléti és a digitális fejlesztési világ új terveit Hírek
- A Legfelsőbb Bíróság elutasítja a meleg párok házasságkötési jogával szembeni régóta húzódó kihívást.
- „Ez nem zsarolás”: a CIA volt igazgatója felfedi, hogyan „megfélemlíti” a CIA a kémeket, hogy folytassák a munkát; Régi klip vírusos világhírek
- Ahogy Trump a megfizethetőséget „csalási munkának” nevezi, a demokraták megfizethető lakhatási tervet mutatnak be
- Ukrajna új béketervet készít, amikor Zelenszkij úgy dönt, hogy átadja a földet
- Nicki Minaj támogatja Donald Trump vitatott állítását, miszerint a keresztényeket üldözik Nigériában
- A COP30-at tűz után evakuálták
- Több mint 600 000 áram nélkül maradt orosz támadás után