Root NationHírekinformatikai újságLétrehozott mesterséges intelligencia, amely 2 másodperc alatt konvertálja a 3D-s képet 5D-s modellné

Létrehozott mesterséges intelligencia, amely 2 másodperc alatt konvertálja a 3D-s képet 5D-s modellné

-

Az Adobe és az Ausztrál Nemzeti Egyetem kutatói olyan algoritmust fejlesztettek ki, amely mindössze 5 másodperc alatt alakítja át a kétdimenziós képeket háromdimenziós modellekké. Ez az áttörés azt ígéri, hogy forradalmasítja a tartalomkészítést a tervezés és a szórakoztatás terén, de óvakodjon az elmosódott textúrák és a szerzői jogok megsértése miatti esetleges problémáktól.

Az új algoritmus, az úgynevezett Large Reconstruction Model (LRM), jelentős előrelépést jelentett az egyetlen képen alapuló háromdimenziós modellek gyors létrehozásában. Az Objaverse és MVImgNet adatbázisokban elérhető, körülbelül egymillió 3D objektumból álló nagy adathalmazra kiképzett algoritmus kivételes általánosítási képességet mutatott be, amikor különféle képekkel dolgozik XNUMXD tartalom létrehozásához.

Ellentétben a korábbi modellekkel, amelyek korlátozott adathalmazokon készültek, és a képek egy kategóriájára összpontosítottak, az LRM olyan transzformatív architektúrát használ, amely a mély tanulás számos fejlesztésének alapja lett, 500 millió paraméterrel. Ez lehetővé teszi, hogy a mesterséges intelligencia modell hatékonyan működjön különféle képtípusokkal, beleértve a valós fényképeket és más mesterséges intelligenciaszolgáltatások, például a DALL-E és a Stable Diffusion által készített vizuális kollázsokat.

Létrehozott mesterséges intelligencia, amely 2 másodperc alatt konvertálja a 3D-s képet 5D-s modellné

Yitzong Hong, a tanulmány vezető szerzője hangsúlyozta, hogy az LRM jelentős áttörést jelent a XNUMXD-s rekonstrukció területén. Az algoritmus képes reprodukálni a részletes geometriát és összetett textúrákat, például a fa textúráját, miközben megőrzi a minőséget és a pontosságot.

Az LRM alkalmazása valóban masszívvá válhat, a tervezéstől és a szórakoztatástól a játékiparig. A tervezők és a 3D-s művészek számára ez a modellalkotási folyamat felgyorsítását jelenti, ami különösen fontos a videojátékok és animációk fejlesztésekor. Ezenkívül az LRM hétköznapi felhasználók általi használatának lehetősége azt ígéri, hogy a 3D modellezés nem csak a szakemberek kiváltsága lesz. Mostantól akár okostelefonon készült fényképekből is lehet majd részletes modelleket készíteni.

Az LRM-nek azonban megvannak a korlátai, például a textúrák elmosódása a kép rejtett területein. Érdemes figyelembe venni a szerzői jogi kérdéseket is, különösen más mesterséges intelligencia szolgáltatások által készített képek felhasználásával összefüggésben. Az LRM képességeinek bemutatására az Adobe kutatói létrehoztak oldalon videó bemutatókkal és interaktív 3D modellekkel. Ez rávilágít az AI növekvő szerepére a mai világban, valamint a kreatív iparágak jövőjére gyakorolt ​​lehetséges hatására.

Olvassa el még:

forrásTechSpot
Regisztrálj
Értesítés arról
vendég

0 Hozzászólások
Beágyazott vélemények
Az összes megjegyzés megtekintése