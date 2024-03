Varem on küll näidatud kunstmõistuse rakendusi, mis suudavad töödelda portreefotot ja kasutada seda osaliselt animeeritud pildi loomiseks, kuid Alibaba meeskond on astunud sammu edasi, lisades ka heli.

Võib-olla veelgi olulisem on see, et nad on seda teinud ilma 3D mudelite või isegi näo kaardistamiseta. Selle asemel kasutatakse difusioonimudelit, treenides tehisaru suurte heli- või videofailide andmekogudega.