23.03.2024.
16:01
Jezivi Google AI pretvara statične slike u video koji govori VIDEO
Istraživači kompanije Google razvili su novi AI model, koji može da transformiše običnu statičnu fotografiju u pokretnog, avatara koji govori.
Ovaj AI model nosi naziv Vlogger i nudi iznenađujuće realistične rezultate, koji su poprilično bizarni.
Google opisuje Vlogger kao "novi okvir za sintezu ljudi iz zvuka", dodajući da je "upravo automatizacija i realizam ponašanja ono čemu težimo u ovom radu... multimodalni interfejs za otelotvoreno konverzacijskog činioca". Taj činilac je dizajniran kako bi podržao prirodne razgovore sa ljudskim korisnicima.
Drugim rečima, cilj istraživača je da kreiraju apsolutno realistične lažne ljude, koji komiuniciraju na "ljudski" način sa pravim ljudskim bićima na drugoj strani.
Model zahteva samo jednu fotografiju i željeni audio klip kao ulaz, a mogao bi da se koristi za poboljšanje onlajn komunikacije, edukaciju ili za personalizovane virtuelne asistente.
Vlogger može i da obrađuje pokretne video snimke, za koje istraživači kažu da će olakšati kreativne procese.
AI animacija, koju Vlogger nudi, još uvek nije perfektna. Još uvek su vidljive ivice koje nisu ljudske, pokreti i govor koji je približniji robotima. Ipak, ovaj AI model se konstantno unapređuje i radi se o impresivnoj tehnologiji, koja se obučava na više od 2.200 sati videa i 800.000 identiteta.
Komentari 2
Pogledaj komentare Pošalji komentar