Ascultă Radio România Actualitaţi Live

Sistem AI capabil să genereze chipurile oamenilor după ce le ascultă vocea

Cercetătorii de la MIT au conceput un sistem de inteligenţă artificială capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia.

Foto: maxpixel.net.

Articol de Răzvan Stancu, 16 Iunie 2019, 12:58

Cercetători americani de la MIT CSAIL (Computer Science & Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă artificială (AI) capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia, ascultând o scurtă înregistrare audio cu respectiva persoană, informează LiveScience care citează un studiu publicat la sfârşitul lunii trecute în jurnalul arXiv şi nu au fost încă evaluate în sistemul peer-review.

Denumit Speech2Face, acest sistem este o reţea neuronală - un computer care gândeşte într-un mod similar cu un creier uman - şi a fost 'antrenat' de oamenii de ştiinţă folosind milioane de clipuri video educaţionale de pe internet în care vorbesc peste 100.000 de oameni diferiţi.

Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii între timbrul vocii şi anumite trăsături ale feţei. Apoi sistemul AI a fost folosit pentru a genera faţa care corespunde unei anumite înregistrări audio.

Deocamdată sistemul AI nu ştie cu exactitate cum arată un individ pornind doar de la sunetul vocii acestuia, însă reţeaua neuronală recunoaşte anumite caracteristici ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale pentru mari categorii de oameni, conform autorilor sistemului.

'Astfel, acest model va produce chipuri care arată generic. El nu va produce imagini ale anumitor indivizi', notează oamenii de ştiinţă.

Chipurile generate de Speech2Face privesc drept înainte şi au expresii neutre. Ele nu corespund exact persoanelor ale căror voci au fost analizate în cadrul studiului. Cu toate acestea, sistemul identifică de obicei în mod curent categoria de vârstă a subiectului a cărui voce a analizat-o, etnia şi genul său.

Confruntat cu variaţii de limbă, sistemul AI a fost însă uşor de păcălit. Spre exemplu, când a ascultat o persoană asiatică vorbind în chineză, sistemul a generat figura unui asiatic. Însă atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit şi a generat imaginea unei persoane caucaziene.

De asemenea, sistemul şi-a demonstrat limitele şi în ceea ce priveşte interpretarea genului persoanei în funcţie de tonalităţile vocii. Astfel, AI-ul a asociat vocile mai groase, mai grave, cu subiecţi de sex masculin şi vocile mai subţiri, cu tonalităţi mai ridicate cu subiecţi de genul feminin, asociere care nu este de fiecare dată corectă.

Conform cercetătorilor, aceste limitări sunt legate de faptul că baza de date folosită pentru pregătirea sistemului provine doar din clipurile video educative de pe YouTube şi nu este reprezentativă la nivelul întregii populaţii umane. (AGERPRES)

Schimbările climatice au agravat cele mai severe evenimente meteorologice
Ştiinţă & Tehnologie 31 Octombrie 2024, 13:27

Schimbările climatice au agravat cele mai severe evenimente meteorologice

Studiul subliniază urgenţa reducerii emisiilor de gaze cu efect de seră, care determină creşterea temperaturilor şi fenomene...

Schimbările climatice au agravat cele mai severe evenimente meteorologice
Probă de Drum - Suzuki Vitara Strong Hybrid
Ştiinţă & Tehnologie 29 Octombrie 2024, 07:41

Probă de Drum - Suzuki Vitara Strong Hybrid

Când vine vorba de SUV-uri compacte, Suzuki Vitara este un veteran apreciat de ani de zile pentru versatilitatea și...

Probă de Drum - Suzuki Vitara Strong Hybrid
Carbuyer: Noua Dacia Duster, cea mai bună maşină a anului
Ştiinţă & Tehnologie 23 Octombrie 2024, 14:52

Carbuyer: Noua Dacia Duster, cea mai bună maşină a anului

Carbuyer publică ştiri, recenzii şi sfaturi pentru cumpărătorii de mașini din Marea Britanie.

Carbuyer: Noua Dacia Duster, cea mai bună maşină a anului
Probă de drum - Nissan X-Trail cu ePedal
Ştiinţă & Tehnologie 20 Octombrie 2024, 13:14

Probă de drum - Nissan X-Trail cu ePedal

Altădată vârful de lance al niponilor pe tărâm european, noul X-Trail încearcă se se impună pe o piața aglomerată a...

Probă de drum - Nissan X-Trail cu ePedal
"Vacanțe de nerefuzat" care ne pot goli conturile
Ştiinţă & Tehnologie 19 Octombrie 2024, 15:49

"Vacanțe de nerefuzat" care ne pot goli conturile

Specialiștii DNSC atrag atenția că în mediul online sunt tot mai multe oferte false, iar neatenția ne poate goli conturile.

"Vacanțe de nerefuzat" care ne pot goli conturile
Probă de Drum – Peugeot 3008
Ştiinţă & Tehnologie 14 Octombrie 2024, 15:21

Probă de Drum – Peugeot 3008

Francezii de la Peugeot se laudă cu noul SUV Peugeot 3008, un model care se află într-un segment extrem de aglomerat, acolo...

Probă de Drum – Peugeot 3008
Suntem primii oameni care vedem această cometă
Ştiinţă & Tehnologie 13 Octombrie 2024, 12:33

Suntem primii oameni care vedem această cometă

Cometa va fi vizibilă inclusiv din ţara noastră şi există şanse mari să fie văzută chiar cu ochiul liber şi în timpul zilei.

Suntem primii oameni care vedem această cometă
Bigster, cel mai puternic și rafinat exemplar Dacia
Ştiinţă & Tehnologie 08 Octombrie 2024, 22:20

Bigster, cel mai puternic și rafinat exemplar Dacia

Bigster este primul SUV familial și beneficiază de multiple noutăți pentru automobilele Dacia. Prețurile pornesc de la 30.000...

Bigster, cel mai puternic și rafinat exemplar Dacia