Badacze z University College London i University of Roehampton wykazali, że klony głosów generowane przez AI mogą być łatwiejsze do zrozumienia niż ludzka mowa, zwłaszcza w hałaśliwym otoczeniu. Wyniki opisano w „The Journal of the Acoustical Society of America”.
Syntetyczne głosy znane z asystentów takich jak Siri czy Alexa wymagają wielu godzin nagrań aktora, natomiast klon głosu konkretnej osoby można stworzyć już na podstawie kilkusekundowego nagrania. Zwiększa to liczbę możliwych głosów i zastosowań technologii.
W eksperymencie naukowcy sprawdzali które z głosów są bardziej zrozumiałe - ludzkie czy syntetyczne. Wstępne założenie było takie, że w tej konfrontacji lepsza okaże się naturalna mowa. Jednak wynik eksperymentu całkowicie zaskoczył autorów badania. Okazało się, że cyfrowe klony okazały się bardziej czytelne i to nawet o 20%.
Testy powtórzono z różnymi grupami: starszymi osobami, uczestnikami z USA oraz z filtrem imitującym implanty ślimakowe. W każdym przypadku klony głosowe okazały się łatwiejsze do zrozumienia.
Na razie nie wiadomo, skąd bierze się ten efekt. Naukowcy zapowiada kolejne eksperymenty i analizę tego, jak działają syntezatory mowy oraz cyfrowe przetwarzanie dźwięku. Celem jest lepsze zrozumienie, dlaczego klony głosowe bywają odbierane tak dobrze.
Pobierz aplikację Newsmax Polska:
Aplikację Newsmax Polska można pobrać z Google Play i App Store.