Китай запустив 80 ГВт нових потужностей ВДЕ тільки за першу половину 2017 року
22 Липня , 2017
Aucto: роботизована рука на допомогу людині
23 Липня , 2017

Розроблена технологія, що дозволяє перетворити аудіозапис в повноцінне відео розмовляючої людини

Дослідники з Лабораторії обробки графіки і зображень (Graphics and Image Laboratory) Вашингтонського університету розробили ряд програмних алгоритмів, що дозволяють перетворити аудіозаписи в реалістичне відео, на якому людина синхронно рухає губами у відповідність з вимовленими словами і фразами. У основі створеної системи лежить нейронна мережа, попередньо навчена на прикладах відео із записів людини, яка говорить на будь-яку тему.
Більш детальна інформація про систему перетворення аудіо у відео буде представлена на конференції з комп’ютерної графіки 2017 SIGGRAPH. А як приклад дослідники підготували досить реалістичні ролики, на яких колишній президент США Барак Обама розмірковує на тему тероризму, батьківства, створення нових робочих місць і т. п. Ці відеоролики були побудовані на базі існуючих аудіозаписів, а для навчання нейронної мережі використовувалось багато годин записів публічних виступів Барака Обами.
В даний час нейронна мережа здатна навчитись імітації мови тільки однієї конкретної людини. Тим не менше, використання технологій штучного інтелекту дозволяє уникнути труднощів, які виникають при використанні традиційних конверсійних технологій. Адже для роботи традиційних технологій використовуються студійні записи безлічі різних людей, які повторюють одні і ті ж фрази, що робиться для визначення кореляції окремих вимовних звуків з формою, положенням губ і інших частин обличчя людини.
Процесс преобразования
Така технологія перетворення мови в реалістичне відео може знайти застосування в різних системах конференц-зв’язку для поліпшення їх роботи, вважають дослідники. Адже для передачі тільки аудіо-сигналу потрібна набагато вужча смуга пропускання комунікаційного каналу, ніж для одночасної передачі аудіо та відео. Крім цього, нова технологія може забезпечити спілкування в режимі реального часу людей з віртуальними персонажами комп’ютерних ігор або історичних реконструкцій.
Поява системи, що забезпечує настільки реалістичний результат, відразу ж змушує задуматись про можливості в сфері фальсифікації, які вона надає. Однак, запевняють дослідники, застосувавши приблизно такий же підхід, тобто “згодувавши” навченій нейронної мережі відео для аналізу, можна без проблем з’ясувати, що це, реальна відеозйомка або ролик, зроблений комп’ютером?


Залишити відповідь

Увійти за допомогою: 
Inline
Inline