Программировать «ведущую» отдельно для каждой новости не нужно – достаточно ввести текст.

Новости «Сбербанка» на корпоративном YouTube-канале вчера, 18 апреля 2019 года, читала "Елена" — фотореалистичная трёхмерная модель. Электронная «ведущая» способна имитировать человеческую мимику и интонации при помощи нейросетевых алгоритмов.

Зрители отмечают, что мимика "Елены" пока несовершенна - движения губ не всегда попадают в текст, а чуть вздернутая с одной стороны верхняя губа придаёт лицу высокомерное выражение. Говорит «ведущая» монотонно, что, несомненно, мешает концентрировать внимание на информации. Возможно, в «Сбербанке» не захотели или не смогли применить какой-нибудь из современных TTS-движков (к примеру, используемые "Алисой" от "Яндекса" или Ассистентом Google), которые звучат намного более реалистично.

Аналогичный эксперимент в ноябре 2018 года представило китайское новостное агентство "Синьхуа". Там нейросетевой ведущий провёл один единственный выпуск. Скорее всего, причина кроется в том, что существующие на сегодняшний день технологии не позволяют имитировать мимику и интонации так, чтобы ведущий выглядел на 100% реалистично.

 

Читайте также: Цифра дня: сколько раз скачали российскую ОС «Эльбрус»

Подписывайтесь на Деловой Донбасс в социальных сетях: Вконтакте, Однокласники, Фейсбук, Яндекс Дзен, Вайбер, Телеграм

Для добавления комментария авторизируйтесь через социальную сеть или укажите имя и email. После модерации, комментарий будет добавлен.

Присоединяйтесь к нам

Популярное

  • За неделю

  • За месяц

  • Все