Главная > Инновации и Технологии > Vera Voice совершенствует нейросеть – имитация голоса известных людей
Инновации и ТехнологииКрупные КомпанииМеждународные Новости

Vera Voice совершенствует нейросеть – имитация голоса известных людей

Vera Voice совершенствует нейросеть - имитация голоса известных людей

Проект Vera Voice совершенствует нейросеть. Она сможет имитировать голоса известных людей на русском языке. Прежде от Сбербанка уже было заявление о мошеннических угрозах посредством подобных технологий.

Компании «Стафори» (создатель HR-ресурса на базе искусственного интеллекта «Робот Вера», в неё вкладывает средства ФРИИ), и Screenlife Technologies, возглавляемая продюсером Тимуром Бекмамбетовым, учредили партнёрскую организацию для продвижения программы Vera Voice. Такая информация поступила от указанных фирм в РБК.

Проект Vera Voice даст возможность отображать голоса популярных личностей на русском языке. В его основе – технология нейросети, она учится повторять речь по шаблону первоисточника. Цену проекта создатели не озвучили.

История проекта

В России уже запускались аналогичные разработки. Конкретно, вкладчик в технологии такого рода – Сбербанк. Организованная банком в 2013 году фирма АБК в начале года презентовала небольшой ролик с искусственно воспроизведённым голосом артиста Иннокентия Смоктуновского. Там его голосом говорится о возможности искусственного интеллекта говорить голосом непревзойдённого актёра, после 18-часового прослушивания его записей.

Затем Сбербанк сделал презентацию технологии в Сочи на Российском инвестиционном форуме. Станиславом Кузнецовым, заместителем председателя правления финансового учреждения, подчёркнуто, что применение таких программ возможно и с противоправными замыслами. Как пример он поставил запись, где какой-то придуманный губернатор обращается с просьбой о пяти миллиардах рублей для строительства моста. При этом звучит голос Смоктуновского.

Прогнозы

Общедоступный алгоритм изображения речи человека посредством нейросети с наименованием WaveNet уже три года назад презентовала фирма DeepMind, относящаяся к Google. На Западе аналогичные технологии повторения голоса интенсивно включены в жизнь. В июле текущего года инженерами Facebook продемонстрирован синтезатор речи, отобразивший конкретно голос Билла Гейтса, создателя Microsoft. В сентябре Amazon сделал заявление, о способности голосовой колонки Alexa говорить голосами известных людей. Вначале «изобразили» актёра Самуэя Ли Джексона. Как прогнозирует фирма консалтинга Markets&Markets, к 2023 году рынок имитации голосов приблизится к цифре 1,73 миллиарда долларов.

Чем это хорошо и чем плохо?

По высказыванию Павла Плескова, эксперта по data science из России, подобно другим стартапам на русском языке, это абсолютное повторение уже имеющей место концепции. Существуют области проблем машинного обучения, относящиеся к языку. Для них есть возможность изготавливать на внутреннем рынке продукт, совпадающий с англоязычным. Основное – накопить довольно объёмную выборку сведений на требуемом языке. В Российской Федерации это поле деятельности Яндекса и Сбербанка. Однако отдельные задачи могут решать и мелкие игроки.

Он дополнил, что сегмент развлечений – основное использование данной технологии. Мошенничество – наиболее серьёзная опасность. Создать голос можно лишь по семплу, который длится три секунды. А при существующей моде на автоматические звонки – робоколы – дать преступнику образец подобного семпла вы можете в нескольких словах: – Алло! Кто это? Какой вопрос у вас? – Далее мошенники сумеют, к примеру, авторизоваться в банке голосом.

Технологии идут вперёд, а мошенники не дремлют

Сгенерировать голос из записи умеют уже давно, по словам Дмитрия Шефтеловича, сотрудника немецкой фирмы ESR Labs AG. По его мнению, в голосовом клонировании, как во всём ряду обучения искусственного интеллекта, объём данных имеет решающее значение. Профессиональная генерация речи в недалёкие времена нуждалась в записях конкретного формата объёмом в несколько часов. Сейчас есть технологии, которым достаточно пары секунд речевой записи на оборудовании даже обычного уровня для обучения голосу.

По заявлению Дмитрия Дырмовского, генерального директора группы компаний «Центр речевых технологий», отображение голосов известных людей – доля общего стремления к искусственному интеллекту с эмоциями, когда создатели стремятся синтезировать натуральное звучание у роботов, во избежание неприятия у пользователей. Как он считает, эта технология подходит для разнообразного использования – от звуковых книг до рекламных акций с голосами популярных личностей. Одновременно, отображение голоса могут задействовать и в обманных деяниях или для подделки новостей.

🇺🇿 Будьте в курсе последних финансовых новостей в Узбекистане и всего Мира!
♻️ Сайт 🇷🇺 🇺🇿
♻️ Telegram channel 🇷🇺
♻️ Telegram channel 🇺🇿
♻️ Facebook страница 🇷🇺
♻️ Facebook страница 🇺🇿
♻️ Instagram
💠 Скачать в Play Market
💠 Скачать в App Store
🌏 Кто владеет информацией, тот владеет миром!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Организация свадьбы Ташкент