×
🏠 Главная 📃 О нас

Meta представляет Voicebox AI: стоит ли нам всем беспокоиться?

Распаковка обещаний и опасностей новой технологии синтетического голоса MetaЧто такое Voicebox?Конкурирующие голосовые модели AI Сила Voicebox Voicebox Meta: прорыв или угроза? Источник массивных обучающих данных Voicebox Обоюдоострый меч технологий Противодействие угрозе дипфейков Ключевые выводы Курта

META to launch app to rival Elon Musk's Twitter

Вы, наверное, слышали о дипфейках для изображений и видео. Эти жутко реалистичные видео, созданные с помощью ИИ? Теперь кажется, что Meta (ранее известная как Facebook) разработала новую модель искусственного интеллекта под названием Voicebox, полностью посвященную звуку. Это похоже на сверхмощную систему преобразования текста в речь, которая может создавать синтетические голоса всего лишь из текстовой подсказки.

 

Что такое Voicebox?

По своей сути Voicebox представляет собой модель искусственного интеллекта, которая создает синтетические голоса на основе простых текстовых подсказок. Другими словами, вы даете ему какой-то текст, и он прочитает его вслух голосом, который звучит как человеческий. Это похоже на функцию преобразования текста в речь, которую вы можете использовать на своем телефоне или компьютере, но она выводит вещи на совершенно новый уровень.

Одна вещь, которая отличает Voicebox, — это его способность воспроизводить определенные стили голоса на основе очень короткого звукового образца — мы говорим всего за две секунды! Это означает, что у вас потенциально может быть синтетический голос, который звучит как ваша любимая знаменитость или даже ваш собственный голос. Это почти как актер озвучивания по запросу, готовый зачитать все, что вы хотите, выбранным вами стилем голоса.

Конкурирующие голосовые модели ИИ 

Speechify 

Speechify и ElevenLabs также участвуют в преобразовании текста в речь. Speechify — это приложение, которое превращает любой текст в аудио. Он может читать вслух книги, статьи, заметки, электронные письма, PDF-файлы, изображения и веб-страницы. Speechify также утверждает, что предлагает функции клонирования голоса, редактирования голоса и выборки голоса. Speechify предлагает сотни бесплатных вечных аудиокниг, имеет настольное приложение и предназначено для помощи людям с ограниченными возможностями чтения.

The Meta logo on a phone

ElevenLabs 

ElevenLabs, с другой стороны, является стартапом, который использует искусственный интеллект для создания синтетических голосов с контекстно-зависимыми эмоциями и пониманием естественного языка. Они предлагают платформу для создания и настройки высококачественного разговорного звука любым голосом и стилем для различных отраслей, таких как видеоигры, анимация, цифровые помощники, образование, развлечения, реклама и подкастинг. У них также есть инструмент для обнаружения синтетических голосов и проверки их подлинности. ElevenLabs работает с актерами, которые предоставляют образцы своего голоса и получают деньги за использование клонов своего голоса. Они используют проприетарные модели глубокого обучения для создания своих речей с помощью ИИ.

Они оба довольно крутые, но они не обладают такой же универсальностью, как Voicebox, который может имитировать настоящие голоса всего за несколько секунд аудио. Это как сравнивать швейцарский армейский нож с несколькими действительно хорошими ложками. Все они имеют свое применение, но один определенно более универсален.

Сила Voicebox 

Но дело не только в создании поддельных голосов. Voicebox также может привести в порядок ваш звук, удалив раздражающий фоновый шум — скажем, тявканье собаки, когда вы пытаетесь записать. И дело не только в английском. Этот ИИ также говорит на французском, испанском, немецком, польском и португальском языках и даже может переводить отрывки с одного языка на другой, сохраняя тот же стиль голоса.

 

Meta logo

Voicebox от Meta: прорыв или угроза?

К сожалению или к счастью, в зависимости от того, как вы относитесь к ИИ, Meta не планирует сразу открывать исходный код Voicebox. Это заставляет людей задаваться вопросом, пытаются ли они избежать некоторых потенциальных проблем. Например, голосовые технологии ИИ можно использовать в негативных целях, например, в кампаниях преследования. Или, может быть, у Меты есть какие-то планы на будущее, чтобы заработать на этой модели.

Источник массивных обучающих данных Voicebox 

Интересная особенность Voicebox заключается в том, что он был обучен на большом количестве данных — более 60 000 часов речи из англоязычных аудиокниг и еще 50 000 часов из многоязычных аудиокниг. аудиокниги. Мета говорит, что в качестве основного источника данных они использовали общедоступные аудиокниги, но они также использовали другие источники, такие как подкасты, выступления и радиопередачи. Однако с использованием общедоступных аудиокниг связаны некоторые проблемы и ограничения, такие как качество, согласованность, выравнивание и идентификация говорящего. Meta утверждает, что они решили некоторые из этих проблем с помощью обработки данных и дизайна модели.

ЧТОБЫ УЗНАТЬ БОЛЬШЕ О МОИХ ПРЕДУПРЕЖДЕНИЯХ О БЕЗОПАСНОСТИ, ПОДПИШИТЕСЬ НА МОЙ БЕСПЛАТНЫЙ ОТЧЕТ О CYBERGUY, ПЕРЕХОДЯ НА CYBERGUY.COM/NEWSLETTER   

Технологический обоюдоострый меч 

Рост Голоса ИИ — довольно щекотливая тема, особенно для актеров озвучивания, а в последнее время и для писателей. Они обеспокоены тем, что компании используют искусственный интеллект для синтеза своих голосов, не платя им. Рынок аудиокниг сильно растет, и компании всегда стремятся сократить расходы, так что это может стать еще одной проблемой для профессионалов в области озвучивания.

Однако не ошибитесь; дело не только в рабочих местах. Есть некоторые серьезные опасения по поводу того, как низкие фальшивые голоса могут быть использованы в мошенничестве. Например, был случай, когда при крупном ограблении использовался синтетический голос, выдававший себя за генерального директора. Также есть опасения, что дипфейковые голоса могут быть использованы для вмешательства в такие вещи, как голосовые биометрические системы, которые используются для таких вещей, как онлайн-банкинг.

Видите ли, как бы круто ни звучала эта технология, у нее есть и темная сторона. Представьте, что вам звонит ваш босс и просит вас перевести огромную сумму денег, чтобы закрыть счет. Ты делаешь, как тебе говорят, потому что это твой босс. За исключением того, что это не так. Это верно; это был фальшивый синтетический голос, созданный с помощью ИИ, который звучал так же, как ваш босс. Дикий, не так ли? Но это не сюжет фильма; это действительно произошло! Это был один из первых случаев, когда при ограблении использовался поддельный голос, и это заставило правоохранительные органы и экспертов по искусственному интеллекту почесать затылок.

Artificial Intelligence

 

И это не только ограбления. Поддельные голоса можно использовать для обмана систем, которые полагаются на распознавание голоса. Мы говорим о таких вещах, как онлайн-банкинг, который использует ваш голос в качестве формы идентификации. Если преступники смогут создать убедительный фальшивый голос о вас, они потенциально могут получить доступ к вашим учетным записям. Это немного похоже на подделку подписи, но вместо этого вашим голосом.

Противодействие угрозе дипфейков 

Пока мы восхищаемся удивительными вещами, которые могут делать технологии, также важно осознавать потенциальные риски и быть на шаг впереди. Это похоже на высокотехнологичную игру в кошки-мышки, когда эксперты по искусственному интеллекту и компании усердно работают, чтобы обнаружить и остановить эти дипфейковые голоса, прежде чем они смогут причинить какой-либо вред.

К счастью, есть люди, пытающиеся дать отпор потенциальному неправомерному использованию дипфейковых голосов. Например, некоторые страны начали принимать законы, регулирующие дипфейки. Кроме того, существуют такие проекты, как «Автоматическая проверка спуфинга и противодействие спикеру» (ASVspoof), в рамках которых ученые и инженеры работают над способами противодействия фейковым голосовым атакам

Ключевые выводы Курта 

Мы в эпоху, когда технологии развиваются с головокружительной скоростью и меняют то, как мы работаем, общаемся и даже слышим. Хотя потенциал искусственного интеллекта, такого как Voicebox от Meta, несомненно, впечатляет, ясно, что нам также нужно действовать осторожно. Между инновациями и вторжением тонкая грань, баланс, который мы все еще пытаемся найти.

AI sign

Со всеми этими достижениями и потенциальными рисками, как вы относитесь к будущему искусственного интеллекта и технологии дипфейков? Считаете ли вы это благом или проклятием? Дайте нам знать, написав нам по адресу Cyberguy.com/Contact 

Чтобы узнать больше о моих предупреждениях о безопасности, подпишитесь на мою бесплатную рассылку отчетов CyberGuy, перейдя по ссылке Cyberguy.com/Newsletter 

Copyright 2023 CyberGuy.com. Все права защищены.

Курт «CyberGuy» Кнутссон — отмеченный наградами технический журналист, который глубоко любит технологии, оборудование и гаджеты, которые делают жизнь лучше благодаря его материалам для Fox News и FOX Business, которые начинаются по утрам в программе «FOX and Friends». Есть технический вопрос? Получите информационный бюллетень Курта CyberGuy, поделитесь своим мнением, идеей истории или комментарием на CyberGuy.com.


Новости партнеров