E-commerce и корпоративное обучение. Как используют дипфейки

Перевод статьи Wired.

Дипфейки часто упоминают в негативном ключе, считая инструментом для шантажа и махинаций. На самом деле технологию уже используют в благих целях. Например, она помогает бизнесам экономить на маркетинговых инструментах и обучать сотрудников. Подробнее об этом — в нашей адаптации материала Wired.

Deepfake: как появился термин

Термин дипфейк появился из-за никнейма пользователя Reddit, который в 2017 году опубликовал серию порнографических роликов с «участием» голливудских актрис. Их лица появились там с помощью ML-алгоритмов. Код разработчики выложили в открытый доступ.

Дипфейки стали инструментом харассмента и вызвали опасения правозащитников и общественности. Но чаще их используют для развлечения. Например, лицо Николаса Кейджа добавили в фильмы, в которых он не снимался.

Synthesia: корпоративное обучение

В июле 2020 года международный рекламный холдинг WPP разослал необычное видео для корпоративного тренинга десяткам тысяч сотрудников.

Спикер на видео говорит на языке зрителя и обращается к нему по имени, объясняя базовые концепты искусственного интеллекта. Само видео — и есть демонстрация возможностей ИИ. Лицо спикера и его речь — синтезированное ПО. Эти искусственно созданные обучающие видео — дипфейки. Их сейчас используют как инструмент корпоративного тренинга.

WPP / Wired

Видео для WPP разработал лондонский стартап Synthesia. Дипфейки ускоряют видеопродакшн и снижают стоимость производства видео. Технология очень быстро улучшается.

CTO WPP Стефан Преториус говорит, что для съемок обычного обучающего видео понадобилось бы 20 разных скриптов. Производство каждого из них обойдется в десятки тысяч долларов.

Разработка лондонского стартапа Synthesia позволяет создать аватары, которые выглядят по-разному, произносят имя зрителя и называют агентство на его языке. И все это обходится в $100 000. Пока видео для WPP доступны на трех языках: английском, испанском, мандаринском. В компании надеются, что в этом году ролики (20 видео по 5 минут) смогут посмотреть 50 000 сотрудников.

Synthesia делает дипфейк-видео и для других корпоративных клиентов, включая консалтинговую компанию Accenture и разработчика программного обеспечения SAP.

В 2019 году Synthesia сняла видео с «Дэвидом Бекхэмом» для общественной организации Malaria Must Die. Искусственный Дэвид говорил со зрителями голосами 9 людей, победивших малярию. Видео было доступно на разных языках, среди которых — хинди, арабский и киньяруанда.

По мнению CEO Synthesia Виктора Рипарбелли, интерес к технологии возрос с начала локдауна. Съемки стали невозможны, и компаниям пришлось запускать новые образовательные программы и тренинги для сотрудников. С Synthesia создать видео можно за секунды: выберите аватар из списка, введите сценарий и нажмите кнопку с надписью «сгенерировать видео».

Аватары основаны на реальных людях, которые получают гонорары в зависимости от того, сколько кадров с их изображением сделано. После обработки реального видео с участием человека алгоритмы Synthesia генерируют новые видеокадры и сопоставляют движения лица модели со словами, которые произносит синтезированный голос (доступны более 20 языков). Клиенты могут создавать свои аватары, а также настраивать окружение и голос.

Synthesia опубликовала этические нормы. Компания сообщает, что проверяет своих клиентов и их скрипты. Человек, чья внешность будет синтезирована, должен согласиться на это. Политический контент в компании запрещен.

Rosebud: маркетинг и e-commerce

Стартап Rosebud AI создает изображения для e-commerce и маркетинга. В 2019 году компания опубликовала 25 000 модельных снимков людей, которых никогда не существовало. Вместе с фото выпустили инструменты, которые позволяют размещать искусственные лица на любом фото. Недавно стартап запустил сервис, где можно примерить одежду с манекенов на виртуальных, но выглядящих реально, моделей.

В мае 2020 года агентство CAA подписало контракт с другой CGI-моделью, Lil Miquela, у которой более 2 млн фолловеров в Instagram.

Rosebud / Wired

Раньше у брендов было два пути: нанять огромную команду креативщиков или купить стоковые фото. Сейчас портфолио может сделать алгоритм. Особенно это помогает маленьким компаниям, у которых нет больших бюджетов на маркетинг.

JumpStory, датский стартап в сфере стоковых фото, протестировала функцию Rosebud, которая позволяла бы клиентам изменять лицо на стоковой фотографии парой кликов. В том числе, менять этническую принадлежность человека. Без сервиса это заняло бы несколько часов работы в Photoshop. В компании признались, что технология их впечатлила. Но функцию решили не запускать, выбрав аутентичные снимки.

Rosebud тоже соблюдает нормы этики. Компания опубликовала заявление, призывающее бороться с использованием синтезированных изображений в недобросовестных целях.

Автор: Елизавета Гогилашвили