«Ми перетворюємо Reface на соціальну мережу»

«Ми перетворюємо Reface на соціальну мережу»

Олесь Петрів, CTO Reface, — про мотивацію, челенджі та майбутнє компанії.

В рубриці «Природний інтелект» лідери українського IT самі розповідають про себе — що вони люблять, які книги читають і чи вірять в підкорення Марса.

Наш другий герой Олесь Петрів — співзасновник ML-компанії Reface — розповів, як шукати мотивацію, що порадив би собі з минулого та що таке «спокійне серце».

 

Як почалася IT-кар'єра
 

З 2007 року я фрілансив — розробляв веб-сайти на основі різних фреймворків, наприклад, інтернет-магазини. Мені доводилося поєднувати всі ролі. З самого початку я не одразу подумав про те, що варто делегувати частину обов'язків людині, якій ці обов'язки будуть більш в кайф. Тобто мені було в кайф програмувати, шукати нові технічні рішення. Але для того, щоб це робити, доводилось також вести комунікацію з клієнтами. Виявилося, що я 80% часу займаюсь саме цим, а на розробку сайту часу майже немає. 

Я потрапив в ситуацію, коли я займаюсь не тим, що насправді приносить кайф. А на те, чим хотілося б займатись, немає часу. Тому собі з минулого я би порадив чітко визначитись, що подобається робити, а що ні, і знайти того, з ким можна розділити обов'язки.

Захоплення machine learning
 

Нейромережі мене цікавили ще зі школи. Але під кінець 2000-х років репутація в них, м'яко кажучи, була така собі. Допоки у 2012-2013 роках з їхньою допомогою не виграли декілька крутих конкурсів з computer vision. Тоді публічна увага повернулася до цієї технології. 

Дуже довго я не розглядав варіант заробляти нейромережами. Це було хобі. Нормальних фреймворків, щоб працювати з машинним навчанням, ще не було. Тому доводилося писати свої, і це дозволило на низькому рівні вивчити те, що зараз більшість отримує автоматично за допомогою софту. 

Мені іноді бракує розуміння того, що відбувається під капотом усіх цих інструментів, які за 10 секунд дозволяють зробите те, на що 10 років тому йшов місяць. 

Одним із перших проєктів, які ми робили з Ромою та Ярославом (кофаундер Reface Роман Могильний та CAO Reface Ярослав Бойко — Ред.), була доставка суші. Але десь у 2011 ми зрозуміли, що за декілька років стане очевидно, що за допомогою ML можна творити ледь не магію. І хто першим застрибне в цей поїзд, в того буде більше шансів реалізувати власну ідею. 

Спочатку ми зробили extension до браузера, який екстрактив текст з кожної переглянутої сторінки та репрезентував його у вигляді нейронного вектора, що за історією браузера дозволяв дуже абстрактно й асоціативно шукати речі, подібні до тих, які ви вже бачили. Цей продукт врешті-решт трансформувався в зовсім іншу річ. Але в процесі стало зрозуміло, що є сенс робити компанію і думати щодо стратегії: як ми будемо в майбутньому підіймати інвестиції, масштабуватись, виходити на ринок. 

Наступним був етап розуміння, що один текст — це класно, але без інтегрування computer vision рішення буде неповноцінним. І десь у 2013-2014 ми багато експериментували з алгоритмами комп’ютерного зору. Вдалося зробити нейромережу, яка видавала абстрактний набір асоціацій. Вона дозволяла, наприклад, асоціативно шукати кадри у відео. Тобто можна було взяти відео, програти його через систему, написати «вечірка» або «весна» — і знайти зони, які за контекстом підходять до весни або вечірки. При тому, що ні вечірка, ні весна — це не конкретний об'єкт на зображенні. 

Потім ми поєднали це із різними NLP-підходами, зробили декілька спроб запуску додатку. На кожному з етапів набивали різні види шишок, без яких з Reface точно б нічого не вдалося.

Ми не збиралися робити додаток по заміні обличчя. Займалися нейромережами в різних прикладних сферах, зокрема і 2D-3D конвертації відео. Майже рік ми витратили на розробку цієї технології та дуже активно вірили в напрямок. І одна кіностудія запитала нас, чи можна було б поміняти етнічність акторів, бо це зрізало б кости на один із фільмів. Ми придумали метод, який вирішує набагато ширшу задачу, ніж цей запит. І почали. Тоді нас було п’ятеро.

Чому важливо займатися продуктом
 

Спочатку ми думали, що зробимо класну технологію, якої ні в кого немає, і цього буде достатньо, а продукт — це не критично. Тому розробку мобільних application ми віддали на аутсорс. В результаті загрузли в комунікації з поясненнями, замість того щоб розробляти продукт. 

Тоді ми зрозуміли, що нам бракує продуктової експертизи. Законтачили з Іваном Альцибєєвим (зараз — CPO/COO Reface — Ред.). Через декілька місяців роботи з ним ми зрозуміли, що нікому з нас не спали б на думку питання, відповіді на які Ваня намагався знайти. Коли він розповідав про концепцію Reface (саме тоді ця назва з'явилася вперше), його презентація була дуже сміливою за дизайном та парадигмою. Я зрозумів, що мені продали мою компанію в тисячу разів дорожче, ніж у моєму найоптимістичнішому уявленні. Я закохався в цю концепцію. 

Саме так Ваня став кофаундером. В нього великий нетворк талановитих людей, які приєдналася разом з ним, і за декілька місяців команда виросла ледь не вдвічі.

З приходом Вані ми вирішили все перевести на inhouse. Коли ми почали активно розробляти продукт, до нас приєднався Діма (CEO Reface Дмитро Швець — Ред.), з яким кожен із кофаундерів був знайомий за багато років до цього. На той момент у команді кофаундерів Reface також були Ден Дмитренко та Кирило Сигида.


Кофаундери Reface

В компанії не було сумнівів, що розширитися — це правильне рішення, бо відтоді в нас з'явилася ціла купа відділів із B2B-партнерств. Ми зуміли за півроку продемонструвати, що Reface — не просто фанова апочка, а й бізнес, який може ефективно партнеритись. Наприклад, ми співпрацювали з Gucci. Взяли рекламу бренду з Ланою Дель Рей та Джаредом Лето. Зробили нарізку — 10-секундні фрагменти — і додали нашу технологію. За декілька днів ми отримали мільйони рефейсів цієї реклами та близько 700 тис. шерів в соцмережах. Причому майже завжди це були пости, які збирали величезну кількість коментарів.

Також нещодавно ми зробили невеличку колаборацію з українцями, які створили мультик «Повернення Гуллівера». Завдяки нам будь-хто міг побачити трейлер цього мультика з собою в ролі Гуллівера. За декілька днів ми отримали 1 млн рефейсів і 324 тис. шерів трейлера. 

Про боротьбу з негативним використанням технології
 

Ми довго думали, як зробити так, щоб ми могли розпізнати, чи було відео результатом рефейса. Оскільки ми модифікуємо контент там, де змінюється обличчя, ми спеціально зробили результат видачі максимально реалістичним, але недостатньо для того, щоб ввести в оману. Тобто, якщо придивитися, ти розумієш, що це модифіковані риси. Але все одно можливі кейси, де обличчя суперреалістично накладається. І, відповідно, ми маємо вміти розпізнавати, це наше відео чи ні. І розробити принцип, за яким, з одного боку, ви тренуєте нейромережу малювати настільки реалістично, наскільки можливо, але не занадто. Це перший такий момент. А друге — це як зробити так, щоб завжди мати в себе нейромережу, яка здатна відрізнити, чи було відео прогнано через Reface. Це дуже нетривіальна задача, і нам вдалося її вирішити. 

В червні 2020 року загалом в інтернеті було близько 200 тиc. відео з модифікованими рисами обличчя, які можна було б назвати deepfake. З них десь близько 150-160 тис. складав датасет від Google і Facebook для тренування нейромереж у боротьбі з діпфейками. Десь 40-50 тис. відео, які були зроблені з використанням різних підходів, що потребують тижня тренування нейромережі. Велику частину з них складала порнографія з обличчями кінозірок. І тому слово deepfake заслужило погану славу з самого початку. Мені було дуже неприємно це спостерігати через те, що я розумів, який великий потенціал є в технології. Хотілося на це вплинути й показати, що технологію можна надати людям в такому вигляді, щоб вони використовували її for good.

Зараз зроблено близько 3 млрд відео з модифікованими рисами обличчя, з яких майже всі — Reface. Більшість із них — це кліпи, сцени з фільмів, якими люди діляться в нормальних соцмережах. Всі ці відео ми можемо розпізнати і з великою впевненістю сказати, що це — результат роботи Reface.

Про хакатони та пошук співробітників
 

Коли приходиш на хакатон в ролі ментора, до тебе підходять люди з різних команд, задають питання за твоєю експертизою, і ти намагаєшся їм допомогти. І з того, які це питання, ти можеш про людину дізнатися на порядок більше, ніж слухаючи відповіді на співбесіді.

З кількома колегами ми познайомились в ситуації, де вони задавали питання і не було фрейму «я прийшов до вас працювати, подивіться, який я молодець». Було так: «у мене є така задача, чи можеш ти допомогти з цим і з цим?». Слухаючи питання, ти одразу бачиш, наскільки ґрунтовні знання є в людини, чи може вона сама знайти відповідь на ці питання та чи розуміє межі своєї експертизи. Навіть з самого питання можна вже розуміти, наскільки це скілова людина, наскільки з нею адекватно співпрацювати. Тому хакатони — прикольне місце для пошуку потенційно корисних колег. Навіть попри те, що іноді це займає всі вихідні та потребує багато часу і включеності.

Про майбутнє Reface
 

Ми зібрали вже доволі велику команду людей, щоб працювати з платформою, на яку перетворюється Reface. Крім того, нам вдалося реорганізувати велику частину інфраструктури таким чином, щоб можна було будувати соціальну платформу, а не просто backend application, який замінює обличчя.

Це буде соціальна мережа, де на першому місці буде здатність реконтекстуалізувати візуальний контент: зі старого і звичного творити щось нове. Тобто ти можеш не зняти жодного кадру, не написати жодного слова, не зробити жодного селфі, але при цьому мати велику кількість поціновувачів твоєї творчості. 

І Reface за допомогою високоінтелектуальних нейромереж дозволить інтегрувати одні об’єкти в інші, трекати, розбирати сцену на запчастини, міняти персонажів і те, що вони говорять. Ми даватимемо набір інструментів і контенту, який можна буде рекомбінувати, збирати, реконтекстуалізувати та трансформувати в абсолютно нові витвори.

Alt text

Бліц-питання
 

Риси, які ви цінуєте в інших

Вірність і спокійне серце. Тобто мені подобаються люди, які не перетворюють челенджі на особисті проблеми. Вони разом з тобою роблять справу, відпускають там, де треба відпускати, і підстраховують там, де треба підстрахувати. 

Яким ви себе бачите через 5 років

Мені б хотілося через певний час (навіть раніше, ніж через 5 років) організовувати заходи та проєкти, які б дозволяли молодим талановитим людям (не тільки з ML-галузі) займатися тим, до чого в них є хист. Наприклад, влаштовувати хакатони в прикольних форматах і агрегувати таланти так, щоб вони між собою взаємодіяли. Я бачив, на які класні штуки перетворюються ситуації, коли під одним дахом збирається багато талановитих людей, які в силу обставин займаються однією справою. І хочеться використати можливості, які є, для того, щоб таки люди знаходили один одного і перетворювали синергію на круті проєкти, що дозволятимуть їм саморозвиватися. 

Книга, що вразила

Permutation city («Місто перестановок») Грега Ігана. Це книга 1993 року, але я коли її читав у 2017, був просто в шоці від того, наскільки Іган відчуває дух нашого часу, наскільки він в курсі всіх сучасних віянь: блокчейн, квантові комп'ютери, віртуальні реальності, клітинні автомати. В його книзі є неймовірна кількість складних концепцій, для опису яких треба бути дуже в курсі того, що відбувається зараз. 

Якщо ви думаєте, що в своїй уяві ви виходили за рамки, раджу прочитати Грега Ігана, щоб зрозуміти, наскільки далеко насправді можна виходити та які горизонти структуровано ірраціональної фантазії він розкриває. Там навіть є інструкція, як створити повноцінний всесвіт.

Якби не ML...

Я б займався чимось пов'язаним з 3D-графікою та VR. А якщо говорити про щось зовсім не пов'язане з ІТ, — я б малював.

Улюблений робочий інструмент

PyCharm — це класне середовище розробки. Зараз я пишу код не так багато, але все одно намагаюся кодити 8-10 годин на тиждень. Оскільки від цього я отримую задоволення.

Улюблена річ на письмовому столі

В мене є мишка Logitech. У 2015 році ми її виграли на хакатоні Mediahack Weekend. Ми зробили штуку, яка дозволяла шукати по відео. І на основі цього пошуку ми за два дні написали робочий прототип відеостоку, де можна було купити не все відео, а тільки потрібний фрагмент. Пишеш, наприклад, «котик бавиться з песиком» — і тобі знаходять тільки фрагментики, де є котик з песиком. І в тебе є можливість заплатити лише за фрагмент. 

Таким чином для продавців збільшилась би кількість маленьких купівель, а покупцям довелося б менше платити за потрібне відео. 

Цей вайб, яким я тоді зарядився, мене не покидає. Мишка мені нагадує хакатонний режим, і це часто допомагає в роботі. 

Коли ми полетимо на Марс?

В цьому десятилітті. Питання в тому, наскільки це буде масштабно. В Маска, звісно, в планах мільйони людей до 2050 року, але це значить, що йому доведеться зробити 17 чи 18 тис. старшіпів до цього часу. Прикольний челендж. Ми теж собі ставимо високі планки. Якщо ти ставиш собі високі цілі, то іноді трапляються ситуації, коли ту планку, яку ти вважав занадто оптимістичною, переганяєш в 10 разів — і сам цьому дивуєшся. 

Питання від Сергія Бриля, Chief Data Science Officer в MacPaw
 

Як пояснити бабусі, чим ви займаєтесь?

Будую системи, які вчаться самі розв’язувати задачі, що я їм ставлю за допомогою комп'ютера.

На яке питання ви хотіли відповісти, але вам його не задали?

Як не втрачати запалу? Це питання, яке я собі періодично задавав. Дуже часто бувають ситуації, коли загоряєшся ідеєю, біжиш, біжиш, біжиш, а потім видихаєшся. Якщо занадто перетопити газу, то точно не добіжиш. Але якщо все дуже розтягувати, тоді запал перетвориться на рутину. І теж не добіжиш. 

Я знайшов вихід для себе. Скажімо, у тебе є велика ціль. Але команда, процеси, задачі відводять тебе від цілі. А коли ми не отримуємо дофаміну і серотоніну за досягнення чогось, мотивація поступово падає. Але коли ти маєш завжди 1-2 паралельні свої челенджі, тоді краще зберігається азарт. Чи це необхідно? Ні. Чи це важче, ніж в іншій формі? Так. І не обов’язково челендж має спрямовувати до великої цілі. Це може бути щось зовсім ірраціональне.

Зображення та відео надані Reface

Ещё статьи
Как упростить разработку.
Data science, web development, gamedev и не только.