Глеб Нечволодов: «Терминаторы нам не грозят»
«Следующий язык программирования — это английский, на котором нужно будет писать правильные prompt’ы для нейросетей»
Глеб Нечволодов
специалист по искусственному интеллекту
Глеб Нечволодов этим летом впервые приедет к нам в «Марабу» в Эстонию. Мы поговорили с Глебом о его курсе «Универсальный глаз: как научить робота видеть?» и выяснили, почему нейросети пока еще не заменят художников и зачем нам всем нужна большая красная кнопка.
Давайте с вас начнем: чем занимаетесь по жизни, в какой области лежат ваши научные интересы?

Я доктор визуальной семиотики и доктор медиа, а мой интерес последних пятнадцати лет — artificial intelligence, то есть искусственный интеллект, в первую очередь через призму машинного видения. Моя докторская диссертация связана с семиотикой и роботовидением. Другими словами, я — тот, кто моделирует визуальные системы для роботов и машинного зрения через призму семиотики. В последние годы я занимаюсь еще и так называемым UX/UI — user experience и user interface, это одна из самых популярных тем не только для изучения, но и для работы в IT-среде.

Кроме того, у меня более двадцати лет опыта работы графическим дизайнером и иллюстратором. Так что я не только прочитаю лекции о том, что сегодня существует в области машинного видения, но и объясню, как это работает с точки зрения визуальных секретов. А в длинном курсе, надеюсь, еще и проведу мастер-класс по UX/UI, и это уже будет стопроцентная рабочая практика для слушателей.

С точки зрения семиотики, какая основная разница и основная проблема между зрением человека и зрением искусственного интеллекта?

По-моему, проблема на сегодняшний день в голливудских фильмах — в том, что в них до сих пор по большей части показывают такой искусственный интеллект, который не просто заменяет человека, а порабощает его.

Что же касается зрения, глаз человека и глаз машины построены фактически по одному принципу оптического восприятия. Я с этого начну свой курс, заодно объясню, как возникает аберрация зрения, почему человек бывает дальнозоркий, почему — близорукий, почему изображение вообще-то перевернуто и т. д.

Машина, с точки зрения механического восприятия изображения, конечно, надежнее человека. А вот с точки зрения интерпретации информации — здесь уже есть нюансы. В любом случае машина сама по себе, без программы, загруженной человеком — просто, как говорится, железо. И если я загружу в нее свои параметры, где круг будет квадратом, а деревья — синими, то машина будет «понимать» объекты именно так, а не иначе.

Именно поэтому нейросети не заменят художников, по крайней мере, в ближайшее время. Они могут в какой-то степени заменить руку, технику. Но художник — это всегда человек, который видит мир по-своему, машина же по-своему пока видеть не может. Машина воспринимает информацию при помощи оптики, весьма совершенной; ее механический глаз может сделать максимально четкую, мгновенную фотографию, но то, как она это интерпретирует — заложено в нее человеком.

Тем не менее вот эти новые нейросети, способные создавать изображения в любом стиле по словесному описанию — это ведь большое достижение. Еще пять лет назад мы видели, что машина не могла нарисовать котика, не понимала, где ему приделать уши.

Машина могла воспроизвести котика, еще когда существовали матричные принтеры. Другое дело, что технологически она их не могла нарисовать аккуратно, но изображение загружалось в память, игры уже были. Просто сегодня, учитывая объем памяти и скорость обработки данных, эти процессы происходят быстрее. Да и фильтры для изображений уже давно существуют в приложениях смартфонов: есть «Гоген», «Пикассо», что угодно. Об этом, кстати, была часть моей диссертации — я разбивал картину на какие-то очень характерные для каждого стиля аспекты, модули и потом эти параметры вносил в машину. И если вы просите обработать изображение в стиле Пикассо — машина легко справится. Но если вы попросите, например, «Пикассо в стиле Гогена» — то, если у нее нет такого алгоритма
совмещения, она не поймет ваш запрос.

Таким образом, серьезный прорыв заключен в том, что машину наконец научили трансформировать вербальную информацию в визуальную. Если раньше ты загружал фотографию и выбирал какой-то стиль, то сейчас ты можешь, не загружая никакого изначального изображения, написать словами «Хочу портрет девушки в стиле Модильяни», и, если стиль Модильяни в эту нейросеть загружен, машина сможет это сделать.

А если написать «Веселая улитка, сидящая на бильярдном шаре со стаканом виски на зеленом фоне» и при этом выбрать стиль Рембрандта, машина сходит с ума — слишком много параметров. Она выдаст вам стиль Рембрандта, цвет, композицию, но что-то потеряется, если только вы не будете очень точно, в деталях, прописывать все, что вам нужно. И все равно выдаст конечное изображение, не выходящее за рамки загруженных человеком понятий.

И вот здесь на первый план выходит так называемый prompt — описание того, что ты хочешь получить. Поэтому, как сказал мой друг, следующий язык программирования — это английский, на котором нужно будет писать правильные prompt’ы для нейросетей.

Планируете поиграть с детьми в DALL-E или какую-то другую сеть с картинками?

Да, я с удовольствием, надеюсь, у нас будет интернет. На одной из лекций как минимум я собирался это сделать и показать. И объяснить на примерах, почему художник — это все-таки художник, а машина — нет.

Мне кажется, этот страх, что машина бесконтрольно самообучится — он не совсем о господстве роботов, а о том, как меняется роль человека в мире. Например, художники волнуются, что машина их заменит и они будут не нужны, ведь люди, чтобы дойти до такого уровня детализации, отображения объема, теней, учатся десятилетиями, а теперь никто не будет тратить столько времени на это обучение.

Нейросети — это инструмент, который позволяет делать какие-то вещи быстрее, как художникам, так и людям, вовсе не умеющим рисовать. Проблема в том, что люди, не умеющие рисовать, сейчас начнут считать, что они тоже художники. Но, с другой стороны, многие всегда так считали. Думаю, время все расставит по своим местам.
Если же мы переживаем о том, что искусственный интеллект почему-то сойдет с ума — на это во всех таких киноисториях всегда один ответ: находим выключатель, спотыкаемся о кабель — и весь интеллект тут же теряет способность быть суперинтеллектом.

Всем нужна большая красная кнопка.

Да. И на моем веку, я уверен, ничего катастрофического не случится, терминаторы нам не грозят. Но жить будет интересно, будем писать prompt’ы, будем совершенствовать свой язык описания реальности.
Оставить заявку
на программу «Науки о человеке»
Лето | Подростки | Эстония | 2750€
I смена продана, вы можете подать заявку в лист ожидания
Смена*
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой конфиденциальности