Мария Кувшинова рассказывает, как после 25 лет работы кинокритиком в ежедневных изданиях и трех опубликованных книг о кино поступила в магистратуру университета ИТМО по профилю «научное искусство» — направлению современного искусства, которое опирается на науку и технологии.
В 1936 году немецкий инженер Конрад Цузе в берлинской квартире своих родителей начал (и продолжал до конца войны) строить машину, которая впоследствии была названа первым цифровым компьютером. Программирование машины осуществлялось при помощи перфорированной ленты, которая на самом деле была списанной 35-миллиметровой пленкой, вероятно, найденной в мусорных баках рядом с одной из немецких киностудий. На одном из кусков пленки можно увидеть бинарный код, выбитый поверх обычной сцены с участием двух актеров в замкнутом помещении. Теоретик медиа Лев Манович, который рассказывает эту историю в своей статье «Как медиа стали “новыми”», опубликованной в сборнике «Теории софт-культуры», добавляет: «Какие бы смыслы и настроения ни заключались в этой сцене, они стирались новой функцией ленты как носителя данных <...>». В технологической версии Эдипова комплекса сын убивает своего отца. Иконический код кино списывается в пользу более эффективного бинарного кода. В итоге кино становится рабом компьютера».
Магистратура Art & Science университета ИТМО обещает за два года превратить человека с любым образованием в художника, сочетающего артистический и научный подход, что не только оказывается реализуемой задачей, но и находится в тренде десакрализации понятия искусства. Два семестра мы изучали программы для моделирования 3D-объектов, создания звука и интерактивных объектов, современную философию, введение в анализ данных и методологию научных исследований — и вот уже по окончании первого курса в описании итоговой выставки «Реализм невидимого» в галерее AIR мы все обозначены как художники. Даже я.
На отделении биоарта студенты учатся работать в биолаборатории, на роботическом отделении — конструировать роботов, на цифровом — понимать и использовать цифровые инструменты, в том числе искусственный интеллект. Это не превращает начинающих художников в ученых (если только они не были учеными по предыдущей специализации), но дает понимание научного поля и способов взаимодействия с ним. Например, моя однокурсница с роботического направления Ирина Короткая для своего проекта _Fly_away_north_//imprinting//_, в котором механическое крыло птенца арктической белой чайки тянется к зрителю, если камера распознает в зрачке его глаза объект импринтинга, привлекла для своего проекта не только коллег, работающих со звуком и видео, но и ученую-орнитолога Марию Гаврило, предоставившую для выставки документацию своих экспедиций. Магистрантка биоарт-направления Влада Олейник для проекта how they grow up вырастила ростки пшеницы с помощью окситоцина — метод, который в Индии используется как более дешевый аналог удобрения, ускоряющего рост сельскохозяйственной продукции (тот же окситоцин вкалывают девочкам для ускорения пубертата и склонения их к занятиям проституцией).
Коллаборация — самый сложный для меня элемент процесса, ведь профессию кинокритика часто выбирают люди, склонные к интровертному поведению и интровертным практикам взаимодействия с аудиовизуальными изображениями. Мне надо было придумать проект, который я смогла бы сделать сама от начала до конца, используя новые навыки работы с данными и программирования на Python, который я изучаю на бонус-треке, доступном для всех студентов ИТМО (и других российских вузов) в дополнение к основной программе.
Приступая к работе, я уже знала, какой этический ад представляют собой датасеты — исходные наборы данных: массивы текстов, картинок, видео, на которых обучаются разные модели искусственного интеллекта, выполняющие разные задачи. Отсутствие прозрачности при их формировании, использование бесконечного количества картинок и текстов из интернета без согласия правообладателей, включение в датасеты полицейских баз для обучения распознаванию лиц, отчуждающие человека от собственного тела и биографии, многочисленные предрассудки, кочующие от человеческой популяции к ИИ, — все это подробно описанная изнанка революции на рынке искусственного интеллекта. В 2020 году MIT удалил популярный у разработчиков датасет Tiny Images, содержащий 80 миллионов изображений из Google с разметкой (коротким описанием), потому что многие картинки оказались сомнительными, а сопровождавшие их ярлыки — неуместными (например, женщины описывались уничижительными терминами, а части тела обозначались с использованием оскорбительного жаргона). Сегодня правообладатели нередко подают к разработчикам иски о нарушении авторских прав, а художники пользуются инструментом Have I Been Trained?, который позволяет определить, использовались ли их работы в обучении больших коммерческих моделей.
Работа с набором собственных данных казалась элегантным выходом из этического тупика, ведь эти данные только мои, и далеко не у каждого живущего на Земле человека есть такой большой массив собственных текстов, посвященных одной теме (собрав все доступные мне файлы, самый ранний из которых относился к 2001 году, я склеила их в один при помощи Python — в нем оказалось более 8 млн знаков, однако, туда случайно затесалась книга Эмили Нуссбаум «Я люблю смотреть», русский перевод которой я редактировала, — текст, который мне хотелось бы присвоить максимально).
После 25 лет работы кинокритиком в ежедневных изданиях и сотен тысяч написанных слов два с половиной года назад я врезалась в стену немоты. Дело не только в разрушении привычной инфраструктуры, в персональных рисках и принципиальном нежелании делать медийную карьеру на фоне происходящего. Язык, как и киноязык, нельзя изобрести — его можно найти в хаосе времени и усовершенствовать, используя такие инструменты, как собственный талант и собственный опыт. Резкая трансформация реальности — это еще и обвальное устаревание предыдущего языка (в одном из фильмов начала 1980-х про атомную войну потомки немногих выживших обитают в руинах прежних городов и говорят на редуцированном, но вполне функциональном английском). Разглядеть новый язык в расщепленной реальности пока не получается. Не понимая, что, зачем и как писать, я решила делегировать свой голос роботу-кинокритику, который унаследовал бы мои пристрастия и мою интонацию, а заодно повеселил бы посетителей выставки.
Выбор фундаментальных русскоязычных моделей, которые пользователь может дополнить своими данными, кастомизируя под свои потребности, не так уж велик, и в итоге я остановилась на YandexGPT, российской модели искусственного интеллекта, которая не так совершенна, как ChatGPT, зато доступна без VPN и ориентирована в первую очередь на русский язык. Сервис просит загрузить данные в текстовом формате JSON, каждая строка которого состоит их трех текстовых фрагментов: образец текста не более 4000 знаков, вопрос к модели и образец ответа не более 2000 знаков. Таким образом, из 8 млн знаков (минус книга Нуссбаум) мне надо было выбрать и вручную залить в файл n кусков текста (от 10 до 10 000, в итоге их было 200), каждый из которых предстояло оценить как значимый и отредактировать под необходимый объем. Затем готовую модель надо было прикрутить к веб-странице (в моем случае это был сервис Streamlit, который позволяет кастомизировать интерфейс для чат-ботов). Разговору с ботом предшествует видео-интро, созданное при помощи эффектов в TouchDesigner и сервиса генерации изображений Runway, — в итоге проект состоит из двух страниц, написанных на Python и HTML.
У меня есть обтекаемая формулировка для медиации выставки, описывающая процесс создания датасета как персональное путешествие в собственное прошлое и опыт работы в жанре digital autofiction, но, строго говоря, впервые в жизни перечитывая эти тексты после публикации я пребывала в перманентном удивлении от количества труда и страсти, потраченного на формирование ныне бесследно исчезнувших контекстов, на описание ныне полностью позабытых фильмов, на манифестацию собственных предрассудков и предрассудков своей социально-демографической прослойки. Большая часть этих текстов никогда бы не была прочитана снова, но я прочитала их, как случайный прохожий читает имена позабытых покойников на деревенском кладбище. Мой робот-кинокритик, которого я назвала «Армавир» в честь одного из впивающихся в мозг словечек из корпуса текстов Александра Миндадзе, пишет короткие рецензии по трем ключевым словам, введенным пользователем, — и эти несуществующие фильмы кажутся не менее реальными, чем те, что когда-то были сняты и бесследно сгинули в болоте аудиовизуального контента. Этого компоста из данных для обучения будущих моделей ИИ.
Интонация этих часто бредовых, часто смешных текстов довольно сильно похожа на мою.
Проект Армавир, Автор: Мария Кувшинова
Чему учит нас эта история, кроме того, что можно прожить достаточно долго и узнать достаточно много, чтобы на новом технологическом витке превратить набор слов в набор данных, переписав собственную биографию при помощи кода, как Конрад Цузе переписывал визуальную информацию на 35-миллиметровой пленке? В персонализированном чат-боте нет ничего оригинального (многим памятен посмертный чат с погибшим московским издателем Романом Мазуренко, созданный стартапом Luka по его перепискам с друзьями еще в 2016 году). Произведением искусства его делает контекст, выставочный фрейминг, эксклюзивность доступа только в физическом пространстве галереи — и само намерение обозначить «Проект «Армавир» как произведение искусства. Но есть и кое-что еще: будучи создан, робот начал жить собственной жизнью, вступая в неожиданные взаимодействия с аудиторией. Рецензии, написанные на выставке, нигде не сохраняются, но три ключевых слова, которые придумывает зритель, подыгрывая машине (фильтры Yandex не позволят нарушить существующее российское законодательство, но в датасет спрятаны и фрагменты текстов, которые сегодня не могут быть опубликованы целиком), — в некотором смысле рассказывает о нем/о ней даже больше, чем обо мне.
Выставка «Реализм невидимого» (куратор Христина Отс) продлится до 4 августа. Санкт-Петербург, Биржевая, 16. Галерея AIR. Вход свободный.
Фото: Алина Чараева (alohamneploho)
К сожалению, браузер, которым вы пользуйтесь, устарел и не позволяет корректно отображать сайт. Пожалуйста, установите любой из современных браузеров, например:
Google Chrome Firefox Safari