Новый договор. Кино и зритель после ИИ
© М. Ю. Кувшинова, 2025
© Н. А. Теплов, оформление обложки, 2025
© Издательство Ивана Лимбаха, 2025
Предисловие
Автобиография глаза
Эта книга – автобиография кинокритика. Это автобиография медиаживотного, которое без разбора поглощает визуальный контент из любого источника. Но я постаралась сделать так, чтобы она была интересна не только поклонникам жанра автофикшн.
Я писала о кино с середины 1990-х, а в конце нулевых стало слишком заметно, что с кинематографом что-то происходит – визуальный океан XX века в веке XXI начал превращаться в остров, трансформируясь под воздействием цифровых технологий и конкурирующих медиа. Результатом этих наблюдений стала книга «Кино как визуальный код» и конференция «История кино как медиаархеология», которую мы с коллегами по журналу «Сеанс» провели на Новой сцене Александринского театра в 2015 году.
Кинокритика – одновременно очень закрытая и очень инклюзивная профессия. Для полевой работы в ней совсем не обязательно обладать теоретической базой. Книга «Кино как визуальный код», известная среди моих знакомых под прозвищем «визуальный кот», была собранием догадок и гипотез, почти не подкрепленных теорией. Сидя в кинозале или перед монитором компьютера, я в режиме реального времени открывала и описывала многое из того, что уже было описано и открыто теоретиками. Тогда, в 2015 году, моя коллега Александра Ахмадщина предложила пригласить на нашу конференцию известного исследователя кино и медиа Томаса Эльзессера – и он неожиданно согласился. Одним из последствий его визита в Санкт-Петербург стал выход в издательстве «Сеанс» русского перевода их совместной с Мальте Хагенером работы «Теория кино. Глаз, эмоции, тело». Оказалось, что уважаемых авторов интересовал тот же круг вопросов, что и меня, – цифровая трансформация кино, влияние носителей (от пленки до DVD) на кинокультуру и содеражание фильмов; физиология взаимодействия кино и зрителя. Наверное, мне надо перестать переживать из-за того, что «Визуальный код» недостаточно фундирован, и порадоваться, что мои интуиции двигались в том же направлении, что и у Эльзессера (уж теперь-то, будьте спокойны, я умею пользоваться источниками – и мне приходилось сдерживаться, чтобы не превратить эту книгу в палимпсест из цитат).
Прошло десять лет, на русском языке вышло множество книг по теории медиа и кинематографа, зарубежные источники стали более доступны, а цифровая трансформация продолжалась пока в 2022 году, наконец, не появились общедоступные коммерческие модели для генерации текстов, картинок и видео. Новый инструмент, очередной доминирующий вид на планете Земля, предмет ожесточенных споров – в обиходе его называют «искусственный интеллект», очевидно меняет и то, что я называю договором между экраном и зрителем. Договор этот представляет собой набор не всегда сформулированных конвенций, определяющих наши отношения с движущимися изображениями, на которые мы смотрим.
Каждый новый этап в истории визуальных медиа предполагает перезаключение этого негласного соглашения – процесс, который происходит постепенно и с участием больших групп людей («Хранишь ли ты старые договоры?» – спрашивает меня один из пользователей Twitter, ныне X). Художники протестовали против фотографии; первые зрители братьев Люмьер, по широко распространенной легенде, бежали от прибывающего поезда. Сегодня генеративные изображения и видео, или как их презрительно называют «ИИ-слоп», вызывают ненависть у одних, интерес у других, а для третьих выглядят, как нечто достоверное, как слепок реальности.
Почти все вирусные генерации, которые мы видим в соцсетях в середине 2020-х являются обработкой и переосмыслением уже знакомых картинок и лиц: морфинги с возрастной трансформацией знаменитых актеров, музыкантов и политиков; лидеры стран, марширующие по подиуму то в образе маленьких детей, то в качестве супергероев в компании гигантских животных, символизирующих из страны; Виктор Цой и Сергей Бодров, отдыхающие сидя, на земле между съемками небесного «Брата 3». И даже вспыхнувший в начале 2025 года «итальянский брейнрот» («бомбардилло крокодилло»), сделанный, казалось бы, без участия человека, в русскоязычном пространстве отсылал к сказкам Эдуарда Успенского и Корнея Чуковского. Так ретропическое сознание использует для своего выражения самую актуальную и самую постмодернистскую из всех технологий – генеративные модели, создающие новые картинки и тексты из все, что когда-то было сначала создано, а потом оцифровано.
Цифровое будущее ностальгии, предсказанное Светланой Бойм в ее неустаревающей книге[1], манифестировалось в виде визуализации коллективной памяти, в виде актуализации «потенциального пространства» культурного опыта. В виде визуальных симуляций прошлого, которого никогда не существовало: советское детство глазами Уэса Андерсона; архитектура социалистического модернизма в Нью-Йорке; поставленная речь пионеров, которые произносят на камеру непредсказуемые реплики.
Однако в этом новом типе движущихся изображений к знакомым образам и эмоциям присоединяется что-то еще – потусторонний эффект «зловещей долины», нечеловеческая пласти-ка человеческих существ, внезапные визуаль-ные метастазы. Жиль Делёз сказал однажды, что «мозг – это экран». Многие теоретики, чьи выводы подтверждаются современной нейронаукой, согласны с тем, что при столкновении с новой формой медиа возникает особый вид сознательного опыта. Как и «Визуальный код», эта книга – результат моих наблюдений за трансформацией визуального и нашего отношения к нему. Попытка заглянуть в «черный ящик» техноло-гии и зафиксировать параметры нового договора между экраном и зрителем, который возникает на наших глазах.
Санкт-Петербург,август 2025
Глава 1
Как я стала токеном
Спустя несколько месяцев после первого публичного сеанса на бульваре Капуцинок братья Люмьер разослали во все концы света людей с киноаппаратами, чтобы «принести мир в мир» – запечатлеть живые сцены повседневной жиз-ни, пейзажи, улицы городов, парады, выставки, лица прохожих. 1895-й был годом рождения не столько киноискусства, сколько коммерческого кинематографа, и обширный каталог движущихся изображений был частью бизнес-стратегии Люмьеров, которые продавали оборудование и занимались дистрибуцией готовых фильмов. Проект охватывал около тридцати стран – от Австро-Венгрии до Мексики, от Австралии до Индокитая. Работавший на братьев журналист Камилл Серф отправился в Россию для съемок коронации императора Николая II.
Еще один из таких специально обученных в Лионе операторов стал второстепенным персонажем короткометражного фильма Алексея Балабанова «Трофим» – эпизода из альманаха молодых российских режиссеров, посвященного столетию кинематографа. Крестьянин, в порыве ревности убивший брата, бежит в Петербург, и на вокзале видит француза с кинокамерой – подлиным деревянным киноаппаратом, найденным в запасниках «Ленфильма». Трофим нерешительно вступает в кадр, а спустя девяносто лет его, пойманного полицией в публичном доме и, скорее всего, казненного, вырежет из хроники режиссер, работающий над русско-немецким проектом «Вокзалы Санкт-Петербурга». Человек, растворившийся в небытии, неожиданно выныривает из него почти столетие спустя, но снова исчезает по воле диктатора-режиссера – на этот раз уже безвозвратно.
Сегодня мы сказали бы, что, отправив операторов в разные части мира, Люмьеры создали первый в истории структурированный датасет движущихся изображений. Воображаемый балабановский Трофим, как и другие случайно попавшие в кадр прохожие, был токеном – минимально значимой единицей информации в большом наборе данных. Судьба Трофима отражает дискретность и фрагментарность исторической памяти – он появляется из небытия на короткий миг и снова исчезает, подобно тому как токен может быть активирован в системе, снова деактивирован и удален. В фильме Балабанова режиссер, сыгранный Алексеем Германом, вырезает героя, потому что он портит кадр; цель удаления токенов в наборах данных – шумоподавление, исключение ошибок, создающих искажения в нейросетевой модели. Попытка довести модель и результаты ее выдачи до совершенства.
* * *
Люмьеры, развивающие свое предприятие, не могли предвидеть, что их коммерческие съем-ки однажды будут осмыслены как набор данных и, возможно, войдут в датасет, на котором тренировались известные модели для генерации видео, такие как Runway, Veo 3 или Luma. В каком-то смысле братья оказались в той же ловушке, что и все мы. Современный этап развития нейросетей связан с социальными медиа – то есть с теми бесконечными терабайтами контента, которые совершенно бесплатно произвели мы сами и на которых впоследствии обучались современные языковые модели. Модели, которые теперь говорят человеческими голосами и фантазируют человеческими образами. То, как стремительно и неотвратимо наши эмоции, наши связи, наше стремление к социальной принадлежности и самовыражению, пойманные в ловушку соцсетей, превратили нас в ресурс для того, что греческий экономист Янис Варуфакис в своей книге «Технофеодализм» называет «облачным капиталом», сегодня подвергается критическому осмыслению, а многим даже внушает обоснованный ужас.
Но я хотела бы опуститься с уровня социально-политической абстракции на высоту человеческого роста и попытаться описать, что сегодня чувствую я – маленький токен, растворившийся в бесконечной вселенной цифровых данных. Что чувствую я, отдавая результат своего труда не только корпорациям, но и той форме жизни, которая, как кажется некоторым, в будущем заменит человечество?
Поп-культура и кинематограф не одно десятилетие готовили нас к встрече с разумными машинами и искусственным интеллектом (об этом подробнее в Главе 3). Но если один известный греческий автор уже упомянут в предыдущем абзаце, то у будет уместно упомянуть и другого. В 2011 году режиссер Йоргос Лантимос, тогда еще не снимавший на английском и не ставший звездой глобального арт-мейнстрима, показал на Венецианском фестивале свой третий полнометражный фильм «Альпы». В центре сюжета – деятельность секретного общества и отчасти коммерческого предприятия: его члены, называющие себя именами альпийских вершин (предводителя зовут Монблан), собирают информацию о недавно умерших людях и предлагают родственникам на время заменять их за небольшую плату. Вместе ходить на любимые фильмы, произносить знакомые реплики, заполнять пустоту.
Предыдущий фильм Лантимоса, превративший его в кумира интеллектуалов, «Клык» (2009), исследовал, как семья и общество формируют наши представления о мире: родители держат своих взрослых детей взаперти, внушая им искаженную информацию о самых заурядных вещах («кошка – это опасный зверь»). «Альпы» же ставили под вопрос само содержание понятия «человек». Социальные медиа находились на начальном этапе своего развития (Facebook[2] стал доступен для всех желающих в сентябре 2006 года), но в раннем фильме Лантимоса, впрямую никак не затрагивающем тему цифровой трансформации, каждый из людей оказывается совокупностью информации, суммой привычек и страхов, которые можно определить, алгоритмизировать, перезаписать на другой носитель – и копия справлялась со своими функциями не хуже оригинала. Я помню, как во время просмотра «Альп» меня пронзило это осознание, за много лет до появления ИИ запустившее рефлексию по поводу моего собственного превращения в токен. Лантимос во время интервью согласился с моей интерпретацией, хотя и не дал развернутого ответа. И теперь мне кажется, что его третий фильм подготовил меня ко встрече с ИИ гораздо лучше, чем голливудские фантастические фильмы про восстание машин.
В этом есть что-то глубоко тревожное – в ощущении, что наша субъектность редуцируется до статуса «токена». Подобно Трофиму из фильма Балабанова, мы нерешительно вступаем в кадр истории, не понимая, что становимся частью чужого датасета. На данном этапе проблемой больше всего озабочены художники и иллюстраторы, не желающие, чтобы их работы использовали модели, которые генерируют картинки в том числе и для коммерческого применения – процесс, который вряд ли можно остановить: недавно, спускаясь по эскалатору в метро Санкт-Петербурга, я поняла, что большинство изображений в рекламных лайтбоксах больше не является изображениями реально существующих людей – на меня смотрели сгенерированные цифровые призраки, производство которых обходится значительно дешевле, чем студийная съемка. Уверена, что большинство пассажиров просто не обращает на это внимание.
* * *
В 2022 году, после нашего первого лета с Midjourney, компания Spawning.ai, создающая инфраструктуру для защиты авторских прав в области ИИ, запустила сервис Have I Been Trained? – онлайн-платформу, помогающая художникам, фотографам и другим творческим людям узнать, использовались ли их работы в обучающих наборах данных генеративных моделей. Поиск по тексту или картинке в LAION-5B – крупном открытом наборе данных для обучения ИИ-моделей, содержащим более 5 миллиардов пар изображений и текстовых описаний, – позволяет выяснить, какие именно данные лежат в основе ИИ-моделей, а также выявить проблемы с нарушением авторских прав и отсутствием согласия со стороны создателей; авторам также предоставляется возможность запросить исключение своих работ из будущих обучающих наборов данных. Несмотря на свои размеры LAION-5B – это капля в цифровом море, но в этой капле можно кое-что рассмотреть.
Помимо фотографий моего собственного лица с разных сайтов и из соцсетей, при помощи сервиса Have I Been Trained? я обнаружила в LAION-5B фотографию филиппинского режиссера Бриллианте «Данте» Мендозы, сделанную мной на цифровой фотоаппарат Sony во время итого-вой пресс-конференции на Каннском фестивале в 2009 году. Эта фотография в плохом разрешении до сих пор иллюстрирует статью о Мендозе в нескольких версиях «Википедии». Когда-то редактор онлайн-энциклопедии нашел ее в моем аккаунте на платформе Flickr, которая была «инстаграмом до инстаграма»[3], и попросил передать в общественное пользование по лицензии Creative Commons, регулирующей (разумеет-ся, не в российском правовом поле) свободное распространение контента. Речь о том, что когда-нибудь на этом изображении будут обучать нейросетевую модель, в конце нулевых, разумеется, не шла.
Ирония цифровой реальности заключается в том, что весь мой фотоархив погиб на одном из неисправных жестких дисков, Flickr в какой-то момент обрезал аккаунты у своих бесплатных пользователей, и «Википедия» оказалась случайно подвернувшимся способом надолго сохранить и эту картинку, и мои воспоминания о том, как я толкалась в толпе других журналистов возле стола в зале пресс-конференций каннского Дворца фестивалей, куда из зала «Люмьер» по одному приводили свежих лауреатов.
Любой, кто вплотную соприкасается с нейросетями, знает, что генерации картинок, текстов или кода происходят в «черном ящике». Современные системы ИИ, особенно большие языковые модели (LLM), – чрезвычайно сложные математические конструкции, поэтому даже их создатели не полностью понимают, как именно они работают[4]. «Мы его построили, мы его обучили, но мы не знаем, что он делает», – говорил в интервью Vox Сэм Боуман, университетский исследователь и научный сотрудник компании Anthropic – разработчика модели Claude, конкурента ChatGPT.
Первый филиппинский автор, получивший режиссерский приз в Каннах в том самом 2009 году, Мендоза занимает почетное место в фестивальной иерархии, но он не так известен в мире, как однажды сыгравшая у него Изабель Юппер – именно поэтому редактор «Википедии» и обратился ко мне: других подходящих и не защищенных копирайтом фотографий режиссера ему отыскать не удалось. Более того, я отлично помню, что специально поместила это изображение в свой аккаунт на Flickr, понимая, что оно может оказаться востребованным именно из-за того, что Мендозу, в отличие от голливудских и европейских кинозвезд, фотографировали не часто. Сервис Have I Been Trained? находит в датасете LAION-5B всего 533 изображений, помеченных именем Бриллианте «Данте» Мендозы, причем около 230 – почти половина – оказываются тем самым бесполезным «шумом» (постерами и кадрами из фильмов, просто визуальным мусором), а пять являются вариациями все той же сделанной мной фотографии.
