Генеративный искусственный интеллект #Forge&flux. Инструкция по установке и настройке
Введение
Одной из самых впечатляющих способностей генеративного искусственного интеллекта, на мой взгляд, является его умение создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных эпох. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире, которые тем не менее можно материализовать, добавив текстовое описание в программу Stable Diffusion WebUI Forge и создать нечто новое.
Stable Diffusion WebUI Forge – это совершенно бесплатная программа, которую вы можете загрузить и установить на свой компьютер. Она устроена таким образом, что в нее без особого труда можно добавлять различные модули, которые расширяют ее функциональные возможности. Одними из таких модулей являются модели, при помощи которых создаются изображения.
Сейчас наиболее популярными моделями являются Stable Diffusion, Midjourney и DALL-E. Но, не так давно, появилась невероятно мощная модель FLUX.1.
В середине 2024 года модель FLUX.1 стала прорывной технологией в генеративном искусственном интеллекте, оставив позади себя все остальные модели от лидеров рынка. Десятки интернет-сервисов стали рекомендовать ее как наиболее производительную и эффективную при создании изображений. И, как вы уже поняли, именно этой модели уделяется основное внимание в этой книге.
Модель FLUX.1 была создана бывшими инженерами из компании Stability AI, которые занимались разработкой и развитием знаменитой модели Stable Diffusion1. Робин Ромбах (Robin Rombach), Андреас Блаттманн (Andreas Blattmann), Доминик Лоренца (Dominik Lorenz) и Патрик Эссер (Patrick Esser) объединили свои усилия в работе над новым проектом FLUX.1 и создали новую компанию Black Forest Lab2.
Black Forest Lab изначально предлажила нам три версии модели FLUX.13:
–FLUX.1 [pro] – самая мощная версия реализация коммерческой модели, доступная к использованию через API у партнеров компании или в индивидуальном порядке.
–FLUX.1 [dev] – немного облегченный вариант первой модели не для коммерческого использования. Варианты реализации модели можно найти на сайте huggingface.
–FLUX.1 [schnell] – самая быстрая реализация модели с открытым исходным кодом, которая так и называется «быстрая / нем. schnell». Она предназначена для использования на локальных компьютерах. Исходный код модели можно найти на сайте GitHub. Варианты ее реализации можно найти на сайте huggingface.
По очень смелой оценке инженеров Black Forest Lab, данная модель более производительна, чем все разновидности модели Stable Diffusion, Midjourney и DALL-E4.
И не прошло и полгода, как Black Forest Lab анонсировала выход еще более мощной версии своей модели FLUX1.1 [pro], которая стала значительно эффективнее предыдущей версии. Она уже доступна на следующих сервисах: Together.ai, Replicate, fal.ai и Freepik.
С помощью этой книги вы познакомитесь с системой генеративного искусственного интеллекта Stable Diffusion WebUI Forge и невероятно мощной моделью FLUX.1 как инструментом творчества.
Вы сможете самостоятельно установить, настроить и удалить совершенно бесплатную программу Stable Diffusion WebUI Forge на свой компьютер, а также подключить к ней различные дополнительные модели FLUX.1.
Но, и самое главное, управляя различными функциями и параметрами через удобный пользовательский интерфейс Stable Diffusion WebUI Forge, вы научитесь создавать уникальные и совершенно неповторимые изображения, которые сможете использовать в своей учебе, работе или для развлечений.
Приятного вам чтения и продуктивной работы!
Ваш Александр Чесалов.
Несколько важных вопросов
Какая цель книги?
Книга «Генеративный искусственный интеллект #Forge&flux. Инструкция по установке и настройке» написана как пособие для всех тех, кто хочет получить знания и опыт по работе с системой генеративного искусственного интеллекта Stable Diffusion WebUI Forge.
С помощью этой книги вы получите базовый навык по установке бесплатной программы Stable Diffusion WebUI Forge и созданию вашего первого цифрового произведения искусства.
Не имеет никакого значения, какой у вас опыт работы с компьютером. Не важно, насколько вы погружены в тему искусственного интеллекта, не важно, владеете ли вы навыками программирования, имеет значение только ваше желание познавать новое и создавать невероятное. Для обучения достаточно базового уровня английского языка и знаний компьютера.
Электронная версия этой книги абсолютно бесплатна.
Для того, чтобы расширить свои знания и приобрести практический опыт, вам понадобится книга «Генеративный искусственный интеллект #Forge&flux. Учебное пособие для школьников старших классов и студентов первых курсов вузов».
Почему в названии книги используется хештег #FORGE&FLUX?
Я придумал хештег «#FORGE&FLUX», который действительно стал частью названия серии книг. Это было сделано потому, что многие издатели требуют от авторов книг подтверждения использования наименования программы в заголовке книги от разработчиков-правообладателей таких программ. Другими словами, чтобы использовать «Stable Diffusion WebUI Forge» в названии книги, мне нужно разрешение от разработчика. Поэтому и был придуман такой хештег, который позволил обойтись без ненужных формальностей.
Для другой своей книги «Невероятный искусственный интеллект Easy Diffusion 3.0» я такое разрешение от разработчика получил, но это заняло немало времени.
Кому принадлежат права на созданные мной изображения?
Споры по этому вопросу не утихают. Однозначного ответа нет.
Тем не менее, чтобы ответить на этот вопрос, приведу конкретный пример.
На то, чтобы написать полную книгу «Генеративный искусственный интеллект #Forge&flux. Учебное пособие для школьников старших классов и студентов первых курсов вузов» и подготовить эту инструкцию, у меня ушло шесть месяцев. За это время был выполнен огромный объем работы: изучено много источников информации; самостоятельно приобретены новые знания и опыт; потрачены недели на работу по созданию уникальных изображений; дни, ночи, выходные ушли на написание и редактирование текста. И самое главное, все это нужно было грамотно «упаковать» в книгу простым и доступным языком.
Исходя из личного опыта, я считаю, что процесс создания изображений при помощи систем генеративного искусственного интеллекта является не только творческим, но и интеллектуальным, и эмоциональным процессом. Этот процесс требует от человека высокой степени погружения в предметную область исследований, высокой самоотдачи, концентрации и работоспособности. На сегодняшний день и в ближайшие десятилетия ни один искусственный интеллект не способен и не будет способен на такое.
Когда меня спрашивают: а кому принадлежат результаты интеллектуальной собственности на подобные цифровые произведения? Я всегда отвечаю однозначно – человеку. Система генеративного искусственного интеллекта – это лишь инструмент воплощения творческих, технических и иных способностей человека. Любые спекуляции на тему, что искусственный интеллект – это нечто живое, являются фантазиями одних людей и некомпетентностью других.
Где можно познакомиться с другими работами автора?
Результаты работ, созданные при помощи разных систем генеративного искусственного интеллекта (для меня принципиально важным моментом в этом процессе является использование бесплатных систем, которые можно установить на свой компьютер), я опубликовал в книгах:
–«Невероятный искусственный интеллект Easy Diffusion 3.0». С помощью этой книги и системы генеративного искусственного интеллекта Easy Diffusion 3.0 вы научитесь создавать уникальные и неповторимые изображения, которые сможете использовать в своей учебе или для развлечений. Книга содержит познавательную информацию о существующих видах искусственного интеллекта и прекрасный альбом из более чем ста иллюстраций.
–«Сказки старой Твери: фауна лесных духов». Этот альбом иллюстраций позволит вам и вашим детям осуществить головокружительное путешествие в яркий мир сказочных образов. В нем вы увидите более 300 потрясающих изображений невероятных животных сказочного леса, которых, к сожалению, невозможно встретить в нашем реальном мире.
–«Сказки старой Твери: ночь лесных духов». Этот альбом иллюстраций не только история о творчестве и технологиях, но и глубокое погружение в яркий мир образов славянской мифологии, которое позволит читателю увидеть древних богов и духов в новом свете.
–«Сказки старой Твери: черти». Этот альбом из более 300 невероятно красивых иллюстраций позволит вам погрузиться в сказочную атмосферу мифических существ. Возможности искусственного интеллекта и творческий потенциал человека позволили воплотить в этой книге в реальность собирательные образы чертей и представить их фантастические и фотореалистичные изображения.
Шаг 1. Установка Stable Diffusion WebUI Forge
Для того чтобы определиться с выбором сборки (или дистрибутива), нам необходимо с вами получить нужную информацию от нашей операционной системы, чтобы узнать версию CUDA (Compute Unified Device Architecture).
CUDA – это технология, работающая на базе программно-аппаратной архитектуры, которая позволяет повысить производительность параллельных вычислений. Параллельные вычисления – это вычисления, при которых процесс разработки программного обеспечения делится на потоки. Потоки обрабатываются параллельно и взаимодействуют между собой в процессе обработки. Технология CUDA поддерживается процессорами видеокарт NVIDIA, которые используют системы генеративного искусственного интеллекта для создания различного контента5.
Для определения версии CUDA в строке поиска наберем и выполним команду cmd, как показано на рисунке ниже:
После того как вы выполните команду cmd, нажав кнопку Enter на клавиатуре, перед вами откроется консоль для ввода пользователем текстовых команд.
В ней вам нужно ввести команду nvidia-smi и нажать Enter.
В результате вы увидите следующую таблицу, где справа сверху будет написана версия CUDA:
После чего вы открываете свой интернет-браузер и переходите на страницу: https://github.com/lllyasviel/stable-diffusion-webui-forge?tab=readme-ov-file, где ближе к середине страницы находите ссылку на файл дистрибутива.
В зависимости от версии CUDA выбираете ссылку для скачивания, как показано на рисунках ниже.
Для вашего удобства я ее перевел:
У меня версия CUDA 12.2, поэтому я выбираю первую ссылку для скачивания.
После чего на ваш компьютер загрузится архивный файл webui_forge_cu121_torch231.7z.
Для его распаковки вам понадобится архиватор 7z, который можно скачать бесплатно, или Zip-архиватор6.
Внутри архива вы увидите следующие папки:
Создайте на любом диске, где у вас есть достаточно места, папку с названием «Stable Diffusion WebUI Forge» и распакуйте содержимое архивного файла в эту папку (например, у меня файлы находятся по следующему пути: D:\Stable Diffusion WebUI Forge).
Нужно отметить, что для программы Stable Diffusion WebUI Forge нужно 6,5 Гбайт дискового пространства, а для моделей FLUX.1 – еще 50 Гбайт.
Но это еще не предел!
Постарайтесь найти на диске не менее 200 Гбайт свободного пространства, потому что в дальнейшем мы будем устанавливать дополнительные модули и модели для расширения функциональных возможностей системы.