Список нейросетей, помимо midjourney, для работы с графикой, видео и звуком.
Графика
- Automatic1111 — интерфейс к Stable Diffusion
- + версия в колабе
- ComfyUI — интерфейс к Stable Diffusion для составных генераций
- ControlNet — дополнительный контроль над генерациями
- SAM — дополнительный контроль сегментацией
- StableSR — апскейл картинок с помощью Stable Diffusion
- multidiffusion — Tiled VAE для больших апскейлов
- adetailer — автоматический детализатор
v class=”story-block story-block_type_text”> - OpenOutpaint — интерфейс для outpaint
- kohya_ss — скрипты для дообучения Stable Diffusion
- + версия в колабе
- + гуи версия для компа
- recognize-anything — разметка картинок
- DeepDanbooru — разметка аниме-картинок
- photobear* — удаление фона. не опенсорс, но легко слямзить картинку через код страницы
Видео
- flowframes — интерполяция кадров
- roop — быстрые дипфейки
- DeepFaceLab — медленные дипфейки
- SadTalker — оживляет лицо
- SD-CN-Animation — video2video через Stable Diffusion
- text2video — text2video через potat1
- nerfstudio — 3d сцена из видео
ЗвукНей
- RVC — копирует тембр голоса
- Ultimate Vocal Remover — отделяет голос от инструментала в песнях
- MusicGen — text2music
- whisperX — расшифровка речи
- tortoise — text2speech
- bark — text2speech
Всем здравствуйте вы на канале Россия 24 и нам объявили что пропал синий Хаги Ваги
всем драсте