С полгода где-то не смотрел, что там с генеративными нейронками, и вот зашел посмотреть. В целом принципиально ничего нового, но есть неплохое.


Вышла Flux.2. В стоке на обычных видеокартах (Nvidia A или H в расчет не берем, это для миллионеров) совершенно неадекватная (там 60гб трансформер + 40гб энкодер, оно даже в 80Гб не влезает одновременно), но с pi-Flow и квантованием до Q8 уже влезает в 24Гб видеопамяти + 64гб рамки, и за четыре шага генерит до четырех мегапикселей картинки качества, сравнимого с SD3.5. Это мы берем.


Опробовал наконец-то Wan 2.2 (это который генерит всратые видео). Хорошее, но до какого-то адекватного уровня, когда можно будет хотя бы короткометражку сгенерировать на этом деле еще очень далеко: за пять секунд (81 кадр) без ключевого кадра в конце уезжает в дальние дали и начинает бредить.


Открытие года — Qwen 2511. Вот это штука крутая, опять же ничего прорывного, просто довели редактирование изображений до уровня «можно пользоваться и не страдать» — до шести мегапикселей на выходе (в мои 24Гб видеопамяти не влезает, так что это не для меня, но на 5090 можно запустить) и в целом если не приближать и не вглядываться — очень хорошо. Это мы тоже берем.


Фейл года — модели Кандинский для видео. Не знаю, может у них там качество, но я не готов рендерить пять секунд 0.4 мегапикселя видео сорок минут, когда Wan 2.2 справляется с 720p за две-три минуты со сравнимым на глаз качеством.