Китайский стартап DeepSeek представил новый генератор изображений

На днях успех китайского стартапа DeepSeek вызвал резкое падение акций крупных американских технологических корпораций. Китайский чат-бот поднялся на первое место по продажам в самых разных странах мира, и эту ситуацию даже прокомментировали главы OpenAI и Nvidia, которые отметили, что этот впечатляющий проект побуждает американские корпорации плотнее заниматься развитием собственных технологий.

На волне такой популярности китайский стартап также представил новую генеративную модель Janus-Pro-7B, которая, согласно отчётам компании, уже превзошла DALL-E 3 и Stable Diffusion в области генерации изображений. При этом модель свободно распространяется с открытым исходным кодом.

Сравнение старой и новой моделей Janus.
Сравнение старой и новой моделей Janus.© DeepSeek

Семейство мультимодальных моделей Janus-Pro демонстрирует прекрасные результаты в тестах, опережая самые известные инструменты по генерации изображений. А Janus-Pro-7B — это усовершенствованная версия базовой модели Janus, выпущенной в конце прошлого года. В отличие от предыдущей итерации, Janus-Pro улучшена за счёт оптимизации процессов обучения, в рамках которого было использовано 72 миллиона изображений.

Впрочем, несмотря на такие потрясающие результаты, у нового ИИ есть и свои минусы. Так, модели семейства генерируют лишь небольшие изображения до 384 x 384 пикселей. Впрочем, даже невзирая на это ограничение, китайский генератор изображений всё равно впечатляет своей производительностью.


deepseek, janus, janus-pro-7b, ии, искусственный интеллект, нейросеть