Qwen 2.5
Нейросеть от Алибаба для конкуренции с ChatGPT и DeepSeek. Может генерировать текст, изображение и видео.
Описание
Qwen 2.5 — это новая версия крупной языковой модели LLM от китайской технологической корпорации Alibaba. Разработка ведётся облачным подразделением компании Alibaba Cloud, специализирующимся на сервисах искусственного интеллекта и облачных вычислениях.
Релиз Qwen 2.5-Max был анонсирован в не совсем типичное для деловых объявлений время: в первый день празднования Китайского Нового года. Этот шаг эксперты связывают с усиливающейся конкурентной гонкой в Китае и мире — на фоне шумихи, вызванной стремительным развитием стартапа DeepSeek и выпуском им модели DeepSeek-V3.
Причины ажиотажа и «гонка вооружений» с DeepSeek
Низкие затраты DeepSeek
Стартап утверждает, что построил свою модель DeepSeek-V3 за сумму около 5,6 млн долларов, используя менее мощные чипы Nvidia H800, специально разрешённые к продаже в КНР. Это ставит под сомнение огромные бюджеты, которые крупные игроки, включая Alibaba, Baidu, Tencent и западные компании, тратят на развитие нейросетей.
Открытость и ценовая конкуренция
Предыдущая модель DeepSeek-V2 была открытой и предлагала крайне низкую стоимость использования — всего 1 юань ($0,14) за 1 млн токенов. Это вынудило Alibaba, Baidu и других китайских лидеров существенно снизить расценки на собственные AI-платформы.
Глобальный эффект
После релизов DeepSeek рынки США и Европы отреагировали резким падением акций технологического сектора. Особенно заметно это затронуло крупные AI-ориентированные корпорации, например Nvidia.
Ответ Alibaba
Обновлённая версия Qwen 2.5-Max — прямой ответ на стремительный рост DeepSeek, демонстрирующий готовность Alibaba продолжать конкурировать как на внутреннем, так и на внешнем рынке.
Что умеет чат-бот Qwen
- Генерирует видео и создаёт изображения на основе заданных сценариев.
- Анализирует информацию, включая большие объёмы текстовых данных.
- Пишет тексты для разных сфер и пишет код на нескольких языках программирования.
- Уже сейчас работает в офлайн-режиме, а в скором времени будет доступен веб-поиск для актуальных данных.
Ключевые особенности и возможности
По данным Alibaba Cloud, Qwen 2.5-Max показывает результаты, сопоставимые или даже превосходящие показатели таких популярных решений, как:
- GPT-4 от OpenAI;
- DeepSeek-V3 и более новая R1 для задач рассуждения;
- Llama-3.1-405B от Meta.
На MMLU (Massive Multitask Language Understanding) — одном из ключевых наборов для проверки знаний и понимания широкого круга дисциплин — Qwen 2.5-Max продемонстрировала «лидирующую в мире» производительность. На LiveCodeBench — тесте, оценивающем качество и корректность генерации кода, модель также показывает результаты на уровне лучших открытых и закрытых решений.
По заявлениям разработчиков, новый релиз улучшил навыки в:
- Генерации и отладки кода на разных языках программирования,
- Решении сложных логических и математических задач,
- Подробном «пошаговом» chain-of-thought рассуждении.
Хотя основной упор в релизе Qwen 2.5-Max делается именно на языковые задачи, внутри Alibaba Cloud и сообщества ведётся работа над версиями с поддержкой анализа изображений и комплексного мультизадачного взаимодействия. Например, экспериментальный прототип QVQ (Qwen Vision+Query) ориентирован на совмещение визуального анализа и линейного рассуждения, что делает модель ближе к универсальному ассистенту.
Планы Alibaba по развитию Qwen Chat
Qwen Chat позиционируется как универсальный инструмент для клиентов и партнёров Alibaba Cloud: от автоматизации общения в e-commerce до внутренних корпоративных сервисов.
Текущие достижения в моделях типа QVQ Qwen2-VL позволяют предположить, что в будущем Qwen Chat сможет эффективно работать с текстом, изображениями и, возможно, другими типами данных - аудио, видео.
Alibaba стремится предложить «альтернативу» американским лидерам OpenAI, Anthropic, Microsoft, одновременно соревнуясь с Meta Llama и молодыми китайскими игроками DeepSeek, ByteDance, Baidu. Компания подчёркивает важность открытых весов и сотрудничества с сообществом разработчиков. Будут продолжены эксперименты с удешевлением обучения и ускорением вывода inference.
В долгосрочной перспективе Alibaba поддерживает исследования в области «искусственного общего интеллекта» AGI. Несмотря на более корпоративную структуру, руководители компании заявляют о стремлении соперничать с амбициозным подходом DeepSeek, для которых главным приоритетом является наука и «достижение AGI любой ценой».
Интересные факты
- Запуски DeepSeek-V3 и Qwen 2.5-Max сопровождались ощутимыми колебаниями на фондовых рынках США, Азии и Европы.
- Президент Дональд Трамп, комментируя рыночные потрясения, назвал развитие китайского AI «пробуждающим сигналом» и призвал американские компании «не упускать лидерство».
- Повторная эскалация «торговой войны» между США и КНР не исключена. Новый виток напряжённости связан с поставками высокопроизводительных GPU и лицензированием использования облачных дата-центров для обучения больших моделей.
