В апреле 2025 года Alibaba сделала значительный шаг в развитии искусственного интеллекта, представив серию открытых моделей Qwen3. Эти модели не только превосходят конкурентов, таких как OpenAI o1 и DeepSeek R1, но и устанавливают новые стандарты в области гибкого и эффективного ИИ.
Что такое Qwen3?

Qwen3 — это семейство больших языковых моделей (LLM), разработанных командой Qwen от Alibaba Cloud. В серию входят восемь моделей, включая две модели с архитектурой Mixture-of-Experts (MoE) и шесть плотных моделей. Наиболее мощная из них, Qwen3-235B-A22B, содержит 235 миллиардов параметров и демонстрирует выдающиеся результаты в бенчмарках, таких как ArenaHard, опережая OpenAI o1 и DeepSeek R1.
Ключевые особенности Qwen3
1. Гибкое и гибридное мышление

Qwen3 предлагает режим “гибридного рассуждения”, позволяя пользователям переключаться между быстрыми ответами и более глубоким анализом. Это особенно полезно для задач, требующих сложных вычислений или логического вывода, таких как математика, программирование и научные исследования.
2. Открытый исходный код и лицензия Apache 2.0

Все модели Qwen3 доступны под лицензией Apache 2.0, что позволяет разработчикам и компаниям использовать их в коммерческих проектах без ограничений. Модели можно найти на платформах Hugging Face, ModelScope, Kaggle и GitHub, а также протестировать через веб-интерфейс Qwen Chat.
3. Эффективность и производительность

Несмотря на меньший размер по сравнению с некоторыми конкурентами, такими как DeepSeek R1 с 671 миллиардом параметров, Qwen3 достигает сопоставимых или лучших результатов благодаря оптимизированной архитектуре и обучению с использованием методов усиленного обучения (RL) .
Почему это важно?
Запуск Qwen3 отражает стратегию Китая по открытию доступа к передовым ИИ-моделям. В условиях ограничений на экспорт полупроводников и других технологий, китайские компании, такие как Alibaba, Baidu и Tencent, активно развивают собственные решения и делают их доступными для мирового сообщества.
Это не только стимулирует инновации внутри страны, но и предоставляет разработчикам по всему миру мощные инструменты для создания новых приложений и сервисов.
Реакция сообщества и перспективы
Сообщество разработчиков и исследователей встретило Qwen3 с большим интересом. Многие отмечают высокую производительность моделей, особенно в задачах, связанных с математикой и программированием. Некоторые пользователи также подчеркивают удобство использования и доступность моделей для тестирования и внедрения в собственные проекты.
С учетом открытого исходного кода и высокой производительности, Qwen3 имеет потенциал стать основой для множества новых приложений в различных областях, от образования до промышленности.
Заключение
С запуском Qwen3 Alibaba демонстрирует свою приверженность развитию открытых и мощных ИИ-решений. Эти модели не только конкурируют с ведущими мировыми разработками, но и делают передовые технологии доступными для широкого круга пользователей. Для разработчиков, исследователей и компаний это открывает новые возможности для инноваций и роста в эпоху. искусственного интеллекта.
Источники
- https://www.cnbc.com/2025/04/29/-alibaba-qwen3-ai-series-chinas-latest-open-source-ai-breakthrough.html?utm_source=opentoolsai-newsletter&utm_medium=newsletter&utm_campaign=eu-s-delulu-chip-plan-falls-flat&_bhlid=a9bbe4ceb0b70ccba23a1e9079a416695da78368
- https://venturebeat.com/ai/alibaba-launches-open-source-qwen3-model-that-surpasses-openai-o1-and-deepseek-r1/
- https://www.nbcnewyork.com/news/business/money-report/alibaba-launches-new-qwen-llms-in-chinas-latest-open-source-ai-breakthrough/6242221/