Alibaba представляет Qwen3: новая эпоха открытых нейросетей, превосходящих OpenAI o1 и DeepSeek R1​

Alibaba представляет Qwen3: новая эпоха открытых нейросетей, превосходящих OpenAI o1 и DeepSeek R1​

В апреле 2025 года Alibaba сделала значительный шаг в развитии искусственного интеллекта, представив серию открытых моделей Qwen3. Эти модели не только превосходят конкурентов, таких как OpenAI o1 и DeepSeek R1, но и устанавливают новые стандарты в области гибкого и эффективного ИИ.​

Что такое Qwen3?

Alibaba представляет Qwen3: новая эпоха открытых нейросетей, превосходящих OpenAI o1 и DeepSeek R1​
Qwen3 — это семейство больших языковых моделей (LLM). Изображение создано в Recraft.

Qwen3 — это семейство больших языковых моделей (LLM), разработанных командой Qwen от Alibaba Cloud. В серию входят восемь моделей, включая две модели с архитектурой Mixture-of-Experts (MoE) и шесть плотных моделей. Наиболее мощная из них, Qwen3-235B-A22B, содержит 235 миллиардов параметров и демонстрирует выдающиеся результаты в бенчмарках, таких как ArenaHard, опережая OpenAI o1 и DeepSeek R1.

Ключевые особенности Qwen3

1. Гибкое и гибридное мышление

Alibaba представляет Qwen3: новая эпоха открытых нейросетей, превосходящих OpenAI o1 и DeepSeek R1​
Qwen3 предлагает режим “гибридного рассуждения”. Изображение создано в Midjourney.

Qwen3 предлагает режим “гибридного рассуждения”, позволяя пользователям переключаться между быстрыми ответами и более глубоким анализом. Это особенно полезно для задач, требующих сложных вычислений или логического вывода, таких как математика, программирование и научные исследования.​

2. Открытый исходный код и лицензия Apache 2.0

Alibaba представляет Qwen3: новая эпоха открытых нейросетей, превосходящих OpenAI o1 и DeepSeek R1​
Qwen3 – на платформах Hugging Face, ModelScope, Kaggle и GitHub и через веб-интерфейс Qwen Chat. Изображение создано в Midjourney.

Все модели Qwen3 доступны под лицензией Apache 2.0, что позволяет разработчикам и компаниям использовать их в коммерческих проектах без ограничений. Модели можно найти на платформах Hugging Face, ModelScope, Kaggle и GitHub, а также протестировать через веб-интерфейс Qwen Chat.

3. Эффективность и производительность

Alibaba представляет Qwen3: новая эпоха открытых нейросетей, превосходящих OpenAI o1 и DeepSeek R1​
Qwen3 достигает сопоставимых или лучших результатов. Изображение создано в Recraft.

Несмотря на меньший размер по сравнению с некоторыми конкурентами, такими как DeepSeek R1 с 671 миллиардом параметров, Qwen3 достигает сопоставимых или лучших результатов благодаря оптимизированной архитектуре и обучению с использованием методов усиленного обучения (RL) .

Почему это важно?

Запуск Qwen3 отражает стратегию Китая по открытию доступа к передовым ИИ-моделям. В условиях ограничений на экспорт полупроводников и других технологий, китайские компании, такие как Alibaba, Baidu и Tencent, активно развивают собственные решения и делают их доступными для мирового сообщества.

Это не только стимулирует инновации внутри страны, но и предоставляет разработчикам по всему миру мощные инструменты для создания новых приложений и сервисов.​

Реакция сообщества и перспективы

Сообщество разработчиков и исследователей встретило Qwen3 с большим интересом. Многие отмечают высокую производительность моделей, особенно в задачах, связанных с математикой и программированием. Некоторые пользователи также подчеркивают удобство использования и доступность моделей для тестирования и внедрения в собственные проекты.​

С учетом открытого исходного кода и высокой производительности, Qwen3 имеет потенциал стать основой для множества новых приложений в различных областях, от образования до промышленности.​

Заключение

С запуском Qwen3 Alibaba демонстрирует свою приверженность развитию открытых и мощных ИИ-решений. Эти модели не только конкурируют с ведущими мировыми разработками, но и делают передовые технологии доступными для широкого круга пользователей. Для разработчиков, исследователей и компаний это открывает новые возможности для инноваций и роста в эпоху. искусственного интеллекта.​

Источники

  1. https://www.cnbc.com/2025/04/29/-alibaba-qwen3-ai-series-chinas-latest-open-source-ai-breakthrough.html?utm_source=opentoolsai-newsletter&utm_medium=newsletter&utm_campaign=eu-s-delulu-chip-plan-falls-flat&_bhlid=a9bbe4ceb0b70ccba23a1e9079a416695da78368
  2. https://venturebeat.com/ai/alibaba-launches-open-source-qwen3-model-that-surpasses-openai-o1-and-deepseek-r1/
  3. https://www.nbcnewyork.com/news/business/money-report/alibaba-launches-new-qwen-llms-in-chinas-latest-open-source-ai-breakthrough/6242221/
Понравилась статья? Поделиться с друзьями:
Нейро AI
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: