Китайский open-source ИИ захватывает мир: 7 фактов о новой эре
Дата публикации

Китай делает ставку на открытый код - и выигрывает
Прошлый год стал переломным для китайского ИИ. С момента выпуска модели DeepSeek R1 в январе 2025 года китайские компании раз за разом выдают системы, которые по производительности не уступают западным флагманам, но стоят копейки. Буквально на прошлой неделе фирма Moonshot AI представила свежую модель с открытыми весами - Kimi K2.5. По первым тестам она почти догнала топовые закрытые системы вроде Claude Opus от Anthropic. Разница? K2.5 обходится примерно в семь раз дешевле.
На платформе Hugging Face семейство моделей Qwen от Alibaba - после того как заняло первое место по загрузкам в 2024 и 2025 годах - обошло знаменитые модели Llama от Meta по общему числу скачиваний. Недавнее исследование MIT показало, что китайские открытые модели превзошли американские по суммарным загрузкам. Для разработчиков по всему миру доступ к передовым возможностям ИИ никогда не был таким широким и доступным.
Эти модели принципиально отличаются от большинства американских систем типа ChatGPT или Claude, за которые нужно платить и которые нельзя изучить изнутри. Китайские компании публикуют веса моделей - числовые значения, которые формируются при обучении - так что любой может скачать, запустить, изучить и модифицировать их.
Если открытые модели продолжат развиваться такими темпами, они не просто предложат самые дешевые варианты для тех, кто хочет получить доступ к передовым возможностям ИИ. Они изменят место, где происходят инновации, и тех, кто устанавливает стандарты.
Открытый код станет нормой для Китая
Когда DeepSeek запустил R1, первый шок был связан с происхождением модели. Внезапно китайская команда выпустила систему рассуждений, которая могла стоять в одном ряду с лучшими разработками американских лабораторий. Но долгосрочное влияние DeepSeek было связано не столько с национальностью, сколько с распространением. R1 вышла как модель с открытыми весами под либеральной лицензией MIT, что позволяло любому скачать, изучить и развернуть ее. Вдобавок DeepSeek опубликовал статью с подробным описанием процесса обучения и методов. Для разработчиков, которые используют модели через API, DeepSeek также сбил цены, предложив доступ за долю стоимости OpenAI o1 - ведущей проприетарной модели рассуждений того времени.
В течение нескольких дней после релиза DeepSeek вытеснил ChatGPT с первого места среди бесплатных приложений в американском App Store. Событие вышло за рамки круга разработчиков и затронуло финансовые рынки, вызвав резкую распродажу акций американских технологических компаний, что на короткое время стерло около триллиона долларов рыночной стоимости. Почти мгновенно DeepSeek превратился из малоизвестной команды, поддерживаемой количественным хедж-фондом, в самый заметный символ китайского движения за открытый ИИ.
Решение Китая сделать ставку на открытый код не удивляет. У страны вторая по величине концентрация талантов в области ИИ после США плюс огромная, хорошо финансируемая технологическая индустрия. После того как ChatGPT ворвался в массовое сознание, китайский сектор ИИ пережил переосмысление - и вышел из него с решимостью догнать конкурентов. Стратегия открытого кода рассматривалась как самый быстрый способ сократить разрыв, объединив разработчиков, расширив принятие и установив стандарты.
Успех DeepSeek вдохнул уверенность в индустрию, долгое время привыкшую следовать глобальным стандартам, а не устанавливать их. "Тридцать лет назад ни один китаец не поверил бы, что может оказаться в центре глобальных инноваций", - говорит Алекс Ченглин Ву, генеральный директор и основатель Atoms, компании по разработке ИИ-агентов и видный участник китайской экосистемы открытого кода. "DeepSeek показывает, что при наличии солидных технических талантов, поддерживающей среды и правильной организационной культуры возможно создавать действительно мирового уровня продукты".
Прорыв DeepSeek не был первым успехом Китая в открытом коде. Qwen Lab от Alibaba выпускал модели с открытыми весами годами. К сентябрю 2024 года, задолго до запуска DeepSeek V3, Alibaba заявляла, что глобальные загрузки превысили 600 миллионов. На Hugging Face Qwen составлял более 30% всех загрузок моделей в 2024 году. Другие организации, включая Пекинскую академию искусственного интеллекта и ИИ-фирму Baichuan, также выпускали открытые модели еще в 2023 году.
Но после успеха DeepSeek поле быстро расширилось. Компании вроде Z.ai (ранее Zhipu), MiniMax, Tencent и растущее число небольших лабораторий выпустили модели, конкурентоспособные в рассуждениях, кодировании и задачах в стиле агентов. Растущее число способных моделей ускорило прогресс. Возможности, на появление которых в мире открытого кода раньше уходили месяцы, теперь возникают за недели, даже дни.
"Китайские ИИ-фирмы увидели реальные выгоды от стратегии открытого кода", - говорит Лю Чжиюань, профессор информатики в университете Цинхуа и главный научный сотрудник ИИ-стартапа ModelBest. "Выпуская сильные исследования, они строят репутацию и получают бесплатную рекламу".
Помимо коммерческих стимулов, открытый код приобрел культурный и стратегический вес, отмечает Лю. "В китайском сообществе программистов открытый код стал политически корректным", - говорит он, обрамляя это как ответ на доминирование США в проприетарных ИИ-системах.
Этот сдвиг также отражается на институциональном уровне. Университеты, включая Цинхуа, начали поощрять разработку ИИ и вклад в открытый код, а политики перешли к формализации этих стимулов. В августе Госсовет Китая опубликовал проект политики, поощряющей университеты вознаграждать работу в открытом коде, предлагая, чтобы вклад студентов на платформах вроде GitHub или Gitee в конечном итоге мог учитываться в академических кредитах.
С растущим импульсом и усиливающей обратной связью китайское движение за открытые модели, вероятно, продолжится в ближайшей перспективе, хотя его долгосрочная устойчивость все еще зависит от финансовых результатов, говорит Тьечжэн Ван, который помогает возглавлять работу по глобальному ИИ в Hugging Face. В январе модельные лаборатории Z.ai и MiniMax вышли на биржу в Гонконге. "Сейчас фокус на том, чтобы сделать пирог больше", - говорит Ван. "Следующий вызов - выяснить, как каждая компания обеспечит свою долю".
Если вы хотите узнать больше о практическом применении открытых ИИ-моделей в бизнесе, посетите AI Projects для детальных рекомендаций.
Следующая волна моделей будет узкоспециализированной - и лучше
Китайские открытые модели лидируют не только по объему загрузок, но и по разнообразию. Qwen от Alibaba стал одним из самых диверсифицированных семейств открытых моделей в обращении, предлагая широкий спектр вариантов, оптимизированных для разных задач. Линейка варьируется от легковесных моделей, которые могут работать на одном ноутбуке, до больших систем с сотнями миллиардов параметров, предназначенных для развертывания в дата-центрах. Qwen предлагает множество вариантов, оптимизированных для конкретных задач и созданных сообществом: модели "instruct" хороши в выполнении команд, а варианты "code" специализируются на программировании.
Хотя эта стратегия не уникальна для китайских лабораторий, Qwen стал первым семейством открытых моделей, которое выкатило столько высококачественных опций, что это начало ощущаться как полная продуктовая линейка - бесплатная в использовании.
Открытая природа этих релизов также облегчает другим адаптацию через такие техники, как тонкая настройка и дистилляция, что означает обучение меньшей модели имитировать большую. Согласно ATOM (American Truly Open Models), проекту исследователя ИИ Натана Ламберта, к 4 августа 2025 года новые вариации моделей, производные от Qwen, составляли "более 40%" новых производных языковых моделей на Hugging Face, в то время как Llama упал примерно до 15%. Это означает, что Qwen стал базовой моделью по умолчанию для всех "ремиксов".
Этот паттерн укрепил позиции меньших, более специализированных моделей. "Вычисления и энергия - реальные ограничения для любого развертывания", - говорит Лю. Он рассказал MIT Technology Review, что рост малых моделей связан с удешевлением запуска ИИ и упрощением использования для большего числа людей. Его компания ModelBest фокусируется на малых языковых моделях, разработанных для локального запуска на устройствах вроде телефонов, автомобилей и другой потребительской техники.
В то время как обычный пользователь может взаимодействовать с ИИ только через веб или приложение для простых разговоров, продвинутые пользователи моделей ИИ с техническим бэкграундом экспериментируют с предоставлением ИИ большей автономии для решения масштабных задач. OpenClaw, открытый ИИ-агент, который недавно стал вирусным в мире ИИ-хакеров, позволяет ИИ взять под контроль ваш компьютер - он может работать 24/7, просматривая ваши письма и рабочие задачи без надзора.
OpenClaw, как и многие другие инструменты с открытым кодом, позволяет пользователям подключаться к различным ИИ-моделям через API. В течение нескольких дней после релиза OpenClaw команда сообщила, что Kimi K2.5 превзошел Claude Opus и стал самой используемой ИИ-моделью - по количеству токенов, то есть обрабатывал больше всего текста в запросах пользователей и ответах модели.
Стоимость стала главной причиной, по которой китайские модели набрали популярность, но было бы ошибкой рассматривать их как простые "дубликаты" западных передовых систем, предполагает Ван. Как и любой продукт, модель должна быть достаточно хороша для конкретной задачи.
Ландшафт открытых моделей в Китае также становится более специализированным. Исследовательские группы вроде Shanghai AI Laboratory выпустили модели, ориентированные на научные и технические задачи; несколько проектов от Tencent сосредоточились конкретно на генерации музыки. Ubiquant, фирма количественных финансов, как и материнская компания DeepSeek High-Flyer, выпустила открытую модель, нацеленную на медицинское рассуждение.
Тем временем инновационные архитектурные идеи из китайских лабораторий подхватываются более широко. DeepSeek опубликовал работу, исследующую эффективность модели и память; техники, которые сжимают "кэш" внимания модели, снижая затраты на память и вывод при сохранении производительности, привлекли значительное внимание в исследовательском сообществе.
"Влияние этих исследовательских прорывов усиливается, потому что они открыты и могут быть быстро подхвачены по всей области", - говорит Ван.
Китайские открытые модели станут инфраструктурой для глобальных разработчиков
Принятие китайских моделей растет и в Кремниевой долине. Мартин Касадо, генеральный партнер Andreessen Horowitz, назвал цифру: среди стартапов, которые презентуют проекты с открытыми стеками, примерно 80% работают на китайских открытых моделях, согласно его посту в X. Данные об использовании рассказывают похожую историю. OpenRouter, посредник, который отслеживает, как люди используют различные ИИ-модели через его API, показывает, что китайские открытые модели выросли почти с нуля в конце 2024 года до почти 30% использования в некоторые недели.
Спрос также растет глобально. Z.ai ограничил новые подписки на свой план кодирования GLM (инструмент кодирования на основе его флагманских моделей GLM) после всплеска спроса, ссылаясь на ограничения вычислений. Примечательно, откуда идет спрос: CNBC сообщает, что пользовательская база системы в основном сосредоточена в США и Китае, за которыми следуют Индия, Япония, Бразилия и Великобритания.
"Экосистемы открытого кода в Китае и США тесно связаны", - говорит Ван из Hugging Face. Многие китайские открытые модели все еще полагаются на Nvidia и американские облачные платформы для обучения и обслуживания, что сохраняет деловые связи запутанными. Таланты также текучи: исследователи перемещаются через границы и компании, и многие все еще работают как глобальное сообщество, делясь кодом и идеями публично.
Эта взаимозависимость - часть того, что заставляет китайских разработчиков чувствовать оптимизм по поводу этого момента: работа распространяется, ремиксуется и действительно появляется в продуктах. Но открытость также может ускорить конкуренцию. Дарио Амодеи, генеральный директор Anthropic, высказал версию этой мысли после релизов DeepSeek в 2025 году: он написал, что экспортные ограничения - это "не способ уклониться от конкуренции" между США и Китаем, и что ИИ-компании в США "должны иметь лучшие модели", если хотят преуспеть.
За последнее десятилетие история китайских технологий на Западе была историей больших ожиданий, которые столкнулись с проверкой, ограничениями и политической реакцией. На этот раз экспорт - не просто приложение или потребительская платформа. Это базовый уровень моделей, на котором другие строят свои решения. Сыграет ли это по-другому - все еще открытый вопрос.
Чтобы получить экспертные консультации по внедрению ИИ-решений в вашу компанию, обратитесь к специалистам AI Projects.
Что это значит для будущего ИИ
Китайские открытые модели меняют правила игры. Они доказывают, что передовые технологии могут быть доступными, открытыми и при этом конкурентоспособными. Разработчики по всему миру получили инструменты, которые раньше были доступны только крупным корпорациям. Университеты и стартапы теперь могут экспериментировать с моделями мирового уровня без миллионных бюджетов.
Открытость китайских моделей создает новую экосистему. Тысячи разработчиков адаптируют, улучшают и специализируют базовые модели под конкретные задачи. Это ускоряет инновации и делает ИИ более практичным для реального бизнеса. От медицинской диагностики до финансового анализа, от генерации музыки до автономных агентов - специализированные модели решают конкретные проблемы лучше универсальных гигантов.
Конкуренция между США и Китаем в сфере ИИ только обостряется. Но для разработчиков это означает одно - больше выбора, ниже цены, быстрее прогресс. Открытый код становится не просто философией, а практической стратегией, которая работает. Следующие годы покажут, сможет ли эта модель стать устойчивой коммерчески, но одно ясно уже сейчас: эпоха, когда передовой ИИ был доступен только избранным, заканчивается.