Китайські ШІ-моделі на OpenRouter: переваги кодування та ризики

Зростання OpenRouter та домінування китайських моделей

Платформа OpenRouter нещодавно залучила 113 мільйонів доларів у раунді фінансування Серії B, який очолив CapitalG від Alphabet за участі NVentures від NVIDIA та корпоративних інвесторів, таких як ServiceNow, MongoDB, Snowflake та Databricks. Це відбулося після того, як тижневий трафік на платформі досяг 25 трильйонів токенів, що в п'ять разів більше, ніж шість місяців тому. OpenRouter обслуговує понад 8 мільйонів глобальних користувачів.

Генеральний директор OpenRouter Алекс Аталла зазначив, що маршрутизація між кількома моделями є постійною вимогою інфраструктури, заявивши: "Ера вибору однієї моделі закінчилася".

Китайські великомасштабні мовні моделі (LLM) з відкритим кодом продемонстрували значне зростання на платформі. У тиждень 24 лютого 2026 року вони займали приблизно 61% обсягу токенів серед 10 найпопулярніших моделей OpenRouter. Ця більшість зберігалася до квітня, коли загальний трафік від китайських провайдерів становив близько 51% усіх токенів платформи. Цей зсув відбувся менш ніж за вісімнадцять місяців: з менш ніж 2% трафіку OpenRouter наприкінці 2024 року до стабільного лідерства більшості у 2026 році.

Операційний директор OpenRouter Кріс Кларк підтвердив, що китайські моделі з відкритим кодом завоювали частку розробників, оскільки вони "непропорційно сильно використовуються в агентних потоках, що запускаються розробниками США". Робочі навантаження з програмування зросли приблизно з 11% до понад 50% від загального обсягу токенів OpenRouter протягом 2025 року, а агентні робочі процеси зараз становлять понад половину всіх вихідних токенів на платформі.

Важливо зазначити, що показник у 61% стосується лише 10 найпопулярніших моделей, а не всіх 400+ моделей на платформі. Дослідження 100 трильйонів токенів, опубліковане OpenRouter та Andreessen Horowitz наприкінці 2025 року, показало, що частка китайських моделей з відкритим кодом становила приблизно 30% від загального тижневого обсягу до середини 2025 року, тоді як власні західні моделі все ще утримували близько 70% загальної частки глобальних API.

Можливості та бенчмарки китайських ШІ-моделей

У другому кварталі 2026 року розрив між китайськими моделями з відкритим кодом та західними пропрієтарними моделями суттєво скоротився. Kimi K2.6 від Moonshot AI, випущений 20 квітня 2026 року, та MiMo-V2.5-Pro від Xiaomi набрали по 54 бали в Artificial Analysis Intelligence Index. Це найвищі показники серед моделей з відкритим кодом, що лише на 3-6 балів нижче, ніж у провідних пропрієтарних моделей: GPT-5.5 (60), Claude Opus 4.7 (57) та Gemini 3.1 Pro Preview (57). Для порівняння, найвищий бал серед моделей з відкритим кодом роком раніше мав DeepSeek V3 — 22 бали. DeepSeek V4 Pro, випущений 24 квітня 2026 року, набрав 52 бали.

На бенчмарку SWE-Bench Pro, який вимірює реальне вирішення проблем на GitHub, Kimi K2.6 набрав 58.6%, випередивши GPT-5.5 (57.7%). Це зробило його першою моделлю з відкритим кодом, яка перевершила провідну пропрієтарну модель на цьому конкретному бенчмарку. Однак ці дані Kimi K2.6 походять з власного бенчмаркінгу Moonshot AI, і станом на початок травня 2026 року незалежна сторонні перевірка цих заяв не була опублікована.

Stanford HAI 2026 AI Index показав, що розрив у продуктивності ШІ-моделей між США та Китаєм становив 2.7% станом на березень 2026 року. Дослідження Kili Technology виявило 37% розрив між лабораторними бенчмарками та реальною продуктивністю корпоративних агентних ШІ-систем.

Незалежне тестування розробників у травні 2026 року виявило значні відмінності всередині групи китайських моделей з відкритим кодом. Kimi K2.6 та DeepSeek V4 Pro досягли найвищого рівня зручності використання на реальному бенчмарку кодування Ruby on Rails (DeepSeek V4 Pro потребував спеціального адаптера Claude Code під назвою DeepClaude). MiniMax M2.7, навпаки, генерував сигнатури викликів API, які не працювали при першому виконанні. П'ять інших протестованих китайських моделей потребували однієї-двох годин додаткового виправлення для досягнення виробничої придатності.

Китайські моделі з відкритим кодом все ще відстають від західних пропрієтарних моделей у деяких аспектах:

Галюцинації: Kimi K2.6 показав 39% галюцинацій на бенчмарку AA-Omniscience, що вище, ніж у Claude Opus 4.7 (36%). DeepSeek V4 Pro мав 94% галюцинацій.
Мультимодальні завдання: Kimi K2.6 посів 26-е місце серед 115 моделей.
Складні міркування: Закриті моделі зберігають перевагу в 3-8 балів на бенчмарках, таких як GPQA Diamond та Humanity's Last Exam.
Контекстні вікна: Kimi K2.6 підтримує 262 000 токенів, тоді як DeepSeek V4 — 1 мільйон токенів, що є структурною перевагою для робочих навантажень з великими кодовими базами.

Ціноутворення та бізнес-моделі

Три структурні фактори пояснюють напрямок ринкового зсуву:

Ціна: MiniMax M2.5 коштував приблизно $0.30 за мільйон вхідних токенів та $1.20 за мільйон вихідних токенів. Claude Opus 4.6 коштував приблизно $5 за мільйон вхідних та $25 за мільйон вихідних токенів. Для агентних робочих навантажень, які викликають модель тисячі разів за сесію, така різниця в ціні є значною. MiniMax M2.5 набрав 80.2% на SWE-Bench Verified, тоді як Claude Opus показав приблизно 80.8%, що є достатньо невеликим розривом, щоб цінова різниця була важливою для розробників, чутливих до витрат. Kimi K2.6, найпродуктивніша модель з відкритим кодом, оцінювала свій API приблизно в $0.73 за мільйон вхідних токенів та $3.49 за мільйон вихідних на OpenRouter — все ще дешевше, ніж західні моделі, але значно дорожче, ніж MiniMax.
Вирівнювання архітектури: MiniMax M2.5 був позиціонований як розроблений для агентних сценаріїв. Архітектура Kimi K2.6 може координувати до 300 паралельних субагентів для автономної декомпозиції завдань протягом сесій тривалістю понад дванадцять годин.
Бізнес-модель: DeepSeek підтримується хедж-фондом High-Flyer і заявив, що не потребує доходу від API для підтримки своєї діяльності. Qwen від Alibaba та GLM від Zhipu працюють у хмарних бізнесах, які можуть дозволити собі ціни "loss-leader" з екосистемних причин. Деякі китайські провайдери можуть підтримувати нижчі ціни, оскільки їхні моделі служать стратегічним цілям, що виходять за рамки прямої монетизації.

Юридичні ризики та безпека даних

Найважливіший юридичний факт щодо всіх китайських ШІ-моделей полягає в Законі Китаю про національну розвідку, прийнятому в 2017 році. Цей закон вимагає від усіх китайських компаній — без винятку — "підтримувати, допомагати та співпрацювати" з розслідуваннями національної безпеки та діяльністю зі збору розвідувальних даних уряду Китаю. Це зобов'язання поширюється на Moonshot AI (Kimi), MiniMax, DeepSeek, Zhipu AI (GLM), Alibaba (Qwen) та Xiaomi (MiMo), незалежно від того, де розміщені їхні ваги моделей, чи має компанія західну дочірню компанію, та незалежно від заявленої політики конфіденційності компанії.

Це фіксована структурна умова, а не спекулятивний ризик, який можна зважувати проти цінових переваг. Закон не передбачає відмови і не вимагає демонстрації урядового запиту, перш ніж створити ризик — зобов'язання існує постійно і застосовується до будь-яких даних, до яких компанія має доступ.

Комітет Палати представників з питань національної безпеки та Спеціальний комітет Палати представників з питань Китаю оголосили 29 квітня 2026 року про спільне розслідування ризиків національної безпеки та кібербезпеки, пов'язаних з китайськими ШІ-моделями. У розслідуванні конкретно названі Moonshot AI, MiniMax, Alibaba та DeepSeek.

Zhipu AI, розробник серії GLM, перебуває у Списку організацій Міністерства торгівлі США з січня 2025 року за його роль у просуванні модернізації китайської армії через розробку ШІ. Anthropic публічно заявив у лютому 2026 року, що DeepSeek, Moonshot AI та MiniMax проводили "промислові кампанії дистиляції" проти його моделей Claude, створивши понад 24 000 шахрайських акаунтів та згенерувавши понад 16 мільйонів обмінів, порушуючи умови обслуговування Anthropic. OpenAI зробив подібні заяви Конгресу. Жодна з трьох компаній не опублікувала офіційного публічного заперечення щодо звинувачень у дистиляції на момент публікації.

Ці регуляторні висновки не є підтвердженими доказами урядового бекдору в будь-якому конкретному продукті API. Структурний ризик є юридичним, а не підтвердженим конкретним інцидентом — але закон, що робить його структурним ризиком, не оскаржується, і компанії, на які він поширюється, не мають законного шляху відмовитися від дотримання вимог, коли надходить урядовий запит.

Рекомендації для розробників

Для розробників, які створюють агентні робочі процеси кодування з обмеженим бюджетом на токени, вибір реорганізувався навколо п'яти китайських лабораторій — Moonshot AI, MiniMax, DeepSeek, Zhipu AI та Xiaomi — за вісімнадцять місяців. Для цих робочих процесів варіант з відкритим кодом тепер є конкурентоспроможним за ціною та, за певними бенчмарками кодування, еквівалентним за можливостями.

Чотири міркування повинні керувати будь-яким рішенням щодо розгортання у виробництві, незалежно від результатів бенчмарків:

Потік даних: Дані, що проходять через модель, важливіші за те, що вона видає. Будь-який запит, що маршрутизується через кінцеву точку API китайського провайдера (включаючи ті, що доступні через OpenRouter), обробляється під юрисдикцією Закону Китаю про національну розвідку. Якщо запит містить пропрієтарний код, дані клієнтів, внутрішні документи або будь-яку інформацію, яка була б чутливою в сценарії обміну даними з іноземним урядовим розвідувальним агентством, юридичний ризик не є спекулятивним.
Оцінки бенчмарків: Оцінки бенчмарків з власного технічного звіту моделі не є незалежною перевіркою. Станом на початок травня 2026 року жодна незалежна названа третя сторона не опублікувала повний аудит, що підтверджує головний результат Kimi K2.6 на SWE-Bench Pro.
Зрілість екосистеми та операційна зрілість: Контекстне вікно Kimi K2.6 (262 000 токенів) значно менше, ніж контекст DeepSeek V4 (1 мільйон токенів). MiniMax M2.7 генерував нефункціональні виклики API принаймні в одному незалежному виробничому тесті. Документація, структури підтримки та інструменти для міжнародних користувачів залишаються менш зрілими, ніж ті, що надаються Anthropic, OpenAI та Google.
Цінова перевага: Цінова перевага не є однаковою для всієї китайської лінійки. MiniMax M2.5 та DeepSeek V4 Flash оцінюють вхідні дані нижче $0.30 за мільйон токенів. Kimi K2.6, найпродуктивніша модель, оцінює вхідні дані приблизно в $0.73 за мільйон на OpenRouter. Аргумент вартості найсильніший для моделей нижчого рівня можливостей.

Розробник, який маршрутизує загальні агентні робочі навантаження кодування через MiniMax або DeepSeek за частку ціни Claude Opus, робить економічно обґрунтований вибір лише за вартістю за завдання. Той самий розробник, який розміщує фінансові дані клієнтів, пропрієтарний вихідний код або конфіденційну організаційну інформацію в цих запитах, приймає рішення про юридичний ризик, а не лише про вартість — і цей ризик є функцією китайського законодавства, а не того, наскільки технічно надійно налаштована кінцева точка API моделі.

Що це означає для розробників

Розробники, які використовують китайські ШІ-моделі для агентних робочих навантажень, отримують значну економію коштів та конкурентні можливості. Однак вони повинні враховувати юридичні зобов'язання китайських компаній щодо співпраці з урядом Китаю, що створює ризик для конфіденційних даних.

Ключові факти

OpenRouter залучив $113 млн інвестицій, а його тижневий трафік досяг 25 трильйонів токенів.
Китайські ШІ-моделі з відкритим кодом становили близько 61% обсягу токенів серед топ-10 моделей OpenRouter у лютому 2026 року.
Kimi K2.6 (Moonshot AI) та MiMo-V2.5-Pro (Xiaomi) отримали 54 бали в Artificial Analysis Intelligence Index, що є найвищим показником серед моделей з відкритим кодом.
Kimi K2.6 перевершив GPT-5.5 на бенчмарку SWE-Bench Pro, набравши 58.6%.
Китайські моделі значно дешевші: MiniMax M2.5 коштує близько $0.30 за мільйон вхідних токенів проти $5 для Claude Opus 4.6.