XPENG X-World: світова модель для автопілота VLA 2.0 вже у виробництві

Китайський виробник електромобілів XPENG (NYSE: XPEV, HKEX: 9868) офіційно оприлюднив технічний звіт про генеративну модель X-World — ключовий інструмент для розробки та валідації системи автономного водіння VLA 2.0. Документ детально описує архітектуру, процес навчання, методи верифікації та практичне застосування моделі у виробничих процесах компанії.
Що відомо коротко
- X-World — керована мультиракурсна генеративна модель, побудована на технології відеодифузії з підтримкою семи камер огляду.
- Модель вже інтегрована у замкнуту симуляцію, онлайн-навчання з підкріпленням та синтез даних для автопілота.
- Кількість симуляційних сценаріїв XPENG зросла з 30 000 рік тому до понад 500 000, а щоденний віртуальний пробіг еквівалентний 30 млн км реальних доріг.
- VLA 2.0 вже розгорнуто для користувачів у квітні 2026 року; Volkswagen став першим зовнішнім комерційним клієнтом системи.
- X-World навчається у два етапи: спочатку перетворення великої відеомоделі на повністю керовану мультикамерну систему, потім — конвертація у потоковий авторегресивний симулятор.
Що таке X-World і навіщо вона потрібна
Традиційні підходи до симуляції автономного водіння базуються на технології 3D Gaussian Splatting (3DGS), яка добре відтворює вже зібрані сцени, проте погано справляється з нестандартними маневрами — різкою зміною смуги чи об’їздом перешкоди. Через це галузь досі значною мірою залежить від дорогих і важко відтворюваних тестів на реальних дорогах. X-World покликана вирішити цю проблему: отримуючи відеопотоки з кількох камер та задані команди керування, модель генерує відповідні майбутні відеопотоки з усіх ракурсів, фактично «уявляючи» зміни дорожньої ситуації на кілька секунд наперед.
В основі X-World лежить провідна модель генерації відео WAN 2.2 із застосуванням латентного простору через поєднання відео-VAE та DiT-денойзера. Нижній рівень використовує тривимірний причинний автоенкодер із високим коефіцієнтом стиснення, що суттєво знижує обчислювальне навантаження та підтримує моделювання довгих відеопослідовностей. Основа мережі — кастомізована DiT-архітектура з механізмом спільної уваги по часовому та ракурсному вимірах, що забезпечує узгодженість між сімома камерами.
Три ключові переваги та застосування у VLA 2.0
Команда XPENG виділяє три головні сильні сторони X-World: крос-ракурсна 3D-узгодженість між усіма сімома камерами, точне виконання команд — згенеровані сцени точно відповідають заданій поведінці автомобіля, та довгострокова симуляція — стабільне прогнозування на тривалих часових горизонтах. Саме ці властивості наближають генеративні моделі до практичного «симулятора реального світу».
На базі X-World XPENG розробила замкнутий рушій оцінювання для VLA 2.0, який дозволяє вимірювати показники зіткнень, прогрес досягнення мети та комфорт їзди у віртуальному середовищі, максимально наближеному до реального. Детальніше про автомобілі XPENG на autoporady.com. Крім того, X-World слугує платформою для онлайн-навчання з підкріпленням — компанія може цілеспрямовано відпрацьовувати складні сценарії: раптовий вихід пішохода на перехресті чи нерішуча зміна смуги у заторі.
Як генеративна фабрика даних, X-World здатна створювати відсутні дані для рідкісних сценаріїв та генерувати дані для зарубіжних ринків, прискорюючи глобальне розгортання автопілота XPENG. VLA 2.0, за даними компанії, підвищує ефективність водіння на 23%, а кількість різких гальмувань скоротилася на 99% порівняно з попереднім поколінням.
Що варто знати водієві про VLA 2.0
VLA 2.0 — це система автономного водіння рівня L4, яка об’єднує сприйняття, розмірковування та дії в єдиній AI-моделі без проміжних перекладів між модулями. Система відмовилася від лідару на користь суто візійного підходу з радаром як резервом. Volkswagen став першим великим західним виробником, який ліцензував цю китайську розробку, що свідчить про серйозний технологічний рівень платформи.
Практичні поради для тих, хто розглядає автомобілі з VLA 2.0:
- Перевіряйте наявність версії Ultra у моделях P7, G7, X9 — саме вони отримали VLA 2.0 у першу чергу.
- Оновлення надходять через OTA, тому важливо підтримувати стабільне підключення до мережі.
- Система залишається асистентом водія (supervised), а не повністю автономним транспортним засобом — уважність за кермом обов’язкова.
- Для оцінки реальної роботи системи зверніть увагу на показники плавності гальмування та поведінку в щільному міському трафіку.



