watch·ia
AccueilActusTutosGlossaireCette semaineTendancesSources
À chaud

Qwen-RobotSuite : Alibaba lance trois modèles d'IA incarnée pour la robotique

mardi 16 juin 202616:511 min de lecture1 source citée
L'essentiel — 3 points
  • 01Qwen-RobotSuite propose trois modèles d'IA incarnée (RobotManip, RobotWorld, RobotNav) pour la manipulation, la modélisation du monde et la navigation robotique.
  • 02Les modèles s'appuient sur Qwen3.5 et Qwen3-VL, avec des tailles allant de 2 à 8 milliards de paramètres.
  • 03Les benchmarks indiquent des performances améliorées, notamment pour la manipulation et la navigation.
ALIBABA

Alibaba a présenté Qwen-RobotSuite, une suite de trois modèles d'IA incarnée (embodied AI) dédiés à la robotique : RobotManip, RobotWorld et RobotNav. Ces modèles s’appuient respectivement sur les architectures Qwen3.5 et Qwen3-VL, avec des tailles variant de 2 à 8 milliards de paramètres. Leur objectif est d’améliorer les capacités des robots en manipulation, modélisation du monde et navigation, via des architectures innovantes et des pipelines de données optimisés.

RobotManip est un modèle Vision-Language-Action (VLA) basé sur Qwen3.5-4B, conçu pour des tâches de manipulation fine. RobotWorld, quant à lui, est un modèle de modélisation du monde conditionné par le langage, utilisant une architecture MMDiT à 60 couches pour générer des représentations dynamiques de l’environnement. Enfin, RobotNav exploite Qwen3-VL pour la navigation robotique, disponible en trois versions (2B, 4B et 8B), afin d’adapter les performances aux besoins spécifiques des applications.

Les résultats des benchmarks montrent des performances compétitives, notamment pour RobotManip et RobotNav, avec une amélioration notable de la précision dans les tâches de manipulation et de déplacement. Les données d’entraînement combinent des simulations et des environnements réels, renforçant la robustesse des modèles face à des scénarios variés.

Réagir :
Partager —XLinkedIn
Sources citées