Задача
Нужно было выделиться на стенде: не пульт, а автономные решения в реальном времени. Пока другие щёлкали пультами, наш краб опирался на Visual Language Model (VLM): осматривал стенд, искал объекты и выполнял команды без заранее прописанных сценариев. Времени было около полутора месяцев — выбрали готовую платформу с ROS, чтобы не писать низкоуровневое управление с нуля.
