Гуманоидный робот Figure выполняет голосовые команды, помогая по дому

Гуманоидный робот Figure выполняет голосовые команды, помогая по дому:

Основатель и генеральный директор Figure Бретт Эдкок в четверг представил новую модель машинного обучения для гуманоидных роботов. Новость, которая появилась через две недели после того, как Эдкок объявил о решении робототехнической фирмы Bay Area отказаться от сотрудничества с OpenAI, сосредоточена вокруг Helix, «универсальной» модели Vision-Language-Action (VLA).

VLA — это новое явление в робототехнике, использующее зрение и языковые команды для обработки информации. В настоящее время наиболее известным примером этой категории является RT-2 от Google DeepMind, который обучает роботов с помощью комбинации видео и больших языковых моделей (LLM).

Helix работает похожим образом, объединяя визуальные данные и языковые подсказки для управления роботом в реальном времени. Figure пишет: «Helix демонстрирует сильную об общённость объектов, будучи способным подобрать тысячи новых предметов домашнего обихода с различными формами, размерами, цветами и свойствами материалов, которые никогда не встречались ранее в обучении, просто спрашивая на естественном языке».

В идеальном мире вы могли бы просто сказать роботу что-то сделать, и он бы просто это сделал. Вот тут-то и появляется Helix, согласно Figure. Платформа разработана для преодоления разрыва между зрением и обработкой языка. Получив голосовую подсказку на естественном языке, робот визуально оценивает свое окружение, а затем выполняет задачу.

Figure предлагает примеры, такие как «Передай пакет с печеньем роботу справа» или «Возьми пакет с печеньем у робота слева и положи его в открытый ящик». Оба этих примера подразумевают совместную работу пары роботов. Это связано с тем, что Helix разработан для управления двумя роботами одновременно, при этом один помогает другому выполнять различные домашние задачи.

Figure демонстрирует VLM, подчеркивая работу, которую компания проделывает с гуманоидным роботом 02 в домашней среде. Дома, как известно, сложны для роботов, поскольку им не хватает структуры и последовательности складов и фабрик.

Трудности с обучением и управлением являются основными препятствиями, стоящими между сложными роботизированными системами и домом. Эти проблемы, наряду с пяти-шестизначными ценниками, являются причиной того, что домашний робот не стал приоритетом для большинства компаний, занимающихся гуманоидной робототехникой. В целом, подход заключается в создании роботов для промышленных клиентов, что повышает надежность и снижает затраты, прежде чем браться за жилые помещения. Работа по дому — это тема для разговора на несколько лет вперед.

Когда TechCrunch посетил офисы Figure в районе залива в 2024 году, Adcock показал некоторые шаги, которые его гуманоид проходит в домашней обстановке. В то время казалось, что работа не была приоритетной, поскольку Figure фокусируется на пилотах на рабочем месте в таких корпорациях, как BMW.

С анонсом Helix в четверг Figure ясно дает понять, что дом должен быть приоритетом сам по себе. Это сложная и сложная обстановка для тестирования подобных моделей обучения. Обучение роботов выполнению сложных задач на кухне, например, открывает им широкий спектр действий в различных условиях.

«Чтобы роботы были полезны в домашнем хозяйстве, они должны быть способны генерировать новые интеллектуальные модели поведения по запросу, особенно для объектов, которые они никогда раньше не видели», — говорит Фигур. «Обучение роботов даже одному новому поведению в настоящее время требует значительных человеческих усилий: либо часов ручного программирования эксперта уровня доктора наук, либо тысяч демонстраций».

Ручное программирование не масштабируется для дома. Просто слишком много неизвестных. Кухни, гостиные и ванные комнаты сильно различаются от одной к другой. То же самое можно сказать и об инструментах, используемых для приготовления пищи и уборки. Кроме того, люди оставляют беспорядок, переставляют мебель и предпочитают разное окружающее освещение. Этот метод требует слишком много времени и денег — хотя у Figure, безусловно, есть много последнего.

Другой вариант — обучение, и его много. Роботизированные руки, обученные подбирать и размещать предметы в лабораториях, часто используют этот метод. Чего вы не видите, так это сотен часов повторения, необходимых для того, чтобы сделать демонстрацию достаточно надежной для выполнения самых разнообразных задач. Чтобы правильно что-то подобрать с первого раза, робот должен сделать это сотни раз в прошлом.

Как и многое из того, что сейчас окружает гуманоидную робототехнику, работа над Helix все еще находится на очень ранней стадии. Зрители должны знать, что за кулисами происходит много работы по созданию коротких, хорошо сделанных видеороликов, которые можно увидеть в этом посте. Сегодняшнее объявление, по сути, является инструментом рекрутинга, призванным привлечь больше инженеров для помощи в развитии проекта.

Читайте нашу главную страницу —  Взгляд в будущееИнновацииТехнологииНаукаНовые открытияИзобретения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *