Google DeepMind lançou o Gemini Robotics, um novo modelo que combina seu avançado modelo de linguagem com robótica. Essa integração permite que robôs sejam mais destros, respondam a comandos em linguagem natural e generalizem tarefas, superando limitações anteriores. Kanishka Rao, diretor de robótica da DeepMind, destacou que a dificuldade em generalizar em cenários desconhecidos tem […]
Google DeepMind lançou o Gemini Robotics, um novo modelo que combina seu avançado modelo de linguagem com robótica. Essa integração permite que robôs sejam mais destros, respondam a comandos em linguagem natural e generalizem tarefas, superando limitações anteriores. Kanishka Rao, diretor de robótica da DeepMind, destacou que a dificuldade em generalizar em cenários desconhecidos tem sido um grande desafio na robótica. O modelo Gemini 2.0 é fundamental para essa evolução, permitindo que os robôs raciocinem sobre ações e compreendam solicitações humanas.
A empresa também anunciou parcerias com empresas de robótica, como Agility Robotics e Boston Dynamics, para desenvolver o Gemini Robotics-ER, um modelo focado em raciocínio espacial. Carolina Parada, líder da equipe de robótica da DeepMind, afirmou que estão trabalhando com testadores confiáveis para aprimorar o sistema. A capacidade do Gemini de entender e executar instruções complexas, como colocar objetos em recipientes, foi demonstrada em vídeos, onde robôs seguiram comandos com precisão, mesmo em situações novas.
Embora os robôs ainda apresentem limitações, como lentidão na execução de tarefas, a habilidade de adaptar-se e compreender comandos em linguagem natural representa um avanço significativo. Jan Liphardt, professor de bioengenharia em Stanford, ressaltou que a conexão entre modelos de linguagem e robótica é crucial para o desenvolvimento de robôs mais interativos e inteligentes. A DeepMind também está explorando métodos para aumentar a coleta de dados, como a análise de vídeos, para treinar os robôs em ambientes reais e simulados.
Além disso, a empresa introduziu um mecanismo de IA constitucional baseado nas leis de Asimov, que orienta os robôs a não causar danos aos humanos. Vikas Sindhwani, cientista de pesquisa da DeepMind, mencionou que os modelos Gemini demonstraram bom desempenho em reconhecer situações potencialmente perigosas. Essa abordagem visa garantir que os robôs operem de forma segura ao lado dos humanos, promovendo um futuro mais colaborativo entre máquinas e pessoas.
Entre na conversa da comunidade