12 de mar 2025
Gemini Robotics transforma robôs com modelo de linguagem avançado da Google
A Google DeepMind lançou o Gemini Robotics, unindo linguagem e robótica. O modelo permite que robôs realizem tarefas complexas com comandos naturais. Parceria com empresas como Agility Robotics visa aprimorar o Gemini Robotics ER. Robôs demonstraram habilidades como identificar objetos e seguir instruções. Inovações podem revolucionar a interação humano robô, aumentando sua utilidade.
O novo modelo da Google DeepMind é um grande passo em direção a robôs que podem generalizar. (Foto: Gemini Robotics)
Ouvir a notícia:
Gemini Robotics transforma robôs com modelo de linguagem avançado da Google
Ouvir a notícia
Gemini Robotics transforma robôs com modelo de linguagem avançado da Google - Gemini Robotics transforma robôs com modelo de linguagem avançado da Google
Google DeepMind lançou o Gemini Robotics, um novo modelo que combina seu avançado modelo de linguagem com robótica. Essa integração permite que robôs sejam mais destros, respondam a comandos em linguagem natural e generalizem tarefas, superando limitações anteriores. Kanishka Rao, diretor de robótica da DeepMind, destacou que a dificuldade em generalizar em cenários desconhecidos tem sido um grande desafio na robótica. O modelo Gemini 2.0 é fundamental para essa evolução, permitindo que os robôs raciocinem sobre ações e compreendam solicitações humanas.
A empresa também anunciou parcerias com empresas de robótica, como Agility Robotics e Boston Dynamics, para desenvolver o Gemini Robotics-ER, um modelo focado em raciocínio espacial. Carolina Parada, líder da equipe de robótica da DeepMind, afirmou que estão trabalhando com testadores confiáveis para aprimorar o sistema. A capacidade do Gemini de entender e executar instruções complexas, como colocar objetos em recipientes, foi demonstrada em vídeos, onde robôs seguiram comandos com precisão, mesmo em situações novas.
Embora os robôs ainda apresentem limitações, como lentidão na execução de tarefas, a habilidade de adaptar-se e compreender comandos em linguagem natural representa um avanço significativo. Jan Liphardt, professor de bioengenharia em Stanford, ressaltou que a conexão entre modelos de linguagem e robótica é crucial para o desenvolvimento de robôs mais interativos e inteligentes. A DeepMind também está explorando métodos para aumentar a coleta de dados, como a análise de vídeos, para treinar os robôs em ambientes reais e simulados.
Além disso, a empresa introduziu um mecanismo de IA constitucional baseado nas leis de Asimov, que orienta os robôs a não causar danos aos humanos. Vikas Sindhwani, cientista de pesquisa da DeepMind, mencionou que os modelos Gemini demonstraram bom desempenho em reconhecer situações potencialmente perigosas. Essa abordagem visa garantir que os robôs operem de forma segura ao lado dos humanos, promovendo um futuro mais colaborativo entre máquinas e pessoas.
Perguntas Relacionadas
Comentários
Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.