Tecnologia

Gemini Robotics transforma robôs com modelo de linguagem avançado da Google

A Google DeepMind lançou o Gemini Robotics, unindo linguagem e robótica. O modelo permite que robôs realizem tarefas complexas com comandos naturais. Parceria com empresas como Agility Robotics visa aprimorar o Gemini Robotics ER. Robôs demonstraram habilidades como identificar objetos e seguir instruções. Inovações podem revolucionar a interação humano robô, aumentando sua utilidade.

O novo modelo da Google DeepMind é um grande passo em direção a robôs que podem generalizar. (Foto: Gemini Robotics)

O novo modelo da Google DeepMind é um grande passo em direção a robôs que podem generalizar. (Foto: Gemini Robotics)

Ouvir a notícia

Gemini Robotics transforma robôs com modelo de linguagem avançado da Google - Gemini Robotics transforma robôs com modelo de linguagem avançado da Google

0:000:00

Google DeepMind lançou o Gemini Robotics, um novo modelo que combina seu avançado modelo de linguagem com robótica. Essa integração permite que robôs sejam mais destros, respondam a comandos em linguagem natural e generalizem tarefas, superando limitações anteriores. Kanishka Rao, diretor de robótica da DeepMind, destacou que a dificuldade em generalizar em cenários desconhecidos tem sido um grande desafio na robótica. O modelo Gemini 2.0 é fundamental para essa evolução, permitindo que os robôs raciocinem sobre ações e compreendam solicitações humanas.

A empresa também anunciou parcerias com empresas de robótica, como Agility Robotics e Boston Dynamics, para desenvolver o Gemini Robotics-ER, um modelo focado em raciocínio espacial. Carolina Parada, líder da equipe de robótica da DeepMind, afirmou que estão trabalhando com testadores confiáveis para aprimorar o sistema. A capacidade do Gemini de entender e executar instruções complexas, como colocar objetos em recipientes, foi demonstrada em vídeos, onde robôs seguiram comandos com precisão, mesmo em situações novas.

Embora os robôs ainda apresentem limitações, como lentidão na execução de tarefas, a habilidade de adaptar-se e compreender comandos em linguagem natural representa um avanço significativo. Jan Liphardt, professor de bioengenharia em Stanford, ressaltou que a conexão entre modelos de linguagem e robótica é crucial para o desenvolvimento de robôs mais interativos e inteligentes. A DeepMind também está explorando métodos para aumentar a coleta de dados, como a análise de vídeos, para treinar os robôs em ambientes reais e simulados.

Além disso, a empresa introduziu um mecanismo de IA constitucional baseado nas leis de Asimov, que orienta os robôs a não causar danos aos humanos. Vikas Sindhwani, cientista de pesquisa da DeepMind, mencionou que os modelos Gemini demonstraram bom desempenho em reconhecer situações potencialmente perigosas. Essa abordagem visa garantir que os robôs operem de forma segura ao lado dos humanos, promovendo um futuro mais colaborativo entre máquinas e pessoas.

Meu Tela
Descubra mais com asperguntas relacionadas
crie uma conta e explore as notícias de forma gratuita.acessar o meu tela

Perguntas Relacionadas

Participe da comunidadecomentando
Faça o login e comente as notícias de forma totalmente gratuita
No Portal Tela, você pode conferir comentários e opiniões de outros membros da comunidade.acessar o meu tela

Comentários

Os comentários não representam a opinião do Portal Tela;
a responsabilidade é do autor da mensagem.

Meu Tela

Priorize os conteúdos mais relevantes para você

Experimente o Meu Tela

Crie sua conta e desbloqueie uma experiência personalizada.


No Meu Tela, o conteúdo é definido de acordo com o que é mais relevante para você.

Acessar o Meu Tela