- Ella, a cafeteria robótica movida por Intel Core Ultra Series 3, opera com um SoC que dispensa GPU discreta, executando três agentes de IA locais (Avatar, Ella e Guardião) para visão, linguagem e movimento, em tempo real, durante a demonstração na Computex 2026 em Taipei.
- A arquitetura substitui a configuração com GPU por um único chip que reúne CPU, GPU e unidade de processamento neural de visão, reduzindo calor e custo total de processamento.
- O Agente Avatar gerencia a interação com o cliente, o Agente Ella aprende padrões de negócio da loja e o Agente Guardião realiza raciocínio de alto nível sobre a integridade do sistema.
- Cada agente utiliza a região do SoC mais adequada à sua carga, permitindo que a pilha completa opere sem placa de vídeo adicional e com latência menor.
- O modelo prioriza inferência na borda, eliminando a dependência da nuvem e permitindo processamento local em tempo real, com vantagens de manutenção, refrigeração e custo para quiosques.
A robô barista Ella será demonstrado na Computex 2026, em Taipei, Taiwan, movido pelos processadores Intel Core Ultra Series 3. A máquina opera sem GPU dedicada e roda três agentes de IA localmente, capaz de atender até 200 bebidas por hora. A solução utiliza um System-on-a-Chip (SoC) que gerencia visão, linguagem e movimento sem envio de dados para a nuvem.
A mudança reduz custos e latência ao eliminar a GPU discreta. Segundo a Sensory AI, a arquitetura integra CPU, GPU e unidade de processamento neural de visão, ocupando o mesmo silício. O objetivo é manter o robô estável, com menor dissipação de calor e menor custo total de propriedade.
Organização da arquitetura
Três agentes de IA atuam em conjunto sobre o SoC: o Agente Avatar gerencia a interação com o cliente, o Agente Ella aprende padrões da loja, e o Agente Guardião realiza raciocínio de alto nível para manter a integridade do sistema. O conjunto facilita resposta rápida a falhas, como copos grudados, com ações coordenadas entre os agentes e o braço robótico.
Impacto econômico e operacional
Tan descreve Ella como plataforma voltada à economia de serviços, com menor necessidade de refrigeração e consumo energético reduzido em relação a soluções com GPU dedicada. A distribuição de tarefas entre diferentes núcleos do chip amplia a eficiência da inferência em tempo real, sem dependência de servidores remotos.
Perspectivas de implantação
A fabricante destaca que a solução é mais fácil de manter e apresenta margem operacional mais robusta para negócios de serviço. O conceito favorece lojas com alto fluxo, que exigem respostas rápidas e consistentes no preparo de bebidas. A Sensory AI recomenda considerar implantação prática após o treinamento dos modelos.
Fonte: Intel Newsroom
Entre na conversa da comunidade