- Centenas de especialistas de várias áreas são escalados para educar o que pode virar uma única inteligência artificial, como o Claude, da Anthropic.
- O processo de educação da IA começa com um currículo amplo, que inclui conteúdo da internet e de livros em várias línguas, organizado em blocos de dados.
- O modelo passa por aprendizado autosupervisionado, buscando entender relações entre os conteúdos e desenvolver habilidades como leitura, escrita e compreensão de perguntas.
- Em seguida, ocorre o aprendizado supervisionado por humanos, com educadores que escolhem as respostas mais adequadas para treinar o sistema.
- A etapa final envolve refino por meio de princípios chamados de constituição, ajustes morais e resistência a tentativas de indução, para que a IA interaja com pessoas de forma segura.
Sistemas de IA recebem educação de centenas de especialistas em áreas como lógica, filosofia, religião e pedagogia. O objetivo é treinar uma única inteligência artificial, com Claude da Anthropic como exemplo.
O debate sugere que as IA podem estar recebendo uma educação mais intensiva do que crianças em alguns contextos. O tema foi abordado ao discutir como Claude é preparado para interagir com seres humanos.
Como é educada uma IA
O artigo descreve que o processo começa com a definição de um currículo amplo, englobando conteúdos da internet, livros e diversas línguas. Tudo que professores digitais selecionam entra no treinamento.
Etapas do treinamento
Inicialmente, blocos de informação são conectados para que o sistema reconheça relações entre conteúdos diversos, como literatura e matemática. O aprendizado é autosupervisionado, exigindo grande capacidade computacional.
Etapas do treinamento (continuado)
Depois vem o aprendizado supervisionado por humanos, com perguntas e seleção de respostas para ajustar o comportamento. Profissionais avaliam e corrigem, como em uma sala de aula tradicional.
Etapas do treinamento (final)
Na fase seguinte, milhares de respostas são usadas para calibrar o que é aceitável. Pesos de modelos mudam para favorecer soluções alinhadas a diretrizes legais e éticas.
Redação técnica e limites
Ao final, Claude passa por um conjunto de regras que orientam o respeito aos usuários. Mesmo assim, especialistas reconhecem falhas no método e a IA pode errar, como qualquer sistema complexo.
Entre na conversa da comunidade