IA recebe instrução mais estruturada do que a educação infantil, diz estudo

Centenas de especialistas de várias áreas são escalados para educar o que pode virar uma única inteligência artificial, como o Claude, da Anthropic.
O processo de educação da IA começa com um currículo amplo, que inclui conteúdo da internet e de livros em várias línguas, organizado em blocos de dados.
O modelo passa por aprendizado autosupervisionado, buscando entender relações entre os conteúdos e desenvolver habilidades como leitura, escrita e compreensão de perguntas.
Em seguida, ocorre o aprendizado supervisionado por humanos, com educadores que escolhem as respostas mais adequadas para treinar o sistema.
A etapa final envolve refino por meio de princípios chamados de constituição, ajustes morais e resistência a tentativas de indução, para que a IA interaja com pessoas de forma segura.

Sistemas de IA recebem educação de centenas de especialistas em áreas como lógica, filosofia, religião e pedagogia. O objetivo é treinar uma única inteligência artificial, com Claude da Anthropic como exemplo.

O debate sugere que as IA podem estar recebendo uma educação mais intensiva do que crianças em alguns contextos. O tema foi abordado ao discutir como Claude é preparado para interagir com seres humanos.

Como é educada uma IA

O artigo descreve que o processo começa com a definição de um currículo amplo, englobando conteúdos da internet, livros e diversas línguas. Tudo que professores digitais selecionam entra no treinamento.

Etapas do treinamento

Inicialmente, blocos de informação são conectados para que o sistema reconheça relações entre conteúdos diversos, como literatura e matemática. O aprendizado é autosupervisionado, exigindo grande capacidade computacional.

Etapas do treinamento (continuado)

Depois vem o aprendizado supervisionado por humanos, com perguntas e seleção de respostas para ajustar o comportamento. Profissionais avaliam e corrigem, como em uma sala de aula tradicional.

Etapas do treinamento (final)

Na fase seguinte, milhares de respostas são usadas para calibrar o que é aceitável. Pesos de modelos mudam para favorecer soluções alinhadas a diretrizes legais e éticas.

Redação técnica e limites

Ao final, Claude passa por um conjunto de regras que orientam o respeito aos usuários. Mesmo assim, especialistas reconhecem falhas no método e a IA pode errar, como qualquer sistema complexo.