Inteligência Artificial gosta mais de bolo do que a verdade

2024年10月2日 Luciano Bertene

A IA pode realmente raciocinar, ou é apenas um papagaio digital sofisticado? Experimentos recentes com modelos populares de IA como ChatGPT, LLaMa, Gemini e Grok revelaram algumas verdades preocupantes sobre suas habilidades de resolução de problemas – e sua inesperada predileção por sobremesa.

O Desafio do Quebra-cabeça de Aniversário

Eu me propus a replicar e expandir experimentos conduzidos pelo Bank of International Settlements e pelo jornalista Tim Harford. O teste? O infame quebra-cabeça lógico "Cheryl's Birthday" e uma variação engenhosa.

"Cheryl's Birthday" é um problema de lógica em que Bernard e Albert devem deduzir o aniversário de Cheryl a partir de um conjunto de pistas. Ele testa o raciocínio dedutivo e o processamento de informações.

Aqui está o que eu encontrei:

O quebra-cabeça original

A maioria das IAs resolveu com facilidade. (Exceto você, Geminiano. O que aconteceu lá?)

Versão com nome trocado

Quase todas as IAs tropeçaram quando renomeamos os atores e trocamos meses e números por palavras aleatórias.

Bolo de Cenoura Razoável(?)

Os métodos avançados do ChatGPT-o1 são um avanço. Sua cadeia de raciocínio enxerga além da ofuscação muito mais do que qualquer concorrente. O avanço ainda tropeça em seu dente doce. Curiosamente, ele pode descartar "bolo", mas então escolhe "Cenoura" porque essa era a opção mais doce restante (e ainda errada):

Por que isso é importante (muito)

Raciocínio vs. Regurgitação

Esses experimentos lançam dúvidas sobre se a IA é realmente "raciocinadora" ou apenas muito boa em correspondência de padrões.

Fácil de Manipular

Uma única frase irrelevante muda drasticamente as respostas de IA. Imagine as implicações para consultas mais complexas!

RAG e dados confidenciais

Se a IA tem dificuldades com quebra-cabeças lógicos simples, como podemos confiar que ela analisará nossos documentos confidenciais e extrairá insights significativos?

Fabricação da "verdade"

Sistemas que geram múltiplas respostas de IA e as agregam para maior precisão podem ser facilmente influenciados por sugestões cuidadosamente colocadas.

O bolo é uma mentira (referência ao portal pretendida)

Não se trata apenas de quebra-cabeças de aniversário e preferências de sobremesas. É um chamado para despertar qualquer organização que esteja considerando IA para processos críticos de tomada de decisão.

Precisamos:

Testes mais rigorosos
Maior transparência nos processos de raciocínio da IA
Salvaguardas robustas contra manipulação

Até lá, aborde os insights gerados pela IA com uma dose saudável de ceticismo. A promessa da IA é tentadora, mas não podemos deixá-la comer o nosso bolo e tê-lo também.

Conteúdo relacionado

Pascal vs. Delphi: Linguagem para Desenvolvimento de Aplicativos Desktop

Na era digital em constante evolução, a escolha da linguagem de programação certa pode fazer toda a diferença no desenvolvimento de aplicativos desktop. Duas opções que têm se destacado nesse cenár...
Aços para a Indústria Bélica

Na indústria bélica, diversos tipos de aços são empregados devido à necessidade de materiais com alta resistência, durabilidade e capacidade de suportar condições extremas. A escolha do aço depende...
Aço Inoxidável S30408 vs. 304: Entendendo as Principais Diferenças

Você já se perguntou sobre as diferenças entre o aço inoxidável S30408 e o 304? Nesta postagem do blog, vamos nos aprofundar nas principais distinções entre esses dois materiais comumente usados. N...
Aço Reciclado impulsiona a Revolução das Motocicletas Elétricas

A indústria de motocicletas está passando por uma transformação revolucionária, com a adoção cada vez maior de veículos elétricos. Essa mudança é impulsionada não apenas pela crescente conscientiza...
FPT Industrial investe R$ 127 milhões em novas tecnologias de propulsão

A FPT Industrial, marca integrante do Grupo Iveco dedicada ao design, produção e venda de motores, informou que irá investir R$ 127 milhões em pesquisa e desenvolvimento de novas tecnologias de pro...
Curso de Power BI para Engenharia Civil

Power BI na Engenharia Civil: Da Introdução às Aplicações Avançadas No cenário competitivo da engenharia civil e da construção, a capacidade de gerenciar e analisar dados se tornou uma habilidade ...
Importância do Martelo de Escória na Soldagem com Eletrodo Revestido

A soldagem com eletrodo revestido é uma técnica amplamente utilizada na indústria e construção civil, sendo essencial para a união de metais e a fabricação de estruturas robustas. No entanto, o pro...
Cálculo de Frequência Natural Longitudinal em Barras de Aço

Cálculo de Frequência Natural Longitudinal em Barras de Aço As estruturas de aço são uma escolha comum nas engenharias civil, mecanica e de transportes, devido à sua estabilidade, resistência à co...