Inteligência artificial alcança marco histórico ao passar no teste de Turing
Estudo revela que inteligência artificial pode passar no Teste de Turing
Pesquisadores da Universidade da Califórnia, em San Diego, realizaram um estudo que indica que modelos de inteligência artificial têm a capacidade de passar no Teste de Turing, uma avaliação clássica da inteligência artificial em comparação com a humana.
O Teste de Turing, desenvolvido por Alan Turing, consiste em observadores que tentam discernir se um texto foi gerado por um humano ou por uma máquina. Se os observadores não conseguem identificar a origem do texto, a inteligência artificial é considerada como tendo passado no teste, sugerindo uma aparente capacidade de raciocínio.
Os resultados do estudo mostraram que o modelo de linguagem GPT-4.5 da OpenAI foi confundido com um humano em 73% das interações, enquanto o modelo LLaMa-3.1-405B da Meta alcançou uma taxa de confusão de 56%. Essa performance sugere que a semelhança entre as respostas das máquinas e as humanas pode ser ainda maior, dado que novos modelos de linguagem foram lançados após o estudo.
Por outro lado, o modelo de linguagem 4o da OpenAI e a inteligência artificial Eliza, desenvolvida na década de 1960, apresentaram os piores desempenhos, sendo confundidos com humanos em apenas 21% e 23% das vezes, respectivamente.
Ben Bergen, professor de ciência cognitiva e um dos autores do estudo, aponta que o Teste de Turing foi inicialmente criado para avaliar a inteligência bruta de humanos e computadores. Embora os computadores tenham superado os humanos em tarefas complexas há anos, a capacidade de passar no Teste de Turing por parte dos modelos de IA é um fenômeno mais recente.
“Agora sabemos que a IA pode responder a muitas perguntas de forma mais rápida e precisa do que os humanos. O verdadeiro desafio não é apenas a inteligência, mas o que o teste realmente mede, que se relaciona cada vez mais com a semelhança com os humanos”, afirma Bergen.
O estímulo desempenha um papel crucial na capacidade dos modelos de IA de se saírem bem no teste. Os modelos só se destacaram quando foram instruídos a se comportar de maneira semelhante aos humanos. Sem essas orientações, suas respostas se tornaram mais facilmente identificáveis como não humanas. Cameron Jones, pesquisador de doutorado que liderou o estudo, ressalta que, com os estímulos adequados, os modelos de linguagem podem replicar comportamentos humanos de maneira convincente.
“Embora esses modelos possam gerar informações sobre uma ampla gama de tópicos, o teste demonstrou que eles também podem imitar traços de comportamento social, o que impacta significativamente nossa percepção da IA”, conclui Jones.
Apesar do desempenho impressionante, as respostas dos modelos de IA não foram isentas de erros, o que gerou confusão entre os observadores durante o estudo.
<p“Essas características não se alinham com a capacidade de resolução de problemas em matemática e lógica que Turing inicialmente imaginou”, resume Bergen.
