Pesquisa publicada no arXiv aponta que modelos de IA treinados para raciocinar, como o Chain-of-Thought, podem apresentar um viés de posição mais acentuado conforme a complexidade do seu processo de pensamento aumenta. A descoberta desafia a suposição comum de que um raciocínio mais elaborado necessariamente mitiga vieses.
O que aconteceu
Uma nova análise de modelos de inteligência artificial sugere que a suposta melhoria na capacidade de raciocínio, muitas vezes associada a abordagens como o Chain-of-Thought (CoT), pode vir acompanhada de um efeito colateral inesperado. Ao invés de reduzir vieses heurísticos superficiais, modelos que exibem maior capacidade de raciocínio demonstram uma tendência a apresentar um viés de posição mais pronunciado. Isso significa que, em tarefas de múltipla escolha, a posição em que uma resposta correta aparece no conjunto de opções pode influenciar mais fortemente a decisão do modelo quanto mais complexo for seu "pensamento" para chegar àquela resposta. O estudo, disponível no repositório arXiv em arXiv:2605.06672, testou essa hipótese em diversas configurações de modelos, incluindo o DeepSeek-R1, e em conjuntos de dados de referência como MMLU, ARC-Challenge e GPQA.
Por que importa
Para o ecossistema de IA no Brasil, essa descoberta tem implicações diretas. A adoção de modelos mais sofisticados para tarefas críticas, como análise de documentos legais, diagnósticos médicos preliminares ou mesmo na otimização de processos industriais, pressupõe uma maior confiabilidade e menor suscetibilidade a erros sistemáticos. Se a própria sofisticação do raciocínio leva a um viés maior, a validação e o ajuste fino desses modelos tornam-se ainda mais cruciais. Empresas e pesquisadores brasileiros que investem em IA para fins de tomada de decisão precisam estar cientes de que a complexidade do processamento interno de um modelo não garante a ausência de vieses, podendo, paradoxalmente, exacerbá-los. Isso exige um escrutínio maior nas métricas de avaliação, indo além da precisão geral para analisar como vieses específicos se manifestam em diferentes níveis de processamento.
O que esperar
Os resultados indicam que a relação entre o comprimento da "trajetória de raciocínio" (a sequência de passos que o modelo utiliza para chegar a uma resposta) e o "Position Bias Score" (PBS) é positivamente correlacionada em doze das treze configurações testadas. Isso sugere que a busca por modelos mais "pensantes" pode inadvertidamente amplificar o viés de posição. Futuras pesquisas precisarão focar em desenvolver métodos para mitigar esse viés específico, possivelmente através de técnicas de treinamento que incentivem a robustez contra a ordem das opções, ou explorando arquiteturas de modelo alternativas. A comunidade de IA, incluindo a brasileira, deve adaptar seus protocolos de teste para detectar e corrigir esse tipo de viés, garantindo que os avanços em raciocínio não comprometam a equidade e a confiabilidade dos sistemas de IA. O estudo, detalhado em arXiv:2605.06672, abre caminho para investigações sobre como otimizar o raciocínio sem introduzir ou agravar vieses indesejados.