¿En quién confiar? Revelan qué inteligencia artificial falla más y cuál es la más precisa

imagen tomada de scalevise.com

Inteligencia artificial precisión es ahora una de las mayores preocupaciones entre usuarios de chatbots, y un nuevo análisis revela cuáles sistemas aciertan más… y cuáles cometen más errores.

Un estudio del laboratorio independiente Artificial Analysis comparó distintos modelos avanzados para medir su capacidad de respuesta y confiabilidad. El resultado: los modelos más recientes de Gemini lideran el ranking, seguidos por desarrollos de Claude y ChatGPT.

El análisis utiliza indicadores como el Omniscience Index, que premia respuestas correctas, penaliza errores y no castiga cuando el sistema decide no responder.

Inteligencia artificial precisión: los modelos que lideran

En términos de inteligencia artificial precisión, el modelo Gemini 3.1 Pro Preview obtuvo la puntuación más alta con 33 puntos en confiabilidad. Le siguen Claude Opus 4.6 y otros sistemas avanzados.

Además, el estudio evaluó la capacidad de razonamiento mediante otro indicador, donde Gemini 3.1 Pro Preview comparte el primer lugar con GPT-5.4, ambos con 57 puntos.

Estos resultados reflejan un avance importante en el desarrollo de modelos capaces de comprender preguntas complejas y ofrecer respuestas más acertadas.

Inteligencia artificial precisión y el problema de las “alucinaciones”

A pesar de los avances, la inteligencia artificial precisión sigue enfrentando un problema clave: las “alucinaciones”. Este fenómeno ocurre cuando un sistema genera información incorrecta o inexistente con total seguridad.

Esto puede suceder cuando los modelos trabajan con datos incompletos o interpretan mal el contexto, lo que representa un riesgo para quienes usan estas herramientas en estudios o trabajo.

El estudio también identificó sistemas con bajo desempeño, como gpt-oss-20B, K-EXAONE y Mi:dm K2.5 Pro, que incluso obtuvieron puntuaciones negativas.

Aunque la competencia entre plataformas crece con Claude ganando popularidad y ChatGPT manteniendo una base de cientos de millones de usuarios, los expertos coinciden en algo: ningún sistema es infalible.

Por ello, recomiendan utilizar estas herramientas como apoyo, pero siempre verificando la información. La carrera por lograr una inteligencia artificial más precisa apenas comienza.

Con información de Infobae.

NOTICIAS