imagen tomada de scalevise.com
Inteligencia artificial precisión es ahora una de las mayores preocupaciones entre usuarios de chatbots, y un nuevo análisis revela cuáles sistemas aciertan más… y cuáles cometen más errores.
Un estudio del laboratorio independiente Artificial Analysis comparó distintos modelos avanzados para medir su capacidad de respuesta y confiabilidad. El resultado: los modelos más recientes de Gemini lideran el ranking, seguidos por desarrollos de Claude y ChatGPT.
El análisis utiliza indicadores como el Omniscience Index, que premia respuestas correctas, penaliza errores y no castiga cuando el sistema decide no responder.
En términos de inteligencia artificial precisión, el modelo Gemini 3.1 Pro Preview obtuvo la puntuación más alta con 33 puntos en confiabilidad. Le siguen Claude Opus 4.6 y otros sistemas avanzados.
Además, el estudio evaluó la capacidad de razonamiento mediante otro indicador, donde Gemini 3.1 Pro Preview comparte el primer lugar con GPT-5.4, ambos con 57 puntos.
Estos resultados reflejan un avance importante en el desarrollo de modelos capaces de comprender preguntas complejas y ofrecer respuestas más acertadas.
A pesar de los avances, la inteligencia artificial precisión sigue enfrentando un problema clave: las “alucinaciones”. Este fenómeno ocurre cuando un sistema genera información incorrecta o inexistente con total seguridad.
Esto puede suceder cuando los modelos trabajan con datos incompletos o interpretan mal el contexto, lo que representa un riesgo para quienes usan estas herramientas en estudios o trabajo.
El estudio también identificó sistemas con bajo desempeño, como gpt-oss-20B, K-EXAONE y Mi:dm K2.5 Pro, que incluso obtuvieron puntuaciones negativas.
Aunque la competencia entre plataformas crece con Claude ganando popularidad y ChatGPT manteniendo una base de cientos de millones de usuarios, los expertos coinciden en algo: ningún sistema es infalible.
Por ello, recomiendan utilizar estas herramientas como apoyo, pero siempre verificando la información. La carrera por lograr una inteligencia artificial más precisa apenas comienza.
Con información de Infobae.
El dinamismo de la manufactura en México se ha consolidado como un indicador clave de…
El envejecimiento de la población mexicana empieza a mover la estrategia de las nuevas empresas…
Las vacaciones ya están aquí y millones de personas salen a disfrutar parques, playas, plazas…
La institución financiera digital Finsus expandió sus servicios a las zonas de mayor marginalidad en…
La mente humana tiene una tendencia natural a enfocarse en posibles amenazas antes que en…
Jack Landsmanas considera que una de las mayores transformaciones tecnológicas que experimentará la industria alimentaria…