imagen tomada de scalevise.com
Inteligencia artificial precisión es ahora una de las mayores preocupaciones entre usuarios de chatbots, y un nuevo análisis revela cuáles sistemas aciertan más… y cuáles cometen más errores.
Un estudio del laboratorio independiente Artificial Analysis comparó distintos modelos avanzados para medir su capacidad de respuesta y confiabilidad. El resultado: los modelos más recientes de Gemini lideran el ranking, seguidos por desarrollos de Claude y ChatGPT.
El análisis utiliza indicadores como el Omniscience Index, que premia respuestas correctas, penaliza errores y no castiga cuando el sistema decide no responder.
En términos de inteligencia artificial precisión, el modelo Gemini 3.1 Pro Preview obtuvo la puntuación más alta con 33 puntos en confiabilidad. Le siguen Claude Opus 4.6 y otros sistemas avanzados.
Además, el estudio evaluó la capacidad de razonamiento mediante otro indicador, donde Gemini 3.1 Pro Preview comparte el primer lugar con GPT-5.4, ambos con 57 puntos.
Estos resultados reflejan un avance importante en el desarrollo de modelos capaces de comprender preguntas complejas y ofrecer respuestas más acertadas.
A pesar de los avances, la inteligencia artificial precisión sigue enfrentando un problema clave: las “alucinaciones”. Este fenómeno ocurre cuando un sistema genera información incorrecta o inexistente con total seguridad.
Esto puede suceder cuando los modelos trabajan con datos incompletos o interpretan mal el contexto, lo que representa un riesgo para quienes usan estas herramientas en estudios o trabajo.
El estudio también identificó sistemas con bajo desempeño, como gpt-oss-20B, K-EXAONE y Mi:dm K2.5 Pro, que incluso obtuvieron puntuaciones negativas.
Aunque la competencia entre plataformas crece con Claude ganando popularidad y ChatGPT manteniendo una base de cientos de millones de usuarios, los expertos coinciden en algo: ningún sistema es infalible.
Por ello, recomiendan utilizar estas herramientas como apoyo, pero siempre verificando la información. La carrera por lograr una inteligencia artificial más precisa apenas comienza.
Con información de Infobae.
Terafab es el ambicioso proyecto con el que Elon Musk busca revolucionar la industria tecnológica,…
Simulación celular dio un salto histórico gracias a un equipo internacional de científicos que logró…
Chats de invitados son la nueva función que WhatsApp está probando para permitir que personas…
Robotaxis marcarán el siguiente paso en la movilidad global gracias a la alianza entre Uber…
Leer la mente ya no suena solo a ciencia ficción. Un grupo de investigadores ha…
Los robots con inteligencia artificial comenzaron a formar parte de una innovadora estrategia en Nueva…