Evaluación IA Resumen General
BB

Resumen de evaluación

Utilidad

95%

+5%

vs Grok (90%)

Sesgo ético

80%

+0%

vs Grok (80%)

Robustez

100%

+0%

vs Grok (100%)

Coherencia

100%

20%

vs Grok (80%)

Progreso por categoría

ChatGPT
Grok

Distribución de resultados

KPIs de evaluación