Inicio  ›  Cursos  ›  Evaluación y Observabilidad de Sistemas IA
Inteligencia Artificial

Evaluación y Observabilidad de Sistemas IA

Curso técnico sobre cómo evaluar y monitorear sistemas con LLMs en producción. Cubrirás benchmarks públicos (MMLU, MT-Bench, Chatbot Arena, HELM, AgentBench), construcción de evals custom y golden datasets, técnica de LLM-as-judge con sus sesgos (position bias...

📊 Intermedio 📚 11 módulos ⏱ 9 h 30 min 🎓 Certificado oficial
Temario · 11 módulos
1
Módulo 1 — Por qué evaluar LLMs es difícil y cómo cambió en 2026
📄 Lectura
1 h
2
Módulo 2 — Benchmarks públicos vs evals custom
📄 Lectura
1 h
3
Módulo 3 — Quiz: Fundamentos
✅ Quiz
30 min
4
Módulo 4 — LLM-as-judge: técnica, sesgos y mitigaciones
📄 Lectura
1 h
5
Módulo 5 — Golden datasets: cómo construirlos
📄 Lectura
1 h
6
Módulo 6 — Quiz: Métodos de evaluación
✅ Quiz
30 min
7
Módulo 7 — Observabilidad en producción: tracing y métricas
📄 Lectura
1 h
8
Módulo 8 — Detección de drift y regresiones
📄 Lectura
1 h
9
Módulo 9 — Frameworks: LangSmith, Braintrust, Helicone, Phoenix, W&B
📄 Lectura
30 min
10
Módulo 10 — Examen final integrador
✅ Quiz
30 min
11
Práctica Integradora — Sistema de eval para un bot de soporte
📄 Lectura
1 h 30 min
Sobre el curso
Curso técnico sobre cómo evaluar y monitorear sistemas con LLMs en producción. Cubrirás benchmarks públicos (MMLU, MT-Bench, Chatbot Arena, HELM, AgentBench), construcción de evals custom y golden datasets, técnica de LLM-as-judge con sus sesgos (position bias, length bias, self-preference) y mitigaciones, tracing y observabilidad de pipelines complejos, detección de drift y regresiones, y frameworks productivos (LangSmith, Braintrust, Helicone, Phoenix, W&B Weave). El curso que evita postmortems caros: medir antes de prometer, monitorear antes de romper.

¿Listo para empezar?

Creá tu cuenta gratis y empezá Evaluación y Observabilidad de Sistemas IA hoy mismo.

Crear cuenta e inscribirme