Evaluación y Observabilidad de Sistemas IA

Name: Evaluación y Observabilidad de Sistemas IA
Availability: InStock

📊 Intermedio 📚 11 módulos ⏱ 9 h 30 min 🎓 Certificado oficial

Temario · 11 módulos

Módulo 1 — Por qué evaluar LLMs es difícil y cómo cambió en 2026

📄 Lectura

1 h

Módulo 2 — Benchmarks públicos vs evals custom

📄 Lectura

1 h

Módulo 3 — Quiz: Fundamentos

✅ Quiz

30 min

Módulo 4 — LLM-as-judge: técnica, sesgos y mitigaciones

📄 Lectura

1 h

Módulo 5 — Golden datasets: cómo construirlos

📄 Lectura

1 h

Módulo 6 — Quiz: Métodos de evaluación

✅ Quiz

30 min

Módulo 7 — Observabilidad en producción: tracing y métricas

📄 Lectura

1 h

Módulo 8 — Detección de drift y regresiones

📄 Lectura

1 h

Módulo 9 — Frameworks: LangSmith, Braintrust, Helicone, Phoenix, W&B

📄 Lectura

30 min

Módulo 10 — Examen final integrador

✅ Quiz

30 min

Práctica Integradora — Sistema de eval para un bot de soporte

📄 Lectura

1 h 30 min

Sobre el curso

Curso técnico sobre cómo evaluar y monitorear sistemas con LLMs en producción. Cubrirás benchmarks públicos (MMLU, MT-Bench, Chatbot Arena, HELM, AgentBench), construcción de evals custom y golden datasets, técnica de LLM-as-judge con sus sesgos (position bias, length bias, self-preference) y mitigaciones, tracing y observabilidad de pipelines complejos, detección de drift y regresiones, y frameworks productivos (LangSmith, Braintrust, Helicone, Phoenix, W&B Weave). El curso que evita postmortems caros: medir antes de prometer, monitorear antes de romper.

¿Listo para empezar?

Creá tu cuenta gratis y empezá Evaluación y Observabilidad de Sistemas IA hoy mismo.

Crear cuenta e inscribirme