Inicio  ›  Cursos  ›  Computer Vision Práctico
Inteligencia Artificial

Computer Vision Práctico

Curso técnico-aplicado de Computer Vision moderna: detección de objetos (YOLO, DETR, RT-DETR), segmentación (SAM, SAM2), embeddings visuales (CLIP, SigLIP), OCR de nueva generación (Surya, Docling, MinerU), y modelos multimodales (GPT-4V, Claude Vision, Gemini...

📊 Intermedio 📚 11 módulos ⏱ 11 h 30 min 🎓 Certificado oficial
Temario · 11 módulos
1
Módulo 1 — CV en 2026: del píxel al multimodal LLM
📄 Lectura
1 h
2
Módulo 2 — CLIP y embeddings visuales: la base de todo
📄 Lectura
1 h
3
Módulo 3 — Quiz: Fundamentos
✅ Quiz
30 min
4
Módulo 4 — Detección de objetos: YOLO, DETR, RT-DETR, open-vocabulary
📄 Lectura
1 h
5
Módulo 5 — Segmentación: SAM, SAM 2, instance vs semantic
📄 Lectura
1 h
6
Módulo 6 — Quiz: Detección y segmentación
✅ Quiz
30 min
7
Módulo 7 — OCR moderno: Surya, Docling, MinerU y multimodal LLMs
📄 Lectura
1 h 30 min
8
Módulo 8 — Modelos multimodales: GPT-4V, Claude Vision, Gemini, Llava, Florence-2
📄 Lectura
1 h 30 min
9
Módulo 9 — Pipelines productivos: ONNX, TensorRT, edge, video, monitoring
📄 Lectura
1 h 30 min
10
Módulo 10 — Examen final integrador
✅ Quiz
30 min
11
Práctica Integradora — Detector de objetos en tiempo real
📄 Lectura
1 h 30 min
Sobre el curso
Curso técnico-aplicado de Computer Vision moderna: detección de objetos (YOLO, DETR, RT-DETR), segmentación (SAM, SAM2), embeddings visuales (CLIP, SigLIP), OCR de nueva generación (Surya, Docling, MinerU), y modelos multimodales (GPT-4V, Claude Vision, Gemini, Llava, Florence-2). Incluye pipelines productivos para imagen y video, deployment en edge (ONNX, TensorRT), y casos reales: inventarios automáticos, control de calidad industrial, accesibilidad, document understanding. Para ingenieros y founders que necesitan llevar CV de demo a producto con latencia, costo y precisión bajo control.

¿Listo para empezar?

Creá tu cuenta gratis y empezá Computer Vision Práctico hoy mismo.

Crear cuenta e inscribirme