Question 1

¿Cuándo usar Amazon Rekognition vs un modelo custom?

Accepted Answer

Rekognition cuando el caso está cubierto por sus modelos pre-entrenados: detección de personas, vehículos, texto, objetos comunes, rostros, contenido moderado, comparación facial. Es la opción más rápida y económica. Modelo custom (SageMaker) cuando necesitas detectar algo específico de tu negocio: un SKU particular, un defecto de calidad puntual, una pieza industrial específica, comportamientos custom. La decisión la tomamos en el discovery con muestras reales.

Question 2

¿Funciona con nuestras cámaras IP actuales?

Accepted Answer

Sí, en la mayoría de casos. Trabajamos con cámaras industriales estándar (Hikvision, Axis, Dahua, Bosch y otras compatibles con RTSP/ONVIF). El stream se ingesta a AWS con Kinesis Video Streams o se procesa localmente en el edge. No requerimos reemplazar tu inversión en hardware existente.

Question 3

¿Qué nivel de accuracy se logra?

Accepted Answer

Depende del caso. Para casos con buena iluminación, ángulos controlados y dataset suficiente: 95-99% en detección de objetos comunes con modelos pre-entrenados, 85-95% en modelos custom para casos específicos. Definimos contigo el SLO de accuracy aceptable y diseñamos la arquitectura para llegar (más data, mejor labeling, ensemble de modelos, human-in-the-loop para borderline cases).

Question 4

¿Cuánto cuesta implementar Vision AI con Caleidos?

Accepted Answer

El alcance y la inversión se definen contigo después de entender tu contexto: número de cámaras, casos de uso, accuracy requerida, latencia y modelo de operación. Conversemos para armar una propuesta a la medida.

Question 5

¿Qué casos de uso típicos atienden?

Accepted Answer

Conteo automático de productos en línea de producción o almacén; control de acceso por reconocimiento facial o lectura de placas; inspección visual de calidad (defectos en piezas, packaging); seguridad industrial (uso de EPP, intrusión perimetral, comportamientos de riesgo); analytics de retail (heatmaps, tiempo en tienda, conversión). Cada caso lo aterrizamos en arquitectura concreta.

Question 6

¿Edge computing o cloud — cuándo cada uno?

Accepted Answer

Edge (NVIDIA Jetson + IoT Greengrass) cuando la latencia importa (control industrial en tiempo real, robótica), cuando hay conectividad intermitente o cara (sitios remotos, vehículos), o cuando el ancho de banda es limitado y procesar todo el video en cloud sería costoso. Cloud (Rekognition, SageMaker endpoints) cuando la latencia tolera segundos, hay buena conectividad y el volumen de inferencias se acomoda al modelo de pago por uso.

Question 7

¿Cómo se relaciona Vision AI con Agentic AI?

Accepted Answer

Vision AI es el componente perceptivo: convierte imágenes y video en datos estructurados (qué hay, dónde, cuánto, cuándo). Agentic AI es la capa de razonamiento que actúa sobre esos datos: analiza, decide, ejecuta. Combinados se vuelven sistemas autónomos completos — un agente que ve un defecto, lo registra, abre un ticket, alerta al supervisor y ajusta parámetros del proceso. Conoce más en Agentic AI.

Visión por computadora industrial sobre AWS

Lo que obtienes con Caleidos

Rekognition para time-to-value rápido

Modelos custom con SageMaker

Reúsa tus cámaras IP existentes

Edge computing con NVIDIA Jetson

Cómo trabajamos

Discovery del caso de uso

Proof of Concept (PoC)

Entrenamiento custom (cuando aplica)

Despliegue productivo

Operación continua

Casos de Vision AI industrial

Stack técnico

Lo que más nos preguntan

¿Listos para arrancar?