Snowflake Cortex AI: qué es y cómo funciona en la práctica

Snowflake Cortex AI lleva LLMs como GPT-5.2 y Claude directamente al data warehouse. Te explicamos cómo funciona, qué cuesta y dónde aporta valor real.

En diciembre de 2025 Snowflake anunció la disponibilidad de GPT-5.2 de OpenAI ejecutándose dentro del perímetro de seguridad de Snowflake Cortex AI, sin que ningún dato salga del warehouse. Según Snowflake, el modelo opera “within the secure Snowflake perimeter” mientras conserva las capacidades de governance de la plataforma. Para los equipos que llevan dos años peleándose con piping de datos hacia APIs externas de LLMs, este es el punto de inflexión: ya no hace falta mover los datos hacia el modelo, el modelo viene al dato.

Pero más allá del anuncio, ¿qué es exactamente Cortex AI y cuándo conviene usarlo en vez de Databricks, Vertex AI o un stack propio sobre OpenAI?

¿Qué es Snowflake Cortex AI?

Snowflake Cortex AI es la suite de capacidades de IA generativa integradas nativamente en Snowflake Data Cloud que permite ejecutar LLMs, búsqueda semántica y agentes directamente sobre datos governados, sin mover la información fuera del warehouse. Según la documentación oficial de producto, Cortex AI da acceso a modelos de Anthropic Claude, OpenAI, Meta Llama y Mistral Large 2 vía SQL o API, sobre datos estructurados y no estructurados (texto, imágenes, audio).

La arquitectura se apoya en cuatro componentes que conviene entender por separado:

  • Cortex AI Functions (antes Cortex AISQL): funciones SQL nativas como AI_COMPLETE, AI_EMBED, AI_SIMILARITY y AI_CLASSIFY.
  • Cortex Search: recuperación documental con embeddings gestionados y búsqueda híbrida (semántica + keyword).
  • Cortex Analyst: text-to-SQL gobernado contra modelos semánticos definidos por el equipo de datos.
  • Cortex Agents: orquestación de razonamiento multi-paso sobre datos estructurados y no estructurados, en GA desde noviembre de 2025 según el release notes oficial.

¿Cómo funciona Cortex AISQL en una consulta real?

La promesa de Cortex AISQL es brutal: convertir cualquier analista SQL en un ingeniero de IA. En la práctica, una sentencia como SELECT AI_CLASSIFY(ticket_text, ['urgente','medio','bajo']) FROM soporte te clasifica miles de tickets sin pipeline externo, sin colas, sin secretos rotando.

Según el anuncio de Snowflake Summit 2025, las optimizaciones de Cortex AISQL ofrecen mejoras de rendimiento entre 30% y 70% dependiendo del dataset, y hasta 60% de ahorro de costes al filtrar o cruzar miles de registros frente a invocar el LLM registro por registro. La clave es que el optimizer de Snowflake reordena las operaciones AI con las operaciones SQL clásicas para minimizar tokens.

El mismo anuncio confirma que más de 13.300 clientes usan Snowflake AI Data Cloud globalmente, lo que da un volumen relevante para evaluar la madurez del producto frente a alternativas más jóvenes.

¿Qué problema resuelven los Cortex Agents?

Hasta 2024, hacer un agente sobre datos corporativos implicaba juntar LangChain, un vector store, un orquestador, observabilidad propia y rezar para que el equipo de seguridad lo aprobara. Cortex Agents, en GA desde el 4 de noviembre de 2025, elimina la mayor parte de ese pegamento.

El patrón típico que estamos viendo en nuestros clientes es:

  1. Un usuario de negocio pregunta en lenguaje natural a Snowflake Intelligence.
  2. El agente decide si consultar Cortex Analyst (datos estructurados) o Cortex Search (documentos).
  3. Razonamiento multi-paso, eventualmente combinando varias fuentes.
  4. Respuesta auditada y trazable bajo el modelo de governance de Snowflake (RBAC, masking, lineage).

Lo importante no es la magia de la respuesta, sino que el agente nunca opera fuera del perímetro de governance. Esto es lo que diferencia un Cortex Agent de un chatbot con RAG montado sobre Pinecone: lineage, audit y políticas de acceso ya están aplicadas.

¿Cuándo NO usar Snowflake Cortex AI?

Por honestidad consultiva: Cortex AI no es la respuesta a todo. Tres escenarios donde sigue ganando otra opción:

  • Fine-tuning intensivo y entrenamiento propio de modelos: Databricks sigue siendo más maduro para MLOps puro y entrenamiento end-to-end. Hablamos de esto en detalle al comparar Dataiku, Databricks y Snowflake.
  • Costes de inferencia muy altos con volumen masivo y latencia subsegundo: ahí conviene benchmark contra Bedrock o Azure OpenAI con caching propio.
  • Modelos open-source muy específicos que no están en el catálogo: aunque Cortex permite traer modelos vía Snowflake ML, la fricción es mayor que en un endpoint de Hugging Face en Databricks.

¿Cómo encajar Cortex AI en una arquitectura existente?

Para equipos que ya tienen Snowflake como warehouse, el ROI de probar Cortex AI es altísimo porque no hay datos que mover ni networking que abrir. La recomendación práctica que damos a nuestros clientes es empezar por dos casos de uso de bajo riesgo y alto impacto:

  • Clasificación o enriquecimiento de campos de texto libre (tickets, reseñas, notas de CRM) con AI_CLASSIFY o AI_COMPLETE.
  • Un “ask your data” interno con Cortex Analyst sobre un modelo semántico controlado por el equipo de datos, no abierto a todo el catálogo.

Después se evoluciona hacia agentes con responsabilidades concretas (no agentes “que lo hagan todo”). Si quieres entender cómo encaja esto en un plan más amplio, revisa nuestro roadmap de 90 días para una AI-Ready Foundation.

Conclusión

Snowflake Cortex AI no es un wrapper sobre OpenAI: es una apuesta arquitectónica por traer la IA al dato governado en lugar de mover el dato a la IA. Con GPT-5.2, Claude y Llama disponibles vía SQL, agentes en GA y mejoras de 30-70% en performance sobre cargas AISQL, hoy es la opción más natural para empresas que ya viven en Snowflake y quieren capturar valor de IA sin reescribir su stack.

Si estás evaluando cómo aprovechar Cortex AI sobre tu Snowflake actual, en EGOS BI ayudamos a diseñar el plan de adopción, los modelos semánticos y los primeros agentes en producción. Hablemos sobre tu AI-Ready Foundation.

¿Te resultó útil?

Agenda una discovery call de 30 minutos para hablar de cómo aplicar esto en tu organización.

Agenda discovery call

¿Qué tan AI-ready
está tu data hoy?

Agenda una sesión de 30 minutos con uno de nuestros consultores senior. Salimos con un diagnóstico inicial y un siguiente paso claro.