DeepSeek en empresas: soberanía del dato, riesgo real y por qué el autoalojamiento es la respuesta sensata

Por Javier

El coste de la IA empieza a pesar… y ahí aparece DeepSeek

Xataka recoge algo que muchos ya intuían: el gasto en APIs de IA generativa a escala está empezando a doler, y algunas empresas estadounidenses están mirando a DeepSeek como alternativa económicamente competitiva. No es irracional: DeepSeek R1 y sus variantes son modelos con rendimiento comparable a GPT-4o en muchos benchmarks publicados, y con un coste de inferencia significativamente menor. El problema no es el modelo. El problema es dónde corre y quién lo opera.

Qué implica realmente usar la API de DeepSeek

Cuando una empresa usa la API cloud de DeepSeek, los datos del prompt y la respuesta transitan por infraestructura de DeepSeek AI (empresa china, con sede en Hangzhou). Esto activa varios vectores de riesgo que cualquier responsable de seguridad o compliance debe evaluar:

Legislación china de seguridad nacional (2017): obliga a empresas chinas a cooperar con los servicios de inteligencia del estado si se lo solicitan. No hay SLA que lo mitigue.
GDPR / LOPDGPD: si los prompts contienen datos personales de ciudadanos europeos, la transferencia a un subencargado en China requiere mecanismos adecuados (cláusulas contractuales tipo, BCR…). La mayoría de empresas no los habrán formalizado.
Confidencialidad corporativa: propiedades industriales, código fuente, estrategias comerciales que viajan en prompts son datos que salen del perímetro sin cifrado end-to-end auditable.

No es alarmismo: es gestión de riesgo básica. El mismo análisis aplica, con matices distintos, a cualquier proveedor cloud extranjero. Pero el contexto geopolítico actual añade una dimensión que los CISO no pueden ignorar.

La alternativa que ya existe: autoalojar DeepSeek

Lo que muchos no saben —o no han evaluado todavía— es que los pesos de DeepSeek R1 (y sus variantes destiladas) están disponibles en abierto bajo licencia MIT. Eso significa que puedes correr el modelo en tu propia infraestructura, sin que un solo token salga de tu red.

Las opciones prácticas según el hardware disponible:

Homelab / Proxmox con GPU NVIDIA: Ollama + DeepSeek-R1:7b o 14b corre bien en una RTX 3090/4090 con 24 GB VRAM. Para el modelo 70B necesitas multi-GPU o quantización agresiva (Q4_K_M en llama.cpp).
Servidor empresarial sin GPU: llama.cpp con inferencia CPU es lento pero funciona para cargas no interactivas. Un Xeon reciente con AVX-512 y suficiente RAM (64-128 GB para el 70B quantizado) es viable.
Cloud privado / VPC: despliegue en instancias GPU (AWS g5, Azure NC) dentro de tu propia cuenta, sin salir a APIs de terceros.

El stack más limpio hoy: Ollama para gestión de modelos + Open WebUI como interfaz + modelo DeepSeek-R1 según tu VRAM disponible. Todo docker-composable en menos de 30 minutos.

¿Qué hacer si ya estás evaluando DeepSeek en tu empresa?

Primero, separa la tecnología del servicio: el modelo es bueno; la API cloud de DeepSeek puede no ser apropiada según tu contexto regulatorio. Segundo, si el caso de uso cabe en hardware razonable (modelos hasta 32B), el autoalojamiento elimina el riesgo de soberanía del dato y suele amortizarse rápido frente al coste de API a escala. Tercero, si necesitas el 671B completo y no tienes infraestructura para ello, evalúa proveedores cloud occidentales que sirvan DeepSeek vía sus propias APIs (Together.ai, Fireworks, Groq), donde las condiciones de procesamiento de datos son más auditables.

La conclusión no es «no uses DeepSeek». Es «elige bien cómo lo usas».

Fuentes

Xataka