Ollama en WhatsApp gratis — Bot de IA local en 5 min (2026)

Novedades de junio de 2026

OpenClaw Easy 2026.5.29 (junio de 2026) llega con detección automática nativa de Ollama — una vez que Ollama está corriendo, el selector de Proveedor de IA lista todos los modelos instalados (Llama 3.2, Qwen 2.5, DeepSeek R1, Mistral) sin ninguna configuración. Las capturas de abajo ya reflejan la nueva interfaz. También añadimos: una sección sobre cómo ejecutar DeepSeek R1 destilado 7B, el punto dulce en Macs con Apple Silicon. Descarga el último instalador firmado →

Los modelos de IA en la nube como ChatGPT y Claude son potentes, pero tienen una contrapartida: tus mensajes salen de tu máquina y viajan a un servidor de terceros. Para muchos usuarios, eso es un dealbreaker. ¿Y si pudieras ejecutar un LLM local en WhatsApp donde nada sale nunca de tu computadora?

Con Ollama y OpenClaw Easy, puedes. En este tutorial vas a instalar un modelo de IA local en tu máquina, conectarlo a WhatsApp y tener un chatbot de IA totalmente privado funcionando en unos 15 minutos. Sin API keys. Sin dependencia de la nube. Sin fugas de datos.

OpenClaw Easy con Ollama configurado como proveedor de IA y WhatsApp conectado

Lo que vas a necesitar

Una computadora con macOS o Windows y al menos 8 GB de RAM (16 GB o más recomendado para modelos grandes).
Ollama -- una herramienta gratis y open source para ejecutar LLMs locales. Disponible en ollama.com.
OpenClaw Easy -- la app de escritorio gratis que conecta tu modelo local a WhatsApp.
WhatsApp en tu teléfono.
15 minutos -- la mayor parte es la descarga del modelo.

¿Por qué ejecutar un LLM local en WhatsApp?

Hay varias razones de peso para ejecutar un modelo local en vez de una API en la nube:

Privacidad total -- tus mensajes, prompts y respuestas de la IA nunca salen de tu máquina. Ni siquiera a un proveedor de API.
Costo cero -- sin tarifas de API, sin cargos por tokens, sin suscripción. Una vez descargado el modelo, funciona gratis.
Funciona offline -- tu IA funciona incluso sin conexión a internet (WhatsApp todavía necesita internet, pero la inferencia de la IA es local).
Soberanía de datos -- para empresas, salud, derecho y otros sectores sensibles, mantener los datos en local no es opcional -- es un requisito.
Sin límites de uso -- las APIs en la nube tienen límites y topes de uso. Un modelo local no tiene esas restricciones.

Paso a paso: conecta un LLM local a WhatsApp

1 Instala Ollama

Ollama es la forma más fácil de ejecutar LLMs open source localmente. Descárgalo desde ollama.com.

macOS -- descarga el .dmg y arrástralo a Aplicaciones.
Windows -- descarga el instalador .exe y ejecútalo.

Después de la instalación, Ollama corre como servicio en segundo plano en tu máquina. Sirve modelos a través de una API local en http://localhost:11434.

2 Descarga un modelo

Abre una terminal (Terminal en macOS, Símbolo del sistema o PowerShell en Windows) y descarga un modelo. Estas son algunas opciones populares:

ollama pull llama3.2

O para otros modelos:

ollama pull qwen2.5
ollama pull deepseek-r1
ollama pull mistral
ollama pull phi3

El tamaño de la descarga varía según el modelo. Llama 3.2 (8B) ocupa unos 4.7 GB. Modelos más pequeños como Phi-3 pesan unos 2.3 GB. Modelos grandes como Qwen 2.5 (72B) ocupan 40+ GB y requieren hardware potente.

Tip: Empieza con llama3.2 o qwen2.5:7b para un buen equilibrio entre calidad y velocidad. Siempre puedes probar modelos más grandes después.

3 Verifica que Ollama está corriendo

Una vez descargado el modelo, verifica que Ollama lo está sirviendo correctamente:

ollama list

Deberías ver el modelo descargado en la lista. También puedes probarlo directamente:

ollama run llama3.2 "Hola, ¿quién eres?"

Si obtienes una respuesta de la IA, Ollama está funcionando y listo para conectarse a OpenClaw Easy.

4 Descarga y abre OpenClaw Easy

Entra a la página de descarga de OpenClaw Easy e instala la app para macOS o Windows. Ábrela cuando esté instalada.

5 Configura Ollama como tu proveedor de IA

En OpenClaw Easy:

Ve a Proveedor de IA en la barra lateral.
Selecciona LLM Local (u Ollama, según la versión de tu app).
Configura el endpoint en http://localhost:11434 (esta es la dirección por defecto de Ollama).

OpenClaw Easy detectará automáticamente qué modelos tienes disponibles a través de Ollama.

Ajustes de Proveedor de IA con LLM Local seleccionado y endpoint de Ollama configurado

6 Selecciona tu modelo

Ve a Configuración del Agente en la barra lateral. En el desplegable de modelo verás todos los modelos de Ollama que descargaste. Selecciona el que quieras usar -- por ejemplo, llama3.2.

Configuración del Agente con llama3.2 seleccionado en el desplegable de modelo

7 Conecta WhatsApp

Ahora conecta WhatsApp:

Ve a Canales en la barra lateral.
Haz clic en WhatsApp.
Escanea el código QR con tu teléfono (WhatsApp > Ajustes > Dispositivos vinculados > Vincular un dispositivo).

Tu LLM local ya está activo en WhatsApp. Envía un mensaje y la IA responderá -- todo procesado completamente en tu máquina.

Conversación de WhatsApp con una respuesta de IA procesada localmente

Elegir el modelo local adecuado

No todos los modelos son iguales. Aquí hay una comparativa de modelos populares que puedes ejecutar con Ollama, junto con sus puntos fuertes y requisitos de hardware:

Modelo	Tamaño	RAM mínima	Ideal para
Llama 3.2 (8B)	4.7 GB	8 GB	Chat general, preguntas y respuestas, balance velocidad/calidad
Qwen 2.5 (7B)	4.4 GB	8 GB	Multilingüe, programación, razonamiento
DeepSeek-R1 (7B)	4.7 GB	8 GB	Razonamiento, matemáticas, lógica
Mistral (7B)	4.1 GB	8 GB	Respuestas rápidas, conocimiento general
Phi-3 (3.8B)	2.3 GB	4 GB	Ligero, equipos con recursos limitados
Llama 3.1 (70B)	40 GB	48 GB	Calidad cercana a la nube, requiere hardware potente

Tip: Si tienes una Mac con Apple Silicon (M1/M2/M3/M4), obtienes un rendimiento excelente para inferencia local. La arquitectura de memoria unificada hace que incluso máquinas con 8 GB puedan ejecutar modelos 7B sin problema. En Windows, contar con una GPU dedicada (NVIDIA con CUDA) mejora bastante la velocidad.

Tips de rendimiento para LLMs locales en WhatsApp

Ejecutar un modelo local en WhatsApp es distinto a usar una API en la nube. Aquí tienes algunos consejos para sacarle el máximo provecho:

Mantén las respuestas cortas

Los modelos locales generan texto más despacio que las APIs en la nube. Configura una longitud máxima razonable para las respuestas en la Configuración del Agente de OpenClaw Easy. Para conversaciones de WhatsApp, 150-300 tokens suele ser ideal -- suficiente para dar una respuesta útil y rápido para sentirse natural.

Usa un modelo más pequeño si la velocidad importa

Un modelo 7B en una MacBook Air M2 genera unos 20-30 tokens por segundo. Eso significa que una respuesta de 100 palabras toma unos 2-3 segundos. Si te parece muy lento, prueba un modelo más pequeño como Phi-3 (3.8B), que corre casi al doble de velocidad en el mismo hardware.

Cierra aplicaciones pesadas

La inferencia local consume bastante CPU y RAM. Si ejecutas aplicaciones pesadas junto con Ollama, puedes notar respuestas más lentas. Para el mejor rendimiento, mantén las apps en segundo plano al mínimo mientras el bot de IA esté activo.

Usa modelos cuantizados

Los modelos de Ollama ya están cuantizados (comprimidos) por defecto, pero puedes elegir distintos niveles de cuantización. La cuantización Q4 por defecto ofrece un buen equilibrio. Si quieres mayor calidad y tienes la RAM, prueba las variantes Q8.

LLM local vs. API en la nube: cuándo usar cada uno

Ejecutar un modelo local no siempre es la mejor opción. Esto es cuándo elegir local o nube:

Usa un LLM local cuando:

La privacidad es un requisito estricto (conversaciones médicas, legales, financieras).
Quieres costos cero después del setup.
Necesitas funcionar offline.
Estás experimentando con modelos open source.
Tienes hardware decente (8 GB+ RAM, idealmente Apple Silicon o GPU NVIDIA).

Usa una API en la nube cuando:

La calidad de la respuesta es lo más importante (ChatGPT y Claude siguen superando a la mayoría de modelos locales).
La velocidad importa -- las APIs en la nube responden en menos de un segundo para la mayoría de consultas.
Tu hardware es limitado (laptop vieja, poca RAM).
Necesitas los modelos más recientes y grandes (100B+ parámetros).

La buena noticia es que OpenClaw Easy admite ambos. Puedes empezar con un modelo local y cambiar a una API en la nube (o al revés) en cualquier momento, sin volver a conectar WhatsApp.

Preguntas frecuentes

¿Puedo usar varios modelos al mismo tiempo?

Ollama puede servir varios modelos, pero OpenClaw Easy usa un modelo por configuración de agente. Puedes cambiar de modelo en la Configuración del Agente cuando quieras -- el cambio surte efecto de inmediato.

¿Ollama usa mi GPU?

Sí, cuando está disponible. En macOS con Apple Silicon, Ollama usa la GPU unificada automáticamente. En Windows y Linux, usa GPUs NVIDIA vía CUDA. La inferencia solo con CPU funciona, pero es bastante más lenta para modelos grandes.

¿Cuánto espacio en disco necesito?

Depende del modelo. Un solo modelo 7B ocupa unos 4-5 GB de disco. Puedes descargar varios modelos y alternar entre ellos. Si tienes poco espacio, quédate con un solo modelo a la vez.

¿Puedo usarlo con Telegram o Discord también?

Por supuesto. Una vez que Ollama está configurado como tu proveedor de IA en OpenClaw Easy, funciona con todos los canales -- WhatsApp, Telegram, Discord, Slack y más. El proveedor de IA es independiente del canal de mensajería.

¿Qué pasa si mi computadora entra en reposo?

Tanto Ollama como OpenClaw Easy se pausarán cuando tu computadora entre en reposo. Los mensajes enviados durante el reposo se procesarán cuando la computadora despierte. Para mantener el bot funcionando 24/7, evita que tu máquina entre en reposo (ajusta la configuración de energía).

¿Qué sigue?

Ya tienes un chatbot de IA totalmente privado y local funcionando en WhatsApp. Esto es lo que puedes explorar a continuación:

Prueba modelos distintos -- descarga Qwen, DeepSeek o Mistral y compara la calidad de las respuestas.
Conecta más canales -- añade tu IA local a Telegram, Discord o Slack.
Programa tareas de IA -- configura cron jobs para enviar mensajes automatizados con IA en horarios programados.
Lee más sobre privacidad -- aprende por qué la IA local-first importa.
Prueba la app de IA de escritorio -- explora las mejores apps de IA de escritorio gratuitas de 2026.

Ejecutar un LLM local en WhatsApp antes requería código personalizado, servidores y conocimientos técnicos profundos. Con Ollama y OpenClaw Easy, toma 15 minutos. Descarga OpenClaw Easy gratis y pruébalo ahora mismo.

Cómo ejecutar un LLM local en WhatsApp con Ollama