Cómo instalar modelos de inteligencia artificial en local paso a paso

Introducción

La inteligencia artificial (IA) ha revolucionado múltiples sectores, desde la salud y las finanzas hasta el desarrollo de software y la automatización de procesos. Hoy en día, poder ejecutar modelos de IA de manera local ofrece múltiples ventajas, como mayor privacidad, menor latencia y un control total sobre los datos y la infraestructura. En este artículo técnico y detallado, te mostraremos paso a paso cómo instalar y correr modelos de IA open source en tu equipo, cómo probarlos con Python y n8n, y cómo exponerlos para acceder desde cualquier lugar. Apostamos a que al finalizar esta guía, tendrás el conocimiento necesario para crear tu propio mini servidor de IA local utilizando herramientas modernas como Ollama.

¿Por qué instalar modelos de inteligencia artificial en local?

Ejecutar modelos de IA en local brinda varias ventajas clave:

Privacidad y seguridad: Los datos nunca salen de tu computadora.
Control total: Configura modelos y servidores según tus necesidades específicas.
Eficiencia en pruebas y desarrollo: Menos dependencia de proveedores externos y costos asociados.
Reducción de latencia: Respuestas más rápidas al tener todo alojado localmente.

Sin embargo, correr modelos de IA locales exige recursos computacionales adecuados y cierta experiencia técnica para la instalación y configuración.

Herramientas esenciales para instalar modelos de IA localmente

Una de las herramientas más accesibles y eficientes actualmente para montar modelos de IA en local es Ollama. Esta plataforma permite descargar, instalar y ejecutar modelos de IA open source como si fueran mini servidores locales en tu PC.

Otros recursos clave para probar e integrar estos modelos incluyen Python (con librerías especializadas como llama-index o langchain) y plataformas de automatización como n8n.

Resumen de herramientas

Herramienta	Función	Requerimientos	Uso recomendado
Ollama	Descarga y ejecución de modelos IA open source	Windows, Linux, Mac; Recursos adecuados dependiendo del modelo	Experimentos y entorno local para pruebas de modelos
Python + Librerías IA	Pruebas y conexión programática con modelos	Python 3.11.5 o superior; Visual Studio Code para desarrollo	Integración de modelos en proyectos software, automatizaciones
n8n	Automatización y conexión con modelos IA sin codificación	Instalación local o en servidor (cloud), conexión a Ollama	Probar y automatizar flujos de trabajo con IA
Ngrok / rrock	Exposición segura de servidores locales a Internet	Cuenta gratuita o paga; ejecutar en PC local	Acceso remoto a modelos alojados en PC propia

Preparación previa: Requisitos técnicos y recomendaciones

Antes de comenzar la instalación, ten en cuenta los siguientes aspectos:

Recursos de hardware: Para un funcionamiento óptimo, se recomienda contar con una computadora con al menos 16 GB de RAM y una tarjeta gráfica dedicada con soporte para cargas de IA. Modelos con mayor número de parámetros (más de 7 billones) requieren GPUs potentes y almacenamiento rápido.
Sistema operativo: Ollama es compatible con Windows, Linux y Mac, facilitando la instalación en diferentes entornos.
Instalación de Python: Para las pruebas mediante código, instala Python 3.11.5 o superior y un editor como Visual Studio Code.

Consejo práctico: Empieza probando modelos con menor cantidad de parámetros (por ejemplo, 1.5 billones) para evaluar el rendimiento de tu PC antes de escalar a modelos más complejos.

Instalación de Ollama para ejecutar modelos IA en local

Descarga e instalación

La instalación de Ollama es intuitiva y rápida. Sigue estos pasos:

Accede al sitio oficial https://ollama.com/.
Dirígete a la sección de Descargar.
Selecciona el instalador acorde a tu sistema operativo: Windows, Linux o Mac.
Ejecuta el archivo descargado y sigue las instrucciones en pantalla. En Windows y Mac es un procedimiento gráfico. En Linux deberás usar comandos en terminal.
Una vez instalado, deberías ver el ícono de Ollama (una llamita) en la bandeja del sistema, indicando que el servidor local está activo.

Nota: Si después de reiniciar no ves el ícono de Ollama, ejecuta el programa manualmente para que inicie el servicio local.

Primeros comandos con Ollama

Con Ollama instalado, puedes comenzar a controlar modelos de IA. Para ello, abre la terminal (PowerShell en Windows, Terminal en Mac/Linux) e ingresa:

ollama models — lista los modelos disponibles para descargar.
ollama run [modelo] — ejecuta un modelo específico.

Descargar e instalar modelos IA con Ollama

Elección y características de los modelos

Ollama ofrece una gran variedad de modelos, desde versiones de LLaMA (por ejemplo, llama 3 y llama f4) hasta DeepSeek R1. Cada modelo tiene características particulares de tamaño y capacidad.

Para ejemplificar, el modelo DeepSeek R1 1.5B es una opción ideal para comenzar debido a su balance entre rendimiento y requerimientos de recursos.

Proceso de instalación

En la terminal, escribe el comando para instalar el modelo: ollama pull deepseek-r1:1.5b.
Espera que Ollama complete la descarga e instalación. El tamaño puede variar, desde 1 GB hasta cientos de GBs para modelos más grandes.
Una vez completado, puedes iniciar el modelo con: ollama run deepseek-r1:1.5b.

Advertencia: Evita descargar modelos de más de 10 billones de parámetros si tu equipo no es un servidor con GPUs potentes, para prevenir bloqueos o errores.

Probar modelos en local desde consola

Una vez que el modelo está corriendo, puedes interactuar con él directamente en la terminal:

Escribe tu consulta o prompt y presiona Enter.
El modelo generará la respuesta luego de unos segundos o minutos, dependiendo de la complejidad.
Para finalizar la sesión, escribe bye.

Este método es práctico para pruebas básicas rápidas antes de integrarlo a otros entornos.

Integración con Python para desarrollo avanzado

Preparar el entorno Python

Para conectar y usar los modelos instalados con Ollama desde Python debes:

Instalar Python 3.11.5 o superior desde el sitio oficial.
Configurar un entorno virtual (opcional pero recomendado) para mantener organizadas las dependencias.
Instalar la librería de comunicación con Ollama, por ejemplo llama-index o langchain, según el caso.

Ejemplo básico de código Python

El siguiente código ilustra cómo enviar una consulta a un modelo local y recibir respuesta:

 from ollama import Ollama ollama = Ollama() respuesta = ollama.query("deepseek-r1:1.5b", "¿Cuántos minutos han pasado desde el 3 de enero de 2024 hasta hoy?") print(respuesta)

Este script conecta con tu servidor Ollama en local y procesa la petición sin salir de tu entorno Python, ideal para integrar IA en aplicaciones personalizadas.

Automatización con n8n: la IA sin necesidad de programar

¿Qué es n8n?

n8n es una plataforma open source de automatización visual que permite crear flujos conectando diferentes sistemas y servicios. Integrar modelos de IA en n8n te permite construir agentes inteligentes sin escribir código.

Configuración básica para n8n local

Instala n8n en tu computadora o servidor. Puedes seguir la documentación oficial para instalación local o en la nube.
En n8n, agrega una nueva credencial Ollama con la URL http://localhost:11434, que es el puerto por defecto donde Ollama escucha.
Crea un flujo que utilice el nodo de agentes IA conectándolo a Ollama y configura el modelo deseado.
Ejecuta el flujo para enviar prompts y recibir respuestas del modelo local.

Esta configuración es excelente para usuarios menos técnicos que quieran experimentar con IA en sus procesos.

Exponer tu servidor Ollama a Internet con ngrok o rrock

¿Por qué exponer el servidor local a Internet?

Cuando n8n o tus aplicaciones Python corren en servidores externos y quieres usar un modelo IA alojado en tu computadora local, necesitas que el servidor Ollama sea accesible remotamente de forma segura. Para ello, puedes usar ngrok o rrock, servicios que crean túneles seguros al puerto local.

Pasos para exponer el servidor local

Descarga e instala ngrok desde su web oficial.
Ejecuta el comando para tunelizar el puerto donde está Ollama:

 ngrok http 11434 --domain TUDOMINIO_PERSONALIZADO --host-header="localhost:11434"

Ngrok generará una URL pública, que debes usar para configurar las credenciales Ollama en n8n o Python remoto.
Para rrock, el proceso es similar: ejecutas un comando que crea un túnel y obtienes un enlace externo.

Así, tus aplicaciones externas pueden comunicarse con el modelo local sin complicaciones ni necesidad de abrir puertos en routers.

Ejemplo de conexión remota en Python

 base_url = "ENLACE_GENERADO_POR_NGROK_O_RROCK" # Ejemplo: https://dashing-wolf-4abcdef.ngrok.io ollama = Ollama(base_url=base_url) respuesta = ollama.query("deepseek-r1:1.5b", "Tu pregunta aquí") print(respuesta)

Buenas prácticas y consejos para manejar modelos locales

Prueba modelos ligeros primero: Evalúa tu hardware y comienza con modelos pequeños antes de escalar.
Maneja adecuadamente la memoria: Activa modos de baja memoria (low VRAM) si tu GPU tiene poca capacidad.
Monitorea recursos del sistema: Mantén un control de CPU, RAM y GPU mientras ejecutas modelos para evitar cuelgues.
Actualiza Ollama y modelos: Frecuentemente se liberan mejoras y correcciones que optimizan rendimiento y funcionalidades.
Documenta tus configuraciones: Esto facilita replicar y escalar instalaciones futuras.

Para complementar esta guía, te invitamos a ver este video donde se muestra de forma visual y práctica cómo instalar y usar modelos IA locales con Ollama y Python.

Glosario y palabras clave relacionadas

Ollama

Es la plataforma utilizada para gestionar, descargar y ejecutar modelos de IA open source localmente. Facilita la interacción con modelos como si fueran servidores propios, simplificando la instalación y administración.

Modelos de IA locales

Se refiere a modelos de inteligencia artificial ejecutados en la máquina del usuario en lugar de la nube. Permiten mayor privacidad, control y personalización, aunque requieren hardware potente y conocimiento técnico para su óptima gestión.

Python

Lenguaje de programación popular para la integración y uso de modelos de IA. Con sus librerías especializadas, permite conectar modelos locales y automatizar procesos de manera sofisticada y eficiente.

n8n

Plataforma visual para automatización de flujos de trabajo que permite interactuar con modelos de IA sin escribir código, ideal para usuarios que buscan integración ágil y sencilla.

Ngrok / rrock

Herramientas que crean túneles seguros para exponer servidores locales a internet, esenciales para el acceso remoto a modelos ejecutándose en tu PC propia.

Preguntas frecuentes (FAQ)

¿Cómo implementar la inteligencia artificial en mi negocio?

La implementación efectiva de IA en un negocio requiere una planificación estratégica en seis pasos:

Identificar necesidades y objetivos: Define qué procesos deseas optimizar o automatizar con IA.
Evaluar infraestructura: Analiza los recursos tecnológicos e humanos disponibles.
Seleccionar el tipo de IA y modelos adecuados: Elige modelos que se adaptan a tus necesidades y presupuesto.
Implementación piloto: Empieza con pruebas en pequeña escala para medir resultados.
Integración progresiva: Escala la IA a otras áreas y procesos.
Medición y optimización continua: Monitorea el rendimiento y ajusta según resultados.

En Código6 ofrecemos asesoría especializada para acompañarte en este proceso, facilitando la incorporación de IA con éxito.

¿Qué son los modelos de IA locales?

Los modelos de IA locales son aquellos que se ejecutan directamente en dispositivos como computadoras personales o servidores internos, sin depender de la nube. Esto permite:

Procesar datos de manera privada y segura.
Reducir latencia y costos asociados al uso de la nube.
Tener mayor control sobre la configuración y personalización del modelo.

Estos modelos son ideales para empresas con políticas estrictas de seguridad o para desarrolladores que desean experimentar sin depender de servicios externos.

¿Qué es la IA local?

La IA local se refiere a la práctica de procesar y ejecutar modelos de inteligencia artificial en dispositivos locales, lo que incluye ordenadores, servidores de edge computing o dispositivos embebidos. Esto contrasta con la IA basada en la nube, y ofrece beneficios como:

Menor dependencia de conexión constante a Internet.
Mayor control y personalización.
Protección de datos sensibles al no salir del entorno local.

Sin embargo, exige una mayor inversión en hardware y conocimientos técnicos para su implementación y mantenimiento.

¿Qué hago si la instalación de Ollama falla?

Verifica que tu sistema operativo sea compatible y que cuentes con los permisos necesarios para instalación. En Windows, ejecuta el instalador como administrador. Verifica también que no haya bloqueos por antivirus o firewall.

Si el problema persiste, revisa la documentación oficial o consulta en la comunidad técnica para obtener soporte específico.

¿Cómo elegir el modelo adecuado para mi equipo?

La clave es balancear el tamaño del modelo con los recursos de hardware disponibles:

Equipos básicos: modelos con menos de 2 billones de parámetros.
Equipos medianos con GPU moderna: hasta 7 billones de parámetros.
Servidores especializados: modelos mayores a 10 billones.

Prueba desde modelos más pequeños para validar rendimiento y luego escala si tu equipo lo soporta.

¿Puedo usar Ollama sin conexión a Internet?

Sí, una vez que hayas descargado y instalado los modelos en tu PC, Ollama puede funcionar completamente offline. Sin embargo, necesitarás conexión para descargar los modelos inicialmente.

¿Cómo solucionar problemas de memoria insuficiente?

Reduce la carga en tu GPU activando modos de baja VRAM si el modelo o Ollama lo permite, o usa modelos más pequeños. También puedes aumentar la memoria virtual de tu sistema operativo, aunque esto no sustituye una buena GPU.

¿Cómo se integra Ollama con n8n en un servidor externo?

Se debe exponer el servidor Ollama local a Internet utilizando ngrok o rrock para generar una URL pública. Esta URL se configura en n8n mediante las credenciales Ollama para que pueda acceder y utilizar los modelos alojados en tu PC.

Conclusión

Ejecutar modelos de inteligencia artificial open source en local es una estrategia potente para quienes buscan privacidad, control y autonomía en el uso de IA. Con herramientas como Ollama, junto a entornos de desarrollo como Python y plataformas de automatización como n8n, es posible crear un entorno robusto para pruebas, desarrollo y prototipado de soluciones inteligentes.

Recuerda siempre empezar con modelos de parámetros moderados, evaluar el rendimiento y adaptar la configuración a las capacidades de tu hardware. Aprovecha además servicios como ngrok para escalar tus proyectos y hacerlos accesibles a otros sistemas o colaboradores.

¿Buscás implementar este tipo de soluciones en tu empresa? En Código6 podemos ayudarte. Somos especialistas en automatización, inteligencia artificial y transformación digital. Contactanos para comenzar tu proyecto hoy.

Cómo instalar y usar Deepseek IA gratis paso a paso útil y fácil

Herramientas de marketing digital ¿realmente valen la pena?

Cómo instalar Visual Studio Code en Ubuntu paso a paso seguro