Potato OS: LLM local en tu Raspberry Pi 5

¿El blog te ha sido útil?Puedes invitarme a un café en Ko-fi. Sin suscripciones, sin compromisos.

Hay una expresión que se repite en cada foro y cada canal de tecnología desde hace dos años: IA local. La idea es sencilla: ejecutar modelos de lenguaje en tu propio hardware, sin mandar nada a ningún servidor externo. Esto interesa especialmente a quienes trastean con electrónica a medida y sistemas embebidos: tener un modelo ligero corriendo en local encaja bien en flujos de automatización, edge AI o incluso prototipado de PCB, sin pasar por la nube. El problema es que montar ese entorno implica instalar dependencias, configurar backends, gestionar archivos de modelo y pelearte con configuraciones que cambian cada mes. Nada de eso suena especialmente divertido.

Potato OS llega con una propuesta más directa. Es una imagen para grabar en una microSD. Convierte una Raspberry Pi 5 en un servidor de LLM local accesible desde el navegador. Además, trae SSH habilitado de serie y una API compatible con el estilo de OpenAI. Flash → arranque → chat. Sin más pasos intermedios.

Qué es Potato OS

Potato OS es una distribución basada en Debian GNU/Linux 13 (Trixie) construida específicamente para ejecutar modelos de lenguaje locales en Raspberry Pi. No es un proyecto oficial de la Fundación Raspberry Pi. Es un proyecto de código abierto que puedes encontrar en GitHub bajo el repositorio potato-os/core. La versión actual — la 0.7.0, catalogada como «lite» — soporta Raspberry Pi 5 y Raspberry Pi 4 Model B de 8 GB.

Internamente usa ik_llama, un fork de llama.cpp con optimizaciones específicas para el procesador de la Pi 5. El modelo que descarga por defecto en el primer arranque es Qwen3.5-2B-Q4_K_M.gguf, un archivo de 1,28 GB en formato GGUF. Este formato es el estándar habitual para distribuir modelos cuantizados listos para ejecutar en hardware con memoria limitada. Además, expone una API con los endpoints /v1/chat/completions y /v1/models. Así, cualquier herramienta que hable con OpenAI puede apuntar a la Pi sin modificar el cliente.

El sistema operativo base es Debian Trixie con el kernel 6.12.75+rpt-rpi-2712, el mismo árbol que usa Raspberry Pi OS en su rama Trixie. También activa ZRAM de serie, con 2,15 GB de espacio de intercambio comprimido que el panel de la interfaz muestra en tiempo real.

Qué necesitas antes de empezar

La lista de materiales es corta. Necesitas una Raspberry Pi 5 (o una Pi 4 Model B de 8 GB, el único modelo de la serie 4 compatible), una tarjeta microSD de al menos 16 GB, la fuente de alimentación correspondiente y las credenciales de tu red Wi-Fi. El proceso completo es headless: no hace falta conectar monitor ni teclado en ningún momento.

Raspberry Pi 5 – 4GB RAM

Ver precio en Amazon →

Raspberry Pi 5 – 8GB RAM

Ver precio en Amazon →

También necesitas el Raspberry Pi Imager en su versión 2.0.7 o superior. Las pruebas de este artículo se hicieron con esa versión. Es también la que gestiona el catálogo ampliado de sistemas operativos disponible desde finales de 2025.

Añadir el repositorio de Potato OS al Imager

El primer paso no es seleccionar la Pi ni el sistema operativo — es añadir el repositorio de Potato OS para que aparezca en el catálogo. Abre el Imager y, antes de tocar nada más, pulsa el botón OPCIONES DE LA… en la esquina inferior izquierda.

Se abre un diálogo con preferencias generales: sonido al finalizar, expulsión automática del soporte, telemetría anónima. Ahí, localiza la fila Repositorio de contenidos y pulsa EDITAR.

Aparece un selector con tres opciones: el repositorio oficial de Raspberry Pi, un archivo local o una URL personalizada. Elige Usar URL personalizada e introduce esta dirección:

https://github.com/potato-os/core/releases/download/stable/potato-lite.rpi-imager-manifest

Pulsa APLICAR Y REINICIAR. El Imager descarga el manifiesto desde GitHub y se recarga. A partir de aquí el flujo es el habitual, aunque con el catálogo filtrado.

Seleccionar dispositivo, SO y almacenamiento

Tras la recarga, en la selección de dispositivo solo aparecen dos opciones: Raspberry Pi 5 y Raspberry Pi 4 Model B (8 GB). El manifiesto de Potato OS solo declara soporte para estos dos modelos, así que el resto no aparece.

Selecciona tu modelo y avanza al paso de sistema operativo. Verás una única entrada: Potato OS v0.7.0 (lite) — Local AI, No Cloud, con 678,1 MB de descarga y publicada el 4 de abril de 2026. Selecciónala.

A continuación elige el soporte de almacenamiento. En las pruebas usé un lector de tarjetas externo con una SD de 256 GB. El Imager marca por defecto la opción Excluir unidades del sistema, que evita mostrar el disco interno del ordenador. Conveniente.

Personalización: hostname, usuario, Wi-Fi y SSH

Después de elegir el almacenamiento llega la pantalla de personalización, donde configuras todo lo necesario para el arranque headless. Son cuatro apartados, y conviene completarlos todos antes de continuar.

En Nombre del equipo introduce el nombre que quieras usar. En las pruebas usé potatopi, lo que hace accesible la interfaz en http://potatopi.lan gracias a mDNS. En Localización ajusta zona horaria y distribución del teclado — para España: Europe/Madrid y distribución es. En Usuario crea tu cuenta con nombre de usuario y contraseña. Por último, en Wi-Fi introduce las credenciales de tu red.

Pantalla de usuario con nombre introducido

En el apartado de Acceso remoto activa SSH con autenticación por contraseña. Sin este paso tendrías que conectar un monitor para acceder al sistema más adelante.

El resumen previo a la escritura confirma todas las elecciones: dispositivo Raspberry Pi 5, sistema operativo Potato OS v0.7.0 (lite), soporte de almacenamiento seleccionado y las cinco personalizaciones marcadas como aplicadas.

Pulsa ESCRIBIR. El Imager muestra un aviso de borrado permanente — confirma con LO ENTIENDO, BORRAR Y ESCRIBIR — y empieza el proceso. Unos minutos después aparece la pantalla de escritura completa y el soporte se expulsa automáticamente.

Primer arranque: descarga y carga del modelo

Extrae la tarjeta, introdúcela en la Raspberry Pi 5 y conecta la alimentación. En unos minutos la Pi se une a tu red Wi-Fi y queda accesible. Abre el navegador y ve a http://potatopi.lan (o la dirección IP que haya obtenido por DHCP).

La interfaz tiene dos zonas. La columna izquierda es el Pi Runtime: telemetría en tiempo real con potencia estimada, uso de CPU por núcleo, frecuencias de CPU y GPU, temperatura, throttling, memoria RAM y almacenamiento. La zona derecha es Potato Chat, el cliente de conversación, con un indicador de conexión en la esquina superior derecha.

En el primer arranque el estado muestra BOOTING | No active download y aparece un aviso: el modelo Qwen3.5-2B-Q4_K_M está pendiente de descarga. La descarga automática arranca sola si la Pi lleva unos minutos sin actividad. También puedes lanzarla manualmente con Start download now. El archivo pesa 1,28 GB, así que el tiempo depende de tu conexión.

Durante la descarga el estado cambia a DOWNLOADING y muestra el progreso en MB. La CPU y la GPU suben de frecuencia y el consumo eléctrico asciende hasta los 4 W. Si intentas chatear antes de que termine, el modelo todavía no está listo y la interfaz responde con Request failed (503).

Estado DOWNLOADING al 45% con error 503 en el chat

Después de la descarga el sistema carga el modelo en RAM. El estado pasa por BOOTING | Downloading vision encoder y luego por LOADING: ik_llama: 0% hasta quedar en READY. En ese momento el indicador cambia a verde: CONNECTED: ik_llama: Qwen3.5-2B-Q4_K_M.gguf.

Estado LOADING del modelo con indicador en proceso

Panel lateral mostrando OS Debian Trixie, kernel y modelo CONNECTED

Rendimiento, temperatura y límites reales

Con el modelo cargado, la primera respuesta llega en torno a 0,9 segundos (tiempo hasta el primer token). La velocidad de generación ronda los 6,20 tokens por segundo. En la práctica, un párrafo corto tarda entre cuatro y cinco segundos. Para conversación casual o preguntas técnicas breves es perfectamente usable.

Sin embargo, hay que hablar del calor. Bajo carga sostenida, la temperatura sube con rapidez. En las pruebas llegó a 84,5 °C con el Soft temp limit activo, que reduce las frecuencias para proteger la placa. En esa situación la CPU pasa de 2.400 MHz a frecuencias más bajas, y la GPU baja también. El consumo eléctrico, por su parte, sube desde los ~3 W en reposo hasta casi 11 W bajo inferencia máxima.

Como lo he estado probando sin ningún tipo de disipador ni ventilador se pone bastante caliente y hace Throttling. Incluso con disipador pasivo estándar y sin caja esto puede ser problemático en sesiones largas. Con el HAT de ventilador oficial la situación mejora considerablemente. El sistema también usa por defecto un perfil de memoria pi5-opt, visible en los ajustes avanzados del backend.

El panel Settings permite añadir otros modelos. Puedes introducir su URL en formato GGUF o subir un archivo directamente desde el ordenador. El modelo activo muestra tres etiquetas: Active, Ready y Vision. Eso confirma que Qwen3.5-2B también puede procesar imágenes adjuntas al chat.

SSH y uso con OpenCode

El acceso por SSH funciona desde el primer arranque con el usuario y contraseña configurados en el Imager:

ssh manuti@potatopi.lan

El banner de bienvenida confirma el kernel: Linux potato 6.12.75+rpt-rpi-2712 #1 SMP PREEMPT Debian 1:6.12.75-1+rpt1 (2026-03-11) aarch64. Desde la terminal puedes inspeccionar logs, ajustar la configuración o simplemente ver qué está pasando en el sistema.

Una vuelta de tuerca interesante es usar OpenCode — un agente de codificación en terminal — apuntando al modelo local de la Pi como backend. La instalación en Linux es un solo comando:

curl -fsSL https://opencode.ai/install | bash

Al arrancar OpenCode desde un directorio de proyecto detecta los modelos disponibles. En las pruebas aparece automáticamente la opción Potato OS local model · Potato OS (Pi 5). Esa opción usa la API local para todas las consultas. La primera respuesta tarda unos 4,9 segundos: algo más que en la interfaz web, porque hay latencia de red adicional y el overhead del agente. Aun así, funciona. Apuntar un agente de codificación a hardware propio sin depender de una API externa tiene su gracia.

OpenCode con "Build · Potato OS local model · Potato OS (Pi 5)"

OpenCode respondiendo "¡Hola! ¿En qué puedo ayudarte hoy?" en 4.9s

Potato OS reduce el tiempo entre «tengo una Pi 5» y «tengo un LLM funcionando» a menos de veinte minutos. El resultado no compite con un ordenador de sobremesa — seis tokens por segundo se notan — pero tampoco pretende hacerlo. Para consultas rápidas en local, como backend de scripts o simplemente para entender cómo funciona la inferencia en hardware pequeño, cumple sin historias. Lo que hay que tener claro antes de empezar es el calor: sin refrigeración activa, las sesiones largas acaban en una pelea contra el throttling.

El código fuente, la documentación completa y la guía oficial de instalación están disponibles en el repositorio de Potato OS en GitHub. La web del proyecto en potato-os.com resume también el flujo de instalación y las preguntas frecuentes.

Cookie	Duración	Descripción
cookielawinfo-checkbox-advertisement	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie registra el consentimiento del usuario para las cookies de la categoría "Advertisement".
cookielawinfo-checkbox-analytics	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie registra el consentimiento del usuario para las cookies de la categoría "Analytics".
cookielawinfo-checkbox-comentarios	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie registra el consentimiento del usuario para las cookies de la categoría "Comentarios (Disqus)".
cookielawinfo-checkbox-functional	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie registra el consentimiento del usuario para las cookies de la categoría "Functional".
cookielawinfo-checkbox-necessary	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie registra el consentimiento del usuario para las cookies de la categoría "Necessary".
cookielawinfo-checkbox-others	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie almacena el consentimiento del usuario para las cookies de la categoría "Others".
cookielawinfo-checkbox-performance	1 año	Establecida por el plugin GDPR Cookie Consent, esta cookie almacena el consentimiento del usuario para las cookies de la categoría "Performance".
CookieLawInfoConsent	1 año	CookieYes establece esta cookie para registrar el estado por defecto de los botones de cada categoría y el estado de la CCPA. Funciona únicamente en coordinación con la cookie principal.
wpEmojiSettingsSupports	sesión	WordPress establece esta cookie cuando un usuario interactúa con emojis en un sitio WordPress. Ayuda a determinar si el navegador del usuario puede mostrar los emojis correctamente.
__cf_bm	1 hora	Esta cookie, establecida por Cloudflare, se utiliza para dar soporte a la gestión de bots de Cloudflare.

Cookie	Duración	Descripción
VISITOR_INFO1_LIVE	6 meses	Cookie establecida por YouTube para medir el ancho de banda y determinar si el usuario recibe la interfaz de reproductor nueva o antigua.
ytidb::LAST_RESULT_ENTRY_KEY	nunca	YouTube utiliza esta cookie para almacenar la última entrada de resultados de búsqueda en la que hizo clic el usuario. Esta información se usa para mejorar la experiencia ofreciendo resultados más relevantes en el futuro.

Cookie	Duración	Descripción
VISITOR_PRIVACY_METADATA	6 meses	YouTube establece esta cookie para almacenar el estado de consentimiento de cookies del usuario para el dominio actual.
__Secure-ROLLOUT_TOKEN	6 meses	YouTube utiliza esta cookie para gestionar el despliegue de funciones y la experimentación. Ayuda a Google a controlar qué funciones nuevas o cambios de interfaz se muestran a los usuarios como parte de pruebas y despliegues escalonados, garantizando una experiencia coherente durante un experimento.
__Secure-YEC	sesión	Cookie de YouTube. Se encarga de almacenar tus preferencias de reproducción de video (como el volumen, la calidad de video predeterminada o la configuración de subtítulos) cuando ves videos de YouTube incrustados en otras páginas web.
__Secure-YNID	6 meses	Cookie de YouTube utilizada para proteger la seguridad del usuario y prevenir el fraude, especialmente durante el proceso de inicio de sesión.