• Saltar al contenido principal
  • Saltar a la barra lateral principal
  • Blog
  • Sistemas Operativos
    • Todos los sistemas operativos del Raspberry Pi Imager en 2026
  • Tipos de Raspberry Pi
    • Selector interactivo de Raspberry Pi
    • Raspberry Pi: rivales y alternativas SBC en 2026 con Armbian y DietPi
  • Glosario
  • FAQ
  • Contacto
  • Cookies y RGPD
  • Acerca de

Raspberry para torpes

Blog sobre Raspberry Pi en español desde 2013. Guías de configuración, hardware, sistemas operativos y proyectos para todos los niveles.

Potato OS Raspberry Pi 5

Potato OS: LLM local en tu Raspberry Pi 5

13 mayo, 2026 by manuti 2 comentarios

Hay una expresión que se repite en cada foro y cada canal de tecnología desde hace dos años: IA local. La idea es sencilla: ejecutar modelos de lenguaje en tu propio hardware, sin mandar nada a ningún servidor externo. Esto interesa especialmente a quienes trastean con electrónica a medida y sistemas embebidos: tener un modelo ligero corriendo en local encaja bien en flujos de automatización, edge AI o incluso prototipado de PCB, sin pasar por la nube. El problema es que montar ese entorno implica instalar dependencias, configurar backends, gestionar archivos de modelo y pelearte con configuraciones que cambian cada mes. Nada de eso suena especialmente divertido.

Potato OS llega con una propuesta más directa. Es una imagen para grabar en una microSD. Convierte una Raspberry Pi 5 en un servidor de LLM local accesible desde el navegador. Además, trae SSH habilitado de serie y una API compatible con el estilo de OpenAI. Flash → arranque → chat. Sin más pasos intermedios.

Qué es Potato OS

Potato OS es una distribución basada en Debian GNU/Linux 13 (Trixie) construida específicamente para ejecutar modelos de lenguaje locales en Raspberry Pi. No es un proyecto oficial de la Fundación Raspberry Pi. Es un proyecto de código abierto que puedes encontrar en GitHub bajo el repositorio potato-os/core. La versión actual — la 0.7.0, catalogada como «lite» — soporta Raspberry Pi 5 y Raspberry Pi 4 Model B de 8 GB.

Internamente usa ik_llama, un fork de llama.cpp con optimizaciones específicas para el procesador de la Pi 5. El modelo que descarga por defecto en el primer arranque es Qwen3.5-2B-Q4_K_M.gguf, un archivo de 1,28 GB en formato GGUF. Este formato es el estándar habitual para distribuir modelos cuantizados listos para ejecutar en hardware con memoria limitada. Además, expone una API con los endpoints /v1/chat/completions y /v1/models. Así, cualquier herramienta que hable con OpenAI puede apuntar a la Pi sin modificar el cliente.

El sistema operativo base es Debian Trixie con el kernel 6.12.75+rpt-rpi-2712, el mismo árbol que usa Raspberry Pi OS en su rama Trixie. También activa ZRAM de serie, con 2,15 GB de espacio de intercambio comprimido que el panel de la interfaz muestra en tiempo real.

Qué necesitas antes de empezar

La lista de materiales es corta. Necesitas una Raspberry Pi 5 (o una Pi 4 Model B de 8 GB, el único modelo de la serie 4 compatible), una tarjeta microSD de al menos 16 GB, la fuente de alimentación correspondiente y las credenciales de tu red Wi-Fi. El proceso completo es headless: no hace falta conectar monitor ni teclado en ningún momento.

Raspberry Pi 5 - 4GB RAM
Raspberry Pi 5 – 4GB RAM
Ver precio en Amazon →
Raspberry Pi 5 - 8GB RAM
Raspberry Pi 5 – 8GB RAM
Ver precio en Amazon →

También necesitas el Raspberry Pi Imager en su versión 2.0.7 o superior. Las pruebas de este artículo se hicieron con esa versión. Es también la que gestiona el catálogo ampliado de sistemas operativos disponible desde finales de 2025.

Añadir el repositorio de Potato OS al Imager

El primer paso no es seleccionar la Pi ni el sistema operativo — es añadir el repositorio de Potato OS para que aparezca en el catálogo. Abre el Imager y, antes de tocar nada más, pulsa el botón OPCIONES DE LA… en la esquina inferior izquierda.

Se abre un diálogo con preferencias generales: sonido al finalizar, expulsión automática del soporte, telemetría anónima. Ahí, localiza la fila Repositorio de contenidos y pulsa EDITAR.

Añadir opciones" del Imager con el botón EDITAR del repositorio

Aparece un selector con tres opciones: el repositorio oficial de Raspberry Pi, un archivo local o una URL personalizada. Elige Usar URL personalizada e introduce esta dirección:

https://github.com/potato-os/core/releases/download/stable/potato-lite.rpi-imager-manifest
Diálogo de repositorio con la URL personalizada introducida

Pulsa APLICAR Y REINICIAR. El Imager descarga el manifiesto desde GitHub y se recarga. A partir de aquí el flujo es el habitual, aunque con el catálogo filtrado.

Seleccionar dispositivo, SO y almacenamiento

Tras la recarga, en la selección de dispositivo solo aparecen dos opciones: Raspberry Pi 5 y Raspberry Pi 4 Model B (8 GB). El manifiesto de Potato OS solo declara soporte para estos dos modelos, así que el resto no aparece.

Selección de SO con Potato OS v0.7.0

Selecciona tu modelo y avanza al paso de sistema operativo. Verás una única entrada: Potato OS v0.7.0 (lite) — Local AI, No Cloud, con 678,1 MB de descarga y publicada el 4 de abril de 2026. Selecciónala.

A continuación elige el soporte de almacenamiento. En las pruebas usé un lector de tarjetas externo con una SD de 256 GB. El Imager marca por defecto la opción Excluir unidades del sistema, que evita mostrar el disco interno del ordenador. Conveniente.

Selección de almacenamiento con el lector SD

Personalización: hostname, usuario, Wi-Fi y SSH

Después de elegir el almacenamiento llega la pantalla de personalización, donde configuras todo lo necesario para el arranque headless. Son cuatro apartados, y conviene completarlos todos antes de continuar.

En Nombre del equipo introduce el nombre que quieras usar. En las pruebas usé potatopi, lo que hace accesible la interfaz en http://potatopi.lan gracias a mDNS. En Localización ajusta zona horaria y distribución del teclado — para España: Europe/Madrid y distribución es. En Usuario crea tu cuenta con nombre de usuario y contraseña. Por último, en Wi-Fi introduce las credenciales de tu red.

Pantalla de Wi-Fi con SSID introducido
Pantalla de usuario con nombre introducido
Pantalla de localización con Madrid y teclado es
Pantalla de nombre de equipo con "potatopi"

En el apartado de Acceso remoto activa SSH con autenticación por contraseña. Sin este paso tendrías que conectar un monitor para acceder al sistema más adelante.

Pantalla de autenticación SSH activada

El resumen previo a la escritura confirma todas las elecciones: dispositivo Raspberry Pi 5, sistema operativo Potato OS v0.7.0 (lite), soporte de almacenamiento seleccionado y las cinco personalizaciones marcadas como aplicadas.

Resumen de escritura con todas las personalizaciones

Pulsa ESCRIBIR. El Imager muestra un aviso de borrado permanente — confirma con LO ENTIENDO, BORRAR Y ESCRIBIR — y empieza el proceso. Unos minutos después aparece la pantalla de escritura completa y el soporte se expulsa automáticamente.

Aviso de borrado permanente
Pantalla "¡Escritura completa!"

Primer arranque: descarga y carga del modelo

Extrae la tarjeta, introdúcela en la Raspberry Pi 5 y conecta la alimentación. En unos minutos la Pi se une a tu red Wi-Fi y queda accesible. Abre el navegador y ve a http://potatopi.lan (o la dirección IP que haya obtenido por DHCP).

La interfaz tiene dos zonas. La columna izquierda es el Pi Runtime: telemetría en tiempo real con potencia estimada, uso de CPU por núcleo, frecuencias de CPU y GPU, temperatura, throttling, memoria RAM y almacenamiento. La zona derecha es Potato Chat, el cliente de conversación, con un indicador de conexión en la esquina superior derecha.

En el primer arranque el estado muestra BOOTING | No active download y aparece un aviso: el modelo Qwen3.5-2B-Q4_K_M está pendiente de descarga. La descarga automática arranca sola si la Pi lleva unos minutos sin actividad. También puedes lanzarla manualmente con Start download now. El archivo pesa 1,28 GB, así que el tiempo depende de tu conexión.

Panel de Potato OS con estado BOOTING y aviso de descarga del modelo

Durante la descarga el estado cambia a DOWNLOADING y muestra el progreso en MB. La CPU y la GPU suben de frecuencia y el consumo eléctrico asciende hasta los 4 W. Si intentas chatear antes de que termine, el modelo todavía no está listo y la interfaz responde con Request failed (503).

Estado DOWNLOADING al 8%
Estado DOWNLOADING al 45% con error 503 en el chat

Después de la descarga el sistema carga el modelo en RAM. El estado pasa por BOOTING | Downloading vision encoder y luego por LOADING: ik_llama: 0% hasta quedar en READY. En ese momento el indicador cambia a verde: CONNECTED: ik_llama: Qwen3.5-2B-Q4_K_M.gguf.

Estado LOADING del modelo con indicador en proceso
Panel lateral mostrando OS Debian Trixie, kernel y modelo CONNECTED

Rendimiento, temperatura y límites reales

Con el modelo cargado, la primera respuesta llega en torno a 0,9 segundos (tiempo hasta el primer token). La velocidad de generación ronda los 6,20 tokens por segundo. En la práctica, un párrafo corto tarda entre cuatro y cinco segundos. Para conversación casual o preguntas técnicas breves es perfectamente usable.

otato Chat con respuesta "¡Hola! ¿Cómo estás?" y métricas TTFT 0.90s / 6.20 tok/sec

Sin embargo, hay que hablar del calor. Bajo carga sostenida, la temperatura sube con rapidez. En las pruebas llegó a 84,5 °C con el Soft temp limit activo, que reduce las frecuencias para proteger la placa. En esa situación la CPU pasa de 2.400 MHz a frecuencias más bajas, y la GPU baja también. El consumo eléctrico, por su parte, sube desde los ~3 W en reposo hasta casi 11 W bajo inferencia máxima.

Chat con respuesta larga y temperatura 84.5°C con throttling activo

Como lo he estado probando sin ningún tipo de disipador ni ventilador se pone bastante caliente y hace Throttling. Incluso con disipador pasivo estándar y sin caja esto puede ser problemático en sesiones largas. Con el HAT de ventilador oficial la situación mejora considerablemente. El sistema también usa por defecto un perfil de memoria pi5-opt, visible en los ajustes avanzados del backend.

El panel Settings permite añadir otros modelos. Puedes introducir su URL en formato GGUF o subir un archivo directamente desde el ordenador. El modelo activo muestra tres etiquetas: Active, Ready y Vision. Eso confirma que Qwen3.5-2B también puede procesar imágenes adjuntas al chat.

Panel Settings con el modelo Qwen3.5-2B-Q4_K_M.gguf activo y etiquetas Active / Ready / Vision

SSH y uso con OpenCode

El acceso por SSH funciona desde el primer arranque con el usuario y contraseña configurados en el Imager:

ssh manuti@potatopi.lan

El banner de bienvenida confirma el kernel: Linux potato 6.12.75+rpt-rpi-2712 #1 SMP PREEMPT Debian 1:6.12.75-1+rpt1 (2026-03-11) aarch64. Desde la terminal puedes inspeccionar logs, ajustar la configuración o simplemente ver qué está pasando en el sistema.

Terminal SSH conectado a potatopi.lan mostrando el banner de login y kernel

Una vuelta de tuerca interesante es usar OpenCode — un agente de codificación en terminal — apuntando al modelo local de la Pi como backend. La instalación en Linux es un solo comando:

curl -fsSL https://opencode.ai/install | bash
Terminal instalando OpenCode versión 1.14.48

Al arrancar OpenCode desde un directorio de proyecto detecta los modelos disponibles. En las pruebas aparece automáticamente la opción Potato OS local model · Potato OS (Pi 5). Esa opción usa la API local para todas las consultas. La primera respuesta tarda unos 4,9 segundos: algo más que en la interfaz web, porque hay latencia de red adicional y el overhead del agente. Aun así, funciona. Apuntar un agente de codificación a hardware propio sin depender de una API externa tiene su gracia.

OpenCode con "Build · Potato OS local model · Potato OS (Pi 5)"
OpenCode respondiendo "¡Hola! ¿En qué puedo ayudarte hoy?" en 4.9s

Potato OS reduce el tiempo entre «tengo una Pi 5» y «tengo un LLM funcionando» a menos de veinte minutos. El resultado no compite con un ordenador de sobremesa — seis tokens por segundo se notan — pero tampoco pretende hacerlo. Para consultas rápidas en local, como backend de scripts o simplemente para entender cómo funciona la inferencia en hardware pequeño, cumple sin historias. Lo que hay que tener claro antes de empezar es el calor: sin refrigeración activa, las sesiones largas acaban en una pelea contra el throttling.

El código fuente, la documentación completa y la guía oficial de instalación están disponibles en el repositorio de Potato OS en GitHub. La web del proyecto en potato-os.com resume también el flujo de instalación y las preguntas frecuentes.

Artículos relacionados:

  • HypriotOS-web
    HypriotOS un Raspbian con Docker listo para usar
  • x-forward
    Instalación mínima de X11 para redireccionar…
  • Nuevo Raspbian
    Transmission no se reinicia en Raspbian
  • wayland_raspberry_pi
    Escritorio con aceleración 3D con Wayland

Publicado en: Proyectos Etiquetado como: gguf, ia-local, inteligencia-artificial, llama-cpp, llm, potato-os, raspberry-pi-5, raspberry-pi-imager

Barra lateral principal

Categorías

  • Cajas (9)
  • comandos (21)
  • Compras (116)
  • dudas (41)
  • Empezando (55)
  • Hardware (106)
  • Instalacion (64)
  • Media Center (56)
  • Negocios (5)
  • Proyectos (44)
  • Rivales (113)
  • Sistemas Operativos (68)
  • sorteo (2)
Raspberry Pi 5 - 4GB RAM
Raspberry Pi 5 - 4GB RAM
Ver precio en Amazon →
Raspberry Pi Zero 2W
Raspberry Pi Zero 2W
Ver precio en Amazon →

Por si te lo perdiste

Radxa Cubie A7S

Radxa Cubie A7S: rival compacta de Raspberry Pi

beagleplay

BeaglePlay: rival industrial de la Raspberry Pi con GPU PowerVR

gemma-4-12b-raspberry pi 5

Gemma 4 12B en Raspberry Pi 5: probamos el LLM multimodal en local

Raspberry Pi 5 - 8GB RAM
Raspberry Pi 5 - 8GB RAM
Ver precio en Amazon →

Visita la tienda Raspberry Pi en Amazon - enlace afiliado
© 2013–2026

Cookie y RGPD | Aviso Legal
Este sitio web usa cookies para mejorar su experiencia como usuario ► Aceptar Rechazar ◘ Si necesita Política de cookies
Política de Cookies

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these cookies, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may have an effect on your browsing experience.
Necessary
Siempre activado
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
GUARDAR Y ACEPTAR