Formato de fichero estándar para distribuir modelos de lenguaje cuantizados, desarrollado por el proyecto llama.cpp. Permite comprimir modelos grandes para ejecutarlos en hardware con memoria limitada, como una Raspberry Pi, sin necesidad de GPU dedicada.



