在 CPU 上运行 FunASR —— llama.cpp / GGUF 运行时

单个二进制 · 无需 Python · 无需 GPU · 量化权重 · whisper.cpp 式的端侧语音识别,中文更强

FunASR on llama.cpp 之于 FunASR,正如 whisper.cpp 之于 Whisper:把 SenseVoice / Paraformer / Fun-ASR-Nano 三个模型搬到 ggml 栈上,**在没有 GPU、没有 Python 的地方也能跑**(笔记本、边缘盒子、嵌入式 C/C++ 应用),与 GPU 上的 PyTorch / vLLM 路线互补。VAD(FSMN)已内置进二进制。

下载预编译二进制(下载即用)

覆盖 Linux(x64/arm64)、macOS(arm64)、Windows(x64),静态自包含、无依赖。三个仓库的 Releases 都能下:

三行跑通

# 1) 解压下载的二进制,拉一个模型(自动下 GGUF + VAD)
bash download-funasr-model.sh sensevoice ./gguf

# 2) 直接出中文(二进制内置 detok,无需 Python)
llama-funasr-sensevoice -m ./gguf/SenseVoiceSmall-f16.gguf --vad ./gguf/fsmn-vad.gguf -a audio.wav
# -> 欢迎大家来体验达摩院推出的语音识别模型

换模型:download-funasr-model.sh paraformerllama-funasr-paraformer;download-funasr-model.sh nanollama-funasr-cli(Fun-ASR-Nano,31 语种)。

精度:中文上对 whisper.cpp 是碾压

同一 184 集中文测试集,字错误率 CER(micro-avg,越低越准):

模型CER ↓说明
FunASR SenseVoice8.01%多语种 + 情感/事件
FunASR Paraformer9.85%非自回归,工业级中文
FunASR Fun-ASR-Nano8.30%LLM-ASR,31 语种
whisper.cpp small22.12%
whisper.cpp large-v3-turbo23.15%
whisper.cpp base31.33%

FunASR 的中文 CER 约为 whisper.cpp 的 1/3。完整方法学见各仓 runtime/llama.cpp/BENCHMARKS.md

包含什么

觉得有用就给个 Star 支持一下 👇 全家桶开源、可商用。

⭐ Star FunASR

也欢迎 Star:SenseVoice · Fun-ASR · FunClip

延伸阅读:FunASR 跑进 llama.cpp(whisper.cpp 替代)详解