FunASR 生态系统

基于 FunASR、SenseVoice、Paraformer 构建的开源项目与集成方案。

50+

集成项目

50+

支持语种

16K+

GitHub Stars

100万+

月安装量

视频与媒体工具

FunClip

5.7K stars

基于语音识别的智能视频剪辑。自动生成字幕，支持按关键词和说话人剪辑视频片段。

视频官方

pyVideoTrans

17.6K stars

视频翻译工具。使用 FunASR 进行中文语音识别，自动生成和翻译字幕。

视频翻译

Voice-Pro

10.4K stars

Gradio WebUI 音频处理工具箱，集成 TTS、语音克隆与 ASR 能力。

音频TTS

Linly-Dubbing

3.2K stars

AI 视频配音工具包。自动语音识别、翻译和语音克隆，实现多语言视频配音。

配音视频

语音输入与桌面应用

CapsWriter-Offline

5.5K stars

PC 端语音输入工具。按住 CapsLock 说话，松开自动上屏。基于 FunASR Paraformer 离线识别。

桌面语音输入

OpenLess

1.8K stars

macOS/Windows 语音输入工具。按住快捷键说话，松开即得润色后的文字。使用 SenseVoice 模型。

桌面macOS

ququ

2.2K stars

开源 Wispr Flow 替代方案。集成 FunASR 本地模型和可配置大语言模型的桌面语音工作流。

桌面语音输入

MTools

1.2K stars

多功能桌面应用程序，集成音视频处理、图片编辑和 AI 增强语音转写。

桌面工具箱

VocoType

704 stars

本地端侧隐私安全语音输入工具。通过快捷键将语音实时转文字并自动输入。支持 MCP 集成。

语音输入隐私

LiveTranslate

325 stars

实时音频翻译工具。捕获系统声音和麦克风，使用 SenseVoice 识别后 LLM 流式翻译显示。

翻译实时

VocoType-linux

139 stars

高性能 Linux 离线中文语音输入法。基于 FunASR，0.1 秒瞬时上屏，支持 IBus/Fcitx5。

Linux输入法

Murmur

103 stars

macOS 离线语音转文字工具。按键说话即用，支持任意应用内使用，完全本地处理。

macOS语音输入

AriaType

74 stars

语音驱动的桌面写作工具。支持语音输入、文本润色和跨应用协作。

桌面写作

VoiceSnap

73 stars

纯离线语音输入工具，Typeless 免费平替。SenseVoice + DirectML，数据永不出设备，适合涉密场景。

离线安全

语音助手与智能体

Fay 数字人

12.8K stars

数字人 Agent 框架，连接 2.5D/3D 虚拟人与大语言模型。使用 FunASR 实时语音识别。

数字人智能体

Duix 数字人

13.4K stars

开源 AI 数字人工具包，支持离线视频生成和实时交互。使用 FunASR 进行语音识别。

数字人视频生成

悟空机器人

7.1K stars

中文语音对话机器人/智能音箱，支持树莓派部署，内置 FunASR 语音识别引擎。

IoT助手

Paseo

6.9K stars

手机端编程助手，通过 Sherpa ONNX 使用 Paraformer 和 SenseVoice 进行语音识别。

编程智能体

Linly-Talker

3.3K stars

数字人对话系统，融合 ASR、LLM 和 TTS，实现与虚拟形象自然对话。使用 FunASR 语音识别。

数字人对话

AudioNotes

2.1K stars

音视频内容提取工具，自动整理为结构化 Markdown 笔记。使用 FunASR 高精度转写。

笔记效率

百聆

1.7K stars

类 GPT-4o 语音聊天机器人，完整 ASR + LLM + TTS 语音对话方案。使用 FunASR 语音识别。

语音对话GPT-4o

AI 平台与框架

GPT-SoVITS

58K stars

一分钟语音数据即可训练 TTS。使用 FunASR 进行训练数据标注。

TTS训练

LocalAI

33K stars

自托管 OpenAI 替代方案。FunASR 作为语音识别后端（PR 审核中）。

LLM自托管

Pipecat

12.5K stars

语音与多模态对话 AI 框架。FunASR 作为社区 STT 集成。

对话 AI

Amphion

9.8K stars

OpenMMLab 开源音频、音乐和语音生成工具包。使用 FunASR 进行 TTS 评测与数据处理。

音频工具OpenMMLab

Dify

143K stars

LLM 应用开发平台。FunASR 可通过 OpenAI 兼容 API 作为语音识别提供者。

LLM 平台

Xinference

9.3K stars

分布式推理框架。内置 FunASR 语音识别后端，支持一键部署 ASR 模型服务。

推理框架分布式

AIGCPanel

5K stars

一站式 AI 数字人系统，支持视频合成、声音合成与克隆。集成 FunASR 语音识别。

数字人AIGC

MiniMind-O

1.6K stars

轻量级多模态模型，融合视觉、音频和语言理解能力。使用 FunASR 作为语音识别模块。

多模态LLM

ComfyUI-FunAudioLLM

95 stars

ComfyUI 自定义节点，集成 SenseVoice 和 CosyVoice。可视化搭建语音识别与合成工作流。

ComfyUI工作流

SenseVoice 社区扩展

OmniSenseVoice

894 stars

增强版 SenseVoice，支持高精度单词级时间戳输出。速度与原版一致。

时间戳SenseVoice

api4sensevoice

541 stars

SenseVoice API 和 WebSocket 服务器。支持 VAD 检测、实时流式识别和说话人验证。

APIWebSocket

streaming-sensevoice

451 stars

伪流式 SenseVoice 实现，支持热词增强。实现低延迟准实时语音识别。

流式热词

SenseVoice-python

111 stars

基于 ONNX Runtime 的 SenseVoice 推理库。企业级部署方案，无需 PyTorch 依赖。

ONNX部署

SenseVoice-Api

109 stars

SenseVoice 的 FastAPI 封装，ONNX 推理，体积更小。附带量化模型，支持 GPU 加速。

FastAPI量化

SenseVoice-OneApi

93 stars

SenseVoice API 服务，可无缝对接 OneAPI。统一接口管理多个语音识别模型。

OneAPIAPI

跨平台推理

Sherpa-ONNX

5K+ stars

跨平台语音处理框架。可在 iOS、Android、树莓派、浏览器上运行 SenseVoice 和 Paraformer。

移动端边缘计算

RapidASR

608 stars

跨平台 ASR 推理库，基于 ONNX Runtime 和 FunASR。开箱即用，支持中英文混合识别。

ONNX跨平台

SenseVoice.cpp

550 stars

SenseVoice 模型的 C/C++ 实现。无需 Python 依赖，纯 C++ 推理。

C++嵌入式

Transformers

142K stars

Hugging Face Transformers 库。Fun-ASR-Nano 集成（PR 审核中）。

ML 框架

Vox-Box

211 stars

OpenAI 兼容的语音服务器，支持 FunASR、Whisper、Bark、CosyVoice 后端。

API 服务OpenAI 兼容

FunSpeech

136 stars

开箱即用的本地私有化语音服务。微服务架构，兼容阿里云语音 API 与 OpenAI TTS API，集成 FunASR 和 CosyVoice。

API 服务私有部署

FunASR-GGML

113 stars

基于 GGML 的 C++ 推理引擎。支持 CPU/CUDA，实时麦克风流式识别，单 GGUF 文件部署。

GGMLC++

ManySpeech

79 stars

多模型 ASR 推理方案，支持 Paraformer、SenseVoice、Whisper 等。ONNX 推理，适配多场景。

多模型ONNX

快速上手

pip install funasr

# Python API
from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="audio.wav")

# 或启动 OpenAI 兼容 API 服务
pip install vllm fastapi uvicorn python-multipart
funasr-server --device cuda

使用 FunASR 构建了项目？欢迎提交到此列表。

GitHub 提交 Issue