FunASR 生态系统

基于 FunASR、SenseVoice、Paraformer 构建的开源项目与集成方案。

45+
集成项目
50+
支持语种
16K+
GitHub Stars
100万+
月安装量

视频与媒体工具

5.7K stars
基于语音识别的智能视频剪辑。自动生成字幕,支持按关键词和说话人剪辑视频片段。
视频官方
17.6K stars
视频翻译工具。使用 FunASR 进行中文语音识别,自动生成和翻译字幕。
视频翻译
10.4K stars
Gradio WebUI 音频处理工具箱,集成 TTS、语音克隆与 ASR 能力。
音频TTS
3.2K stars
AI 视频配音工具包。自动语音识别、翻译和语音克隆,实现多语言视频配音。
配音视频

语音输入与桌面应用

5.5K stars
PC 端语音输入工具。按住 CapsLock 说话,松开自动上屏。基于 FunASR Paraformer 离线识别。
桌面语音输入
1.8K stars
macOS/Windows 语音输入工具。按住快捷键说话,松开即得润色后的文字。使用 SenseVoice 模型。
桌面macOS
2.2K stars
开源 Wispr Flow 替代方案。集成 FunASR 本地模型和可配置大语言模型的桌面语音工作流。
桌面语音输入
1.2K stars
多功能桌面应用程序,集成音视频处理、图片编辑和 AI 增强语音转写。
桌面工具箱
704 stars
本地端侧隐私安全语音输入工具。通过快捷键将语音实时转文字并自动输入。支持 MCP 集成。
语音输入隐私
323 stars
实时音频翻译工具。捕获系统声音和麦克风,使用 SenseVoice 识别后 LLM 流式翻译显示。
翻译实时
139 stars
高性能 Linux 离线中文语音输入法。基于 FunASR,0.1 秒瞬时上屏,支持 IBus/Fcitx5。
Linux输入法

语音助手与智能体

12.8K stars
数字人 Agent 框架,连接 2.5D/3D 虚拟人与大语言模型。使用 FunASR 实时语音识别。
数字人智能体
7.1K stars
中文语音对话机器人/智能音箱,支持树莓派部署,内置 FunASR 语音识别引擎。
IoT助手
6.9K stars
手机端编程助手,通过 Sherpa ONNX 使用 Paraformer 和 SenseVoice 进行语音识别。
编程智能体
3.3K stars
数字人对话系统,融合 ASR、LLM 和 TTS,实现与虚拟形象自然对话。使用 FunASR 语音识别。
数字人对话
2.1K stars
音视频内容提取工具,自动整理为结构化 Markdown 笔记。使用 FunASR 高精度转写。
笔记效率
1.7K stars
类 GPT-4o 语音聊天机器人,完整 ASR + LLM + TTS 语音对话方案。使用 FunASR 语音识别。
语音对话GPT-4o

AI 平台与框架

58K stars
一分钟语音数据即可训练 TTS。使用 FunASR 进行训练数据标注。
TTS训练
33K stars
自托管 OpenAI 替代方案。FunASR 作为语音识别后端(PR 审核中)。
LLM自托管
12.5K stars
语音与多模态对话 AI 框架。FunASR 作为社区 STT 集成。
对话 AI
9.8K stars
OpenMMLab 开源音频、音乐和语音生成工具包。使用 FunASR 进行 TTS 评测与数据处理。
音频工具OpenMMLab
143K stars
LLM 应用开发平台。FunASR 可通过 OpenAI 兼容 API 作为语音识别提供者。
LLM 平台
9.3K stars
分布式推理框架。内置 FunASR 语音识别后端,支持一键部署 ASR 模型服务。
推理框架分布式
5K stars
一站式 AI 数字人系统,支持视频合成、声音合成与克隆。集成 FunASR 语音识别。
数字人AIGC
1.6K stars
轻量级多模态模型,融合视觉、音频和语言理解能力。使用 FunASR 作为语音识别模块。
多模态LLM

SenseVoice 社区扩展

894 stars
增强版 SenseVoice,支持高精度单词级时间戳输出。速度与原版一致。
时间戳SenseVoice
541 stars
SenseVoice API 和 WebSocket 服务器。支持 VAD 检测、实时流式识别和说话人验证。
APIWebSocket
451 stars
伪流式 SenseVoice 实现,支持热词增强。实现低延迟准实时语音识别。
流式热词

跨平台推理

5K+ stars
跨平台语音处理框架。可在 iOS、Android、树莓派、浏览器上运行 SenseVoice 和 Paraformer。
移动端边缘计算
608 stars
跨平台 ASR 推理库,基于 ONNX Runtime 和 FunASR。开箱即用,支持中英文混合识别。
ONNX跨平台
550 stars
SenseVoice 模型的 C/C++ 实现。无需 Python 依赖,纯 C++ 推理。
C++嵌入式
142K stars
Hugging Face Transformers 库。Fun-ASR-Nano 集成(PR 审核中)。
ML 框架
211 stars
OpenAI 兼容的语音服务器,支持 FunASR、Whisper、Bark、CosyVoice 后端。
API 服务OpenAI 兼容
113 stars
基于 GGML 的 C++ 推理引擎。支持 CPU/CUDA,实时麦克风流式识别,单 GGUF 文件部署。
GGMLC++

快速上手

pip install funasr

# Python API
from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="audio.wav")

# 或启动 OpenAI 兼容 API 服务
pip install vllm fastapi uvicorn python-multipart
funasr-server --device cuda

使用 FunASR 构建了项目?欢迎提交到此列表。

GitHub 提交 Issue