5.5K stars
PC 端语音输入工具。按住 CapsLock 说话,松开自动上屏。基于 FunASR Paraformer 离线识别。
桌面语音输入
1.8K stars
macOS/Windows 语音输入工具。按住快捷键说话,松开即得润色后的文字。使用 SenseVoice 模型。
桌面macOS
2.2K stars
开源 Wispr Flow 替代方案。集成 FunASR 本地模型和可配置大语言模型的桌面语音工作流。
桌面语音输入
1.2K stars
多功能桌面应用程序,集成音视频处理、图片编辑和 AI 增强语音转写。
桌面工具箱
704 stars
本地端侧隐私安全语音输入工具。通过快捷键将语音实时转文字并自动输入。支持 MCP 集成。
语音输入隐私
323 stars
实时音频翻译工具。捕获系统声音和麦克风,使用 SenseVoice 识别后 LLM 流式翻译显示。
翻译实时
139 stars
高性能 Linux 离线中文语音输入法。基于 FunASR,0.1 秒瞬时上屏,支持 IBus/Fcitx5。
Linux输入法
12.8K stars
数字人 Agent 框架,连接 2.5D/3D 虚拟人与大语言模型。使用 FunASR 实时语音识别。
数字人智能体
7.1K stars
中文语音对话机器人/智能音箱,支持树莓派部署,内置 FunASR 语音识别引擎。
IoT助手
6.9K stars
手机端编程助手,通过 Sherpa ONNX 使用 Paraformer 和 SenseVoice 进行语音识别。
编程智能体
3.3K stars
数字人对话系统,融合 ASR、LLM 和 TTS,实现与虚拟形象自然对话。使用 FunASR 语音识别。
数字人对话
2.1K stars
音视频内容提取工具,自动整理为结构化 Markdown 笔记。使用 FunASR 高精度转写。
笔记效率
1.7K stars
类 GPT-4o 语音聊天机器人,完整 ASR + LLM + TTS 语音对话方案。使用 FunASR 语音识别。
语音对话GPT-4o
58K stars
一分钟语音数据即可训练 TTS。使用 FunASR 进行训练数据标注。
TTS训练
33K stars
自托管 OpenAI 替代方案。FunASR 作为语音识别后端(PR 审核中)。
LLM自托管
12.5K stars
语音与多模态对话 AI 框架。FunASR 作为社区 STT 集成。
对话 AI
9.8K stars
OpenMMLab 开源音频、音乐和语音生成工具包。使用 FunASR 进行 TTS 评测与数据处理。
音频工具OpenMMLab
143K stars
LLM 应用开发平台。FunASR 可通过 OpenAI 兼容 API 作为语音识别提供者。
LLM 平台
9.3K stars
分布式推理框架。内置 FunASR 语音识别后端,支持一键部署 ASR 模型服务。
推理框架分布式
5K stars
一站式 AI 数字人系统,支持视频合成、声音合成与克隆。集成 FunASR 语音识别。
数字人AIGC
1.6K stars
轻量级多模态模型,融合视觉、音频和语言理解能力。使用 FunASR 作为语音识别模块。
多模态LLM
5K+ stars
跨平台语音处理框架。可在 iOS、Android、树莓派、浏览器上运行 SenseVoice 和 Paraformer。
移动端边缘计算
608 stars
跨平台 ASR 推理库,基于 ONNX Runtime 和 FunASR。开箱即用,支持中英文混合识别。
ONNX跨平台
550 stars
SenseVoice 模型的 C/C++ 实现。无需 Python 依赖,纯 C++ 推理。
C++嵌入式
142K stars
Hugging Face Transformers 库。Fun-ASR-Nano 集成(PR 审核中)。
ML 框架
211 stars
OpenAI 兼容的语音服务器,支持 FunASR、Whisper、Bark、CosyVoice 后端。
API 服务OpenAI 兼容
113 stars
基于 GGML 的 C++ 推理引擎。支持 CPU/CUDA,实时麦克风流式识别,单 GGUF 文件部署。
GGMLC++