跳转到内容

aistack

一个自托管、兼容 OpenAI API 的网关,把开源 ASR(faster-whisper、NVIDIA Parakeet、阿里 SenseVoice)、TTS(Qwen3-TTS via vLLM)以及一个本地 LLM 代理(转发到 Ollama)封装在同一个 HTTP 端点之后。

aistack 是研究形态的,不是产品化的。它服务于想要对比后端、衡量质量/延迟权衡、把本地 ASR/TTS 集成进自己工具链的开发者与研究者 —— 而不是期待一键安装、下载即用的终端用户。重点放在可观测性、多后端对比、以及不带感情色彩的基准测试上。

如果你想要开箱即用的本地 AI 体验,LLM 直接用 Ollama,ASR/TTS 等下游产品化工具出现。如果你想 研究 本地 ASR/TTS,aistack 是为你而做的。

章节内容
集成指南从 Hello World 到上线:能力发现、请求、错误、流式。新接触 aistack 的话先读这页。
HTTP API每个端点的设计动因(为什么),加上自动生成的 Reference是什么)。

更多章节(配置、部署说明、研究结论)会陆续发布。完整代码仓库在 github.com/dosmoon/aistack

Terminal window
git clone https://github.com/dosmoon/aistack
cd aistack
pip install -e .[asr-fasterwhisper]
python -m uvicorn aistack.main:app --port 11500
curl http://127.0.0.1:11500/health

完整的安装方式与 extras 布局(按 ASR 后端按需安装、TTS Docker 容器、Ollama 同机并行)在仓库的 README.md 里有详细说明。

GET /health 存活检查
GET /v1/models 能力清单
POST /v1/audio/transcriptions 语音转文字 (Whisper / Parakeet / SenseVoice)
POST /v1/audio/speech 文字转语音 (Qwen3-TTS)
POST /v1/chat/completions 对话补全 (代理到 Ollama)

默认 base URL:http://127.0.0.1:11500。每个端点的详细说明请看 HTTP API 章节