源码地址

欢迎大家试用反馈，觉得有用的话，欢迎点个。

界面截图

PushToTalk 是一个高性能的桌面语音输入工具。它不仅仅是一个语音转文字工具，更集成了大语言模型（LLM）能力。你可以按住 Ctrl+Win 说话，松开后应用会自动将你的语音转为文字，并根据你的设定进行润色、翻译或整理成邮件，最后自动粘贴到当前光标位置。

平均说一段话的转写时间在0.5-1s内，体感十分快速！！！

语音转文本由qwen-asr-flash/doubao驱动，当耗时较长时，采用SiliconFlow的SenseVoice作为备用驱动
文本润色兼容openai格式（推荐使用glm4flash，速度特别快，还免费，基本上润色会在0.5秒到1秒之内

支持实时流式转录/HTTP转录 – 支持 WebSocket 边录边传，极低延迟，松手即出字。
LLM 智能后处理 – 内置 “文本润色”、“邮件整理”、“中译英” 等预设，支持自定义 Prompt。
全局快捷键 – 在任何应用中（包括全屏游戏或 IDE）按住 Ctrl+Win 即可录音。
双模引擎 & 自动备备 – 默认使用 Qwen Realtime 引擎，网络不佳时自动降级到 HTTP 模式，并支持 SiliconFlow (SenseVoice) 作为备用渠道。
音频反馈 – 录音开始/结束时的清脆提示音，盲操也放心。
多配置管理 – 支持保存多套 LLM 预设，通过界面快速切换不同场景。