Releases: Huang-junsen/py-xiaozhi
Releases · Huang-junsen/py-xiaozhi
v1.1.4
v1.1.3
版本 1.1.3
此版本主要修复了打包后mac地址异常问题、点击打断无法暂停在线音乐播放
主要变更
- 打包脚本全面升级,使用pathlib统一处理路径,提升各平台兼容性
- 修复打包后无法生成新的MAC地址的问题
- 修复点击打断无法暂停在线音乐播放
系统兼容性
- 增强对Windows/macOS/Linux多平台的支持
- 改进打包后的路径处理逻辑
路径处理优化
- 使用pathlib替代os.path,实现更统一的跨平台路径处理
- 优化模型加载路径计算逻辑,解决唤醒词模型路径识别问题
- 改进配置文件和资源文件路径处理
唤醒词功能
- 修复打包后唤醒词模型加载问题
v1.1.2
版本 1.1.2
此版本主要修复了音频处理和在线音源集成相关的问题。
主要变更
- 重构 MusicPlayer 以支持在线音源播放
- 修复部分平台上音频丢失的问题
- 解决录音资源争夺问题,实现共用录音流
- 改进摄像头模块,确保每次启动都重新从配置中读取参数
- 修复唤醒词打包后无法加载
音频改进
- 解决了播放中途音频丢失的问题
- 优化音频解码队列管理
- 改进了TTS和音乐播放之间的切换逻辑
IOT设备优化
- 增强音乐播放器组件,支持更稳定的在线歌曲播放
- 优化摄像头设备初始化流程
- 改进各IOT设备的错误处理机制
v1.1.1
项目优化
修复:修复keyboard在macos下导致程序异常问题
v1.1.0
版本 1.1.0
主要更新
- 新增 IoT 视觉识别能力,支持摄像头控制和画面识别
- 优化在线音乐播放器,改进与 TTS 的交互
- 去除 VAD 检测打断功能,提高系统稳定性
- 修复音乐播放时切换聆听状态的问题
详细变更
新功能
-
IoT 视觉识别:
- 添加摄像头控制功能,支持打开/关闭摄像头
- 新增画面识别能力,可以识别摄像头捕获的图像内容
- 优化摄像头与 VL 推理 URL 配置设置
- 使用方法:只需说"打开摄像头"、"关闭摄像头"、"识别画面"即可
-
在线音乐播放:
- 优化音乐播放器与 TTS 的交互逻辑
- 改进播放状态管理,确保音乐播放不会被应用程序状态变化中断
- 修复音乐播放完成后进度更新不完整的问题
改进
- 去除了 VAD 检测打断功能,现在只支持通过唤醒词打断,提高系统稳定性
- 改进了 TTS 播放状态管理,确保 is_tts_playing 状态正确更新
- 更新了项目文档和 issues 模板
- 优化了依赖项配置
升级说明
如果从 v1.0.1 升级到 v1.1.0,只需要拉取 main 分支代码即可。
使用说明
- 视觉识别:说"打开摄像头"、"关闭摄像头"、"识别画面"
- 音乐播放:说"播放音乐 [歌曲名]"、"暂停音乐"
已知问题
无
v1.0.1
项目优化
- 修复:修复mac和linux的运行异常(原先使用pycaw来处理音频音量大小)
- 新增:wss协议
- 重构:按照虾哥1.1.2固件移植
安装/升级方式
- 下载最新的源码或二进制包并解压。
- 按照文档进行配置。
- 启动程序并确认正常运行。
注意事项
- 如果从 v1.0.0 升级到 v1.0.1,只需要拉取main分支代码即可,如果旧版在V1分支,请勿合并,main分支破坏性更新。
v1.0.0
项目优化
- 优化了 goodbye 后无法重连问题
- 新增 GUI 页面,无需在控制台一直按空格
- 拆分代码,封装为类,各司其职