Skip to content

Releases: Huang-junsen/py-xiaozhi

v1.1.4

23 Mar 14:44
Compare
Choose a tag to compare

版本 1.1.4

此版本主要修复了音频流线程重复创建问题

系统兼容性

  • 此版本主要修复了音频流线程重复创建问题

v1.1.3

21 Mar 08:17
Compare
Choose a tag to compare

版本 1.1.3

此版本主要修复了打包后mac地址异常问题、点击打断无法暂停在线音乐播放

主要变更

  • 打包脚本全面升级,使用pathlib统一处理路径,提升各平台兼容性
  • 修复打包后无法生成新的MAC地址的问题
  • 修复点击打断无法暂停在线音乐播放

系统兼容性

  • 增强对Windows/macOS/Linux多平台的支持
  • 改进打包后的路径处理逻辑

路径处理优化

  • 使用pathlib替代os.path,实现更统一的跨平台路径处理
  • 优化模型加载路径计算逻辑,解决唤醒词模型路径识别问题
  • 改进配置文件和资源文件路径处理

唤醒词功能

  • 修复打包后唤醒词模型加载问题

v1.1.2

18 Mar 18:21
Compare
Choose a tag to compare

版本 1.1.2

此版本主要修复了音频处理和在线音源集成相关的问题。

主要变更

  • 重构 MusicPlayer 以支持在线音源播放
  • 修复部分平台上音频丢失的问题
  • 解决录音资源争夺问题,实现共用录音流
  • 改进摄像头模块,确保每次启动都重新从配置中读取参数
  • 修复唤醒词打包后无法加载

音频改进

  • 解决了播放中途音频丢失的问题
  • 优化音频解码队列管理
  • 改进了TTS和音乐播放之间的切换逻辑

IOT设备优化

  • 增强音乐播放器组件,支持更稳定的在线歌曲播放
  • 优化摄像头设备初始化流程
  • 改进各IOT设备的错误处理机制

v1.1.1

17 Mar 17:23
Compare
Choose a tag to compare

项目优化

修复:修复keyboard在macos下导致程序异常问题

v1.1.0

17 Mar 14:59
Compare
Choose a tag to compare

版本 1.1.0

主要更新

  • 新增 IoT 视觉识别能力,支持摄像头控制和画面识别
  • 优化在线音乐播放器,改进与 TTS 的交互
  • 去除 VAD 检测打断功能,提高系统稳定性
  • 修复音乐播放时切换聆听状态的问题

详细变更

新功能

  • IoT 视觉识别

    • 添加摄像头控制功能,支持打开/关闭摄像头
    • 新增画面识别能力,可以识别摄像头捕获的图像内容
    • 优化摄像头与 VL 推理 URL 配置设置
    • 使用方法:只需说"打开摄像头"、"关闭摄像头"、"识别画面"即可
  • 在线音乐播放

    • 优化音乐播放器与 TTS 的交互逻辑
    • 改进播放状态管理,确保音乐播放不会被应用程序状态变化中断
    • 修复音乐播放完成后进度更新不完整的问题

改进

  • 去除了 VAD 检测打断功能,现在只支持通过唤醒词打断,提高系统稳定性
  • 改进了 TTS 播放状态管理,确保 is_tts_playing 状态正确更新
  • 更新了项目文档和 issues 模板
  • 优化了依赖项配置

升级说明

如果从 v1.0.1 升级到 v1.1.0,只需要拉取 main 分支代码即可。

使用说明

  • 视觉识别:说"打开摄像头"、"关闭摄像头"、"识别画面"
  • 音乐播放:说"播放音乐 [歌曲名]"、"暂停音乐"

已知问题

v1.0.1

01 Mar 16:49
Compare
Choose a tag to compare

项目优化

  • 修复:修复mac和linux的运行异常(原先使用pycaw来处理音频音量大小)
  • 新增:wss协议
  • 重构:按照虾哥1.1.2固件移植

安装/升级方式

  1. 下载最新的源码或二进制包并解压。
  2. 按照文档进行配置。
  3. 启动程序并确认正常运行。

注意事项

  • 如果从 v1.0.0 升级到 v1.0.1,只需要拉取main分支代码即可,如果旧版在V1分支,请勿合并,main分支破坏性更新。

v1.0.0

16 Feb 14:16
Compare
Choose a tag to compare

项目优化

  • 优化了 goodbye 后无法重连问题
  • 新增 GUI 页面,无需在控制台一直按空格
  • 拆分代码,封装为类,各司其职