将AI返回内容中的markdown代码块转换为普通json #160

yanyao2333 · 2024-07-22T04:17:54Z

在生成记忆时,部分LLM有概率返回markdown代码块格式而非单纯地json格式,导致无法解析并创建记忆.

这个pr尝试移除掉代码块标记,并在生成记忆错误时打印log

idootop · 2024-07-23T09:35:41Z

多谢 PR，这里没有严格校验 AI 输出的内容格式，考虑到 LLM 返回的格式可能多种多样，解析失败默认按异常处理。

idootop

❤️ 感谢 PR，你的 fix 很有效，但仍有一些可优化的空间，暂时就先不合并了哈。

这个问题的本质是怎样尽可能多的兼容 LLM 输出的各种异常 case，

也欢迎你继续提出一些建议和改进方法，咱们一起讨论。

src/services/bot/memory/index.ts

src/services/bot/memory/long-term.ts

yanyao2333 · 2024-07-23T13:49:42Z

感谢您的 code review!

当时修改这部分代码时只想着针对这一种 case, 代码量较少, 所以没做过多工程和代码风格方面的考量, 这确实是我的问题.
大部分指令服从性好的 LLM 都能够输出正确的 json 格式, 少部分模型会稳定输出 markdown code block, 这导致使用这种模型时记忆完全不可用, 所以考虑通过这种方式来纠正这种情况.
我觉得再通过优化 prompt (eg. 增加样本, 完善要求) 去适应其他的极端情况并不划算, 因为 LLM 的输出本身就具有随机性, 对于其他的更极端的偶然情况, 直接丢弃就可以.
通过正则表达式来处理 json 确实不错, 可以考虑换用这种方式.

另外这个 pr 用不用 close? 还是我继续优化一下?

idootop · 2024-07-23T23:25:11Z

了解你说的场景了，我觉得还是有必要兼容下的。

如果你能换用正则匹配，并封装成一个统一的解析方法的话，我可以重新考虑合并你的这个 PR。一个 python 的例子：

refactor: 将json编解码操作放入/utils/parse

yanyao2333 · 2024-07-24T02:26:31Z

这次修改我把jsonDecode jsonEncode放到了/utils/parse, 并且将清洗json代码封装为一个函数

idootop · 2024-07-24T07:18:45Z

已合并

bwnjnOEI · 2025-01-01T11:48:48Z

遇到返回md的内容就没语音了

yanyao2333 added 2 commits July 22, 2024 12:06

fix: 增加记忆生成失败时的日志

2f53d99

fix: 去除掉ai返回内容中的代码块样式

c985e5b

idootop reviewed Jul 23, 2024

View reviewed changes

src/services/bot/memory/index.ts Outdated Show resolved Hide resolved

src/services/bot/memory/index.ts Outdated Show resolved Hide resolved

src/services/bot/memory/long-term.ts Outdated Show resolved Hide resolved

src/services/bot/memory/long-term.ts Outdated Show resolved Hide resolved

yanyao2333 added 3 commits July 24, 2024 10:18

fix: 将json清洗操作封装为函数

208b2db

refactor: 将json编解码操作放入/utils/parse

refactor: 调用封装后函数

11dc25a

fix: 恢复原threshold数值

bba886e

idootop closed this Jul 24, 2024

idootop reopened this Jul 24, 2024

idootop merged commit 5d455e2 into idootop:main Jul 24, 2024

yanyao2333 deleted the fix-code-block-format branch July 24, 2024 07:32

bwnjnOEI mentioned this pull request Jan 1, 2025

虽然最新版v4.2.0貌似早就修复了这个问题，但是返回md格式的内容仍然没有语音 #234

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

将AI返回内容中的markdown代码块转换为普通json #160

将AI返回内容中的markdown代码块转换为普通json #160

yanyao2333 commented Jul 22, 2024

idootop commented Jul 23, 2024

idootop left a comment •

edited

Loading

yanyao2333 commented Jul 23, 2024

idootop commented Jul 23, 2024

yanyao2333 commented Jul 24, 2024

idootop commented Jul 24, 2024

bwnjnOEI commented Jan 1, 2025 •

edited

Loading

将AI返回内容中的markdown代码块转换为普通json #160

将AI返回内容中的markdown代码块转换为普通json #160

Conversation

yanyao2333 commented Jul 22, 2024

idootop commented Jul 23, 2024

idootop left a comment • edited Loading

Choose a reason for hiding this comment

yanyao2333 commented Jul 23, 2024

idootop commented Jul 23, 2024

yanyao2333 commented Jul 24, 2024

idootop commented Jul 24, 2024

bwnjnOEI commented Jan 1, 2025 • edited Loading

idootop left a comment •

edited

Loading

bwnjnOEI commented Jan 1, 2025 •

edited

Loading