快捷键	功能
`Alt` + `s`	显示/隐藏导航框
`Alt` + `z`/`⇽`	切换上一个页面
`Alt` + `x`/`⇾`	切换下一个页面

辅助LLM进行数据库调试的框架。

V. Singh et al., “Panda: Performance Debugging for Databases using LLM Agents,” 2018
https://www.amazon.science/publications/panda-performance-debugging-for-databases-using-llm-agents

【摘要】调试数据库性能问题历来非常困难。如果每个数据库系统都有一个可以查询自然语言 (NL) 的预言家或副驾驶，比如问“出了什么问题？”或者更好的是“如何修复它？”，那将非常方便。像 ChatGPT 这样的大型语言模型 (LLM) 看起来像是这个预言家的自然替代品，因为它们能够通过有效地编码大量知识（例如，互联网的大部分内容）来回答各种各样的问题。然而，用数据库性能查询提示 ChatGPT 通常会导致“技术上正确”但高度“模糊”或“笼统”的建议，经验丰富的数据库工程师 (DBE) 通常认为这些建议毫无用处且不可信。在这项工作中，我们提出了 Panda，一个为预训练 LLM 提供上下文基础的框架，以便生成更“有用”和“上下文相关”的故障排除建议。Panda 从经验丰富的 DBE 执行调试的方式中获得灵感，并建立了一个包含部署预训练 LLM 进行调试所需的必要组件的系统。Panda 的 4 个关键组件是：(1) 接地；(2) 验证；(3) 供词；(4) 反馈。我们描述了每个组件的必要性和有用性，以及它们如何内部通信以将给定的预训练 LLM 转换为生成针对给定数据库系统的上下文、可操作、有用和准确的推荐以进行调试。

【关键词】数据库调试，大型语言模型

Panda是一个利用大型语言模型 (LLM) 进行数据库性能调试的系统。它旨在解决LLM在缺乏上下文的情况下生成泛泛而谈的建议的问题，并帮助用户快速分析数据库性能下降并获取修复建议。

Hyplus目录

1 引言
2 Panda架构
3 案例研究
4 研究方向
5 结论

1 引言

LLM的局限性：尽管LLM具有强大的知识存储能力，但它们缺乏对具体问题的上下文理解，导致生成的建议往往过于泛泛而谈，无法解决实际问题（P. 1, Para. 1, Line 2）.
Panda的目标：建立LLM与数据库性能调试场景之间的联系，使其能够生成针对特定问题的可操作建议（P. 1, Para. 1, Line 3）.
Panda的关键特性：接地、验证、供词和反馈（P. 2, Para. 1, Line 1）.

2 Panda架构

Panda由5个关键组件组成：

问题验证代理（QVA）：作为守门人，识别并过滤掉与数据库性能调试无关的查询（P. 3, Para. 1, Line 2）.
接地机制：构建全局和局部上下文，为LLM提供必要的信息（P. 3, Para. 2, Line 1）.
- 文档检索器：从故障排除文档和历史客户票中提取相关信息，构建全局上下文（P. 4, Para. 1, Line 1）.
- 特征提取器：从遥测数据中提取特征，并收集相关的SQL查询和数据库信息，构建局部上下文（P. 4, Para. 2, Line 1）.
- 上下文聚合器：将全局和局部上下文整合为一个结构化对象，作为LLM的输入（P. 4, Para. 3, Line 1）.
验证机制：验证LLM生成的建议的正确性，并提供引用来源（P. 5, Para. 1, Line 1）.
- 答案验证：将验证问题视为自然语言推理（NLI）任务，利用LLM对生成的建议进行验证（P. 5, Para. 2, Line 1）.
- 来源归因：提供用于生成建议的文档和票证的引用来源，并使用内联引用标注（P. 6, Para. 1, Line 1）.
反馈机制：收集用户对建议的反馈，并将其用于改进LLM的生成效果（P. 6, Para. 2, Line 1）.
- 缓存存储管理器（CSM）：存储用户查询、建议和反馈，并利用相似性搜索进行少样本学习（P. 6, Para. 3, Line 1）.
供词机制：评估建议对数据库性能的影响，并提供潜在风险提示（P. 6, Para. 3, Line 2）.
- 影响估计：利用统计模型或行为模型预测建议对性能指标的影响（P. 7, Para. 1, Line 1）.
- 高风险操作识别：识别潜在的高风险操作，例如删除表或更改隔离级别，并在输出中突出显示（P. 7, Para. 2, Line 1）.

3 案例研究

研究人员使用GPT-3.5和GPT-4对Panda进行了评估，并邀请不同水平的数据库工程师对生成的建议进行评分。结果表明，Panda生成的建议比GPT-4更可信、更实用，但理解性略低。这表明Panda在为用户提供具体解决方案方面表现良好，但对于新手用户来说，可能需要提供更多背景信息（P. 8, Para. 1, Line 1）.

4 研究方向

改进IR：开发针对特定领域的嵌入模型，以提高信息检索的准确性（P. 8, Para. 2, Line 2）.
处理长多模态文档：开发更有效的技术来处理包含文本、截图和代码片段等不同模态信息的文档（P. 8, Para. 3, Line 1）.
遥测数据到文本：开发更有效的技术将遥测数据转换为文本，以便LLM能够理解和使用（P. 8, Para. 3, Line 2）.
验证和归因：开发更可靠的验证和归因方法，以提高LLM生成的建议的可信度（P. 8, Para. 4, Line 1）.
LLM作为工具管理器：利用LLM查询外部工具，以计算更准确的影响评估（P. 8, Para. 4, Line 2）.

5 结论

Panda是一个很有前景的数据库性能调试系统，它利用LLM的强大能力，并结合接地、验证、供词和反馈机制，生成针对特定问题的可操作建议。未来研究可以进一步改进Panda的性能，使其能够处理更复杂的问题，并为用户提供更可靠的帮助（P. 9, Para. 1, Line 2）。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

AI大模型

控制台

实用工具

社区资源

官网/API文档

特殊检索

1 引言

2 Panda架构

3 案例研究

4 研究方向

5 结论

发表评论 取消回复

发表评论取消回复