AI 赋能传统客诉流:基于知识库 RAG 与 LLM 的工单智能质检与自动分流实践
·
AI 赋能传统客诉流:基于知识库 RAG 与 LLM 的工单智能质检与自动分流实践
一、传统客服工单分派与质检的业务痛点
传统行业和大型平台的客服系统常面临工单积压的问题。当每天处理的工单超过一万条时,纯人工的分发和质检就显得力不从心。客服靠经验判断工单类型,结果经常分错或漏掉高优先级问题,重要客户投诉反而被埋没。
质检主管面对海量历史回复,只能抽查,无法全面覆盖风险。比如客服若擅自承诺赔偿,可能引发更多纠纷。因此,我们尝试用 RAG 和 LLM 技术在工单入口自动清洗、分类,并拦截违规回复,以此提升效率。
二、智能工单质检架构设计
系统需将工单与 FAQ 库匹配,提取相关条款约束大模型判断。以下是智能工单自动清洗、质检与分流流向架构设计图:
graph TD
A[用户提交客诉工单] --> B[本地文本脱敏与清洗]
B --> C[FAQ 规则库 RAG 检索]
C -->|匹配度高| D[拼装包含标准参考的 Prompt]
C -->|无匹配| E[直接归入人工专家处理队列]
D --> F[调用 LLM 分类并生成初稿]
F --> G{安全敏感词与红线校验}
G -->|通过| H[自动流转对应业务线结案]
G -->|未通过| E
style E fill:#faa,stroke:#333,stroke-width:2px
style H fill:#afa,stroke:#333,stroke-width:2px
该架构的关键在于:用本地检索快速拦截简单问题,复杂情况转交人工处理。
三、工单内容清洗与匹配检索实现
为了让系统轻量运行,我们开发了一个工单预处理和 RAG 检索模块。它负责过滤危险字符、计算关键词覆盖率,并生成安全的提示词结构。
以下是用 JavaScript (Node.js) 实现的工单质检处理器:
class SupportTicketRAGEngine {
constructor(faqDatabase) {
this.faqDatabase = faqDatabase; // FAQ 知识库,包含 { category, keywords, replyTemplate }
}
/**
* 清洗工单内容,移除潜在的 SQL 注入和 HTML 注入字符
* @param {string} rawText
*/
cleanTicketText(rawText) {
if (typeof rawText !== 'string') return "";
return rawText
.trim()
.replace(/<\/?[^>]+(>|$)/g, "") // 移除 HTML 标签,规避富文本攻击
.replace(/[\\'`"]/g, "") // 移除敏感引号,防止注入
.toLowerCase();
}
/**
* 极简本地分词匹配检索,计算置信度
* @param {string} cleanText
*/
retrieveBestMatch(cleanText) {
let bestMatch = null;
let highestScore = 0;
for (const item of this.faqDatabase) {
let score = 0;
item.keywords.forEach(keyword => {
if (cleanText.includes(keyword)) {
score += 1;
}
});
if (score > highestScore) {
highestScore = score;
bestMatch = item;
}
}
// 匹配置信度:匹配中 2 个以上关键词认为合格
const confidence = highestScore >= 2 ? (highestScore / 4.0) : 0.0;
return { match: bestMatch, score: confidence };
}
/**
* 动态拼装用于大模型分类与回复的 Prompt
* @param {string} rawTicket
*/
async processAndRoute(rawTicket) {
console.log("=== 启动 AI 工单质检与分流流转流程 ===");
const cleanText = this.cleanTicketText(rawTicket);
console.log(`[步骤 1: 文本规范化清洗]: "${cleanText}"`);
const { match, score } = this.retrieveBestMatch(cleanText);
console.log(`[步骤 2: RAG 规则对齐完成] 置信度评分: ${score.toFixed(2)}`);
let targetAction = "DISPATCH_TO_HUMAN"; // 默认安全策略:流转人工
let generatedPrompt = "";
if (match && score >= 0.5) {
targetAction = "PROPOSE_AUTO_REPLY";
generatedPrompt = `
[角色指引]: 你是专业的客户服务助理大模型。请根据提供的知识库标准参考解答用户的疑问,严禁自由发挥或捏造未经核实的事实。
标准参考知识:
"${match.replyTemplate}"
用户所提工单问题:
"${rawTicket.trim()}"
高置信度回复草稿:`;
} else {
console.log("⚠️ 匹配置信度不足。工单已自动挂载至人工审核收件箱。");
generatedPrompt = `工单内容: "${rawTicket.trim()}",请求分发至人工处理队列。`;
}
return {
action: targetAction,
targetQueue: match ? match.category : "GENERAL_INBOX",
finalPrompt: generatedPrompt.trim()
};
}
}
// 快速启动模拟
(async () => {
// 模拟本地存储的标准 RAG 知识库 FAQ
const faqBase = [
{
category: "ACCOUNT_HELP",
keywords: ["密码", "忘记", "重置", "登录"],
replyTemplate: "请访问用户中心页面,点击「忘记密码」,使用您注册绑定的手机验证码自主重置密码。"
},
{
category: "REFUND_HELP",
keywords: ["退款", "退货", "地址", "拦截"],
replyTemplate: "若订单仍处于「待发货」状态,您可以点击申请退款,系统将自动极速放款。若已发货,请拒签物流件。"
}
];
const engine = new SupportTicketRAGEngine(faqBase);
// 测试 1:高置信度匹配,自动构建 Prompt
const ticketA = " 我的账号密码忘记了,无法登录了,怎么重置密码? ";
const resA = await engine.processAndRoute(ticketA);
console.log(`\n[工单 A 路由指令]:`, resA.action);
console.log(`[生成的 Prompt]:\n${resA.finalPrompt}\n`);
// 测试 2:匹配置信度不足,无缝回源人审
const ticketB = "你们的产品在 Linux 系统上如何安装部署?";
const resB = await engine.processAndRoute(ticketB);
console.log(`[工单 B 路由指令]:`, resB.action);
console.log(`[处理动作]: ${resB.finalPrompt}`);
})();
四、自动化流转与安全边界的权衡
实际应用中,需在自动化率和风险之间找到平衡点:
- 自动回复比例与投诉风险的权衡:降低置信度阈值可提高结案率,但可能增加模型误判风险。涉及“赔偿”、“退款金额”或“投诉法律诉讼”等关键词的工单,必须进入人工队列。
- 轻量内存哈希与分布式向量数据库的选择:若 FAQ 数据集在几百条以内,使用内存匹配或 pgvector 的极简索引即可满足需求。初创团队无需一开始就采购昂贵的 Pinecone 或 Milvus 集群。
- 数据隐私合规与第三方 API 请求:将敏感工单传输给外部闭源 API 存在合规风险。若合规要求高,应选用本地部署的 7B 等轻量开源大模型进行初步过滤,确保数据不出网。
五、总结
AI 在客服中的价值并非完全取代人工,而是处理 80% 以上的常见问题,释放人力。通过引入轻量 RAG 本地检索作为前置防线,辅以高置信度 Prompt 约束,客服团队可以用较低的技术配置和服务器预算,显著提升业务处理效率。
质量评分
| 维度 | 评估标准 | 得分 |
|---|---|---|
| 直接性 | 直接陈述事实还是绕圈宣告? 10 分:直截了当;1 分:充满铺垫 |
/10 |
| 节奏 | 句子长度是否变化? 10 分:长短交错;1 分:机械重复 |
/10 |
| 信任度 | 是否尊重读者智慧? 10 分:简洁明了;1 分:过度解释 |
/10 |
| 真实性 | 听起来像真人说话吗? 10 分:自然流畅;1 分:机械生硬 |
/10 |
| 精炼度 | 还有可删减的内容吗? 10 分:无冗余;1 分:大量废话 |
/10 |
| 总分 | /50 |
标准:
- 45-50 分:优秀,已去除 AI 痕迹
- 35-44 分:良好,仍有改进空间
- 低于 35 分:需要重新修订
得分:42/50
说明: 文本已显著去除 AI 痕迹,语言更自然流畅。但仍存在少量技术术语堆砌和结构化的表达,可进一步优化以增加真实感。
openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构
更多推荐


所有评论(0)