基于矩阵分解和注意力多任务学习的客服投诉工单分类.docx资源-CSDN文库

版权申诉

22 浏览量 2022-06-01 08:34:53 上传评论收藏 136KB DOCX 举报

在客服投诉工单分类的领域，随着通信运营商业务的扩展，快速准确地处理投诉变得至关重要。传统的依靠人工标记投诉工单的方式效率低下且准确性有限。因此，利用自动化的方法对投诉工单进行分类成为提高客户满意度和运营效率的关键。具体而言，这是一种层次多标签文本分类（Hierarchical Multi-Label Text Classification，HMTC）问题，因为投诉工单通常涉及多个层级的业务类别，这些类别之间存在相互关联。传统文本分类方法往往忽视了类别间的层级关系，导致分类效果不理想。为了解决这个问题，本文提出了一种创新性的方法，即基于矩阵分解（Matrix Factorization，MF）和注意力机制的多任务学习方法（Attention-based Multi-task Learning Approach，AML）。这种方法被称为MF-AMLA，它专门针对HMTC任务，旨在更精确地对通信运营商的投诉工单文本进行分类。多标签文本分类是自然语言处理中的基础任务，早期的分类算法，如朴素贝叶斯、SVM、KNN和随机森林，由于高维和稀疏性问题，分类效果并不理想。随着深度学习的发展，神经网络模型如TextCNN、RNN、LSTM和GRU在文本分类领域表现出色。尤其是Transformer模型及其衍生的预训练模型，如GPT和BERT，通过自注意力机制有效地处理长期依赖，显著提升了分类性能。对于多标签分类，可以分为问题转换和算法适应两种策略。问题转换方法将多标签问题转化为多个单标签问题，如Binary Relevance和Label Power-set，但它们在处理大规模多标签数据时可能遇到计算复杂度问题。算法适应方法则直接处理多标签数据，如Rank-SVM和ML-KNN，更适用于具有依赖关系的多标签分类。在HMTC中，局部方法如Hierarchical SVM根据类别层次结构分别建立模型，而全局方法则尝试捕捉所有类别的依赖关系。MF-AMLA结合了这两种思路，利用矩阵分解来捕获类别之间的潜在关系，同时通过注意力机制来强调关键信息，从而在多任务学习框架下优化分类性能。这种方法有望在处理通信运营商投诉工单分类时，提高效率和准确性，推动客服服务的智能化和数字化进程。

资源推荐

资源详情

资源评论

0 引言

近年来，通信运营商的客户数量稳步上升，业务范围增大，面临的投诉问

题日趋繁多和复杂

[1

]

。快速准确地处理投诉工单是提升客户满意度和运营商效益

的重要方面。针对每个投诉工单，首先需要判断其所属的业务类别。传统的依

赖客服坐席标记投诉工单所属类别需要耗费大量的人力成本和时间成本，而且

不能保证很高的准确率。因此，对投诉工单文本进行自动化分类是运营商朝着

数字化、智能化方向发展的要求

[2

]

。

通信运营商客服场景的投诉工单文本相较于一般的文本，通常对应很多层

级的业务类别，并且各类别之间存在一定的关联关系

[3

]

，每个层级的业务类别串

联形成最终的总类别，属于典型的层次多标签文本分类（ hierarchical multi-

label text classification，HMTC）问题。传统的文本分类方法很少考虑类别层

级的关联关系，文本特征表示相对较弱，分类效果仍有提升空间。因此，为了

实现对运营商投诉工单文本的自动分类以及保证高的准确率，需要采取更有针

对性的有效分类方法。本文创新性地提出一种基于矩阵分解（ matrix

factorization ， MF ）和注意力的多任务学习（ attention-based multi-task

learning approach， AMLA）的方法，被称为 MF-AMLA，处理 HMTC 任务，

帮助运营商客服快速准确地对多层级的投诉工单文本进行分类。

1 相关工作

1.1 多标签文本分类

文本分类是自然语言处理（NLP）中的一个经典任务，旨在为给定的文本

序列分配预定义的类别

[4

-5

]

。早期的文本分类算法主要基于浅层学习，如朴素贝

叶斯（naive bayes）、支持向量机（support vector machine，SVM）、K 最

邻近分类（K-nearest neighbor，KNN）和随机森林等，这些方法存在高维度、

高稀疏问题，分类效果差。近年来，深度学习的快速发展使得神经网络在文本

分类领域大放异彩。例如，文本卷积神经网络（ text convolutional neural

network，TextCNN）

[6

]

能够捕捉局部相关性，在短文本分类上取得较好效果。

循环神经网络（recurrent neural network，RNN）

[7

-8

]

考虑了上下文信息的语义

关联。长短期记忆（long short-term memory，LSTM）网络

[9

]

可以学习长距离

依赖信息，解决了传统 RNN 梯度消失的问题。门控循环单元（gated recurrent

unit，GRU）

[10

]

作为 LSTM 的一种变体，结构更加简单。Transformer 的自注意

力机制在处理长期依赖的问题时相较于 LSTM 有更好的表现

[11

]

。基于此，

GPT（generative pre-training）预训练词向量模型[12]、BERT （bidirectional

encoder representations from transformers）预训练语言模型

[13

]

，依次刷新各

NLP 任务效果。

多标签文本分类是文本分类的重要分支，相比于单标签分类任务，多标签

通常有复杂的依赖性，每个文本不只属于一个类别，而是被赋予多个标签。

Tsoumakas 等

[14

]

将多标签分类的方法分为两类，一类是问题转换的方法，另一

类是算法适应的方法。前者将多标签分类问题转化为一个或多个单标签分类问

题，代表算法有 Binary Re levance

[15

]

、 Random k-labelsets

[16

]

、 Calibrated

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余9页未读，立即下载

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 4060
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip