例如,当问“您发货到哪里? ”时,客户实际上可以说出以下任何短语: 你们送货到爱尔兰吗? 您会邮寄到法国吗? 我可以从意大利订购吗? 我想知道你们是否可以运送到英国境外? 可以送货到丹麦吗? 还有很多很多。这些短语的含义只有一个,但它们彼此之间却有很大的不同。 理想情况下,可能用来提问或提及问题的每个模telegram 手机号码数据式的大量示例。这很难实现,但如果您可以访问并使用客户和客服人员之间过去对话中的短语,则可能接近目标。仅仅猜测客户可能会说什么是远远不够的,尽管不幸的是,许多客户服务自动化项目(即聊天机器人)都是从这开始的。
为 AI 构建训练数据 我们已
经看到,获得高质量的训练数据对于让您的自动化系统理确定中心页面的关键主题解客户所说的内容至关重要,但什么才是真正的高质量?有四个维度需要考虑,按重要性顺序排列:正确性、清洁度、多样性和数量。 正确数据 将用于语言理解的分类算法视为一种近似方法。对于训练示例中的任何给定类别,它近似于人类认为该类别应该属于的基本事实。因此,它的结果总是比基本事实更不准确。如果基本事实不正确或不一致,结果将相同或更糟。 这就是为什么训练数据中的示例需要分配正确的类别,理想情况下在所有情况下都是如此。实现起来比看起来要难,特别是当你处理大量类别时。
最大的困难是一致性
主要是因为人类语言固有的歧义性。一个人可以将一个措辞分配给一个特定的类别,而另一个人会将具有相同含义的类似措辞分配给另一个类别。这在很大程度上取决于你的类别定义方式。 让我们举全部100个例子。有两个类别:运费(对运费的疑问或投诉)和超额收费(客户说他被收取的费用超过了应有的费用)。像“预计运费是多少? ”这样的措辞很容易被任何人误认为是运费。但是“我被错误地收取了运费” 呢?根据不同的人,人们可以将此短语视为运费或超额收费。甚至一个人在某个时候也可以将这样的短语分配给运费,但后来又将具有相同含义的类似短语分配给超额收费。