# 模糊匹配

当用户勾选了模糊匹配时,引擎会在用户语料的基础上进行训练,以覆盖更多的说法。开发者提供的语料越丰富,模型效果越好。

假如用户只写了一句语料“空调怎么卖”,其中系统可以覆盖以下情况:

  • “请问一下空调怎么卖” 礼貌用语的冗余与缺失
  • “空调怎么卖的” 语气助词的冗余与缺失
  • “空调怎么出售” 通用领域的近义词

总结如下:语气助词、礼貌性用语等与语义无关词汇的冗余或缺失以及口语化的表示,通用领域的近义词,如:“出售”,“卖”,“售卖”三个词词义一致,不会影响匹配效果。

TIP

技能工作室后续迭代过程中,我们会持续拓展通用和垂直领域的同义词并迭代更新模型来优化方案,以达到更好的理解效果。

# 模糊匹配阈值

系统目前针对自定义技能、问答开放了模糊匹配阈值调整的功能,阈值越低,用户的说法越容易和已存在的语料匹配,阈值越高,对说法和语料的相似度要求越高。

你可以在快速体验中调整技能阈值进行测试,同时也可以为每个技能在不同场景下设置不同的阈值。目前阈值允许的调整范围是0.50~0.99,自定义技能默认阈值为0.82,自定义问答为0.81。

如果你的产品中有多个技能,我们建议你所有技能均使用默认阈值,并通过丰富语料的方式提高命中率。如果你的产品使用场景非常垂直且单一,你可以尝试降低阈值来实现说法的高命中率。

TIP

自定义技能默认阈值0.82,自定义问答默认阈值0.81是我们经过完善的测试,得到的一个平衡点,适合使用了多个技能的产品,可以保证良好的模糊匹配效果,同时保证较低的错误理解概率。