刘康 发表于 2024-12-27 23:36:08

娜娜对类似含义的话术,识别的准确率好像不同,请问这是什么问题导致?


对娜娜说“我要查请假资料”时,娜娜可以正确识别意图,但是如果缓存“帮我查请假资料”,就可能出现识别错误的情况

刘康 发表于 2024-12-27 23:36:08

原因解释:“我要查请假资料”和“帮我查请假资料”,在“人”的认知中,含义相似,但是因为2句话的使动结构不同,在AI侧理解方式会完全不同,因为当前模型训练时,只训练了“我要查请假资料”这句话,因此小模型其实不太能识别“帮我查请假资料”,转而只能交给大模型进行,而因为用户输入的是“请假资料”,而实际场景名称为“休假资料”,同时助理下还存在名为“请假额度”的场景,所以大模型就有概率出现误判
当前可以将“帮我查请假资料”,及类似语料加入小模型的训练语料中,重新训练,以提交模型识别准确率
对模型做语义训练时,NaNa Designer对训练语料的数量有推荐要求,其实是为了开发者能够丰富语料内容,特别是语法结构,以便AI可以处理不同的话术环境
页: [1]
查看完整版本: 娜娜对类似含义的话术,识别的准确率好像不同,请问这是什么问题导致?