期刊介绍
期刊导读
- 06/11城市+数字技术=?AECOM又有啥大动作?
- 06/10城市+数字技术=?AECOM又有啥大动作?
- 06/10未来博物馆什么样数字技术全面应用于文物展陈
- 06/10上虞这家企业依托数字技术开启“智慧造气”
- 06/10专家热议:金融业应与数字技术融合发展
注意力机制的唇动序列数字验证码识别方法(2)
图2 网络框架
通常训练的模型往往会过度拟合数据集场景,目标词总是在其中心位置。在这种有偏差的环境下训练的模型可以记住这些偏差,并对输入的微小变化变得敏感。例如,简单地从输入序列中删除一个随机帧会导致性能显著下降。所以为了避免这种数据集的偏差,我们提出了一种方法,即对每个输入训练序列在目标词边界之前和之后的一个随机点进行随机裁剪。虽然这种变化不会直接改善现有的基准,但我们认为它产生了更健壮的模型。
3 实验结果与分析
本文是基于数字验证码来做唇语识别的实验,并且在实际应用中是可以通过手机摄像头获得清晰的唇动序列,所以综合考虑下,使用OuluVs2数据集作为本文的实验数据集。OuluVs2数据集具有多个视角的唇动序列,并且也有关于数字验证码的相关唇动序列样本,所以我们使用该数据集的正面视角中的数字验证码部分作为实验数据。该数据集是在实验室环境下采集,样本中总共有52个人,每个人说出30个不同的数字验证码,总共有1560个样本,通过随机分配成1400个训练集,160个作为测试集。
我们使用相同的数据集对不同的算法进行性能测试,一种是基于CNN+LSTM+CTC的传统方法,一种是我们提出的基于CNN+GRU+Attention的方法。使用的评测指标为精确度,其中对于一个样本所有数字验证码的位数都对就认为是正确的,有一个数字识别错误了就认为是错误的。
表1 实验结果方法 精确度CNN+LSTM+CTC 85.4 CNN+GRU+Attention 91.2
实验结果如表1所示,在同样的实验设置下,本文方法在精确度上比传统方法提高了5个百分点的精度。可以看出,我们的方法具有一定的优越性。
文章来源:《数字技术与应用》 网址: http://www.szjsyyyzz.cn/qikandaodu/2021/0611/1463.html
上一篇:数字技术与小微金融担保与风险转移模式创新研
下一篇:字母代替数字代出一片精彩