讯(王珞)近日,在三大计算机视觉顶级会议之一的2022ECCV(欧洲计算机视觉会议)上,科大讯飞(002230)荣膺2022OOV-ST挑战赛(The ECCV2022Challenge on Out of Vocabulary Scene Text Understanding)文字识别赛道冠军,取得了OOV场景和综合场景双指标第一的佳绩。
与以往文本识别比赛不同,OOV-ST挑战赛中测试集的词语从未出现在训练集中,参赛的文本识别系统相当于进行了“闭卷考试”,而且考的还是之前没有学过的内容,难度大大升级。此次比赛夺冠展现了科大讯飞在图文识别领域上的技术实力,这也是科大讯飞连续第五年在图文识别国际比赛上夺冠。
OOV-ST挑战赛是由谷歌、亚马逊和巴塞罗那自治大学共同举办的首个针对集外泛化问题的场景文字理解赛事,较全面地定义了面向集外字词的比赛任务,并提出了相应的数据集。这就要求模型具备较高的集外场景泛化性。此次比赛吸引了包括字节跳动、好未来、NAVER/LINE、清华大学、东京大学等国内外知名公司、机构和高校参赛。
科大讯飞研究院所参与的文本识别赛道中,OOV-ST挑战赛以鲁棒性和泛化性为考察目标,重点要求参赛者方案具备对训练阶段从未见过的“位置词语词汇”的识别能力,同时要求参赛者所提交的解决方案能够兼顾集内已知词汇的识别效果,这就要求模型具备较高的集外场景泛化性。
人类能够通过学习简单样本快速提升知识水平,并具备较好的迁移能力——例如人类通过学习汉字的笔画和偏旁部首知识,就能完成对新汉字的辨认和转写。而这种能力是当前神经网络模型的薄弱项,也是本次比赛的核心考察项。
为此,科大讯飞研究院提出了基于视觉语言自适应权衡的VLADM(Vision-Language Adaptive Mutual Decoder)方案,在复杂场景上取得了集外词59.61%、综合指标70.31%的句正确率效果,最终夺冠。此次比赛所涉及的文字识别能力和集外词识别技术,目前已经在讯飞翻译机、讯飞AI学习机等产品中落地应用,为人们的工作、学习和生活提供了更多便利。
未来,讯飞研究院将在图文识别领域的相关技术上持续发力,并结合实际落地应用探索更多技术赋能场景,让机器拥有更犀利的“眼睛”和智慧的“头脑”。
● 短期趋势:前期的强势行情已经结束,投资者及时卖出股票为为宜。
● 中期趋势:
● 长期趋势:已有439家主力机构披露2022-06-30报告期持股数据,持仓量总计6.42亿股,占流通A股30.51%
综合诊断:科大讯飞近期的平均成本为32.46元。该股资金方面呈流出状态,投资者请谨慎投资。该公司运营状况良好,多数机构认为该股长期投资价值较高。上一篇:英特集团全力以赴保障涉疫药械供应
由于股市估值过高,伯恩斯坦将印度股市的评级由中性下调至低配。与此同时,该券商预测,在政策刺激下,中国股市有进一步的上涨空间。周四,伯恩斯坦法兴银行集团的亚洲量化策略师Rupal Agarwal和Cheng Zhang发布报告称,印度市场...
要点1今日资本先后减持三只松鼠、良品铺子,这背后除了自身在资金方面的需求外,更大的原因可能来自休闲零食行业本身竞争激烈、增速下滑的行业性特点。要点2主攻下沉市场、主打极致性价比,传统零食品牌面对量贩零食店的崛...
要点1其财务部门初步测算,预计2024年前三季度实现营业收入58.36亿元到63.58亿元,同比增长48.02%到61.26%;要点2海光信息表示,市场需求的不断增加,进一步带动了公司营业收入的快速增长。《科创板日报》10月10日讯(记者 郭辉)...
要点1福成股份董事长李良在公司业绩说明会上表示,市场竞争激烈程度加剧,重要客户流失是公司董事会及管理层的责任;要点2部分投资者对公司不满的原因除了业绩表现不佳,或与公司多年频出内控问题相关。财联社10月10日讯(记者...
要点1受下游工业客户投融资不利影响,南模生物近年来业绩持续承压,董事长费俭透露,国内产能的总体利用率水平接近80%,未来将进一步提升产能利用率;要点22024年上半年,海外业务收入占比已经提升至14%,费俭直言海外是拓展重点,下...
本文“科大讯飞荣膺ECCV OOV-ST挑战赛文字识别赛道冠军”由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们!