责编:鱼鱼 热度:24999
近日第十六届国际语义评测(The 16th International Workshop on Semantic Evaluation, SemEval 2022)大赛落下帷幕,经过角逐,科大讯飞在三项主要赛道中拿下冠军,彰显了其在多语种语言理解领域技术的硬实力。
第一项是本次SemEval 2022评测聚焦的“多语种新闻相似度评测任务”(Task 8),该项任务是需要参赛队伍在两篇相似度极高的新闻中做判断,比如在地理信息、写作风格、叙述方式以及描述的具体事件等主要元素做剥离和分析,得出两篇文章的相似度与差异化,且其中还包含了多达10种语言,需要具备很强的跨语言理解能力。从实际角度来看,未来此技术可以甄别外网新闻报道是否存在偏差与曲解,有效预防虚假信息、不良信息的传播。在此赛道上拔得头筹,充分展示了科大讯飞在跨语言理解能力上的实力。
科大讯飞拿下的第二项冠军,是“多语种惯用语识别任务”(Task2 Subtask A)的惯用语检测。该任务的要求是要判断给定的语句中,多字短语用法究竟是惯用语还是字面意思,比如“说曹操,曹操到。”句中的曹操是否真实存在。此任务需要参赛队伍区分不同句子中同一个词的不同语义,这需要强大的分析及跨语言理解能力。该项技术在日常写作和翻译工作中,可以有效鉴别惯用语的表达用意,极大提高内容准确率。
第三项是“多语种复杂命名实体识别任务”(MutiCoNER)。科大讯飞披荆斩棘、迎难而上,在该项任务中一举拿下三个子赛道冠军。该任务是一个多语言赛道数据集,包含11项单独语言命名实体评测任务,以及2项多语言统一建模的评测任务。参赛团队需要在单个语言以及多个语言混合的文本数据中,精准预测不同语言实体的类别标签,例如人名、地名、机构名、专有名词等。此项任务复杂程度和难度都极高,科大讯飞不负众望持续进阶。
此前,科大讯飞已经多次在多种语音识别竞赛中荣获第一并刷新世界纪录,在此次SemEval 2022多语种语言理解领域中也取得了佳绩,说明科大讯飞有着顶尖技术实力,已经走在了行业前沿。
前沿的技术在实际场景中也做到了应用落地。在今年北京冬奥会和冬残奥会上,科大讯飞作为“官方自动语音转换与翻译独家供应商”,依托强大的多语种语音语言技术,做到了语种足够全、翻译足够准、反应足够快,支持包括冬奥体育在内的16大行业领域翻译,帮助各国观众、游客快速掌握赛事信息。科大讯飞AI虚拟人“爱加(i+)”还在北京冬奥小屋中,用多种语言与各国运动员进行面对面的交流,助力了冬奥的无障碍沟通。
除此之外,在4月21日晚间科大讯飞刚发布的2021年度及2022年第一季度年报中显示,讯飞的多语种语音交互系统,在教育、医疗、司法等各个场景的应用中,都发挥着重要作用,且规模在持续扩大。
持续解决社会刚需,用人工智能创造美好生活的初心不变,相信科大讯飞未来依旧坚持在人工智能源头的技术创新,带动人工智能行业继续蓬勃发展。