当前位置:首页 >网络 >

云知声-中科院自动化所联合实验室获CCKS2020医疗命名实体识别评测冠军

2020-11-18 10:29:00

日前,第十四届全国知识图谱与语义计算大会(CCKS-2020)在南昌召开。会上公布了CCKS-2020技术评测结果,云知声-中科院自动化所语言与知识计算联合实验室在“面向中文电子病历的医疗命名实体识别评测任务”中获得冠军,并斩获该任务唯一技术创新奖。

CCKS由中国中文信息学会语言与知识计算专业委员会主办,是知识图谱、语义技术、链接数据等领域的核心会议。其中,CCKS技术评测致力于促进国内知识图谱领域的技术发展,以及学术成果与产业需求的融合和对接,而“技术创新奖”的设立,专门用于鼓励创新性技术的使用。

“面向中文电子病历的医疗命名实体识别”是CCKS围绕中文电子病历语义化开展的系列评测的延续,在CCKS 2017、2018、2019相关评测任务的基础上进行了延伸和拓展,旨在从电子病历纯文本文档中识别并抽取出医学临床相关的实体指称,并将其归类到预定义的疾病诊断、影像检查、实验室检验、手术、药物以及解剖部位六种实体类别上。

相对于通用领域的命名实体识别,医疗命名实体识别面临两大核心挑战:

● 实体标注不一致。医疗领域的标注通常需要医学专业背景的人员,而不同科室方向的标注者对标注标准的理解各异,因此容易出现不同标准的标注结果。这一现象难以用规则去规避,也不能简单的直接纠正训练集中标注不一致的实体,因为并不知道哪一种标准是正确的。

● 缺乏训练数据。由于医学领域数据的敏感性,研究者们往往难以获得足够多的标注数据。标注数据的缺乏通常会导致长尾现象以及模型泛化性不足。当训练数据缺乏时,模型的预测结果可能会因模型参数的不同设置而剧烈变动。在医学场景下,需要的是更稳定、可靠的模型。

为应对上述难点,云知声-中科院自动化所联合实验室团队基于贝叶斯不确定性策略构建了一个基于有噪标签学习的中文医疗命名实体识别系统。该系统由基于对抗训练的半监督深度学习融合模块与基于实体多标、漏标与错标规则的后处理模块共同组成。在本次评测中,系统在官方决赛测试集上取得了严格指标0.9156,松弛指标0.9660的最高分数。

目前,联合实验室团队这一创新研究成果已在云知声旗下“智能病历质控”、“智能语音电子病历”等产品中应用,并用于医疗知识图谱的构建。相关产品已在全国百余所医院落地,对于提升医生工作效率、强化医院信息化管理及智慧医疗体系建设意义重大。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐阅读

  • 初级教程:微信上的标签怎么删除
    微信上的标签怎么删除微信好友删除标签的步骤是:1、打开位置,在【通讯录】页面,点击【标签】选项。2、选择并点击好友所在的标签。3、点击【删除标签】即可。微信(w
    2022-04-29
  • 使用手册:微信群聊怎么指定回复某一段话
    微信群聊怎么指定回复某一段话微信群聊指定回复某一段话的方法是:1、打开微信群聊。2、长按需要回复的对话,在弹出的对话框里点击【引用】选项。3、输入回复内容即可。
    2022-04-29
  • 技术教程:微信聊天背景动态壁纸怎么设置
    微信聊天背景动态壁纸怎么设置微信是不能设置动态聊天背景的。微信聊天背景图的设置方法如下:1、点击微信菜单栏的【我】--【设置】,进入设置选项;2、进入设置页面,
    2022-04-28
  • 联发科天玑2000旗舰芯片已备好,请于Q3-Q4季度查收!
    三星马上就发布带AMD RDNA 2 GPU的SOC,高通也准备了骁龙888 PLUS和骁龙895,苹果则是A15在9月份蓄势待发。今年下半年的高端芯片市场竞争
    2021-07-09
  • 虎牙斗鱼合并泡汤!腾讯回应
    2021年1月4日,市场监管总局对腾讯申报的虎牙与斗鱼合并案,依法进行经营者集中反垄断审查。7月9日,市场监管总局依据《反垄断法》,全面分析评估,审查表明,腾讯
    2021-07-10
  • 谷歌 Fuchsia O S系统新标识曝光,黑了
    根据外媒爆料,从美国专利商标局发现谷歌提交了一项图标专利申请, 可以看出是基于英文字母“f”的设计而来,从原来活泼的紫红色变成稳重的黑色,本质设计上来说都是无限
    2021-07-13