近日,平安科技亮相重庆,参加第十一届中国健康服务业大会。在会上平安科技与国内知名体检软件领导者天方达签署合作协议,并首次向外界展示了人脸识别、声纹识别、大数据分析、体检智能录入系统等与健康管理相关的产品及技术解决方案。
2017年5月9日,在国际权威人脸识别公开测试集LFW(Labeled Faces in the Wild)上,平安科技以99.8%的识别精度和最低的波动幅度超越国内外知名公司,取得世界领先的成绩。
平安集团董事长马明哲曾在年中报的致辞中指出,“平安将逐步从资本驱动型的公司变身为科技驱动型的公司”。担负起平安集团科技发展重任的正是其全资子公司平安科技。
目前,平安科技已经在人脸识别、声纹识别、预测AI、决策AI、区块链五大创新科技技术取得巨大突破。并着重关注平安集团的金融资产、医疗健康这两大产业。
为了了解平安科技在人工智能医疗领域的布局,动脉网记者特意专访了国家千人计划专家,平安科技首席科学家兼技术研究院院长肖京博士。
肖京博士
AI四大要素:技术、数据、场景、专家
肖京博士本人是卡耐基梅隆大学博士,拥有二十多年从事人工智能与大数据分析相关的研究经验。据他告诉动脉网,人工智能在医疗领域的发展离不开四个要素:技术、数据、场景、专家。在3年多的发展过程中,平安科技在四个方面做了深厚的积累和认识。
在技术方面,平安科技目前拥有6000多名专业IT技术人员和IT管理专家。在计算机视觉、自然语言处理、语音识别、机器学习等领域有深入的研究。主要团队成员均来自CMU、MIT、UCLA、普林斯顿、清华、浙大等国内外著名大学或研究机构。
平安科技团队经过几年努力搭建的“平安脑”智能引擎具备行业领先的数据挖掘和分析能力,可以实现文本理解、图像识别、语音识别、精准匹配、趋势预测异常分析等功能。
在医疗大数据方面,平安本身有自己的优势。平安集团在30多年的发展过程中一直与医疗健康打交道,多年来积累了亿级以上的数据量,这是别的人工智能公司不能望其项背的。
另外,针对平安科技的大数据的分析,肖京博士认为主要经历四个阶段:
规则引擎:平安科技从医疗经验里总结出特定的规则,经过反复的实验和探索,将其应用在保险的反欺诈和健康管理方面; 数据关联分析:主要处理数据的统计聚类和线性回归分析; 机器学习:分析结构化的数据,平安科技与医疗专家一起定义显著的特征,然后建立模型,应用到临床; 深度学习:这个阶段主要分析非结构化的数据,比如影像、语音文本数据等。
在场景方面,平安集团作为一家行业领先的综合金融服务公司,业务覆盖金融服务生态圈、医疗健康生态圈、汽车服务生态圈、房产金融生态圈等涉及用户衣食住行的200多个应用场景。
在专家方面,肖京博士说:“在医疗领域,平安拥有强大的医疗保障团队,目前平安好医生拥有1000多名专职医生,还有1000多兼职专家。这些医生团队为平安科技在人工智能+医疗领域的布局提供了非常专业而且接地气的指导,避免了平安科技走弯路。”
人工智能+医疗的五大应用场景
肖京博士介绍,平安布局人工智能+医疗是顺理成章的事情。平安重要的业务之一是保险,保险与医疗息息相关,比如我们所熟知的健康险就是最直接的医疗保险,所以平安涉足医疗是很正常的。
目前,平安科技在人工智能+医疗领域已经覆盖了五大场景:人脸识别核验身份、流行病预测、智能读片、医保欺诈识别和“相似病例”服务。我们分别对这五个场景进行了简单解读。
人脸识别核验身份
平安科技人脸识别技术现阶段主要应用在诊疗的身份核验环节,包括如下应用场景:就诊者刷脸预约挂号;诊前刷脸验证,预防伪检、替检;刷脸打印检查报告,方便、快捷,为市民建立了快捷通道。
这个技术也不是纸上谈兵,平安科技已经与中山大学附属第八医院等医疗机构进行了技术方案的试点落地,刷脸核验身份已经应用在就医的多个环节。
流行病预测
2017上半年,由平安科技研发的全球首个人工智能+大数据流感预测模型已落地。该模型能够精确预测流感趋势,精准预测个人和群体的疾病发病风险,帮助公共卫生部门及时监控疫情,并指导民众进行疾病预防,有效降低国家疾病与防控工作的成本。涉及的病种包括流感、肿瘤、慢病、高血压、糖尿病等。
智能读片
智能读片是目前国内大多数人工智能+医疗的创业公司的研究领域。目前大多数公司都研发出了自己的产品,在肺癌、糖网病、甲状腺疾病、消化道疾病等领域也取得了一定的成绩。但是在实际临床应用中很多公司由于数据来源单一,仅仅只能在几家或者几十家医院使用,不具备普适性。
肖京博士介绍,目前全国各级医院使用的大型设备有很多种型号,比如CT设备就有近百种型号,为了能够让产品可以在大多数医院使用,平安科技在AI训练的时候采用了各级医院的不同数据,使系统可以尽量让大多数医院使用。目前,平安科技的肺结节检测系统在临床的灵敏度已经达到94%,在胃癌、宫颈癌等疾病上的研究也在稳步进行中。
医保欺诈识别
医保本来是一种人民的健康保障制度,现在有些不法之人利用医保违法牟利。比如“药老鼠”、挂床、串诊等。药老鼠是指不法分子利用“社保卡套现”为诱,向市民收购社保卡,随后用这些卡购买药品后销售牟利。挂床又称“假住院”,一般规定,不在医院里住或者连续三天以上没有诊疗费就可以称为挂床。
针对这些问题,平安科技建立了可视化关系网络,结合时间和空间,从患者、疾病、诊疗、医生、医院等多个维度建立医疗就医关系网络,利用机器学习等相关算法,识别其中的欺诈行为和群体。
比如,连续三个月平均每个月就诊20次,购药40次以上,报销金额超过2000元,且就医地点分布在相隔较远的两个区域,系统就会初步判定为欺诈。
“相似病例”服务
“相似病例”服务是系统利用语义识别技术,根据用户输入的病症,召回最为相关的病例与医生的回答。肖京博士介绍,此技术可以提高基层医生的诊疗能力,帮助基层医生实现全科医生的职能。同时,这个技术也可以服务于C端用户,减少他们不必要的就诊。
人工智能+医疗的产品要“接地气”
在整个访谈的过程中,肖京博士不止一次提到“接地气”这个词。
对于这个说法,我们也非常认同。从动脉网采访的数十家医疗AI企业来看,经过过去一年多的发展,不少人工智能+医疗的公司都研发出了自己的产品,且在实验室研发阶段的检测准确率也很高,可是当产品应用于临床之后,准确性会大打折扣,远不如实验室里的效果好。
针对这种“不接地气”的现象,肖京博士认为人工智能+医疗领域的产品研发出发点都需要基于临床的实际需求,在准备阶段要多与临床的医生沟通,而且是不同医院,不同阶段的医生,了解他们的痛点。在准备训练数据的时候,团队也需要搜集不同医院的临床数据,然后进行标注处理。产品出来以后也需要在实际临床中不断打磨,让人工智能这个“高大上”技术,变得具备实用价值。
因此,平安科技推出的医疗AI产品都是在充分沟通以后,以实际需求为导向,为解决医生、政府、民众等用户实际问题而进行研发的。这些产品不仅仅是实验室里高高在上的科研项目,更是可以实实在在解决临床问题的创新产品。