文章 |随着人工智能技术的发展,AI逐渐开始应用于各个行业并发挥出自身的价值。
其中,由于医疗涉及国计民生,且行业较为传统,具有良好的发展空间,自然成为了大家青睐的AI应用领域。
过去一年,“AI+医疗”成为越来越热门的话题。
智洞智也在医学图像识别、辅助会诊、医疗文献数字化等领域进行了相应的采访。
今天,智喜喜来到另一家AI医疗创业公司康夫子,与创始人兼CEO张超聊了聊。
张超介绍,康夫子专注于为B端客户提供基于医疗数据的AI服务。
其核心技术包括知识图谱、NLP(自然语言处理)等,推出了医疗预诊系统“全科医生”和病历数据结构化服务等产品。
1.五年百度NLP经验。
我是第一次见到张超。
他身材高高瘦瘦,戴着眼镜,笑容灿烂。
张超介绍,康夫子成立于2001年,目前已经经历了两轮种子轮和天使轮融资。
目前,数千万元A轮融资即将完成:其中天使轮融资近千万,由晨兴创投投资。
。
张超本人此前曾在百度搜索 NLP 部门担任高级研发工程师 5 年。
他也是文本知识挖掘的负责人,负责相关的知识图谱和实体建模(这些技术后面会进一步讲解)。
公司另外两位合伙人也来自百度:负责整体架构的前百度高级研发工程师张冲和技术合伙人/前百度NLP高级研发工程师李晓华。
目前,康夫子团队约有30人,其中大部分来自百度NLP部门,技术研发人员约20人。
张超说,其实,当他第一次萌生创业想法时,他第一个接触的人就是张冲。
“周三我和他约好了,周五我们在新中关下面的星巴克见了面。
当时他已经(从百度)辞职了。
”两人几乎一拍即合,很快就确定了发展方向。
李晓华在“六上草堂”期间受到张超的邀请。
此前,李晓华和张超在百度上是很好的好友。
他们曾多次拒绝张超的邀请,理由是“好朋友不愿意一起创业”。
(从左到右:张超、李晓华、张冲)2、深耕知识图谱,有丰富的团队经验。
作为昨天国务院下发的《新一代人工智能发展规划》中也出现的人工智能关键技术,NLP(自然语言处理)我们已经非常熟悉了。
一旦熟悉了,就比较容易理解了;但什么是“知识图谱”呢? 2020年5月,谷歌在其官方博客上发表了一篇题为《Introducing the Knowledge Graph: things, not strings》的文章,介绍了谷歌借助知识图谱实现搜索技术从关键词到实体的飞跃,即让机器学习理解关键词代表什么。
实际意义。
此时,知识图谱的概念开始慢慢出现。
张超介绍,知识图谱是实体和实体关系的总和。
我们可以将其理解为由相互连接的实体组成的语义网络。
(来源:网友高天普《什么是知识图谱》)如图所示,不同的实体可以通过属性关联起来,例如:1)刘德华(实体)&#;妻子(属性)->朱丽倩(其他实体)2)刘德华电影作品->无间道3)无间道的制作国家/地区->中国香港最终的知识图谱是实体与总和的图片他们的关系。
以搜索引擎为例。
随着数字信息的指数级增长,“关键词搜索”已经不能满足用户的精准需求。
搜索引擎需要识别内容中出现的实体和实体关系,准确理解用户的搜索意图。
并给出准确的答案。
知识图谱中的技术面临的挑战包括实体识别、消歧(重名、别名)、实体关系挖掘等,归根到底是NLP自然语言处理技术。
张超表示,知识图谱的构建需要通过信息抽取技术(Information Extraction,IE)来实现,而信息抽取技术现阶段还没有很好的解决方案。
因此,从整体上看,信息抽取是一门“熟能生巧”的技术,只有“熟悉”才能“熟能生巧”。
由于康夫子的团队普遍拥有多年的实践经验,并基于百度大语料库做过信息抽取,因此能够总结出适合实际使用的方法论,知道如何快速结构化数据。
知识图谱的方法很明确:实体抽取、关系抽取、图存储和检索。
然而,由于这仍然是一个非常年轻的学科,仅仅从论文和教科书上进行理论知识研究是不够的。
需要在实践中一一经历很多“坑”,才能真正在行业落地并获得效益。
效力。
“我们的优势是经验多,做起来快。
别人做一个维度需要一个月,而我们只需要不到一周。
医疗有多个维度,我们已经做到了7、80个维度。
” ”张超微微一笑说道。
得意地对志东说道。
3、基于知识图谱打造三大医疗法宝。
目前,康夫子的主要合作伙伴是为医院提供软件平台(如HIS医院管理、医疗活动信息系统)的公司。
核心产品包括以下几类: 1)“机器人全科医生”(医疗聊天机器人) “机器人全科医生”实际上是一台设置在医院挂号处的机器,内置康夫子的预诊系统,类似于一个医疗聊天机器人(Chatbot)。
输入/点击姓名、性别、年龄后,用户可以输入相应的症状,例如“胃痛很厉害”。
系统会模仿全科医生,一步步询问患者的病情,比如“腹痛最为常见”。
什么时候发生的?”、“属于哪种类型的疼痛?”等等。
(图为康夫子全科医师iOS SDK)问题结束时,系统会告诉用户,基于出现上述症状,有73%的可能性是患有肠炎,需要去消化科会诊。
同时,系统还会生成一份用专业医学术语描述的病历,并将这份病历发送给医生。
消化内科医生,提高了医患沟通效率,节省了时间和成本,目前该系统已在张家港市第一人民医院上线测试,除了提高挂号效率外,这套预诊系统还可以应用于急诊。
未来的救护车在运送病人时,救护人员可以提前收集病人信息并提前准备相应的医生。
2)病历结构化。
多年来,医院存储的患者病历通常包含病情描述,这是非结构化数据,非常不利于信息检索和分类。
而且,医疗数据的维度一般都非常高。
仅就高血压而言,就有“既往诊断、当前诊断、将来可能诊断”等不同的结果。
又如,“患者住院第一天没有咳嗽,第二天使用某种药物时出现咳嗽,24小时内出现高烧”。
在这种情况下,药物、住院史和患者的病情属于不同的类别。
相关文件需要按照时间线进行整理和分析。
此外,每个病房护士可能会用不同的方式描述相同的症状,从而导致医疗数据极其复杂。
康夫子所做的就是将这些海量的数据进行结构化,最终打造出一个医生可以点击、搜索的病历平台。
例如“患者性别=男”+“疾病名称=感冒”+“病史!=糖尿病”等,最终得到用户在今年3月某日的病历。
3)临床辅助系统 与前两项一样,康夫子的临床辅助系统也是基于康夫子的NLP(自然语言处理)技术的一套产品。
这项技术将被植入医生填写病历、发放药品、核对医嘱的系统中。
系统根据医生填写的病历了解和分析患者的病情后,给出推荐的治疗方案。
不过,这个系统不会改变医生的工作流程。
医生填写病历、选药、开具检查单等动作和以前一模一样。
唯一不同的是,填写完成后,系统中会出现一个小弹窗: 系统正在分析 医生填写病历后,会提醒检查是否有空白(例如,某些两种药物可能会发生冲突)。
医生可以选择遵循它,或者干脆忽略它。
该产品目前正处于打磨阶段。
张超表示,康夫子正在与一家三级公司做医学研究,预计年底上线。
4、从2C到2B,康夫子的转型之路。
事实上,康夫子在2008年创立时,最早定下的方向就是从孕妇群体出发,打造饮食营养知识图谱。
基于孕妇特别注重营养的事实,我们以孕妇膳食分析为切入点,推出了孕期美食App。
孕妇在App中记录饮食后,“饮食记录分析”功能可以通过知识图谱输出分析报告和饮食建议。
但医疗App作为C端产品首先面临变现困难的问题,这也是2016年兴起的互联网+医疗App浪潮面临的共同问题;其次,虽然营养知识是孕妇迫切需要的,但它并没有严格的标准,人们往往有不同的意见(比如饭前吃米饭还是饭后吃水果……),很难让人信服。
。
从年底到年初,团队开始思考转型策略。
因为团队的强项仍然是其多年的知识图谱和文本分析技术积累,而医疗健康仍然是康福子看好的领域。
经过几番考虑,今年4月,团队最终决定向B端转型,并选择了医学等边界严格、更适合用机器来理解和分析的领域。
张超表示,目前,康夫子的合作伙伴已经覆盖了全国前十大HIS医疗信息公司的近一半。
其咨询互动服务也应该在搜狗名医、好医生网站上推出。
当用户访问这些网站时搜索“咳嗽”或“胃痛”时,系统会给出可能的疾病类型,比如“也许57%是感冒,4%是支气管炎,3%是咽炎……”结论中在与张朝中辉交流的过程中发现,他与无数技术出身的创业者有着相似的特征。
他逻辑思维清晰,有毅力,谈起技术就很兴奋,对自己和团队的能力有足够的信心和自豪。
经历了从C端到B端、从营养到医疗的转变,康夫子的业务推广路线逐渐初见成效,在优化问诊流程、结构化医疗数据等方面取得了良好进展。
在这个医疗数据丰富而复杂的时代,医疗信息的数字化、结构化、信息检索的重要性日益凸显。
在此背景下,一些创业团队选择了将医疗信息文档识别数字化(比如之前智动智采访过的医学影像智能),而康夫子选择的路线就是在数字化的基础上对数据进行结构化。
、图处理,并依托公司创始人及团队在百度多年的经验和技术积累,进入医疗信息化公司并取得了不错的成绩。