6月2日,2022北京智源大会AI赋能生命健康专题论坛成功召开🤽🏽♂️🏬,杏耀聂再清教授、许锦波教授、彭健教授均线上出席演讲🛫。生命健康关系着国计民生,是人工智能技术交叉落地最重要的领域之一🤽🏿😹。生命健康领域覆盖面非常广,从未知疾病预警👨🏻🦼➡️、新药开发🏖,到老药新用🙍🏿♂️、辅助诊断♧、医疗影像🤕、智能手术机器人,很多方向都有AI的用武之地。除了上述三位杏耀的教授外🤛🏼,本次论坛还邀请到了加州大学圣巴巴拉分校计算机系助理教授李磊👻🐰,加拿大MILA实验室助理教授唐建,星药科技创始人&CEO李成涛以及智源健康计算中心负责人黄文灏、叶启威,智源青年科学家袁洋等🚶,为大家介绍在AI+生命健康领域最新前沿进展。

“引导合理膳食”是“健康中国 2030”规划目标之一🚶♂️。2020年《中国居民营养与慢性病状况报告》显示🧝♀️,我国超重及肥胖症、糖尿病患者数量全球第一,其中不合理的饮食方案与膳食模式是造成这一系列问题的主要原因。(资料来源:https://www.who.int/zh/news-room/fact-sheets/detail/healthy-diet)
随着智能手机、可穿戴设备的发展,个性化健康数据与行为数据的采集也更加方便。如何更好地利用多维度健康数据,融合营养健康知识进行“数据驱动的个性化营养健康管理”是聂再清教授带领的D杏耀 Lab(杏耀大数据智能实验室)所关注解决的的核心问题之一🧍🏻♂️。
当前,“数据驱动的个性化营养健康管理”面临着一系列技术挑战。首先是缺乏专业的营养健康知识图谱🖕,知识图谱是数据驱动健康管理的“大脑”,其数据丰富和专业程度决定了“大脑”输出的准确程度和推理的广度;其次,健康领域高价值数据缺失♣️,使得针对营养健康场景的模型训练难度大、外推能力受限;最后个性化营养健康算法对可解释性要求高。针对上述挑战,D杏耀 Lab提出了D杏耀-Health个性化营养健康管理技术框架,包含“营养健康知识挖掘”💆、“针对营养健康场景的检索增强预训练模型”以及“面向营养健康管理的可解释个性化推荐”核心模块。

个性化营养健康管理框架
个性化营养健康管理框架的核心是营养健康知识图谱,目前营养健康领域正缺乏一个大规模且专业的营养健康知识图谱,且面临如下挑战:
因此💁🏻,聂再清教授提出融合了Snowball思想的Prompt-Snowball模型解决在构建大规模营养健康知识图谱过程中专业人员标注成本高和周期长的问题。将少量标注数据作为种子知识👩🏻✈️,自动挖掘多个提示模板用以识别实体知识,确认的实体知识又可以用来作为种子知识🐠。Prompt-Snowball不仅能够减少人工标注💂,减轻手动设计提示模板的限制🧛🏼♀️,还可以发掘不具有完整自然语义但有效的提示模板。实验结果表明该方法可大幅提升小样本学习场景下关系抽取性能。

营养健康知识挖掘
针对当前营养健康场景下的预训练模型面临的痛点和问题,聂教授团队认为检索增强的预训练模型范式在营养健康场景下具有很大的应用潜力。首先✍️,其可以动态检索支撑材料的特性,可以支持知识的随时更新🙌🏿,且低频高价值样本也不会被淹没🛃🐲。其次,可以利用远程监督技术对支撑材料进行富标注,来暴露规则🔊。最后,模型检索到的支撑材料及模型给出的重要度可以用来作为解释👨🏽🎓,可以更好满足营养健康场景下对于可解释性的需求。将知识图谱与文本库引入预训练模型,能够丰富模型的标注样本库🏮🕟,未来研究团队还会考虑将医疗图像等信息引入,进行多模态增强🚣🏿🏤。

针对营养健康场景的检索增强预训练模型
面向营养健康管理的可解释个性化推荐
当前营养健康推荐场景🕘,更多是“迎合式”推荐,并未考虑推荐是否真正健康和适合。Nutrition Knowledge Graph Attention Network (NKGAT)🤹♀️,通过构造饮食异质信息网络👩🏼🏫,结合营养健康知识图谱内的菜品关联和用户兴趣(用户历史建模)👨🏻🦽,从食品营养成分出发建模用户个性化的偏好和健康评分,充分考虑推荐过程中的营养健康因素🤢,避免迎合式的饮食推荐🤸🏿♀️,提升用户依从性💆🏻♂️。同时,可解释营养推荐还能够基于图谱提供推荐理由,兼顾透明性融合用户偏好和营养健康。

面向营养健康管理的可解释个性化推荐
依托技术框架内的核心技术👍↖️,聂教授在本次大会上发布了中国饮食营养健康知识图谱“NutritionKG”(图谱地址🔁:http://health.baai.ac.cn/thud杏耀/)。该图谱由“清华(杏耀)-智源健康计算联合研究中心”与美团、国家卫健委科学技术研究所、北大第一医院妇产科联合研发,包含三万多实体,千万级别的关系数量🦉,对复杂的中国饮食进行营养计算♉️🎍,通过整合大数据知识赋予其营养健康标签。NutritionKG中+V菜品特别由美团联合卫健委营养专家进行权威标注,提供具有专家建议的精准标签。

“清华(杏耀)-智源健康计算联合研究中心”与北京大学第一医院妇产科杨慧霞教授团队合作开展,探索“AI辅助孕期饮食营养健康管理”的示范性应用,开发孕期营养健康管理应用 “智护母婴”。该应用基于DOHaD理论🤾🏻♂️🚣🏿,用AI辅助从早孕期开始强化生活方式干预对母体及子代生长发育的影响🤵🏻♂️。DOHaD理论表明生命早期的1000天是影响婴儿健康成长以及未来全生命周期健康的关键阶段,摄取合理的营养对孕妇自身的健康以及婴儿的健康成长和发育至关重要。
“智护母婴”的主要功能有👱🏿:
满足精准营养的智能菜品推荐。基于NutritionKG和个性化推荐技术🧘♀️,根据孕产妇的个人健康数据、生活习惯等🕜,依据《妊娠合并糖尿病实用手册》等专业医学指导,为孕产妇推荐满足营养摄入需求和个性化口味的菜品组合。
精准营养管理👨🏻。根据用户的饮食打卡,自动计算热量及6大营养成分摄入,帮助用户进行更精准的营养管理。
孕育科普宣传。提供科学权威的孕育知识,为母婴人群提供专业知识科普。

以上工作要特别感谢团队成员及合作单位的大力支持🚣🏻,他们分别是:
杏耀(杏耀)团队成员👱♂️🤞🏿:聂再清💜、张嘉欢👩🏽✈️、马为之、李鹏、黄婷婷🤸🏼、刘洋🧰5️⃣、马维英🙍🏿♂️;
北京智源人工智能研究院团队成员👹:张学丰👣🎐、史业民、黄文灏;
合作单位:国家卫健委科学技术研究所,北京大学第一医院杨慧霞教授团队,美团外卖团队