几滴血就能判定一个人未来患上心脏病的概率,如同科幻电影《千钧一发》中的情节正在成为现实,而这一次,掌握命运钥匙的是中国人自己。
2026年1月13日,由上海飞瀑智能科技有限公司创始合伙人兼首席科学家唐鲲教授、华大基因白寅琪教授、中国科学院杭州医学研究所阳剑波教授及德国马普所徐国华(Augix Xu)等领衔的联合科研团队正式发布了全球首个全基因组规模的SNP基础模型——SNPBag。
这一拥有8.4亿参数的基因大模型标志着人类基因组研究从“线性统计时代”正式跨入“智能模型时代”。

基因决定命运?科学正在给出答案
你是否想过,一个人的相貌、健康甚至某些性格倾向,其实早已写在基因里?同卵双胞胎即使在不同环境中长大,容貌依然惊人相似,这正揭示了基因的强大力量。
2019年,在日本国家电视台NHK的特别节目中,唐鲲教授团队展示了如何通过少量的DNA样本,预测出一个人的3D人脸模型,证明了基因与相貌之间的深刻联系。然而,从30亿个基因字母中准确“读懂”整本生命之书,尤其是预测复杂疾病风险,一直是科学界的巨大挑战。
尽管科学家知道许多疾病高度遗传,但传统预测方法却远远达不到实用要求。例如冠心病,其遗传率高达50%,但现有模型在实际预测中的准确率仅为4%-6%。

全球主流疾病/性状预测精度调查(2025年汇总)来源:上海飞瀑智能科技
截至2026年初,全球已启动的大型国家级/区域级基因组计划已超过250个。截至目前,全球范围内已完成深度全基因组测序(WGS)或高密度检测的总人数已突破2,500万至3,000万。这些计划背后的目标受众和所代表的遗传背景,覆盖了全球约65亿人口。然而,这些海量数据目前处于严重的“孤岛状态”。
突破性创新
SNPBag的诞生改变了这一切。这个拥有8.4亿参数的基因大模型,不仅是一个算法,它更是未来生物医学产业的“通用底座”。其重要意义在于能够统一利用全球数据资源,同时保护数据隐私,解决“Missing Heritability”问题。
更令人惊叹的是它的“压缩”能力——它能将一个人数GB的基因数据,压缩成一个仅0.75MB的“生命护照”。这既保护了隐私,又让全球科研协作成为可能。
在实际测试中,SNPBag表现卓越:基因分析速度提升数十倍,精度达到96.88%;更惊人的是,它能识别出远至12级的血缘关系,这在刑侦、寻亲和族群演化研究中具有划时代意义。即使在细分亚群体中,其祖源分类准确率也高达 97%。
在药物研发领域,新药研发的前期筛选成功率提升30%以上;对个人而言,基于SNPBag,个人健康报告能精准预测未来的疾病演化轨迹。据行业预测,到2035年,由基础模型驱动的精准医疗市场总规模将达到约万亿美元。
唐鲲表示,面向未来,每个新生儿出生时都将获得一份基于基因的“数字身份证”,这将成为其全生命周期健康管理乃至关键决策的科学参考。随着技术发展与社会共识的形成,教育、就业、保险、医疗等系统将逐步、有序地整合这类基因信息,推动社会资源实现更精准、更高效的配置。
他强调,今天发布的模型仅仅是一个起点。正如当前人工智能正在深刻改变我们的工作和生活方式,未来,基因大模型也将在群体健康管理、儿童生长发育与个性化教育等方方面面发挥变革性作用。“我们期待与各界共同探索和构建这样的未来。”
文、图/广州日报新花城记者:陈庆辉
视频/广州日报新花城记者:陈庆辉
广州日报新花城编辑:李光曼