提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
北京市目录链2.0升级上线 系全国首个超大城市区块链基础设施******
图为北京市目录链2.0。 北京市经信局供图
中新网北京1月12日电 (记者 陈杭杜燕)记者从北京市经信局获悉,北京市目录链2.0已于今年1月1日0时正式上线。全市80余个部门、16个区、经济技术开发区以及交通、金融等领域10余家社会机构的数据目录全部上“链”。作为全国首个超大城市区块链基础设施,北京市目录链本次升级依托国内首个自主可控的区块链软硬件技术体系“长安链”开展,实现从底层架构到核心算法的全面自主可控。
北京市大数据中心介绍,目录链作为“北京大数据行动计划”的核心内容,于2018年10月设计、2019年4月上线、2019年10月“锁链”,经过三年多运行,全市80余个部门、16区和经济技术开发区及交通、金融、电信等各领域10余家社会机构“入链”,链上实时管理目录信息50余万条、信息系统2700余个,支撑跨部门、跨层级、跨领域、跨主体的数据安全共享1万余类次、数百亿条。
依托目录链,北京市逐步建立起“数据来源可信任、授权范围可界定、流通过程可追溯、场景用途可监管”的数据管控新格局,在疫情防控、冬奥会和冬残奥会闭环管理、复工复产、城市运行、社会治理、民生服务等上百项重点应用中发挥了核心作用,成为全市大数据整体工作的“定海神针”。
2022年1月以来,为深化北京智慧城市2.0建设、推动数字经济高质量发展,北京市启动了区块链先进算力实验平台建设,对目录链的底层架构和技术能力进行了全面自主可控的国产化改造和适配,并在大规模、高性能、跨平台等方面进行了整体优化升级。
据悉,本次升级依托国内首个自主可控的区块链软硬件技术体系“长安链”开展。“长安链”技术团队负责人介绍,“长安链”具备高并发、低延时、大规模节点组网等能力,实现了目录链2.0在架构灵活性、共识机制、数据存储等方面的显著提升,区块链数据查询响应速度达毫秒级。特别是在安全性方面,目录链2.0的框架体系、技术架构及核心组件全部自主研发,采用国密算法和密码机等多重安全防护技术,全面保障系统安全和数据安全。
下一步,北京市将依托目录链,结合数据专区等创新模式,进一步探索数据要素可信流通、治理体系高效协同的数据全流程管控与监管机制,健全数据要素评估评价体系,全面提升政企数据融合共用的服务能力,挖掘数据效能,释放数据价值,打造全球领先的数字经济标杆城市。(完)
(文图:赵筱尘 巫邓炎)