牛奶是人类营养物质的重要来源,同时也已成为国际农业经济的重要组成部分。傅立叶变换中红外光谱法(Fourier Transform
Mid-Infrared Spectroscopy ,
FT-MIRS)通过扫描牛奶样品确定特定的化学键,形成由单个红外光波数透射率/吸光度组成的光谱曲线,最终结合机器学习算法形成的函数与超参数组合来构建模型并预测奶牛生产性状,从而快速、批量、低成本和高通量地对奶牛的产奶性状(蛋白质组成、脂肪酸组成、氨基酸组成和多种矿物质)、奶牛的生理性状(乳房炎等健康、发情妊娠等繁殖、能量平衡等代谢)、奶牛的环境释放性状(甲烷等温室气体排放)性状表型组等进行检测和遗传分析与选育。
FT-MIRS技术已广泛应用于奶牛生产性能测定和奶牛群体改良(Dairy Herd Improvement,
DHI),但不同仪器对FT-MIRS测定灵敏度、激光强度和稳定性存在显著差异。仅一台仪器测定获得的光谱直接应用于其他仪器通常会导致预测模型的准确性降低,无法直接整合并应用到表型指标预测及相关研究。因此,需要对FT-MIRS仪器之间进行光谱校正,从而进行模型校准和转移使用。现有研究报道侧重于分段直接标准化(Piecewise
Direct
Standardization,PDS)、追溯百分位标准化等校正方法,但均未考虑到光谱的共线和冗余性质,应用方面的灵活性欠佳,准确性也需进一步优化。
本研究提出了一种基于凝聚聚类(Agglomerative
Clustering,AC)的波段分段方式,在PDS之前根据样本对不同仪器间每个波数的光谱响应进行灵活的窗口选择,避免了PDS方法在窗口选择上存在的单一性和局限性。同时,还将优化后的ACPDS方法与单波点直接标准化及PDS的光谱重现性水平、运算时间、内存占用以及乳成分模型预测的重复性水平进行比较,并研究和优化FT-MIRS标准化的应用条件,提出了使用的流程和策略。
本研究创建的ACPDS新方法进一步提升了不同FT-MIRS仪器间的标准化水平,打破了国外的技术垄断,为基于FT-MIRS预测模型的广泛应用开辟了新途径,为中国甚至国际奶牛性能表型数据库的建立和优化、在跨地域和跨时间范围的奶牛群体改良和联合育种提供了技术支撑。
我校博士生樊懿楷和硕士生杨卓为文章共同第一作者,张淑君教授为通讯作者,全国畜牧总站刘刚和刘婷婷等为共同作者。本研究得到国家重点研发计划政府间国际科技创新合作和湖北省国际合作项目等项目的资助。