公共卫生学院博士生赵俊康发表
膳食模式统计分析方法的总结与展望
膳食摄入在高血压、肥胖、糖尿病等慢性病中起着重要作用,但在营养流行病学领域,占据长期主导地位的单一营养素或食物组研究难以反映食物和营养素间错综复杂的相互关系,导致整体膳食在健康促进及疾病预防方面的作用难以被清晰地阐明。例如,某种食物中包含多种营养素,这些营养素有着复杂的交互作用和潜在的累积作用,传统方法很难分离并明确这些营养素对疾病的单独效应。另外,由于饮食摄入为不同食物的组合,一些食物摄入的增加会相应导致其它一些食物摄入的减少,呈现出替代效应,因此也很难分析单个食物的健康效应,而同时将所有食物组纳入分析模型又会产生共线性的问题。因此,从整体上考虑了不同食物和营养素间关系的膳食模式研究受到越来越多地关注。过去的几十年里,已经涌现出许多经典统计方法来构建膳食模式,主要分为三大类:第一类是研究者驱动法或先验法,包括膳食指数法和饮食评分法等;第二类是数据驱动法或后验法,包括主成分分析、因子分析、聚类算法等。第三类是合并法,包括降秩回归和偏最小二乘法等。另外,近年来还不断涌现出一些新的统计方法用于构建膳食模式,包括Treelet变换法、有限混合模型、决策树算法、LASSO和成分数据分析等方法,但这些方法很少或从未被充分的评述及讨论过。
近日,山西医科大学公共卫生学院卫生统计学教研室博士研究生赵俊康及课题组在nutrition journal(中科院升级版2区)发表了题为“A Review of Statistical Methods for Dietary Pattern Analysis”的述评文章,全面总结了国内外膳食模式统计分析方法领域的最新进展。
该研究对目前已知用于构建膳食模式的所有方法进行了重分类,并从其基本思想、主要优缺点、实现软件及进一步研究方向等方面,进行了全面归纳和总结。尽管经典的统计方法已经被广泛应用,但某些新颖的方法在具体应用场景中也展示了自身在膳食模式研究中相对于经典方法的优点,尤其是成分数据分析方法作为一种新的单独类别,给广大研究者提供了新的研究思路和方向。目前,众多膳食模式分析方法主要用于解答不同的研究问题,尚没有一种方法可以解决膳食模式研究中的所有问题。另外,课题组还介绍了未来膳食模式研究中的方法学挑战并提出了发展展望,为后续更深入的研究和理解膳食模式的构建并揭示膳食与健康结局间的关系提供了参考。
王彤教授为该研究的通信作者,博士研究生赵俊康为第一作者,公共卫生学院营养与食品卫生教研室的赵海峰教授也为该研究做出了重要贡献。该研究得到了国家自然科学基金的支持。