Study on the Impact of Multicollinearity Among Components on Near-Infrared Spectroscopy Quantitative Models
-
摘要: 在近红外光谱结合化学计量学方法进行定量分析中,变量之间存在的多重共线性是影响光谱模型效果的一个关键问题。探究了组分含量间的多重共线性对化学计量学定量模型的影响。设计维生素B6(低浓度)和维生素B1(高浓度)含量之间分别呈强相关性和弱相关性的两个体系,以维生素B6为目标待测组分,利用体系的近红外光谱信息结合偏最小二乘法建立组分含量的预测模型。结果表明,当体系中存在与目标组分具有强相关性的其它较高浓度共存组分时,模型可以借助该共存组分信息实现对较低浓度的目标组分更为准确地预测,从而提高了模型对目标组分定量分析的精确度。通过应用于检测含维生素B6和B1组分的市售口服液,进一步验证了组分含量之间存在强相关的多重共线性能够提高近红外光谱模型的定量预测能力。该研究结论具有很强的理论和实际应用价值,可以将其应用到复杂混合物体系组分的同时定量分析中。Abstract: In quantitative analysis using near-infrared spectroscopy combined with chemometric methods, multicollinearity among variables is a key issue affecting the performance of spectral models. This study investigates the impact of multicollinearity between component concentrations on chemometric quantitative models. Two systems were designed with strong and weak correlations between the concentrations of vitamin B6 (low concentration) and vitamin B1 (high concentration), respectively. Using vitamin B6 as the target component, prediction models for component concentrations were established using near-infrared spectral information combined with partial least squares regression. The results show that when there are coexisting components with high concentrations strongly correlated to the target component in the system, the model can utilize information from these coexisting components to achieve more accurate predictions of the lower-concentration target component, thereby improving the precision of quantitative analysis for the target component. The application of this approach to the detection of commercially available oral solutions containing vitamins B6 and B1 further verified that strong multicollinearity between component concentrations can enhance the quantitative predictive ability of near-infrared spectral models. The conclusions of this study have significant theoretical and practical application value and can be applied to the simultaneous quantitative analysis of components in complex mixture systems.
-
0. 引言
化学计量学从数学维度上将原始数据的复杂信息进行处理分离,获取关键信息,实现对混合体系中目标组分的定量以及定性分析。化学计量学思想的出现,源于人们认识到传统的单变量统计已经不足以描述和模拟化学实验,化学计量学通过使用实验设计、化学信号处理、化学模式识别和多元校正与分辨,使用从数学、统计学和计算机科学衍生的方法,突破了单变量统计的局限性。近年来,伴随分析技术的不断发展,仪器分析获取数据量的不断增大,化学计量学越来越多的被用于食品[1 − 2]、医药[3 − 4]、环境等[5 − 6]相关研究领域,尤其是在近红外光谱(Near Infrared Spectroscopy,NIRS)分析中发挥了重要作用。近红外光谱技术结合化学计量学方法,将样品近红外光谱中的化学信息与样品本身的物质含量或性质数据进行分析,从而建立定量或定性分析模型,运用模型实现对某种物质含量或性质的快速预测[7]。
在构建光谱化学计量学模型[8 − 9]的过程中,量测数据所包含的变量之间常会出现多重共线性的现象。多重共线性是解释变量之间存在的一种较强的线性关系,两个或多个解释变量之间的线性关系越强,它们之间就越有可能存在显著的多重共线性。在一个特定的样本中,如果存在严重的多重共线性,那么样本计算的估计值就会产生偏差,多重共线性将会产生一定的负面影响[10]。近红外光谱数据是一种多变量高维数据,光谱信息中往往存在大量冗余信息,若直接建模,会因为高维数据存在的多重共线性问题而严重影响模型的精度。当前发表的研究大都聚焦于因变量(光谱)响应信号之间的多重共线性问题。当光谱信号中存在两个或多个变量之间具有高度相关性,往往会影响化学计量学模型的建立,从而降低数据分析结果的准确性。这是由于变量间存在的严重多重共线性问题,会使回归估计量的方差变大[11],参数估计值的置信区间不断变宽,从而大大降低了估计系数的精度,严重影响估计值的稳定性。同时,变量之间存在线性关系,则意味着这些变量具有相似的趋势,并且可能携带相似的信息[12]。变量之间的高度相关性使得数据的拟合程度过高,降低了分析的可靠性,导致模型的泛化能力较差,从而降低了模型的稳定性和预测能力[13]。因此,经常采用变量筛选(选择)的方法以降低或消除光谱变量之间的较强的相关性,提高模型的预测精度和预测效率。TANG等[14]提出了一种基于相关性的连续投影算法(Correlation-Based Successive Projection Algorithm,CB-SPA)算法,对橡胶树的氮含量进行预测,选择出更有价值的变量和更少的多重共线性的变量子集,缩短了检测时间,提高了预测精度。CHENG等[15]提出了一种基于相互信息和方差膨胀因子相结合(Mutual Information-Variance Inflation Factor,MI-VIF)的变量选择方法,对茶叶的真菌菌落数含量和柴油的总芳烃含量建立定量分析模型,有效地从全谱数据中提取出与响应变量相关性最大以及与所选变量共线性最小的变量,获得了较好的预测效果。
在化学计量学模型的构建中,自变量(待测组分)之间的多重共线性也会对模型的构建和预测产生的影响。邵学广等[16]指出当被测成分与样品基质中具有近红外光谱活性的组分具有相互作用或含量之间具有相关性时,多元校正模型可以很好地体现光谱与被测物之间的定量关系。Cozzolino等[17]结合化学计量学对土壤中的多种金属元素含量进行分析,得到良好预测结果,从而推测微量金属离子的含量预测与基质中其他常量组分含量之间的相关性有关。Chodak等[18]分析了重金属污染的土壤中Zn和Pb的含量,但未能准确预测,认为Zn和Pb与土壤中的有机物或其他组分不具有良好的相关性。这些研究基本都围绕着无机微量成分的分析,推测提出无机成分可以通过与有机物成分含量之间的相关性或与其结合作用而得到较准确定量,推论相关的系统的定量实验考察并未展开。
本研究设计比较了有机物维生素B6和维生素B1浓度之间分别呈强相关性和弱相关性的两个体系。维生素B族包含一系列成员,它们是人体新陈代谢所必需的辅酶,通过参与蛋白质、脂肪和碳水化合物的代谢,维持身体细胞的正常功能。利用它们的近红外光谱信息结合偏最小二乘[19 − 22](Partial Least Square, PLS)法建立化学计量学模型,探究组分间的多重共线性对近红外光谱定量模型的影响,并实现多组分含量的同时定量预测。发现当体系中存在与被测组分具有强相关性的较高浓度组分时,模型可以借助该组分信息实现对较低浓度的被测组分更为准确地预测。进一步通过预测含维生素B6和维生素B1市售口服液中成分的含量,验证了组分间存在强相关的多重共线性能够提高近红外光谱模型的定量预测能力。而当体系中存在与目标组分具有弱相关性的较高浓度组分时,该组分携带的信息对目标组分模型构建产生不利影响,使预测准确性降低。该研究结论具有实际应用价值,可以拓展应用到复杂混合物体系组分的同时定量分析中。
1. 材料与方法
1.1 材料与仪器
主要试剂:维生素B1(98%,上海麦克林生化科技股份有限公司)、维生素B6盐酸盐(99%,上海麦克林生化科技有限公司)、韦达普锌维生素B1维生素B6口服液(威海百合生物技术股份有限公司);主要仪器设备:MATRIX-F傅里叶变换近红外光谱仪(天津恒创立达科技发展有限公司)、CP224C电子天平(奥豪斯仪器(常州)有限公司)。
1.2 实验过程
1.2.1 溶液配制
1)强相关性、弱相关性双组分溶液的配制
配制50个浓度范围为0.4~20.0 mg/mL的维生素B6单组分水溶液,50个浓度范围为2.0~88.0 mg/mL的维生素B1单组分水溶液。在配制双组分体系溶液之前,通过控制浓度相关系数的大小来确定维生素B6和维生素B1的浓度对应关系。在浓度呈强相关性的双组分体系的实验设计中,将维生素B6和B1浓度的皮尔逊相关系数(R2)设置为
0.9512 ,其相关关系如图1(a)所示。依据设计的浓度关系,配制50个具有强相关性的双组分溶液样本。同样,在浓度呈弱相关性的双组分体系的实验设计中,将维生素B6和B1浓度的皮尔逊相关系数(R2)设置为0.3867 ,其相关关系如图1(b)所示。依据设计的浓度关系,配制50个具有弱相关性的双组分溶液样本。2)实际药物样本的配制
将维生素B6和维生素B1含量均为0.2 mg/mL的“韦达普锌维生素B1维生素B6”口服液用纯净水逐级稀释,获得含维生素B6和B1浓度均为0.05 mg/mL、0.1 mg/mL、0.15 mg/mL和0.2 mg/mL的4个待测样本溶液,维生素B6和B1浓度之间呈强相关性。
1.2.2 近红外光谱的采集
采用光程为2 mm的石英比色皿,空气作背景,分别采集上述配置的维生素B6单组分溶液、维生素B1单组分溶液、强相关性双组分溶液、弱相关性双组分溶液、实际药物样本的近红外吸收光谱。设置扫描次数为32次,分辨率为8 cm−1,光谱采集范围为
4000 ~12000 cm−1。每个样本重复采集3次光谱,取其平均光谱作为最终光谱。1.3 模型构建
采用偏最小二乘(Partial Least Square, PLS)法对近红外光谱数据进行分析。PLS是近红外光谱中最常用的多元校准方法,它用潜变量代替原始变量来减少波段重叠和噪声干扰等的影响[23]。PLS能同时对吸光度矩阵和浓度矩阵进行主成分提取,加强了近红外光谱与样本浓度之间的相互对应关系,有助于建立稳健、精确的近红外光谱模型。
采用决定系数(R2)、校正均方根误差(root mean square error of calibration, RMSEC)、预测均方根误差(root mean square error of prediction, RMSEP)和预测集相对偏差(residual prediction deviation, RPD)对模型进行评价。选用训练集决定系数(R2c)和RMSEC作为评价训练模型好坏的依据[24 − 25],R2c越接近于1,RMSEC越小,说明建立的训练模型精密度越好。预测集决定系数(R2p)和RMSEP通常作为评价模型预测能力的指标[26],R2p越接近于1,RMSEP越小,模型预测的准确度越好。除此之外,RMSEC和RMSEP越接近,建立模型的稳定性越好。RPD可用来验证模型的可靠性,一般RPD的值大于2.5时,则认为所建模型具备较高的可靠性,能够用于实际的分析中[27]。四个评价指标的计算公式如下:
RMSEC/RMSEP=[1mm∑j=1(yj−ˆyj)2]12 (1) R2=1−m∑j=1(yj−ˆyj)2m∑j=1(yj−¯yj)2 (2) RPD=[1mm∑j=1(yj−¯yj)2]12RMSEP (3) 上述公式中,m表示样本数量;yj表示第j个样本的真实值;ˆyj表示第j个样本的预测值;¯yj表示所有m个训练样本真实值的平均值。
2. 结果与讨论
2.1 光谱分析
近红外光谱基于近红外光的吸收特性,通过测量样品对不同波长近红外光的吸收程度来获得样品的光谱信息。对维生素B6溶液、维生素B1溶液、维生素B6和B1混合溶液进行近红外光谱扫描,波长范围在
12000 ~4000 cm−1之间的傅里叶变换近红外光谱如图2所示。可以看出,维生素B6溶液和维生素B1溶液的近红外光谱几乎一致。被测物质在
4185 cm−1和6920 cm−1下对近红外光有较大的吸收,在4868 ~5300 cm−1内由于溶剂水分子的存在而对近红外光谱产生强烈吸收。维生素B6和B1混合溶液的近红外光谱并无新的吸收峰产生,在6920 cm−1处的特征峰吸收程度增强。由此可见,仅对被测物质水溶液的近红外光谱图进行对比,并不能直接获得样本差异信息。所以借助化学计量学方法对所获得近红外光谱数据进行有效信息的提取,从而对维生素溶液成分含量进行定量分析。2.2 模型的建立与分析
Kennard-Stone(KS)[28]法以两两样本之间的欧氏距离为依据实现代表性强、分布范围均匀的样本划分选择。通过选择具有最大差异性和信息量的样本,KS法可以最大限度地保留原始数据集的多样性和代表性。采用KS法将维生素B6单组分溶液、强相关性双组分溶液、弱相关性双组分溶液的光谱数据分别划分为包含35个样本的校正集,以及包含15个样本的预测集。
2.2.1 强相关性、弱相关性双组分体系模型的建立
以混合溶液中低浓度的维生素B6为目标分析组分,高浓度的维生素B1为其它共存组分,对强相关性双组分溶液和弱相关性双组分溶液进行定量分析。在PLS建模过程中,主成分(主因子)数是影响模型性能的一个主要参数,需要选择合适的主成分数对模型进行优化[29]。将主成分数优化范围设置为1~10,使用数据集的RMSEP来确定PLS最佳主成分数。经优化后,维生素B6单组分溶液、强相关性双组分溶液、弱相关性双组分溶液体系的所选取的PLS最佳主成分数分别为2、5、5。得到的模型各评价参数如表1所示。将维生素B6单组分溶液与强相关性双组分溶液的预测结果进行对比,可以看出:当体系内组分浓度之间存在强相关的多重共线性时,相比较单组分溶液,维生素B6的RMSEC、RMSEP值分别下降了50.7%、31.5%;同时R2c、R2p和RPD均得到提升,也表明了模型的预测精确度的提高。而将弱相关性双组分溶液与维生素B6单组分溶液的预测结果进行对比,可以看出:当体系内存在弱相关的多重共线性共存组分时,目标分析组分的RMSEC、RMSEP值分别上升了2.3%、29.0%;同时R2c、R2p和RPD的下降也表明了模型预测准确性的降低。
表 1 维生素B6的预测结果Table 1. Prediction results for vitamin B6目标组分 溶液体系 最佳主成分数 校正集 预测集 RPD R2c RMSEC R2p RMSEP 维生素B6 维生素B6单组分溶液 2 0.9540 1.2369 0.8988 1.4997 3.0489 强相关性双组分溶液 5 0.9898 0.6101 0.9676 1.0272 4.6435 弱相关性双组分溶液 5 0.9492 1.2657 0.8969 2.1114 2.7562 图3为维生素B6单组分溶液、强相关性双组分溶液、弱相关性双组分溶液中维生素B6浓度的实际值和预测值的线性关系图。当组分之间存在强相关性时,R2p为
0.9676 ,说明模型的预测准确性较高。因此,可以得出结论:因变量(光谱)响应信号之间的多重共线性是导致模型效果较差的一个关键因素,会降低模型的泛化能力,并且还会对数据造成过度拟合[30]。而当自变量(待测组分)之间出现多重共线性时,体系中存在与目标组分具有强相关性的较高浓度组分时,模型可以很好地借助该组分信息实现对较低浓度的目标组分更为准确地预测;体系中存在与目标组分具有弱相关性的较高浓度组分时,该组分就会成为干扰组分,其携带的信息对模型的构建产生不利影响,使模型的预测准确性降低。因此,在实际目标体系的应用中,若存在与目标组分具有强相关性的较高浓度组分时,则无需消除该组分的存在,可以借助该组分的信息来实现对低浓度目标组分的含量预测,具有较大的实际意义和应用价值。
2.2.2 实际药物样本中维生素B6浓度的预测
为验证组分含量之间存在强相关的多重共线性能够提高近红外光谱模型的定量预测能力这一结论,以维生素B6为目标分析组分,维生素B1为其它共存组分,用建立的近红外光谱定量分析模型预测实际药物样本中维生素B6的浓度,预测结果见表2。所建模型中,R2c、R2p分别为
0.9624 、0.9348 ,表明模型的拟合程度较高;RMSEC、RMSEP分别为1.2435 、1.6019 ,RPD为2.8418 ,表明模型的预测精度较高且所建模型具备一定的可靠性。表 2 实际药物样本的预测结果Table 2. Prediction results for actual drug samples目标组分 最佳主成分数 校正集 预测集 RPD R2c RMSEC R2p RMSEP 维生素B6 5 0.9624 1.2435 0.9348 1.6019 2.8418 图4为实际药物样本中维生素B6浓度的实际值和预测值的线性关系图。当组分之间存在强相关性时,R2p为
0.9348 ,说明所建立的近红外光谱定量分析模型对实际药物样本中维生素B6浓度的预测有较高的准确度。通过对实际药物样本的检测,进一步表明当体系中的目标组分与其他共存组分具有强相关性时,模型会借助组分间强相关的线性关系提高预测准确度。3. 结论
本研究利用近红外光谱技术结合化学计量学方法建立了组分含量的预测模型,探究了组分间的多重共线性对模型的影响,并实现了多组分含量的同时定量预测。研究表明,当体系中存在与目标组分具有强相关性的较高浓度组分时,模型可以借助该组分信息实现对较低浓度的目标组分更为准确地预测,从而提高了模型对目标组分定量分析的准确度。通过应用于实际药物样本的检测,进一步验证了组分含量之间存在强相关的多重共线性能够提高近红外光谱模型的定量预测能力。组分间的多重共线性现象普遍存在于实际目标体系中,本研究结论具有较强的理论和应用意义。可以将其拓展应用到其他复杂混合物体系中,实现对多组分干扰共存下的低浓度目标组分的定量预测,但该模型也存在一定的局限性。模型优势首先取决于样品本身的特征,当实际样品的基质发生较大变动时,预测效果可能会降低[16]。未来研究中将应用不同形成环境的样品,进一步考察模型定量预测的结果和对定量关系的影响。
-
表 1 维生素B6的预测结果
Table 1 Prediction results for vitamin B6
目标组分 溶液体系 最佳主成分数 校正集 预测集 RPD R2c RMSEC R2p RMSEP 维生素B6 维生素B6单组分溶液 2 0.9540 1.2369 0.8988 1.4997 3.0489 强相关性双组分溶液 5 0.9898 0.6101 0.9676 1.0272 4.6435 弱相关性双组分溶液 5 0.9492 1.2657 0.8969 2.1114 2.7562 表 2 实际药物样本的预测结果
Table 2 Prediction results for actual drug samples
目标组分 最佳主成分数 校正集 预测集 RPD R2c RMSEC R2p RMSEP 维生素B6 5 0.9624 1.2435 0.9348 1.6019 2.8418 -
[1] 高峰, 邢雅阁, 罗华平, 等. 基于可见/近红外光谱与化学计量学的杏品种无损鉴别方法[J]. 光谱学与光谱分析, 2024, 44(1): 44-51. [2] WU J, PENG H, LI L, et al. FT-IR combined with chemometrics in the quality evaluation of Nongxiangxing baijiu[J]. Spectrochimica acta. Part A, Molecular and biomolecular spectroscopy, 2023, 284: 121790. DOI: 10.1016/j.saa.2022.121790
[3] TAKAMURA A, OZAWA T. Recent advances of vibrational spectroscopy and chemometrics for forensic biological analysis[J]. The Analyst, 2021, 146(24): 7431-7449. DOI: 10.1039/D1AN01637G
[4] PRUKSAPHA P, KHONGKAEW P, SUWANVECHO C, et al. Chemometrics-assisted spectroscopic methods for rapid analysis of combined anti-malarial tablets[J]. Journal of food and drug analysis, 2023, 31(2): 338-357. DOI: 10.38212/2224-6614.3449
[5] LU Y Y, YAO G D, WANG X, et al. Chemometric discrimination of the geographical origin of licorice in China by untargeted metabolomics[J]. Food chemistry, 2022, 380: 132235. DOI: 10.1016/j.foodchem.2022.132235
[6] 黄秀, 康嘉诚, 王淇, 等. 基于盲源分离的有机物混合信号特征提取与解析[J]. 计量学报, 2023, 44(4): 645-652. DOI: 10.3969/j.issn.1000-1158.2023.04.23 [7] 李鑫, 沈晓君, 王媛媛, 等. 近红外光谱法快速测定晒青毛茶三种儿茶素组分含量[J]. 现代食品科技, 2024, 40(3): 326-332. [8] 李艳坤, 许东情. 基于中红外光谱模型对食用植物油掺伪的判别[J]. 河北大学学报(自然科学版), 2022, 42(6): 605-610. [9] 张正东, 李轲, 丁超民, 等. 利用近红外光谱有效化学信息建模快速识别醇基汽油种类[J]. 计量科学与技术, 2023, 67(12): 3-12. DOI: 10.12338/j.issn.2096-9015.2023.0331 [10] 董丽华. 对多重共线性的分析及其补救措施[J]. 绥化学院学报, 2008(3): 171-173. DOI: 10.3969/j.issn.2095-0438.2008.03.060 [11] TOKA O. A Comparative Study on Regression Methods in the presence of Multicollinearity[J]. Journal of Statisticians: Statistics and Actuarial Sciences, 2016, 9: 47-53.
[12] 程介虹, 陈争光, 衣淑娟. 最小相关系数的多元校正波长选择算法[J]. 光谱学与光谱分析, 2022, 42(3): 719-725. DOI: 10.3964/j.issn.1000-0593(2022)03-0719-07 [13] 李艳坤, 董汝南, 张进, 等. 光谱数据解析中的变量筛选方法[J]. 光谱学与光谱分析, 2021, 41(11): 3331-3338. [14] TANG R N, CHEN X P, LI C. Detection of Nitrogen Content in Rubber Leaves Using Near-Infrared (NIR) Spectroscopy with Correlation-Based Successive Projections Algorithm (SPA)[J]. Applied spectroscopy, 2018, 72(5): 740-749. DOI: 10.1177/0003702818755142
[15] CHENG J H, SUN J, YAO K S, et al. A variable selection method based on mutual information and variance inflation factor[J]. Spectrochimica acta. Part A, Molecular and biomolecular spectroscopy, 2022, 268: 12065.
[16] 邵学广, 宁宇, 刘凤霞, 等. 近红外光谱在无机微量成分分析中的应用[J]. 化学学报, 2012, 70(20): 2109-2114. [17] COZZOLINO D, MORÓN A. The potential of near-infrared reflectance spectroscopy to analyse soil chemical and physical characteristics[J]. The Journal of Agricultural Science, 2003, 140(1): 65-71. DOI: 10.1017/S0021859602002836
[18] CHODAK M, NIKLIŃska M, BEESE F O. Near-infrared spectroscopy for analysis of chemical and microbiological properties of forest soil organic horizons in a heavy-metal-polluted area[J]. Biology and Fertility of Soils, 2007, 44: 171-180. DOI: 10.1007/s00374-007-0192-z
[19] HAO Y, LU Y, LI X Y. Study on robust model construction method of multi-batch fruit online sorting by near-infrared spectroscopy[J]. Spectrochimica acta. Part A, Molecular and Biomolecular Spectroscopy, 2022, 280: 121478. DOI: 10.1016/j.saa.2022.121478
[20] YI L, LI X L, LI W J, et al. Detection of chlorpyrifos and carbendazim residues in the cabbage using visible/near-infrared spectroscopy combined with chemometrics[J]. Spectrochimica acta. Part A, Molecular and Biomolecular Spectroscopy, 2021, 257: 119759. DOI: 10.1016/j.saa.2021.119759
[21] VISNUPRIYAN R, FLANAGAN B M, HARPER K J, et al. Near infrared spectroscopy combined with chemometrics as tool to monitor starch hydrolysis[J]. Carbohydrate polymers, 2024, 324: 121469. DOI: 10.1016/j.carbpol.2023.121469
[22] VEETTIL T C P, WOOD B R. A Combined Near-Infrared and Mid-Infrared Spectroscopic Approach for the Detection and Quantification of Glycine in Human Serum[J]. Sensors (Basel, Switzerland), 2022, 22(12): 4528. DOI: 10.3390/s22124528
[23] JIANG Z Q, DU Y P, CHENG F, et al. A simple multiple linear regression model in near infrared spectroscopy for soluble solids content of pomegranate arils based on stability competitive adaptive re-weighted sampling[J]. Journal of Near Infrared Spectroscopy, 2021, 29: 140-147. DOI: 10.1177/0967033520982366
[24] YUN Y H, LI H D, DENG B C, et al. An overview of variable selection methods in multivariate analysis of near-infrared spectra[J]. Trends in Analytical Chemistry, 2019, 103: 102-115.
[25] HOSSEINI E, GHASEMI J B, DARAEI B, et al. Near-infrared spectroscopy and machine learning-based classification and calibration methods in detection and measurement of anionic surfactant in milk[J]. Journal of Food Composition and Analysis, 2021, 104: 104170. DOI: 10.1016/j.jfca.2021.104170
[26] 李轲, 鲁冰, 杜彪, 等. 汽油中乙醇光谱特征谱段的有效选取及应用[J]. 计量科学与技术, 2022, 66(5): 19-24. [27] NICOLAI B M, BEULLENS K, BOBELYN E, et al. Nondestructive measurement of fruit and vegetable quality by means of NIR spectroscopy: A review[J]. Postharvest Biology and Technology, 2007, 46(2): 99-118. DOI: 10.1016/j.postharvbio.2007.06.024
[28] KENNARD R W, STONE L A. Computer aided design of experiments[J]. Technometrics, 1969, 11: 137-148. DOI: 10.1080/00401706.1969.10490666
[29] LU Z H, LU R T, YU C, et al. Nondestructive testing of pear based on fourier near-infrared spectroscopy[J]. Foods, 2022, 11(8): 1076. DOI: 10.3390/foods11081076
[30] CHAN J Y L, LEOW S M H, BEA K T, et al. Mitigating the multicollinearity problem and its machine learning approach: A Review[J]. Mathematics, 2022, 10(8): 1283. DOI: 10.3390/math10081283