欢迎访问《安徽农学通报》官方网站,今天是
农产品加工·检验检测

主成分、聚类和判别分析在翠碧一号烤烟加工性能划分中的应用

  • 庄增坤 1 ,
  • 王清旺 1 ,
  • 陆军 2 ,
  • 陈清柏 1 ,
  • 林梦涵 1
展开
  • 1福建省三明金叶复烤有限公司,福建 三明 365000
  • 2江苏中烟工业有限责任公司原料部,江苏 南京 210000
王清旺(1975—),男,福建建瓯人,工程师,从事打叶复烤加工工艺研究工作。

庄增坤(1975—),男,福建三明人,工程师,从事烟草打叶复烤加工工艺、质量管理工作。

Copy editor: 杨欢

收稿日期: 2024-09-25

  网络出版日期: 2024-12-12

Application of principal component analysis, cluster analysis and discriminant analysis in the classification of processing properties of Cuibi No.1 flue-cured tobacco

  • ZHUANG Zengkun 1 ,
  • WANG Qingwang 1 ,
  • LU Jun 2 ,
  • CHEN Qingbai 1 ,
  • LIN Menghan 1
Expand
  • 1Fujian Sanming Golden Leaf Rebaking Co. , Ltd. , Sanming 365000, China
  • 2Raw Material Department of Jiangsu Zhongyan Industry Co. , Ltd. , Nanjing 210000, China

Received date: 2024-09-25

  Online published: 2024-12-12

摘要

为对翠碧一号烤烟的加工性能进行进一步划分,对400个烤烟样品(2020—2023年生产于福建)的单叶重、叶面密度等11项物理特性指标,和总植物碱、总糖等5项化学成分指标进行主成分分析;分别从烟叶的强度性能、化学性能、尺寸性能、撕扯性能和吸湿性能5个方面反映烟叶的综合特性,建立烟叶加工性能综合得分数学模型Y=0.415y 1+0.210y 2+0.173y 3+0.116y 4+0.085y 5,计算样品的加工性能综合得分。根据综合得分进行聚类分析,将400个样品分为4类。基于聚类分析的分类数,对294个未分类的烤烟样品进行判别分析。主成分分析结果表明,提取特征值≥1的因子,共提取5个因子,其累计方差贡献率达78.643%。聚类分析结果表明,第I类综合得分-2.62~-0.84,加工性能一般,主要为中偏下部烟叶;第II类综合得分1.24~3.07,加工性能强,主要为上部烟叶;第III类综合得分0.24~1.23,加工性能较强,主要为中偏上部烟叶;第IV类综合得分-0.83~0.23,加工性能适中,主要为中部烟叶。判别分析结果表明,其各类别的加工性能综合得分范围与聚类分析结果基本重合,对初始分组进行判别及交叉验证,其中初始分组正确率94.3%,交叉验证分组正确率91.3%。本研究为翠碧一号烤烟打叶复烤加工处理提供理论和数据支撑。

本文引用格式

庄增坤 , 王清旺 , 陆军 , 陈清柏 , 林梦涵 . 主成分、聚类和判别分析在翠碧一号烤烟加工性能划分中的应用[J]. 安徽农学通报, 2024 , 30(23) : 95 -101 . DOI: 10.16377/j.cnki.issn1007-7731.2024.23.019

Abstract

To further classify the processing performance of Cuibi No.1 tobacco, principal component analysis was conducted on 11 physical characteristic indicators such as single leaf weight and leaf density, as well as 5 chemical component indicators such as total plant alkaloids and total sugars, of 400 tobacco samples (produced in Fujian Province from 2020 to 2023). The comprehensive characteristics of tobacco leaves are reflected from 5 aspects: strength performance, chemical performance, size performance, tearing performance, and moisture absorption performance. A mathematical model for the comprehensive score of tobacco processing performance is established, which is Y=0.415y 1+0.210y 2+0.173y 3+0.116y 4+0.085y 5. The comprehensive score of processing performance of the sample was calculated. Cluster analysis was conducted based on the comprehensive score, and 400 samples were divided into 4 categories. Discriminant analysis was conducted on 294 unclassified tobacco samples based on cluster analysis of classification numbers. The results of principal component analysis showed that for factors with eigenvalues ≥ 1, a total of 5 factors were extracted, and their cumulative variance contribution rate reached 78.643%. The clustering analysis results indicate that the comprehensive score of Class I ranges from -2.62 to -0.84, with average processing performance, mainly consisting of middle to lower tobacco leaves; The comprehensive score of Class II ranges from 1.24 to 3.07, indicating strong processing performance, mainly consisting of upper tobacco leaves; The comprehensive score of Class III was 0.24~1.23, indicating strong processing performance, mainly consisting of middle to upper tobacco leaves; The comprehensive score of Class IV was -0.83~0.23, with moderate processing performance, mainly for central tobacco leaves. The discriminant analysis results showed that the comprehensive score range of processing performance for each category basically overlapped with the clustering analysis results. The initial grouping was discriminated and cross validated, with an initial grouping accuracy rate of 94.3% and a cross validation grouping accuracy rate of 91.3%. This study provided theoretical and data support for the processing and re roasting of Cuibi No.1 tobacco leaves.

翠碧一号烤烟是自主选育的一种特色烤烟品种,具有清雅、飘逸且醇和的香气特征,但其易烤性和耐烤性有待进一步提高[1]。衡量烟叶品质的指标包括外观质量、物理特性、化学成分和感官质量4个部分[2-3],其中,物理特性、化学成分与烤烟的加工性能密切相关[4]。现有的分类方法主要是根据烟叶的成熟度、叶片结构、身份、油分、色度、长度、残伤、破损和颜色等指标进行分组分级,该方法暂无法完全适应打叶复烤加工技术的发展。为保持翠碧一号烟叶原有风格特征,在打叶复烤环节开展参数化加工,对烟叶以理化特性为主要表征的加工性能的研究显得尤为紧迫。
为进一步提升烟叶的性能,相关学者进行了大量研究。李志伟等[5]对烟叶化学和感官质量进行分析,发现总植物碱、总糖和糖碱比是影响感官评吸质量的主要因素。卫盼盼等[6]、徐波等[7]研究了烟叶的物理特性、典型力学特性与工艺参数的关系,发现烟叶的物理特性、典型力学特性直接影响打叶复烤参数设定。赵瑞蕊等[8]、周敏等[9]采用主成分和聚类分析的方法,对不同产区烟叶的品质进行划分和评价。彭玉富等[10]研究认为,鲜烟叶的理化特征与烤后烟叶品质密切相关,利用鲜烟叶的总氮、淀粉含量可实现烤后烟叶总氮、还原糖和糖碱比值的预测。付秋娟等[11]研究表明,棕榈酸、苹果酸和富马酸可以作为上部烟叶原料质量的重要评价指标。吴曜廷等[12]研究认为,微生物酶制剂能够促进烟叶内含物质的转化,提升上部烟叶的品质。金昕等[13]针对选后中部叶混上部叶问题进行调查分析,实现选后烟叶等级纯度和可用性提升。
本文采用主成分、聚类和判别分析方法,对翠碧一号烟叶的单叶重、叶面密度、平衡含水率、长度、宽度、厚度、拉力、剪切强度、穿透强度、叶梗结合力和支脉结合力等物理指标(分别用X1~X11表示)和总植物碱、总糖、还原糖、总氮和钾等化学成分(分别用X12~X16表示)进行研究分析,按加工性能对其重新进行类别划分,确定各类别烟叶的耐加工性能,为打叶复烤参数化加工提供参考。

1 材料与方法

1.1 试验材料

烟叶样品为翠碧一号,共694个样品,试验年份2020—2023年。将样品分为2个部分,第一部分选取400个样品,用于主成分和聚类分析,其中B2F样品60个,B3F样品35个,B2K样品5个,C2F样品130个,C3F样品200个,C4F样品55个,CX1K样品5个,X2F样品10个;第二部分为剩余的294个样品,用于判别分析。各等级样品数量分布见表1
表1 各等级样品数量分布单位:个
年份 B2F B3F B2K C2F C3F C4F CX1K X2F
合计 88 9 75 143 204 116 14 45
2020 9 0 9 11 22 9 0 1
2021 15 0 9 21 30 19 0 9
2022 35 9 30 64 80 44 14 15
2023 29 0 27 47 72 44 0 20

1.2 试验设备与仪器

CTX质构仪(美国博勒飞);Freas625干燥箱(美国热电);Skalar化学成分流动分析仪(荷兰);FOSS-CT293旋风式样品磨(丹麦);KBF-720恒温恒湿箱(德国宾德);JDC-15M-10双刃切刀(美国);CHY-C2A厚度仪(济南蓝光);LRX PLUS拉力仪(英国);ME4002T电子天平(梅特勒托利多)。

1.3 试验方法

1.3.1 测定指标及方法

测定的烟叶物理特性指标和化学成分指标。物理特性指标包括单叶重、叶面密度、平衡含水率、长度、宽度、厚度、拉力、剪切强度、穿透强度、叶梗结合力和支脉结合力共11项,其中单叶重、叶面密度、平衡含水率、厚度和拉力5项指标按参考文献[14]中的方法进行测定,剪切强度、穿透强度、叶梗结合力和支脉结合力等指标按烟草行业标准方法进行测定;化学成分指标包括总植物碱、总糖、还原糖、总氮和钾共5项,其中总糖和还原糖按YC/T 159《烟草及烟草制品 水溶性糖的测定 连续流动法》进行检测,总植物碱按YC/T 468《烟草及烟草制品 总植物碱的测定 连续流动(硫氰酸钾)法》进行检测,总氮按YC/T 161《烟草及烟草制品 总氮的测定 连续流动法》规定的方法进行检测,钾按YC/T 217《烟草及烟草制品 钾的测定 连续流动法》规定的方法进行检测。

1.3.2 原始数据标准化处理

原始数据测定的16项指标量纲不统一,部分指标数值可能相差数百倍,存在数量级差异。因此,对原始数据进行标准化处理,降低其差异对试验分析结果的影响。标准化计算如式(1)
Z i = X i - X ¯ S
式(1)中, X i为第i个观测值, X ¯X的平均值,S为标准差。 Z i是一个无量纲数值,表示一个变量与该变量的平均值之差是标准差的倍数。经过标准化处理后,数据呈标准正态分布,其均值为0,标准差为1。

1.3.3 主成分分析

通过主成分分析,利用降维,在损失较少信息的前提下,将原始指标转化为几个综合指标,每个综合指标均是原始指标的线性组合,且每个综合指标之间互不相关。(1)选取400个样品进行因子分析。由于各项指标之间的相关性较强,因此先进行取样足够度的检验和Kaiser-Meyer-Olkin度量的球形度检验,当KMO值>0.5,且Bartlett的球形度检验Sig.<0.01时,认为分析有效;抽取所有特征值≥1的因子,计算指标因子特征值及贡献率。(2)用最大方差法对因子成分矩阵进行具有Kaiser标准化的正交旋转,得到旋转后的因子成分矩阵,当│矩阵系数│≥0.5时,认为该因子在此项指标上有较高载荷。(3)利用公式:特征向量 i=因子 i /SQRT(初始特征值 i )计算各因子特征向量值。式中,因子 i 为未旋转的因子成分,最终得到特征向量矩阵[15]

1.3.4 聚类分析

利用公式:因子 i 权重=因子 i 特征值/入选因子累积特征值计算各因子权重得分;建立数学模型:Y=Σ(因子 i 权重×y i )计算各样品的加工性能综合得分,式中,yi 为原始数据经标准化处理后主成分 i 的计算值。计算400个样品的加工性能主成分综合得分,采用k-均值聚类法对翠碧一号烟叶加工性能指标主成分分析综合得分进行聚类分析,根据生产加工经验确定分类数为4。

1.3.5 判别分析

判别分析是一个学习和预测的过程[15]。在聚类分析已确定的分类数目基础上,根据烟叶理化指标对294个剩余样品进行判别分析,得到分类的判别函数;利用该函数确定每个样品的类别归属。

1.4 数据处理

采用Excel 2007软件进行数据筛选及处理,用SPSS 19.0软件进行主成分分析、聚类分析和判别分析。

2 结果与分析

2.1 主成分分析

KMO和Bartlett的球形度检验对原始变量进行因子分析的结果有效,具体见表2。采用主成分分析法,抽取特征值大于1的因子,共抽取5个,累积贡献率78.643%,结果见表3
表2 KMO和Bartlett的球形度检验
检验方法 原始变量 因子分析结果
KMO取样适切性量数 0.799
Bartlett的球形度检验 近似卡方 4 160.095
df 120
Sig. 0
表3 指标因子特征值及贡献率
成分 合计 初始特征值 提取平方和载入 旋转平方和载入
方差/% 累积/% 合计 方差/% 累积/% 合计 方差/% 累积/%
1 5.227 32.666 32.666 5.227 32.666 32.666 4.305 26.905 26.905
2 2.643 16.521 49.187 2.643 16.521 49.187 2.897 18.105 45.010
3 2.177 13.606 62.792 2.177 13.606 62.792 2.181 13.633 58.643
4 1.461 9.131 71.924 1.461 9.131 71.924 1.870 11.689 70.331
5 1.075 6.719 78.643 1.075 6.719 78.643 1.330 8.312 78.643
正交旋转后的因子成分矩阵的详细情况如表4所示,因子1在X2、X5、X6、X7、X8和X9的矩阵系数分别为0.849、-0.539、0.847、0.689、0.790和0.815,有较高载荷,该因子主要体现烟叶的强度性能;因子2在X12、X13、X14和X15的矩阵系数分别为0.757、-0.907、-0.758和0.844,有较高载荷,该因子主要体现烟叶的化学性能;因子3在X1、X4和X5的矩阵系数分别为0.911、0.780和0.732,有较高载荷,该因子主要体现烟叶的尺寸性能;因子4在X10和X11的矩阵系数分别为0.949和0.939,该因子主要体现烟叶的撕扯性能;因子5在X3和X16的矩阵系数为0.895和-0.536,有较高载荷,该因子主要体现烟叶的吸湿性能。
表4 正交旋转后因子成分矩阵
指标 因子1 因子2 因子3 因子4 因子5
X 1 0.157 -0.015 0.911 0.123 0.040
X 2 0.849 0.068 -0.02 0.093 0.055
X 3 0.006 0.100 -0.041 0.109 0.895
X 4 -0.499 -0.178 0.780 0.034 -0.045
X 5 -0.539 -0.119 0.732 -0.008 -0.113
X 6 0.847 0.127 -0.026 0.056 -0.091
X 7 0.689 -0.045 -0.213 0.209 0.240
X 8 0.790 0.159 -0.132 0.030 0.167
X 9 0.815 0.181 -0.055 0.031 -0.001
X 10 0.047 0.055 0.098 0.949 0.074
X 11 0.173 -0.011 0.034 0.939 0.047
X 12 0.373 0.757 0.250 0.042 0.167
X 13 -0.129 -0.907 0.153 -0.026 0.019
X 14 0.227 -0.758 0.186 -0.023 0.282
X 15 0.229 0.844 -0.076 -0.015 0.113
X 16 -0.496 0.273 -0.007 -0.002 -0.536
根据公式计算各因子特征向量,最终得到特征向量矩阵,结果如表5所示。其中,特征向量1与X 2X 4X 5X 6X 7X 8X 9的系数分别为0.34、-0.31、-0.32、0.34、0.31、0.35和0.34,相关性较高;特征向量2与X 13X 14X 15X 16的系数分别为0.46、0.51、-0.39和-0.33,相关性较高;特征向量3与X 1X 4X 5X 10X 11X 12的系数分别为0.48、0.35、0.33、0.45、0.40和0.32,相关性较高;特征向量4与X 1X 10X 11的系数分别为0.43、-0.51和-0.50,相关性较高;特征向量5与X 3X 16的系数分别为-0.81、0.33,相关性较高。
表5 特征向量矩阵
指标

特征向

量1

特征向

量2

特征向

量3

特征向

量4

特征向

量5

X 1 -0.05 0.18 0.48 0.43 0.05
X 2 0.34 0.16 0.03 0.16 0.16
X 3 0.10 0.10 0.09 -0.10 -0.81
X 4 -0.31 0.09 0.35 0.24 -0.02
X 5 -0.32 0.03 0.33 0.23 0.01
X 6 0.34 0.10 0.02 0.18 0.28
X 7 0.31 0.21 -0.03 -0.06 -0.02
X 8 0.35 0.09 -0.02 0.12 0.02
X 9 0.34 0.07 0.01 0.18 0.18
X 10 0.08 0.15 0.45 -0.51 0.09
X 11 0.12 0.20 0.40 -0.50 0.15
X 12 0.24 -0.25 0.32 0.23 -0.15
X 13 -0.21 0.46 -0.16 0.02 0.07
X 14 -0.04 0.51 -0.10 0.13 -0.10
X 15 0.24 -0.39 0.16 0.06 -0.16
X 16 -0.18 -0.33 0.05 -0.11 0.33
对原始数据进行标准化变换,变换后的指标用x 1x 16表示,得到各主成分的模型,其表达式如式(2)~(6)。
y 1=-0.05x 1+0.34x 2+0.10x 3-0.31x 4-0.32x 5+0.34x 6+0.31x 7+0.35x 8+0.34x 9+0.08x 10+0.12x 11+0.24x 12-0.21x 13-0.04x 14+0.24x 15-0.18x 16
y 2=0.18x 1+0.16x 2+0.10x 3+0.09x 4+0.03x 5+0.10x 6+0.21x 7+0.09x 8+0.07x 9+0.15x 10+0.20x 11-0.25x 12+0.46x 13+0.51x 14-0.39x 15-0.33x 16
y 3=0.48x 1+0.03x 2+0.09x 3+0.35x 4+0.33x 5+0.02x 6-0.03x 7-0.02x 8+0.01x 9+0.45x 10+0.40x 11+0.32x 12-0.16x 13-0.10x 14+0.16x 15+0.05x 16
y 4=0.43x 1+0.16x 2-0.10x 3+0.24x 4+0.23x 5+0.18x 6-0.06x 7+0.12x 8+0.18x 9-0.51x 10-0.50x 11+0.23x 12+0.02x 13+0.13x 14+0.06x 15-0.11x 16
y 5=0.05x 1+0.16x 2-0.81x 3-0.02x 4+0.01x 5+0.28x 6-0.02x 7+0.02x 8+0.18x 9+0.09x 10+0.15x 11-0.15x 12+0.07x 13-0.10x 14-0.16x 15+0.33x 16

2.2 聚类分析

根据1.3.4的公式及表3数据,计算出因子1~5的权重分别为0.415、0.210、0.173、0.116和0.085。建立烟叶加工性能综合得分的数学模型,如式(7)
Y=0.415y 1+0.210y 2+0.173y 3+0.116y 4+0.085y 5
计算各样品的加工性能综合得分,其基本规律为上部叶>中部叶>下部叶,对加工性能综合得分的聚类分析结果见表6。第I类最终聚类中心为-1.38,分布在-2.62~-0.84,有2.41%上部叶、26.80%中部叶和63.64%下部叶划入该类别,主要为中偏下部烟叶;第II类最终聚类中心为1.73,分布在1.24~3.07,有55.42%上部叶、3.59%中部叶和9.09%下部叶划入该类别,主要为上部烟叶;第III类最终聚类中心为0.74,分布在0.24~1.23,有36.14%上部叶、20.59%中部叶和9.09%下部叶划入该类别,主要是中偏上部烟叶;第IV类最终聚类中心为-0.28,分布在-0.83~0.23,有6.03%上部叶、49.02%中部叶和18.18%下部叶划入该类别,主要是中部烟叶。
表6 聚类分析结果汇总
类别 属性 综合得分范围 最终聚类中心 样本数 B2F B2K B3F C2F C3F C4F CX1K X2F
合计 400 48 5 30 87 180 39 4 7
I 中偏下部 -2.62~-0.84 -1.38 91 0 1 1 8 55 19 1 6
II 上部 1.24~3.07 1.73 58 24 3 19 6 5 0 1 0
III 中偏上部 0.24~1.23 0.74 94 22 0 8 21 37 5 1 0
IV 中部 -0.83~0.23 -0.28 157 2 1 2 52 83 15 1 1

2.3 判别分析

根据聚类分析得到的4个类别,确定分类的判别函数,对294个剩余样品进行类别判断,将判别函数所判的分类与原始数据的分类进行对比。进行组均值的均等性检验,所有指标在4组的均值差异存在统计学意义。
提取3个典型判别式函数,其中第一个函数解释了96.0%的变异,第二个函数解释了3.3%的变异,第三个函数解释了0.7%的变异,具体见表7;对3个判别函数进行Wilks的Lambda检验,判别函数1~3、2~3的Sig.为0<0.01,差异在0.01水平上具有统计学意义,判别函数3的Sig.为0.028<0.05,其在0.05水平上具有统计学意义(表8)。
表7 特征值
函数 特征值 方差/% 累积% 正则相关性
1 9.534 a 96.0 96.0 0.951
2 0.329 a 3.3 99.3 0.497
3 0.068 a 0.7 100 0.253

注:a表示分析中使用了3个典型判别式函数。

表8 Wilks的Lambda检验
判别函数 Wilks的Lambda 卡方 df Sig.
1~3 0.067 1052.245 48 0
2~3 0.704 136.292 30 0
3 0.936 25.689 14 0.028
典型判别式函数系数见表9,其判别函数的表达式分别表示为式(8)~(10)。
表9 典型判别式函数
指标 函数
1 2 3
X 1 0.197 0.363 0.271
X 2 0.052 -0.008 -0.014
X 3 0.186 0.096 -0.073
X 4 0.017 0.140 0.113
X 5 -0.127 -0.301 -0.351
X 6 0.026 0.004 -0.024
X 7 0.769 -0.645 0.393
X 8 9.032 0.641 -0.144
X 9 5.389 1.730 0.958
X 10 1.414 0.148 -3.656
X 11 0.929 -0.065 1.542
X 12 0.340 0.084 0.533
X 13 -0.040 0.042 -0.002
X 14 0.024 0.091 -0.045
X 15 -0.208 -0.402 0.454
X 16 -0.590 -0.058 0.470
(常量) -18.122 -9.131 0.250

注:非标准化系数。

P 1=0.197X 1+0.052X 2+0.186X 3+0.017X 4-0.127X 5+0.026X 6+0.769X 7+9.032X 8+5.389X 9+1.414X 10+0.929X 11+0.340X 12-0.040X 13+0.024X 14--0.208X 15-0.590X 16-18.122
P 2=0.363X 1-0.008X 2+0.096X 3+0.140X 4-0.301X 5+0.004X 6-0.645X 7+0.641X 8+1.730X 9+0.148X 10-0.065X 11+0.084X 12+0.042X 13+0.091X 14-0.402X 15-0.058X 16-9.131
P 3=0.271X 1-0.014X 2-0.073X 3+0.113X 4-0.351X 5-0.024X 6+0.393X 7-0.144X 8+0.958X 9-3.656X 10+1.542X 11+0.533X 12-0.002X 13-0.045X 14+0.454X 15+0.470X 16+0.25
各组质心处的函数见表10,各组数值在函数1维度的分辨率最高,与前述的第一个函数解释了96.0%的变异结果一致。
表10 组质心处的函数
类别 函数
1 2 3
I -4.073 -0.73 0.013
II 5.337 -0.61 -0.342
III 2.239 0.051 0.428
IV -0.951 0.618 -0.137

注:在组均值处评估的非标准化典型判别式函数。

通过对比400个样品的初始分组和判别函数所判的分类可知,初始分组中94.3%的个案进行了正确分类;通过交叉验证,有91.3%的个案进行了正确分类。对294个未分组的样品进行分类,其中分在I类的有96个样品,其加工性能得分在-2.48~-0.77;分在II类的有66个样品,其加工性能得分在1.19~2.50;分在III类的有63个样品,其加工性能得分在0.25~1.18;分在IV类的有69个样品,其加工性能得分在-0.76~0.23。各类加工性能得分范围与聚类分析中各类得分范围基本重合,具体见表1112
表11 分类结果汇总
预测组成员
案例的类别号 I II III IV 合计
初始 计数 I 89 0 0 2 91
II 0 53 5 0 58
III 0 0 89 5 94
IV 6 0 5 146 157
未分组的案例 96 66 63 69 294
交叉验证 计数 I 87 0 0 4 91
II 0 52 6 0 58
III 0 4 82 8 94
IV 7 0 6 144 157

注:(1)仅对分析中的案例进行交叉验证。在交叉验证中,每个案例都是按照该案例以外的所有其他案例派生的函数来分类的。(2)已对初始分组案例中的94.3%进行了正确分类。(3)已对交叉验证分组案例中的91.3%进行了正确分类。

表12 判别分析结果汇总
类别 属性 得分范围 样本数 B2F B2K B3F C2F C3F C4F CX1K X2F
合计 294 40 4 45 56 24 77 10 38
I 中偏下部 -2.48~-0.77 96 1 1 0 6 8 35 7 38
II 上部 1.19~2.50 66 27 2 31 3 0 2 1 0
III 中偏上部 0.25~1.18 63 12 1 13 16 5 15 1 0
IV 中部 -0.76~0.23 69 0 0 1 31 11 25 1 0

3 结论与讨论

3.1 结论

采用主成分分析法从翠碧一号烟叶的单叶重、叶面密度等11项物理特性指标和总植物碱、总糖等5项化学成分指标中提取5个特征值≥1的主成分因子,累积方差贡献率达78.643%;选用最大方差法对因子成分矩阵进行正交旋转,发现第一主成分主要反映强度性能,第二主成分主要反映化学性能,第三主成分主要反映尺寸性能,第四主成分主要反映撕扯性能,第五主成分主要反映吸湿性能。以此建立烟叶加工性能综合得分数学模型Y=0.415y 1+0.210y 2+0.173y 3+0.116y 4+0.085y 5。计算每个烟叶样品的加工性能综合得分,发现分值越高,其耐加工性能越好。
采用k-均值聚类法对400个烟叶样品的加工性能综合得分进行聚类,聚类结果分为4类。第I类最终聚类中心为-1.38,分布在-2.62~-0.84,加工性能较弱,主要是中偏下部烟叶;第II类最终聚类中心为1.73,分布在1.24~3.07,加工性能强,主要是上部烟叶;第III类最终聚类中心为0.74,分布在0.24~1.23,加工性能较强,主要是中偏上部烟叶;第IV类最终聚类中心为-0.28,分布在-0.83~0.23,加工性能适中,主要是中部烟叶。
基于聚类分析的4个分类,对294个未知分类的烟叶样品进行判别分析,各类加工性能分布情况与聚类分析结果基本重合。

3.2 讨论

3.2.1 模型所用指标、样品数据量的补充与完善

烟叶黏附力主要是指烟叶细胞内溢出的、具有黏性的液体或半液体脂类等大分子物质附着在烟叶表面的能力[16],其对打叶复烤加工可能会产生一定影响,因此有必要扩大建模选用指标范围,同时定期对样品数据进行补充。

3.2.2 单等级打叶复烤烟叶样品的选择

由于烟叶受气候、土壤和种植等多方面因素的影响,即使是同一等级的烟叶,其物理特性、化学成分也可能存在较大差异。因此,单等级打叶复烤的烟叶样品要求足够大,以代表该等级烟叶的总体分布情况。而对于确定烟叶不同总体的样品量研究分析,还有待进一步深入。

3.2.3 模块配方打叶复烤烟叶样品的选择

模块配方存在多个产地、多等级烟叶,各等级、产地的烟叶按其在配方中所占的比例取足样品,以样品均值作为该模块烟叶进行判别分析的数值,以降低极值可能带来的预测误差。
[1]
仙立国,黄一兰,王松峰,等. 翠碧一号鲜烟叶素质及烘烤特性研究[J]. 中国烟草学报202026(3):66-73.

[2]
闫克玉,袁志永,吴殿信,等.烤烟质量评价指标体系研究[J].郑州轻工业学院学报(自然科学版)200116(4):57-61.

[3]
闫克玉,赵献章. 烟叶分级[M]. 北京:中国农业出版社,2003.

[4]
《卷烟工艺》编写组. 卷烟工艺:烟草中专学校统编试用教材[M]. 北京:北京出版社,1993.

[5]
李志伟,陈溪,王鹏泽,等. 基于因子、聚类及判别方法分析烟叶化学和感官质量[J]. 安徽农学通报202329(13):144-149,161.

[6]
卫盼盼,吴祚友,安银立,等. 烟叶物理特性与打叶风分工艺参数的关系[J]. 烟草科技201447(8):5-9.

[7]
徐波,姜焕元,范明登,等. 基于“翠碧1号” 品种烟叶典型力学特性的打叶复烤加工技术及应用[J]. 烟草科技202053(7):80-86,106.

[8]
赵瑞蕊,何结望,王海明,等. 基于主成分和聚类分析的湖北烤烟物理质量指标综合评价[J]. 中国烟草科学201233(4):90-94.

[9]
周敏,张忠武,陈拾华,等. 主成分与聚类分析在NC297烟叶品质区域划分中的应用[J]. 贵州农业科学201947(8):40-46.

[10]
彭玉富,李俊营,过伟民,等.基于鲜烟叶理化特征的烤后烟叶品质预测[J].烟草科技202457(9):48-58.

[11]
付秋娟,郝贤伟,杜咏梅,等.烤烟上部烟叶中非挥发性有机酸及高级脂肪酸与烟叶内在品质的关系[J].烟草科技202457(9):24-32.

[12]
吴曜廷,刘丹然,李润杰,等.微生物酶制剂对上部烟叶醇化品质的影响[J].安徽农业科学202452(18):166-170.

[13]
金昕,陈栋,王菲,等.烤烟烟叶烤前选后中部叶混上部叶原因分析与解决措施[J].新农民2024,(26):49-51.

[14]
郭建华,宋纪真,王广山,等. 基于主成分分析和聚类分析的烟叶物理特性区域归类[J]. 烟草科技201447(8):14-17.

[15]
时立文. SPSS 19.0统计分析从入门到精通[M]. 北京:清华大学出版社,2012.

[16]
张玉海,邓国栋,冯春珍,等. 含水率对烟叶力学特性的影响[J]. 烟草科技201346(1):10-12,24.

文章导航

/