欢迎访问《安徽农学通报》官方网站,今天是
农业经济·管理

基于反向传播神经网络模型的平武县蜂蜜产值预测

  • 任向辉 ,
  • 刘润强 ,
  • 邢巧 ,
  • 段亦诗 ,
  • 孙恒飞 ,
  • 赵燚佳 ,
  • 秦梦妍 ,
  • 张朝阳 ,
  • 岳文龙 ,
  • 阚云超
展开
  • 河南科技学院资源与环境学院,新乡市农作物重大有害生物防控重点实验室,河南 新乡 453003
阚云超(1974—),男,河南南阳人,博士,教授,从事昆虫生化与分子生物学相关研究。

任向辉(1967—),男,河南温县人,硕士,讲师,从事害虫综合防治教学研究。

Copy editor: 李媛

收稿日期: 2025-03-07

  网络出版日期: 2025-12-25

基金资助

国家自然科学基金面上项目(31272103)

国家现代农业产业技术体系建设专项(CARS-45-SYZ10)

Prediction of honey output value in Pingwu County based on BP neural network model

  • REN Xianghui ,
  • LIU Runqiang ,
  • XING Qiao ,
  • DUAN Yishi ,
  • SUN Hengfei ,
  • ZHAO Yijia ,
  • QIN Mengyan ,
  • ZHANG Chaoyang ,
  • YUE Wenlong ,
  • KAN Yunchao
Expand
  • Key Laboratory of Major Crop Pests Prevention and Control in Xinxiang City, School of Resource andEnvironment Science, Henan Institute of Science and Technology, Xinxiang 453003, China

Received date: 2025-03-07

  Online published: 2025-12-25

摘要

本文以2019—2023年四川省平武县统计部门提供的蜂蜜产值为因变量,蜂产业投入、蜜产量、销量3个蜂蜜产值影响因素为自变量,在DPS平台进行反向传播神经网络模型建模分析,对其蜂蜜产值进行预测。分析结果显示,利用2019—2022年的自变量与因变量数据做训练样本可得到一个反向传播神经网络模型。蜂产业投入、蜜产量、销量3个自变量神经元节点的权重值依次为-1.111 12、-13.976 60和15.452 97,该模型可以准确预测出次年蜂蜜产值变化趋势,模型因变量理论值与实际值拟合优度R 2=0.72。相关分析结论可为该地区养蜂业发展决策提供参考。

本文引用格式

任向辉 , 刘润强 , 邢巧 , 段亦诗 , 孙恒飞 , 赵燚佳 , 秦梦妍 , 张朝阳 , 岳文龙 , 阚云超 . 基于反向传播神经网络模型的平武县蜂蜜产值预测[J]. 安徽农学通报, 2025 , 31(24) : 132 -135 . DOI: 10.16377/j.cnki.issn1007-7731.2025.24.027

Abstract

Based on honey output value data from 2019 to 2023 provided by the Pingwu County statistics department of Sichuan Province, this study established a backpropagation neural network model on the DPS platform to predict honey output value, using bee industry input, honey yield, and sales volume as independent variables and honey output value as the dependent variable. The results showed that a back-propagation neural network model was developed using the independent and dependent variable data from 2019 to 2022 as training samples. The weight values of the neurons for the three independent variables: bee industry input, honey yield, and sales volume were -1.111 12, -13.976 60, and 15.452 97, respectively. This model accurately predicted the trend of honey output value in the following year, with a goodness-of-fit R² of 0.72 between the theoretical and actual values of the dependent variable. The analytical conclusions provide references for decision-making in the development strategy of the apiculture industry in the region.

DPS软件作为全国植保员培训要求掌握的统计学软件,其计算模块包含基本统计学计算、生态学研究以及与各种植物保护相关的专业数据处理模块[1]。目前,国家标准化管理委员会发布的部分植保田间试验与室内生测试验相关文件中,规定使用该软件进行数据处理计算。该软件的操作贴近基层农技人员,具有较多实用模块,如处理生物杀菌剂拮抗作用的培养基菌斑直径计算分析、处理诱虫灯灯下昆虫群落专用的对数正态分布模型分析以及用于昆虫病原微生物活体杀虫剂生测的互补重对数模型计算等[1]。利用Python与Matlab平台的反向传播神经网络(BP神经网、BP网络)工具包建模属于一种重要的鲁棒性较好的机器学习数据处理方法,但其操作比较繁琐,专业性强[2-3]。利用DPS软件进行反向传播神经网络建模操作较为简洁,且结果标准可靠。
智慧农业是当前的研究热点,包括神经网络算法在内的非线性建模技术在养蜂学各领域应用较多。如武宵[4]提出了一种结合高光谱成像与透射光谱技术,并融合多种机器学习方法(BP神经网络、CNN-SVM)的蜂蜜品种鉴别与掺假检测模型;通过光谱预处理与特征提取,实现了对5种蜂蜜品种的准确分类,并对不同掺假浓度实现了高效识别,为蜜蜂品种的无损、快速检测提供了可行方案。刘妍[5]研究面向智能蜂箱的蜂群活动监测方法,提出基于深度学习的计算机视觉技术,实现对蜜蜂的检测、花粉识别与多目标跟踪;通过改进YOLO、ResNet和ByteTrack等算法,结合数据增强与注意力机制,有效提升了检测精度与跟踪效率。蔡家豪[6]提出了一种基于深度学习的蜜蜂出勤行为监测系统,设计了一种集成温湿度传感器与红外摄像头的智慧蜂箱,开发了结合Faster R-CNN与SRGAN的蜜蜂部位检测算法和身份识别方法,实现了对蜜蜂进出行为的自动化监测。实际生产中,利用BP网、卷积网、极限学习机等与神经网络有关的机器学习算法进行蜂业产出数据挖掘的相关文献较少,一些已发表的养蜂学文献往往缺少趋势分析与影响因素排序等方面的内容。本文利用DPS软件对四川省平武县发布的2019—2023年蜂产业统计蜂蜜产值与3个蜂蜜产值影响因素进行反向传播神经网络模型建模分析。

1 材料和方法

1.1 输入数据与数据标准化变换方法

计算分析输入数据为研究区2019—2023年国民经济和社会发展统计公报中的四川省平武县蜂产业数据(https://tjgb.hongheiku.com/xjtjgb/xj2020/41015.html),分散的数据整理结果见表1 [7]
表1 研究区2019—2023年蜂产业数据
年份 蜂产业投入(X 1)/万元

蜜产量

X 2)/t

销售量(X 3)/万元 蜂蜜产值(Y)/万元
2019 195.8 340.12 238.08 2 720.92
2020 258.8 211.75 238.08 1 693.96
2021 58.0 436.46 278.46 3 491.66
2022 50.0 362.19 305.52 2 818.60
2023 245.3 730.10 450.10 5 840.80
表1中2019—2022年数据作为神经网络建模训练样本,2023年度数据作为预测样本,BP网具体算法参考文献[6-8]。由于3个自变量单位不同,建模前需对数据进行无量纲化处理,处理方法是每列自变量数据减去2019—2022年4行训练样本该自变量的均值并除以这4行训练样本值的方差。自变量经无量纲化处理后保留10位有效数字的数据见表2
表2 数据标准化处理结果
年份 蜂产业投入(X 1 蜜产量(X 2 销售量(X 3 蜂蜜产值(Y
2019 0.005 162 345 0.000 284 869 -0.024 711 146 2 720.92
2020 0.011 059 493 -0.014 401 353 -0.024 711 146 1 693.96
2021 -0.007 736 497 0.011 306 686 0.012 307 444 3 491.66
2022 -0.008 485 341 0.002 809 797 0.037 114 849 2 818.60
2023 0.009 795 818 0.044 900 690 0.169 659 369 5 840.80

1.2 建模参数确定方法

早期的神经网络算法是单层的线性分类算法,之后出现的反向传播算法使得多层神经网络训练成为可能,极大推动了深度学习算法的发展。DPS平台的反向传播神经网络计算模块与Matlab、Python、R语言等平台的各种神经网络工具包类似,其能随机生成一些初始值,极大地简化了操作。这种反向传播算法的核心是通过误差反向传播来调整计算网络参数,以实现模型参数优化。
BP神经网络模型的层级架构包含输入层、隐含层和输出层,各层通过权重矩阵连接。运行时输入层接收数据,然后在隐藏层进行非线性变换,最后在输出层生成预测结果。DPS平台上这种算法通过Sigmoid函数做激活函数,引入了非线性表达能力,利用损失函数衡量预测与真实值的差异大小。在DPS平台的反向传播神经网络模块训练时,采用均方误差(MSE)进行模型回归计算[1]
反向传播神经网络计算模块在DPS平台的训练过程分初始值设定、前向传播、反向传播与参数更新4步。前向传播的数据从输入层逐层传递到输出层,逐步计算各层的加权和与激活值,最后得到预测结果。反向传播时从输出层反向传递至输入层,计算损失函数对各神经元的梯度。最后利用优化算法更新权重,实现各个模型的参数更新[8-11]。这种算法广泛应用于图像识别、语音信号处理、自然语言数据处理等非线性映射场景计算,在处理农业与经济学等方面的非结构化数据时表现优秀。
表2数据贴入DPS操作界面,选定训练样本与预测样本,然后在软件功能菜单栏选择“其他—BP神经网络”进行建模。对此自变量为3个的模型应该设置隐含层为1层,输入层节点数设置为3;对输入节点的数值设置为不进行标准化转换。经过不同参数反复测试后,发现最小训练速率、动态参数、Sigmoid函数参数、允许误差、最大迭代次数等参数设为系统默认值时拟合优度最佳,因此5个参数的具体数值依次设置为0.1、0.7、0.9、0.000 01与1 000。

2 结果与分析

2.1 反向传播神经网络模型参数

系统运行后最终得到的隐含层与输出层各个神经元(节点)的权值向量与权值矩阵见表34。由表3~4可知,DPS软件仅利用了3个与因变量相关程度无决定性影响的自变量,并利用4个训练样本,通过机器学习训练得到反向传播神经网络模型,全部计算模型参数。DPS给出的隐含层与输出层各个神经元(节点)的权值向量具体值可以一定程度上定量反映3个自变量对蜂蜜产值Y的影响力。
表3 第1隐含层各个结点的权重矩阵
自变量 节点1 节点2 节点3
X 1 -2.311 39 7.276 71 -6.429 61
X 2 -2.358 88 -11.822 40 13.129 54
X 3 1.530 32 -2.234 94 -3.534 98
表4 输出层3个结点的权重值
自变量 权重值
X 1 -1.111 12
X 2 -13.976 60
X 3 15.452 97

2.2 模型预测结果

拟合残差变化终止时的截图如图1所示。1 000次迭代计算最终显示拟合总残差约0.009 766 776,由此可知,模型训练结果与预测结果较为可靠。
图1 反向传播神经网络拟合残差变化

2.3 模型理论值与实际值趋势分析

反向传播神经网络模型预测理论值与实际值可形成一个平滑曲线图观察其具体预测效果。具体结果如图2所示。DPS软件还给出了最后预测结果,如果以实际值减去预测误差再除以实际值作为分析的准确度,则全部预测结果如表5所示。经Excel软件计算预测值与实际值相关度R=0.85,拟合优度R 2=0.72。
图2 BP神经网络模型预测效果
表5 神经元网络训练结果及预测结果
样本类型 年份 Y实际值 DPS分析的预测值 准确度/%
训练样本 2019 2 720.92 2 642.58 97.12
训练样本 2020 1 693.96 1 924.61 86.38
训练样本 2021 3 491.66 3 251.40 93.12
训练样本 2022 2 818.60 2 916.66 96.52
预测样本 2023 5 840.80 3 420.32 58.56
表5图2可知,经过1 000次迭代计算,基于本研究中选取的3个自变量数据,利用DPS软件计算出了一套根据自变量数据得到因变量Y值的神经网络模型计算方法,已知训练样本计算结果准确性在90%左右。对于2023年度预测样本自变量数据,所得因变量数值大小的计算准确度为58.56%。此外,Y值经过第2年、第4年的低谷和第5年变化趋势有2个波峰,图2的理论值曲线也有同步存在的波峰。因此,该反向传播神经网络模型的数据趋势预测中对因变量的变化趋势做出了正确判断,具体预测值对蜂产业决策有重要的参考价值。

3 结论

在神经网络建模中,数据规模并非决定模型效能的唯一因素。本研究采用3个自变量样本进行建模,尽管这些自变量对蜜蜂产值的直接解释力有限,且与因变量之间蕴含复杂的经济学关联,借助近年来智慧农业领域中广泛应用的机器学习算法,实现了具有较高实用价值的预测效果。借助BP神经网络、支持向量机与随机森林等现代机器学习模型,具备较强的鲁棒性与非线性拟合能力,即使在变量关系不明确或数据信息不完整的情形下,仍能从中挖掘出潜在的统计规律,实现“数据淘金”[12-15]。本研究所构建模型的拟合优度达到0.72,在变量数量有限且关联性较弱的情况下已属较优结果。通过解析隐含层与输出层间神经元的权值向量,可量化评估各自变量对蜂蜜产值的影响力,为该地区蜂业生产布局与资源投入提供科学依据。此外,基于DPS平台所构建的预测系统不仅可用于该地区未来蜂蜜产值的预估,还可随着数据积累不断纳入新的样本,通过持续优化输出层权重矩阵,进一步提升模型的预测精度与泛化能力,为农业决策支持系统的动态完善提供技术路径。
[1]
唐启义,冯明光. 实用统计分析及其DPS数据处理系统[M]. 北京:科学出版社,2002.

[2]
谭清萱,宁璐,荣建宇,等. 北京房山区蒲洼乡中华蜂产业发展策略[J]. 安徽农学通报202329(17):73-76.

[3]
刘超. 基于深度学习的蜂箱物种识别算法研究[D]. 福州:福建农林大学,2022.

[4]
武宵. 基于多光谱维度与机器学习相结合的蜂蜜分类与掺假研究[D]. 云南:云南师范大学,2024.

[5]
刘妍. 面向智能蜂箱的蜂群活动监测方法研究[D]. 北京:中国石油大学(北京),2023.

[6]
蔡家豪. 基于深度学习的蜜蜂出勤行为监测算法及其应用[D]. 广州:华南农业大学,2020.

[7]
李双双,陈宝瑞,李为常,等. 平武县中蜂产业发展现状、问题及建议[J]. 四川农业科技2024(5):69-73.

[8]
BRONER I COMSTOCK C R. Combining expert systems and neural networks for learning site-specific conditions[J]. Computers and electronics in agriculture199719(1):37-53.

[9]
CORNE S A CARVER S J KUNIN W E,et al. Predicting forest attributes in Southeast Alaska using artificial neural networks[J]. Forest science200450(2):259-276.

[10]
GOH A T C. Back-propagation neural networks for modeling complex systems[J]. Artificial intelligence in engineering19959(3):143-151.

[11]
戴文战. 基于三层BP网络的多指标综合评估方法及应用[J]. 系统工程理论与实践199919(5):29-34,40.

[12]
刘坤,刘娜,张娜,等. 改进BP神经网络和特征提取的黄瓜病害识别研究[J]. 安徽农学通报202228(3):119-122.

[13]
陈兰珍,孙谦,叶志华,等. 基于神经网络的近红外光谱鉴别蜂蜜品种研究[J]. 食品科技200934(8):287-289.

[14]
米湘成,马克平,邹应斌. 人工神经网络模型及其在农业和生态学研究中的应用[J]. 植物生态学报200529(5):863-870.

[15]
邵咏妮,何勇,鲍一丹. 基于独立组分分析和BP神经网络的可见/近红外光谱蜂蜜品牌的鉴别[J]. 光谱学与光谱分析200828(3):602-605.

文章导航

/