作者:王辉等   来源:   发布时间:2024-02-26   Tag:   点击:
[麻进展]基于气候变量的苎麻产量SSA-BP预测模型

摘要:苎麻产量与生长期间的气候因子具有极高相关性,基于气候变量构建的苎麻产量预测模型能够有效精准预测最终产量。BPbackpropagation)神经网络具有强大的数据分析能力,在作物产量预测建模中得到广泛应用,然而传统BP神经网络存在精度低、鲁棒性差等问题,可采用麻雀搜索算法(sparrowsearchalgorithmSSA)对BP神经网络模型进行优化。基于20102019年苎麻长期定位试验采集的纤维产量、鲜皮产量和气候数据,分析气候因子在10年内的变化趋势及其对多年生苎麻产量的影响,利用构建的BP神经网络模型及优化后的SSA-BP神经网络模型预测苎麻产量的性能,对比确定最佳的苎麻产量预测模型。结果表明,苎麻产量与季平均气温、季极端最高气温均值、季极端最低气温均值、季日照时数均值4项气候因子具有极显著相关关系。SSA算法能有效优化BP神经网络,基于SSA-BP的苎麻纤维产量预测模型和鲜皮产量预测模型的R2分别为0.59130.6791,高于BP神经网络的苎麻纤维产量预测模型(R2=0.4057)和鲜皮产量预测模型(R2=0.5518)。因此,SSA-BP模型能够更加科学、合理地预测苎麻产量,对于苎麻生产的田间管理及统筹规划具有重要指导意义。

关键词:产量预测;气候因子;麻雀搜索算法;BP神经网络

 

苎麻(BoehmerianiveaL.)是具有中国特色的纤维作物和水土保持作物[1],其产量预测对于生产过程精细管理、纤维棉纺市场风险管理具有重要意义[2]。然而,由于影响苎麻产量的因素复杂,其产量预测极具挑战性[3?4]

作物产量具有强烈的空间变异性,与田间环境、大气温度、湿度、光照强度、降雨量等因素密切相关[5-7]。以往研究表明,苎麻对不同地区环境的适应性差异明显,而气候因素,尤其是降水量、日照时间、相对湿度3个气候要素是导致苎麻产量在不同生态区域存在差异的重要原因[8]。除了空间变异外,气候因素的时间变异也同样重要[9],但对其在产量预测研究中的关注有限。在当前全球极端天气事件高频发生的情况下,了解气候因素的多变性对农业生产的影响显得尤为重要,因此有必要探究苎麻产量随气候变化的规律,以及时预测产量信息并调整生产管理。

经验模型是当前作物产量估测常用的方法,该方法通过建立变量因子与产量之间的经验模型来监测不同情景下的作物生长[10]。徐敏等[11]结合温度、日照、降水适宜度等气象因子,采用最优相关和逐步回归等方法构建了水稻年景综合指数的预测模型,为水稻产量分析预测提供依据。刘振洋等[12]使用关联规则算法确定了云南省甘蔗产量的5个主要影响因子,基于此构建了各大主产区的多元线性回归产量预测模型,准确率较单一回归模型分别提升了14.3%3.5%30.1%8.7%17.7%。在利用经验模型进行作物产量预测研究时,可选择线性回归方法(线性回归、多元线性回归等)或非线性回归方法(随机森林、支持向量机、神经网络等)[13-18]构建模型。相比于线性回归模型,基于机器学习技术的非线性回归模型在解决复杂的非线性问题上具有独特优势,为包含不同气候因素、基因型信息的数据建模提供了解决方案。BPbackpropagation)神经网络具有强大的数据分析能力,广泛用于作物产量预测建模。但是它也需要先进的优化技术来训练以提高其模型学习的效率和精度。麻雀搜索算法(sparrowsearchalgorithmSSA)是受麻雀觅食和反捕食行为启发

而提出的一种新的优化算法,具有较强的全局寻优能力,为进一步优化估产模型初始权重和阈值提供了新的解决方案[19-20]。为探究不同时间气候因素的变异对苎麻产量的影响,分析导致产量差异的关键气候要素,本文基于20102019年连续采集的苎麻产量数据及对应年份气象因子,构建了SSA-BP苎麻产量预测模型。该模型能较为精确地预测苎麻产量模型,为苎麻生产管理措施调整及决策提供技术支撑。

1 材料与方法

1.1 试验设计

试验于20102019年在湖南农业大学国家麻类长期定位试验基地进行(113°04'E28°10'N)。试验品种包括中苎1号、多倍体1号、湘苎33个苎麻品种,材料由湖南农业大学苎麻研究所提供。200967日将育好的麻苗(幼苗生长约20~30cm)移栽到长期定位试验小区,每个品种4个重复,小区面积约20m2

1.2 数据采集

1.2.1 产量数据采集

于苎麻成熟期收割每个小区地上部分,然后将苎麻鲜皮从苎麻茎秆上剥离后,采用电子秤(TCS-永彩防水秤,承重150kg,精度0.01kg)称重获取其鲜皮重量。采用剥麻机获取苎麻纤维,干燥后称其重量记为纤维产量。

1.2.2 气候数据获取

选取长沙市区季平均气温、季极端最高气温均值、季极端最低气温均值、季降水量均值、季日照时数均值、季相对湿度均值6项气候指标作为气象因子,数据来源于20102019年《中国气象年鉴》。

1.3 数据处理方法

1.3.1 BP神经网络

基于BP的苎麻产量预测模型拓扑结构如图1所示。将6项影响苎麻产量的气象因子(季平均气温、季极端最高气温均值、季极端最低气温均值、季降水量均值、季日照时数均值、季相对湿度均值)和实测产量数据作为输入层,确定输入层、隐含层和输出层各层的节点数并采用误差反向传播对网络中每个权重系数进行更新,最终输出预测苎麻产量。

  

1 苎麻产量预测BP 模型结构

1.3.2 SSA搜索算法

在麻雀搜索算法中,发现者的位置更新如下。

  

式中,xi,j(t+1)为雀群中第i只麻雀在迭代次数为t时处于第j维的位置信息值;α为处于区间(01]内的随机数,T为迭代的最大次数;Q为随机数,符合标准正态分布;r2为预警值[0,1]ST为安全值[0.51],若r2<ST表示麻雀种群附近没有捕食者,反之则出现捕食者;L为内部元素为1、维度为dd矩阵。跟随者的位置更新如下。

  

式中,xworst为当前全局中最差位置;xbestj为雀群迭代时最优位置;n表示麻雀群体的数量。

i>n/2时,第i只跟随者由于饥饿需要飞往他处觅食。通常警戒者在麻雀种群中占比只有10%~20%,其位置更新如下。

  

式中,xbest(t)为全局中最佳位置;β和K均起到控制参数步长的作用,前者为标准正态分布的随机数,后者为−11之间的随机数,代表麻雀的移动方向;ε为常数项,其作用是确保分母不为0fi为表示第i只麻雀适应度值;fgfw分别为当前全局适应度的最佳值和最差值。

1.3.3 基于SSA-BP的苎麻产量预测模型构建

基于麻雀搜索算法改进的SSA-BP苎麻产量预测模型具体构建步骤如下。

①利用获取的90份样本数据,按21的比例划分为训练集和预测集,对训练集全体数据以及测试集的输入指标数据进行归一化处理。

②对BP神经网络模型的结构参数进行确认,例如隐含层的层数及节点个数、层与层之间的传递函数等。本研究采用的BP神经网络包含2个隐含层和1个输出层,共3层人工神经网络结构,其他参数设置如下:传递函数为tansig,包含神经元15个;输出层传递函数为purelin,包含神经元1个。模型学习率0.01,学习函数trainscg,最大训练次数为10000次,神经模型的训练收敛于3.12e4

③输出BP神经网络的预报结果,并在反归一化后依据评估指标进行后续评估。

④设置SSA中麻雀种群的相关参数。确定麻雀种群规模为100只,麻雀之间信息交换100次,发现者占总麻雀规模的比例为0.20,同时设置预警值和警戒者数量。

⑤确定每只麻雀的初始位置。

⑥依据公式(1)~(3),对每只麻雀的位置分别进行更新。

⑦输出最优的麻雀个体位置和全局最优解,分别作为BP神经网络各层之间的权值和阀值;完成BP神经网络各参数的优化。

⑧使用优化后的BP神经网络进行训练,并比较各项评估指标。根据误差指标的符合度来确定是否结束计算,若符合则停止计算并输出结果,若不符合则返回到步骤④重新执行直至符合要求。

算法具体流程见图2

 

2 SSA-BP算法流程

1.3.4模型性能验证

为定量评估SSA优化后BP神经网络预测模型的准确性,采用决定系数(R2)、均方根误差(RMSE)、均方误差(MSE)、平均绝对误差(MAE)和平均误差(MAPE)加以评价作为评价指标。通常R2越接近于1RMSE越小说明模型预测能力越好[18]

  

  

式中,yi为苎麻产量参数实测值,?i为苎麻产量参数预测值。?为苎麻产量参数平均值,n为样本个数。

2结果与分析

2.1苎麻产量描述

3和表1展示了苎麻纤维、鲜皮产量的统计结果。苎麻纤维产量集中分布在500~1100kg·hm2,最小值为493kg·hm2,最大值为1228kg·hm2,变异系数为到3.32%,整体分布符合正态分布。鲜皮产量也是衡量苎麻纤维产量的重要参数之一,集中分布在5000~9000kg·hm2,最小值为2570kg·hm2,最大值为10520kg·hm2,变异系数为2.98%。综上,2种苎麻产量均具有较大变异幅度,数据具备建模所需的差异要求。

  

3 苎麻产量分布

1苎麻产量统计

  

2.2变量相关性分析

为分析气候因子与苎麻纤维、鲜皮产量之间的相关性,将相关变量分别归一化到[1,1]之间,以消除变量大小差异带来的误差。图4与表2分析了各季苎麻产量及最佳气候因子的变化趋势和相关系数,可以看出,头麻产量性状与季平均气温的变化趋势一致性最高,与纤维产量的相关系数为−0.27,与鲜皮产量的相关系数为0.45。二麻产量因素与季极端最低气温的变化趋势一致性最强,与纤维产量的相关系数为−0.33,与鲜皮产量的相关系数为−0.37。三麻产量参数与季日照时数相关性最高,纤维产量与季日照时数的相关性系数为0.32,鲜皮产量与季日照时数的相关性系数为0.54。结合连续10年数据,分析6项气候因子与苎麻纤维、鲜皮产量的相关性(表3)。除季降水量均值和季相对湿度均值2项指标外,其他气候因子与苎麻纤维、鲜皮产量均呈极显著相关,相关系数绝对值均高于0.42,说明利用气候因子预测苎麻产量具有可行性。

2.3苎麻纤维产量估测

将苎麻纤维产量分别采用BP网络和SSA-BP组合模型进行预测,并对得到的结果进行拟合分析。由图5可知,BP网络模型的R2仅为0.4057,拟合程度差,而采用SSA优化后的SSA-BP网络模型的拟合程度明显优于BP神经网路,模型R2达到0.5913

由表4可知,采用SSA优化后,模型MSE1.93降低到1.33RMSE1.39降低到1.15MAE1.06降低到0.89MAPE12.61%降低到10.73%,表明SSA算法优化后的SSA-BP神经网络模型对于苎麻纤维产量的估测能力优于BP神经网络模型。

 

4 各季苎麻产量及最佳气候因子的变化趋势

2 气候因素与苎麻各季产量的相关性分析

  

注:***表示P<0.05P<0.01水平显著相关。

3气候因素与苎麻产量的相关性分析

  

注:**表示P<0.01水平显著相关。

  

5 2种模型纤维产量预测值与实测值的拟合

4 2种模型预测苎麻纤维产量的误差分析

  

2.4苎麻鲜皮产量估测

将苎麻鲜皮重量分别采用BP网络和SSA-BP组合模型进行预测,并对得到的结果进行拟合系分析(图6),SSA-BP网络模型与期望值的拟合程度优于BP神经网络,回归拟合性较好,SSA-BP神经网络模型决定系数R20.5518增加到0.6791

由表5可知,采用SSA优化后,模型MSE1.32降低到0.94RMSE1.15降低到0.97MAE0.83降低到0.77MAPE12.10%降低到11.43%,表明SSA算法优化后的SSA-BP神经网络模型对于苎麻鲜皮产量的估测能力优于BP神经网络模型。

  

6 2种模型鲜皮重量预测值与期望值的拟合

5 2种模型预测苎麻鲜皮重量的误差分析

  

3讨论

苎麻是喜温、短日照和充足水分的作物,苎麻产量与田间环境的气温、降水量、光照强度、湿度等因素密切相关。本研究采用相关性分析及趋势分析方法探究气候因素时间变异对苎麻产量的影响,结果表明,苎麻产量参数(苎麻纤维、鲜皮产量)与气候因子之间存在较高相关性,季平均气温、季极端最高气温均值、季极端最低气温均值、季日照时数均值4项因子与苎麻纤维、鲜皮产量的相关系数绝对值均高于0.42。刘头明等[8]研究发现,苎麻的产量与其生长期间降水量、日照时间和相对湿度均呈显著相关性,其中日照与降水量呈正相关关系,而相对湿度则呈负相关关系,这与本研究结果存在差异,导致的原因可能与苎麻对不同的生态区域适应能力不同有关[21];袁晋琰等[22]研究也表明苎麻生长期间的温度和降雨量是影响产量的重要因素。

BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,由输入层、隐含层和输出层组成,含多层神经元。当前,BP方法在产量预测应用上取得了极大进展,但是它仍然需要先进的优化技术来提高其学习的效率和精度。本研究采用BP神经网络构建的苎麻纤维产量、鲜皮产量预测模型效果均较差,预测精度R2分别为0.40570.5518,为此,引入麻雀搜索算法对BP神经网络阈值与权值进行优化,结果表明,SSA的引入有效地提高了苎麻估产模型精度,基于SSA-BP网络的苎麻纤维产量估测模型精度达到0.5913,而SSA-BP网络的苎麻鲜皮产量估测模型精度达到0.6791SSA算法能有效提高BP神经网络模型预测的准确性和稳定性,这与前人[23]研究结果一致。

总体来说,本文提出的基于气候变量和SSA算法优化神经网络的苎麻产量预测模型预测效果较好,能够满足苎麻生产的实际需要,对提高苎麻的生产效率具有指导作用与参考依据,后续研究还需在不同地域、田间动态监测等条件下对苎麻产量预测模型进行优化。

 

参考文献

[1]杨洁, 唐昀, 申香英, . 我国苎麻产业现状与振兴发展[J]. 中国麻业科学, 2022, 44(4): 253-256.

YANG J, TANG Y, SHEN X Y, et al.. Current situation and developmentof ramieindustryinChina[J].PlantFiberSci. China, 2022, 44(4): 253-256.

[2]付虹雨, 崔国贤, 李绪孟等 . 基于无人机遥感图像的苎麻产量估测研究[J]. 作物学报, 2020, 46(9): 1448- 1455.

FU H Y, CUI G X, LI X M, et al.. Estimation of ramie yield basedonUAVremotesensingimage[J].ActaAgron.Sin., 2020, 46(9): 1448- 1455.

[3]王辉, 付虹雨, 王继龙, . 基于多元回归和BP神经网络的苎麻产量估测模型比较研究[J]. 中国麻业科学, 2020, 42(5): 227-238.

WANG H, FU H Y, WANG J L, et al.. Comparative study of ramieyieldestimationmodelsbasedonmultipleregressionand BP neural network [J]. Plant Fiber Sci. China, 2020, 42(5): 227-238.

[4]王辉, 白玉超, 付虹雨, . 3 个苎麻品种三年间产量及其构成因子的变化研究[J]. 中国麻业科学, 2020, 42(2): 76-82.

WANG H, BAI Y C, FU H Y, et al.. Study on changes of yield and component factors of three ramie varieties in three years [J]. Plant Fiber Sci. China, 2020, 42(2): 76-82.

[5]于珍珍, 邹华芬, 于德水, . 融合田间水热因子的甘蔗产量 GA-BP 预测模型[J]. 农业机械学报, 2022, 53(10): 277-283.

YU Z Z, ZOU H F, YU D S, et al.. GA-BP prediction model of sugarcaneyieldwithfieldhydrothermalfactors[J].Trans.Chin. Soc. Agric. Mach., 2022, 53(10): 277-283.

[6]张文婧, 赵锦, 崔文倩, . 气候平均态和极端态变化对东北玉米气象产量的影响[J].中国农业科学 , 2023, 56(10):1859- 1870.

ZHANG W J, ZHAO J, CUI W Q,et al..Effectsof climate mean and extreme changes on meteorological yield of maize in Northeast China [J]. Sci. Agric. Sin., 2019, 56(10): 1859- 1870.

[7]刘焕才, 史书琦, 李曼, . 疏勒河流域中游地区玉米性状及单产的影响因子研究[J]. 干旱区地理2023, 46(9): 1453-1466.

LIU H C, SHI S Q, LI M, et al.. Study on influencing factors of maizecharacterandyieldinMiddlereachesofShuleRiver Basin [J]. Arid Land Geography2023, 46(9): 1453- 1466.

[8]刘头明, 汤清明, 朱四元, . 长江流域 5个地区间苎麻产量差异的气候影响因素分析[J]. 安徽农业科学 , 2011, 39(25): 15559- 15562+15734.

LIU T M, TANG Q M, ZHU S Y, et al.. Analysis of climatic factors affecting the difference of ramie yield in five regions in the Yangtze River Basin [J]. J. Anhui Agric. Sci., 2011, 39(25): 15559- 15562, 15734.

[9]MELILLO J M, RICHMOND T C, YOHE G W. Climate change impacts in the United States[R]. The Third National Climate Assessment, 2014.

[10]唐俊 , 赵成萍 , 周新志 , . 基于 EVI-RBF 的玉米长势监测及产量预测[J]. 江苏农业学报, 2020, 36(3): 577-583.

TANG J, ZHAO C P, ZHOU X Z, et al..Maizegrowth monitoring and yield prediction based on EVI-RBF [J]. Jiangsu J. Agric. Sci., 2019, 36(3): 577-583.

[11]徐敏, 吴洪颜, 张佩, . 基于气候适宜度的江苏水稻气候年景预测方法[J]. 气象, 2018, 44(9): 1200- 1207.

XU M, WU H Y, ZHANG P, et al.. Annual climate prediction methodforJiangsu rice based on climate suitability [J]. Meteorol. Monthly, 2018, 44(9): 1200- 1207.

[12]刘振洋, 赵家松, 胡仁傑, . 基于关联规则与多元线性回归的云南省甘蔗产量预测模型[J]. 广东农业科学, 2022, 49 (12): 160- 166.

LIU Z Y, ZHAO J S, HU R J, et al.. Sugarcane yield prediction model based on association rules and multiple linear regressioninYunnanProvince[J].GuangdongAgric.Sci., 2022, 49(12): 160- 166.

[13]XUE J K, SHENB. A novelswarm intelligence optimization approach: sparrow search algorithm [J]. Syst. Sci. Control Eng., 2020, 8(1): 22-34.

[14]EAP, D. B. D, Narendra K,et al..A comprehensive investigationofGenotype-Environmentinteractioneffectson seed cotton yield contributing traits inGossypium hirsutum L. using multivariate analysis and artificial neural network [J/OL]. Computers Electron. Agric., 2023, 211: 107966 [2023-09-06]. https://doi.org/10.1016/j.compag.2023.107966.

[15]SONG S, XIONG X, WU X, et al.. Modeling the SOFC by BP neural network algorithm [J]. Int. J. Hydrogen Energy, 2021, 46 (38): 65-77.

[16]娄高中 , 谭毅 , 白二虎 . 主成分分析与改进 PSO-BP 神经网络的下沉系数预测[J]. 测绘科学, 2023, 48(2): 124- 130, 147.

LOU G Z, TAN Y, BAI E H. Principal component analysis and subsidence coefficient prediction of improved PSO-BP neural network [J]. Sci. Survey. Map., 2023, 48(2): 124- 130, 147.

[17]郭倩, 魏嘉豪, 张健, . 基于无人机多光谱影像和随机森林的蔬菜识别[J]. 中国农业科技导报, 2023, 25(2): 99- 110.

GUO Q, WEI J H, ZHANG J, et al..Vegetablerecognition based on UAV multi-spectral image and random forest[J]. J. Agric. Sci. Technol., 2023, 25(2): 99- 110.

[18]薛建凯 . 一种新型的群智能优化技术的研究与应用[D]. 上海: 东华大学, 2020.

XUE J K. Research and application of a new swarm intelligence optimization technology [D]. Shanghai: Donghua University, 2020.

[19]顾清华, 姜秉佼, 常朝朝, . 求解大规模优化问题的改进麻雀搜索算法[J]. 控制与决策, 2023, 38(7): 1960- 1968.

GU Q H, JIANG B J, CHANG C C, et al..Animproved Sparrow search algorithm for large-scale optimization problems [J]. Control Decision, 2023, 38(7): 1960- 1968.

[20]胡建华, 黄宇龙, 张坚, . 基于麻雀搜索算法优化双隐含层 BP 神经网络的张力减径钢管壁厚预测[J]. 塑性工程学 报, 2022, 29(8): 145- 151.

HU J H, HUANG Y L, ZHANG J, et al.. Predictionof wall thickness of tension reduced steel pipe by double-hidden layer BPneuralnetwork basedonsparrowsearchalgorithm[J].J. Plasticity Eng., 2022, 29(8): 145- 151.

[21] 刘头明, 汤清明, 朱四元, . 6 个不同生态区域苎麻产量及环境影响因素分析[J]. 耕作与栽培, 2011, No. 178(1): 30-32.

LIU T M, TANG Q M, ZHU S Y, et al.. Analysis of ramie yield andenvironmentalimpactfactorsinsixdifferentecological regions[J]. Tillage Cultivation, 2011, 178(1): 30-32.

[22]袁晋琰, 吴春燕, 阮启亮, . 分宜气象因子对苎麻生长的影响及种植区域的划分[J]. 中国麻业科学, 2013, 35(4): 210- 213, 218.

YUAN J Y, WU C Y, RUAN Q L,et al.Influence of meteorological factors on ramie growth and division of planting area [J]. Plant Fiber Sci. China, 2013, 35(4): 210-213+218.

[23]崔兴华, 靳晟, 姚芷馨, . 基于麻雀搜索算法和广义回归神经网络的玉米产量预测[J]. 数学的实践与认识, 2022, 52 (7): 88-96.

CUI X H, JIN S, YAO Z X, et al.. Maize yield prediction based on sparrow search algorithm and generalized regression neural network [J]. Math. Practice Theory, 2022, 52(7): 88-96.

 

文章摘自:王辉,付虹雨,岳云开,崔国贤,佘玮.基于气候变量的苎麻产量 SSA-BP预测模型[J/OL].中国农业科技导报. https://doi.org/10.13304/j.nykjdb.2023.0557


更多阅读