中国农学通报 ›› 2023, Vol. 39 ›› Issue (18): 142-150.doi: 10.11924/j.issn.1000-6850.casb2022-0581
收稿日期:
2022-07-11
修回日期:
2022-10-27
出版日期:
2023-06-25
发布日期:
2023-06-25
通讯作者:
王静,女,1972年出生,云南曲靖人,副教授,研究方向:农业工程经济技术分析。通信地址:650201 云南省昆明市盘龙区沣源路452号,E-mail:作者简介:
孙博,男,1989年出生,云南昆明人,在读硕士研究生,研究方向:城乡建设技术经济与管理。通信地址:650031 云南省昆明市五华区茭菱路24号 省种子管理站孙林华收转,E-mail:505671359@qq.com。
基金资助:
SUN Bo1(), LI Jing2, WANG Jing2(
)
Received:
2022-07-11
Revised:
2022-10-27
Online:
2023-06-25
Published:
2023-06-25
摘要:
为有效缓解来自人口、环境和资源方面的压力,发展植物工厂非常重要。智慧植物工厂是设施农业发展的高级阶段,研究如何将机器学习应用在植物工厂中有效提高生产效率,促使植物工厂向智能化方向发展是一个重要的新课题。通过将机器学习与作物表型研究相结合,建立作物生长模型,并应用到生长环境监测中(病、虫、草、旱涝、营养等),及精准调控植物工厂室内环境及营养液智能调控等方式中,解决好中国植物工厂成本高、作物产量低的问题,助力植物工厂向信息化、自动化、智能化、精准化和个性化方向发展。
孙博, 李靖, 王静. 机器学习在植物工厂中的研究现状与挑战[J]. 中国农学通报, 2023, 39(18): 142-150.
SUN Bo, LI Jing, WANG Jing. Machine Learning in Plant Factory: Current Status and Challenges[J]. Chinese Agricultural Science Bulletin, 2023, 39(18): 142-150.
分类 | 算法 | 数学模式 |
---|---|---|
用作监督学习的用途 | k-近邻算法 | 线性回归 |
朴素贝叶斯算法 | 局部加权线性回归 | |
支持向量机 | Ridge回归 | |
决策树 | Lasso最小回归系数估计 | |
用作无监督学习的用途 | k-均值 | 最大期望算法 |
DBSCAN | Parzen窗设计 |
分类 | 算法 | 数学模式 |
---|---|---|
用作监督学习的用途 | k-近邻算法 | 线性回归 |
朴素贝叶斯算法 | 局部加权线性回归 | |
支持向量机 | Ridge回归 | |
决策树 | Lasso最小回归系数估计 | |
用作无监督学习的用途 | k-均值 | 最大期望算法 |
DBSCAN | Parzen窗设计 |
机器学习 类型 | 机器学习 算法 | 优点 | 缺点 | 适用数据 范围 |
---|---|---|---|---|
监督学习 | k-近邻算法 | 精度高、对异常值不敏感、无数据输入假定 | 计算复杂度高、空间复杂度高 | 数值型和标称型 |
决策树 | 计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 | 可能会产生过度匹配问题 | 数值型和 标称型数据 | |
朴素贝叶斯 | 在数据较少的情况下仍然有效,可以处理多类别问题 | 对于输入数据的准备方式较为敏感 | 标称型数据 | |
Logistic回归 | 计算代价不高,易于理解和实现 | 容易欠拟合,分类精度可能不高 | 数值型和 标称型数据 | |
支持向量机 | 泛化错误率低,计算开销不大,结果易解释 | 对参数调节和核函数的选择敏感 | 数值型和 标称型数据 | |
AdaBoost | 泛化错误率低,易编码,可以应用在大部分分类器上,无参数调整 | 对离群点敏感 | 数值型和 标称型数据 | |
线性回归 | 结果易于理解,计算上不复杂 | 对非线性的数据拟合不好 | 数值型和 标称型数据 | |
树回归 | 可以对复杂和非线性的数据建模 | 结果不易理解 | 数值型和 标称型数据 | |
无监督学习 | k-均值聚类算法 | 容易实现 | 可能收敛到局部最小值,在大规模数据集上收敛较慢 | 数值型数据 |
Apriori算法 | 易编码实现 | 在大数据集上可能较慢 | 数值型或 标称型数据 | |
FP-growth算法 | 计算速度一般要快于Apriori算法 | 实现比较困难,在某些数据集上性能会下降 | 标称型数据 |
机器学习 类型 | 机器学习 算法 | 优点 | 缺点 | 适用数据 范围 |
---|---|---|---|---|
监督学习 | k-近邻算法 | 精度高、对异常值不敏感、无数据输入假定 | 计算复杂度高、空间复杂度高 | 数值型和标称型 |
决策树 | 计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 | 可能会产生过度匹配问题 | 数值型和 标称型数据 | |
朴素贝叶斯 | 在数据较少的情况下仍然有效,可以处理多类别问题 | 对于输入数据的准备方式较为敏感 | 标称型数据 | |
Logistic回归 | 计算代价不高,易于理解和实现 | 容易欠拟合,分类精度可能不高 | 数值型和 标称型数据 | |
支持向量机 | 泛化错误率低,计算开销不大,结果易解释 | 对参数调节和核函数的选择敏感 | 数值型和 标称型数据 | |
AdaBoost | 泛化错误率低,易编码,可以应用在大部分分类器上,无参数调整 | 对离群点敏感 | 数值型和 标称型数据 | |
线性回归 | 结果易于理解,计算上不复杂 | 对非线性的数据拟合不好 | 数值型和 标称型数据 | |
树回归 | 可以对复杂和非线性的数据建模 | 结果不易理解 | 数值型和 标称型数据 | |
无监督学习 | k-均值聚类算法 | 容易实现 | 可能收敛到局部最小值,在大规模数据集上收敛较慢 | 数值型数据 |
Apriori算法 | 易编码实现 | 在大数据集上可能较慢 | 数值型或 标称型数据 | |
FP-growth算法 | 计算速度一般要快于Apriori算法 | 实现比较困难,在某些数据集上性能会下降 | 标称型数据 |
引用文献 | 完成的工作 | 方法 | 优点 |
---|---|---|---|
[ | 建立基于光流分析和机器学习的植物工厂叶片运动的生长预测模型 | 决策树(Decision Tree)、梯度推进回归(Gradient Boost Regression)、光流分析(Optical Flow Analysis)、 主成分分析(Principal Component Analysis, PCA)、 支持向量回归(Support Vector Regression, SVR)、 时间序列分析(Time Series Analysis) | 建立multiple plant imaging (MPI)系统收集数据、使用了多种机器学习方法对数据进行处理、对数据进行了合理的降维 |
[ | 人工光源型植物工厂中应用叶绿素荧光对莴苣幼苗进行高通量生长预测 | 人工神经网络(Artificial Neural Network) | 应用基于生物信息的神经网络预测植物生长,如叶片面积和叶绿素荧光(CF)的6次时间测量:4、8、12、16、20、24 h和4个昼夜节律特征 |
[ | 温室和植物工厂里的植物和水果说话途径的实现 | 人工神经网络(Artificial Neural Network)、 遗传算法(Genetic Algorithm) | 应用传感器收集而来的结果,通过神经网络建模、通过遗传算法寻优,实现了在前人研究的基础上,通过机器学习的方法使环境控制更优化 |
[ | 利用监督机器学习对法拉第笼外植物状态的电生理评估 | 梯度增强树(Gradient Boosted Trees, GBT)、 人工神经网络(深度学习)、Logistic回归、 主成分分析(Principal Component Analysis, PCA) | 作者通过测量植物工厂中番茄的潜在的电生理信号,通过主成分分析的方法预处理数据,通过梯度增强树的方法计算出了番茄苗是否处于水分充足或是水分胁迫的状态 |
[ | 野生细叶万寿菊(莴苣)上Erysiphe cruciferarum白粉真菌致白粉病:非破坏性疾病检测的高光谱成像和机器学习模型 | 递归特征减少法(Recursive Feature Elimination, RFE)、随机森林(Random Forests, RF)、 极度梯度增加法(Extremely Gradient Boosting, XGB) | 通过分析温室中作物的图像,运用随机森林的方法找到4个波长在403~446 nm的波段,运用时下最流行的极度梯度增加法(XGB)学习高光谱图像,得到了可以预测植株是否感染了白粉病的机器学习模型 |
[ | 基于图像分析和机器学习的完整番茄果实植物检测 | 回归树(Regression Tree, CART)、 随机森林(Random Forests, RF)、X均值聚类算法 (X-means Clustering Algorithm) | 作者通过传统RGB相机拍摄的番茄照片,通过图像分割、运用回归树(CART)和决策树分类器,较为成功地检测出番茄的成熟、未成熟和幼果,成功地预测了番茄的产量 |
[ | 智能植物工厂农业传感数据提高作物产量 | 深度神经网络(Deep Neural Network, DNN)、 确定性策略梯度算法 (Deterministic Policy Gradient Algorithms, DDPG) | 作者应用深度强化学习的方法,接受环境对植物作用的反馈,不断优化自身的算法,实现了植物工厂中多环境因素的最优控制 |
[ | 基于强化学习的植物工厂系统自适应营养供水控制 | 改进的强化学习算法 (Reinforcement Learning, RL) | 作者在没有参考模型的基础上,建立了一个有别于标准强化学习模型(RL)的改进型强化学习模型,该模型能较好的优化植物工厂中的营养供水 |
引用文献 | 完成的工作 | 方法 | 优点 |
---|---|---|---|
[ | 建立基于光流分析和机器学习的植物工厂叶片运动的生长预测模型 | 决策树(Decision Tree)、梯度推进回归(Gradient Boost Regression)、光流分析(Optical Flow Analysis)、 主成分分析(Principal Component Analysis, PCA)、 支持向量回归(Support Vector Regression, SVR)、 时间序列分析(Time Series Analysis) | 建立multiple plant imaging (MPI)系统收集数据、使用了多种机器学习方法对数据进行处理、对数据进行了合理的降维 |
[ | 人工光源型植物工厂中应用叶绿素荧光对莴苣幼苗进行高通量生长预测 | 人工神经网络(Artificial Neural Network) | 应用基于生物信息的神经网络预测植物生长,如叶片面积和叶绿素荧光(CF)的6次时间测量:4、8、12、16、20、24 h和4个昼夜节律特征 |
[ | 温室和植物工厂里的植物和水果说话途径的实现 | 人工神经网络(Artificial Neural Network)、 遗传算法(Genetic Algorithm) | 应用传感器收集而来的结果,通过神经网络建模、通过遗传算法寻优,实现了在前人研究的基础上,通过机器学习的方法使环境控制更优化 |
[ | 利用监督机器学习对法拉第笼外植物状态的电生理评估 | 梯度增强树(Gradient Boosted Trees, GBT)、 人工神经网络(深度学习)、Logistic回归、 主成分分析(Principal Component Analysis, PCA) | 作者通过测量植物工厂中番茄的潜在的电生理信号,通过主成分分析的方法预处理数据,通过梯度增强树的方法计算出了番茄苗是否处于水分充足或是水分胁迫的状态 |
[ | 野生细叶万寿菊(莴苣)上Erysiphe cruciferarum白粉真菌致白粉病:非破坏性疾病检测的高光谱成像和机器学习模型 | 递归特征减少法(Recursive Feature Elimination, RFE)、随机森林(Random Forests, RF)、 极度梯度增加法(Extremely Gradient Boosting, XGB) | 通过分析温室中作物的图像,运用随机森林的方法找到4个波长在403~446 nm的波段,运用时下最流行的极度梯度增加法(XGB)学习高光谱图像,得到了可以预测植株是否感染了白粉病的机器学习模型 |
[ | 基于图像分析和机器学习的完整番茄果实植物检测 | 回归树(Regression Tree, CART)、 随机森林(Random Forests, RF)、X均值聚类算法 (X-means Clustering Algorithm) | 作者通过传统RGB相机拍摄的番茄照片,通过图像分割、运用回归树(CART)和决策树分类器,较为成功地检测出番茄的成熟、未成熟和幼果,成功地预测了番茄的产量 |
[ | 智能植物工厂农业传感数据提高作物产量 | 深度神经网络(Deep Neural Network, DNN)、 确定性策略梯度算法 (Deterministic Policy Gradient Algorithms, DDPG) | 作者应用深度强化学习的方法,接受环境对植物作用的反馈,不断优化自身的算法,实现了植物工厂中多环境因素的最优控制 |
[ | 基于强化学习的植物工厂系统自适应营养供水控制 | 改进的强化学习算法 (Reinforcement Learning, RL) | 作者在没有参考模型的基础上,建立了一个有别于标准强化学习模型(RL)的改进型强化学习模型,该模型能较好的优化植物工厂中的营养供水 |
机器学习 方法分类 | 植物工厂中的任务 | 支持的算法 | 优点 | 不足 |
---|---|---|---|---|
回归 | 建立作物生长模型、优化作物生长环境、作物的长势、产量预测等 | 人工神经网络、卷积神经网络、支持向量回归、随机森林、Logistic回归等。 | 可利用物联网所得的大量数据、精度较高 | 不同机器学习方法可应用范围不同、对数据的要求较高、受数据异常值影响较大 |
分类 | 作物病虫害分类、作物生长状态分类、作物表型分类等 | 卷积神经网络等 | 卷积神经网络对图像识别精度较高、并可对作物图像进行目标检测等操作 | 受图像数据的影响较大,对图像数据大样本数量的要求较高,对计算机的要求较高 |
聚类 | 无监督学习,在没有标签的情况下的作物性状分类、作物群体长势评估、病虫害分类及预测等等 | KNN算法等 | 可以对作物的表型、生长状态等进行聚类,对作物的生长进行智能识别和管理 | 目前的研究对无监督学习(聚类)的精度的提升不大 |
机器学习 方法分类 | 植物工厂中的任务 | 支持的算法 | 优点 | 不足 |
---|---|---|---|---|
回归 | 建立作物生长模型、优化作物生长环境、作物的长势、产量预测等 | 人工神经网络、卷积神经网络、支持向量回归、随机森林、Logistic回归等。 | 可利用物联网所得的大量数据、精度较高 | 不同机器学习方法可应用范围不同、对数据的要求较高、受数据异常值影响较大 |
分类 | 作物病虫害分类、作物生长状态分类、作物表型分类等 | 卷积神经网络等 | 卷积神经网络对图像识别精度较高、并可对作物图像进行目标检测等操作 | 受图像数据的影响较大,对图像数据大样本数量的要求较高,对计算机的要求较高 |
聚类 | 无监督学习,在没有标签的情况下的作物性状分类、作物群体长势评估、病虫害分类及预测等等 | KNN算法等 | 可以对作物的表型、生长状态等进行聚类,对作物的生长进行智能识别和管理 | 目前的研究对无监督学习(聚类)的精度的提升不大 |
[1] |
doi: 10.3390/cli8010001 URL |
[2] |
|
[3] |
|
[4] |
|
[5] |
吴思. 2030年的中国城市化[J]. 中国经济报告, 2014(7):93-98.
|
[6] |
杨其长. 植物工厂发展史[J]. 生命世界, 2019(10):4-7.
|
[7] |
doi: 10.1038/s41580-021-00407-0 pmid: 34518686 |
[8] |
刘勇, 康立山, 陈毓屏. 非数值并行算法(第二册)遗传算法[M]. 北京: 科学出版社, 1995.
|
[9] |
|
[10] |
|
[11] |
|
[12] |
仝宇欣, 方炜. 数字化植物工厂理论与实践[M]. 北京: 中国农业科学技术出版社, 2020.
|
[13] |
孙忠富, 陈晴, 王迎春. 不同光照条件下温室黄瓜干物质生产模拟与试验研究[R]. 设施园艺产业可持续发展研讨会, 2005.
|
[14] |
倪纪恒, 毛罕平. 电导率对温室黄瓜叶面积和干物质生产影响的动态模拟[J]. 农业工程学报, 2011, 27(12):105-109.
|
[15] |
朱剑锋, 郑增威, 孙霖, 等. 基于无线传感网的温室花卉自适应调控系统[J]. 计算机测量与控制, 2016(10):96-100,112.
|
[16] |
|
[17] |
徐丹. 基于作物状态在线反馈的温室双闭环最优控制研究[D]. 北京: 中国农业科学院, 2020.
|
[18] |
皮特·哈里顿. 机器学习实战[M]. 北京: 人民邮电出版社, 2013.
|
[19] |
doi: 10.3389/fpls.2017.01852 pmid: 29163582 |
[20] |
doi: 10.1016/j.compag.2018.01.009 URL |
[21] |
|
[22] |
doi: 10.17781/P002611 URL |
[23] |
doi: 10.3390/agriculture11040337 URL |
[24] |
|
[25] |
A.M.史密斯, G.库普兰特, L.多兰, 等. 植物生物学[M]. 北京: 科学出版社, 2012.
|
[26] |
|
[27] |
|
[28] |
|
[29] |
林真紀夫, 大田直大山克己う. 施设園芸におけゐヒートポンプの有效利用[M]. 東京: 社団法人農業電化協会, 2009.
|
[30] |
pmid: 15776542 |
[31] |
陈桂芬, 李静, 陈航, 等. 大数据时代人工智能技术在农业领域的研究进展[J]. 吉林农业大学学报, 2018, 40(4):502-510.
|
[32] |
李跃洋, 苏铁, 王胤, 等. 中国与荷兰设施园艺对比分析[J]. 中国蔬菜, 2020(6):11-15.
|
[33] |
王小菁. 植物生理学[M]. 北京: 高等教育出版社, 2019:67-112.
|
[34] |
张明秋. 人工光源型植物工厂温湿度环境控制与试验研究[D]. 密山: 黑龙江八一农垦大学, 2021.
|
[35] |
周健民. 土壤学大辞典[M]. 北京: 科学出版社, 2013:10
|
[36] |
|
[37] |
何海东. 营养液自适应控制机制研究[D]. 合肥: 中国科学技术大学, 2011.
|
[38] |
doi: 10.3389/fpls.2019.00227 pmid: 30967880 |
[39] |
doi: 10.2525/ecb.47.55 URL |
[40] |
doi: 10.3390/s140712191 pmid: 25010694 |
[41] |
|
[42] |
doi: 10.1016/S1474-6670(17)48655-1 URL |
[43] |
doi: 10.1016/j.eng.2021.03.019 URL |
[44] |
|
[45] |
何清, 李宁, 罗文娟, 等. 大数据下的机器学习算法综述[J]. 模式识别与人工智能, 2014, 27(4):327-336.
|
[46] |
施玮囡. 基于深度学习的植物工厂幼苗表型信息获取及定植装备研究[D]. 杭州: 浙江大学, 2019.
|
[47] |
何子力. 基于视觉巡检机器人的植物工厂控制系统的设计与实现[D]. 合肥: 中国科学技术大学, 2019.
|
[48] |
王新忠. 温室番茄收获机器人选择性收获作业信息获取与路径规划研究[D]. 镇江: 江苏大学, 2012.
|
[49] |
赵春江. 智慧农业的发展现状与未来展望[J]. 中国农业文摘-农业工程, 2021, 33(6):4-8.
|
[1] | 李素英, 崔燕娇, 窦宝峰, 刘正理. 中国谷子杂优利用研究进展及相关问题的探讨[J]. 中国农学通报, 2023, 39(9): 24-32. |
[2] | 梁展图, 全林发, 梁盛曦, 陈炳旭, 马群, 姚琼. 基于CiteSpace的鳞翅目昆虫转录组学研究态势分析[J]. 中国农学通报, 2023, 39(8): 142-148. |
[3] | 陆姣云, 田宏, 张鹤山, 熊军波, 刘洋. 基于中国知网的氮循环研究文献计量分析[J]. 中国农学通报, 2023, 39(7): 158-164. |
[4] | 齐康康, 赵佳, 王利民, 樊阳阳, 侯学会, 阮怀军. 山东省智能农机装备重大关键技术创新战略研究[J]. 中国农学通报, 2023, 39(5): 1-5. |
[5] | 张木清, 杨本鹏. 关于加快甘蔗源头创新、保障国家食糖安全的建议[J]. 中国农学通报, 2023, 39(5): 6-8. |
[6] | 邹语嫣, 王连军, 雷剑, 柴沙沙, 靳晓杰, 程贤亮, 杨新笋, 李艳芝. 甘薯国家地理标志的保护现状与发展对策[J]. 中国农学通报, 2023, 39(2): 152-157. |
[7] | 关婷, 樊明寿, 贾立国. 基于微型蒸发器估算不同作物棵间蒸发的研究进展[J]. 中国农学通报, 2023, 39(2): 63-67. |
[8] | 付晓宇, 魏丹, 伍一宁, 郭媛, 张荣涛. 土壤动物研究热点的可视化分析[J]. 中国农学通报, 2023, 39(18): 158-164. |
[9] | 崔诗宇, 金荷仙. 国内外社区花园土壤重金属污染研究进展[J]. 中国农学通报, 2023, 39(18): 67-74. |
[10] | 陈文婷, 孙博, 李春生, 彭云, 李靖, 王静. 基于熵权-TOPSIS模型的植物工厂规模效益分析[J]. 中国农学通报, 2023, 39(17): 140-146. |
[11] | 李媛媛, 德力格尔, 刘晶, 石凯. 单细胞转录组在昆虫学研究的应用[J]. 中国农学通报, 2023, 39(17): 79-85. |
[12] | 韩梅梅, 段青青, 谭延肖, 张绍丽, 李腾飞, 李华, 张超, 常培培, 王静静, 张自坤. 辣椒主要病害抗病育种研究进展[J]. 中国农学通报, 2023, 39(14): 27-32. |
[13] | 陈和敏, 肖文芳, 陈和明, 吕复兵, 朱根发, 李宗艳, 李佐. 基于CiteSpace的兰花保鲜研究进展及可视化分析[J]. 中国农学通报, 2023, 39(1): 151-164. |
[14] | 高文瑞, 孙艳军, 韩冰, 费聪, 王显生, 徐刚. 弱光对西瓜果实品质及蔗糖代谢的影响[J]. 中国农学通报, 2023, 39(1): 56-61. |
[15] | 王绍新, 王宝宝, 李中建, 许洛, 冯健英. 中国鲜食玉米的研究脉络和趋势探析[J]. 中国农学通报, 2023, 39(1): 8-15. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||