实验详情

使用机器学习方法进行豆荚内部害虫检测

通过本实验,学员可以了解图像分类问题的一般解决方法,了解逻辑回归算法的概念与原理,了解机器学习产品PAI的功能和工作流程,最终可独立使用阿里云机器学习解决常见的机器学习场景。

云计算、大数据、编程语言、物联网(IoT)学习指南下载,100+技术课程免费学!

150 实验点 兑换实验点
提示: 实验资源会在固定时间后释放,请创建资源后尽快操作。

实验评分

平均时长

4 小时

难易程度

普通

实验编号

A02001

学习人次

2058

背景介绍

        菜用大豆和豌豆中极易携带害虫等杂质,成为检验检疫部门的重点检控对象。其中的主要害虫为豆荚螟。根据2009年调查数据,我国山东莱阳菜用大豆豆荚含虫率为0.34%至18.52%,远达不到出口检测标准,成为企业发展的重要阻碍。豆荚螟也称为蛀豆虫,以幼虫蛀食豆荚内鲜豆粒为生。被害豆荚轻则被蛀食成孔,重则内部豆粒被蛀食为空,同时,被害豆荚内通常存有大量虫粪,污染豆荚致使霉烂变质,严重影响着豆类蔬菜的品质。对此,世界各国制定了严格的检测标准。根据美国进出口贸易标准,每26磅豆类农产品中豆荚螟数量不能超过一条,且要求其长度小于0.7cm。豆荚内部害虫的检测剔除不同于食品中微生物的处理,豆荚内部害虫检测“活要见虫、死要见尸”,对加工预处理技术环节有极高的要求。

        去杂分选的对象中,最难检测和剔除的是豆荚内部的害虫,因其具有隐蔽性的特点,对检测手段要求较高。传统的害虫检测方法主要有染色体法和比重法等,不仅对样本有破坏性,而且费时费力。现实中加工企业更多采用人工分选法剔除豆荚内部害虫,这种检测方式对劳动强度要求高,效率低,而且受主观因素影响严重,检测准确率难以保证,成为企业生产线自动化发展的瓶颈。随着农产品品质检测研究的不断深入,机器视觉等现代光电无损探测技术显示出巨大的潜力,为豆荚内部害虫检测提供了新思路。

        近几年随着机器学习技术的推广,图片识别技术得到了广泛的应用,通过机器学习技术,对有标注的豆荚图片数据进行学习,构建机器学习模型,然后使用模型对未标注的图片进行识别,判断其有害虫还是无害虫,并保证识别准确率。

        本实验选用的对称透射光源为美国ASD公司的一款卤素灯,额定电流为15V,额定功率为75W。该光源具有良好的稳定性,光照强度满足豆荚透射成像需求。对拍照后的图片进行裁剪,将毛豆部分裁剪到图中,其他部分去掉,裁成500*500像素的图片。

后续的步骤如下:

1、从裁剪后的图片中分别选取有虫图片和无虫图片各50张

2、使用matlab软件对图片数据进行降维处理

3、使用逻辑回归算法对降维后的图片数据进行分类训练

4、使用训练的模型对测试样本进行预测

5、部署离线批处理模型

本实验从获取到的使用matlab软件对图片数据进行降维处理后的数据开始进行。