基于PCA-ELM和光谱技术预测香蕉成熟度

黎源鸿1,王红军1,邓建猛1,黎邹邹1,周伟亮2,靳俊栋2

(1.华南农业大学南方农业机械与装备实验室,广东广州 510642)(2.国家柑橘产业技术研发中心机械研究室,广东广州 510642)

摘要:本文利用高光谱成像技术(Hyperspectral imaging)对常温下贮存的450个未剥皮香蕉样本光谱数据进行采集,首先检测样本果肉可溶性固形物含量(TSS)、坚实度(FIM),采用spss单因素方差分析,然后运用线性优化岭回归分析-偏最小二乘法(RR-iPLS)建立了香蕉成熟度理化指标的光谱和图像特征分类模型,结果表明通过实验平台获取光谱数据预测香蕉可溶性固形物含量以及坚实度的相关系数R2值分别为0.92和0.94。再通过连续投影法(successive projections algorithm,SPA)法以及主成分分析法(principal component analysis,PCA)分别选取特征波长,建立基于特征波长的极限学习机(extreme learning machine,ELM)对光谱数据进行建模交叉验证。通过比较RR-iPLS,SPA-ELM与PCA-ELM三种分类预测模型,表明基于特征波长的PCA-ELM分类模型具有较好的预测性能。交叉验证准确率达到 99%。为能快速无损识别香蕉果实品质提供一种有效的预测研究,基本满足对香蕉成熟度分类检测且显示出有效建模分析,且能达到有效的经济效益。

关键词:高光谱成像技术;连续投影法;特征波长;主成分分析;极限学习机

香蕉作为主要的热带和亚热带水果之一,是世界上贸易量比较大的水果之一。往往由于香蕉品质检测技术在效率以及成本上都是跟不上香蕉产业现代化步伐。导致香蕉成熟度在采摘以及运输过程中对于品质的影响很难得到保证。因此,香蕉的品质检测技术间接影响消费者的满意度和市场价格。目前,香蕉成熟度分类方法主要有人工识别和化学检测两种。为了克服人工与化学检测的不足,将先进的高光谱图像技术应用于香蕉成熟度的快速无损检测研究就尤为重要了。本文旨在通过研究以及光谱平台技术,融合图像技术和光谱技术的特点,提高香蕉成熟度检测效率从而实现低成本香蕉成熟度的无损检测,利用光谱数据实现检测香蕉成熟指标不但对于我国香蕉品质乃至整个水果产业现代化都具有战略性意义。香蕉成熟过程中,颜色、气味、坚实度、粘度和糖度等特性都会发生明显变化,而在成熟的过程中,果皮的谷氨酸脱羧酶(GAD)活力变化与分布情况与TSS有一定相关性[18]。李洪涛等(2010)针对香蕉品质变化过程中释放的特征气体,选择了特定的气敏传感器阵列,检测异丁醇、乙酸乙脂和乙烯等有机化合物吸附机理。利用传感器检测腔的环境控制优化模块来稳定气体传感器的工作环境,提高系统检测精度和稳定性[6]。P.Rajkumar(2012)以及胡耀华等(2011)提出了近红外光谱技术无损检测香蕉品质指标的新方法,该检测方法达到了较高的精度,同时为利用光谱技术应用于香蕉品质检测这一方向提供理论依据。

1 材料与方法

1.1 推扫型高光谱成像设备

图1 高光谱成像系统实物图
Fig.1 Hyperspectral imaging system

图2 高光谱成像系统原理图
Fig.2 Schematic diagram of hyperspectral imaging system

实验采用的高光谱成像系统实物如图1,使用的是北京卓立汉光公司研发ZolixHyperSIS高光谱成像系统,硬件主要由4盏灯50 W卤素光源头、可检测370~1000 nm的光谱反射的成像光谱仪、CCD相机、传送机构和计算机工作站等组成。其中光谱分辨率为2.8 nm、采样间隔为1.2 nm。实验前设置其曝光时间为5 ms,平均移动速度为12 mm/s,扫描距离为200 mm。其工作原理是推扫型,综合横纵扫描信息获取样品的三维高光谱图像数据。如图2。

1.2 实验样本采集

试验的香蕉样品为大丰1号香蕉品种,假茎高度240 cm,假茎中部周长50.5 cm,果指长度20.9~21.1 cm,果指周长11.0~11.7 cm,单果重160~173 g,比对照种平均+高 12%,可溶性糖含量 18.0%,可食率70.6%。商品价值可观。该品种由广东省农业科学院果树研究所选育。样品于2016年4月26日从广东省广州市天河区长湴综合市场购买。

图3 不同成熟阶段的香蕉样品图片
Fig.3 Pictures of different maturity of banana samples

注:a,第1阶段;b,第2阶段;c,第3阶段;d,第4阶段;e,第5阶段。

本文共选用450个带皮香蕉样品,分成5组,每天定时观察香蕉的表皮,香蕉成熟阶段分级按照Von Loesecke H W的香蕉表皮颜色分级法分为7级。TSS含量测定参考洪添胜等(2007)的测定方法,本文应用邦西仪器科技(上海)有限公司生产的手持式折光仪测量 450个香蕉果肉样本,该测量范围为0~32 °Brix,分辨率为 0.2 °Brix[9]。坚实度的测定参考段学武等(2011)的测定方法,采用艾德堡硬度计LX-A,针头为圆筒形,直径 3.5 mm,量程 0.5~4 kg/cm2。测量标准按照GB/T 12295-1990进行理化指标的测量。由于本实验是侧重检测香蕉开始成熟后的实用参考数据,取该成熟度3级到7级为本实验的1级到5级为研究样本,即定义成熟度如下:1)绿色多于黄色为第一成熟阶段;2)黄色多于绿色为第二成熟阶段;3)几乎全黄,但果冠处有残绿色为第三成熟阶段;4)全黄有少量斑点,基本集中在中部为第四成熟阶段;5)全黄,有大部分斑点成片出 现为第五成熟阶段;每个阶段选取24个样品进行实验。不同成熟阶段香蕉样品如图3。

1.3 高光谱数据采集

图4 五个成熟阶段实验采集的光谱曲线
Fig.4 Spectral curves of five mature stages

对含有果皮且不同成熟度香蕉样本的光谱数据进行采集,将采集到的全部光谱数据计算平均值,五个阶段的平均光谱曲线图如图4所示,在可见光区域(波长为450 nm~780 nm),样本光谱的反射率在650 nm到700 nm之间出现吸收波谷,这主要是跟香蕉表皮GAD活力及内部果肉细胞中的叶绿素和类胡萝卜素对光谱的吸收有关[2],相对成熟的样本在第4个成熟阶段就没有在该波长区域出现波谷。相反从第3个成熟阶段开始在近红外波段区域(波长为 780 nm~990 nm)第1、2成熟阶段的光谱反射率要高于其他阶段的样本反射率,这正是表明香蕉在第2成熟阶段由于自身的化学因素变化表现出光谱吸收特征,而在波长为900 nm左右表现局部的极大值以及很强的反射特征。不同的成熟阶段的光谱曲线的光谱差异正是为不同的成熟度的检测提供了理论依据。

1.4 数据预处理

预处理使用的软件是 spectraSENS以及 The unscrambled,利用平滑化(MAS)小波分析原理先将数据导入进行黑白校正、去噪。考虑到 non-linear信号技术对于光谱数据降维去噪效果较好,先使用基于排序统计的中值滤波(MFS)法进行去噪,再在MFS基础上建立以原来的基线平移领域块为二维滑动模板进行Gauss线性处理。从450个样本数据中选取350个样本作为建模集,剩余100个样本作为预测集[15]。通过Unscrambler 9.7软件采用最小二乘法分别对单独使用高斯Gauss、中值、卷积平滑(Savitzky Golay)、以及标准正态变量校正(SNV)等四种方法建立判别模型。根据表1的统计数据,在判断样本5个相应的成熟阶段时,总体识别率较好,卷积平滑化效果识别率较低,只有84.16%,分别用高斯以及中值平滑化预处理经过二乘法的判别正确率达到了90.83%,但中值滤波后再经过高斯卷积的平滑化效果明显将识别正确率提高到了93.33%。

表1 不同预处理方法的最小二乘判别模型结果
Table 1 Partial least squares discriminant models of different pretreatment methods

成熟阶段 样本个数/个误判数/个 判别正确率/%Gauss MFS Savitzky Golay SNV MFS+Gauss Gauss MFS Savitzky Golay SNV MFS+Gauss第一阶段 90 11 4 8 4 11 87.50 95.83 91.66 95.83 87.53第二阶段 90 8 15 19 8 4 91.66 83.33 79.16 91.66 95.83第三阶段 90 8 11 15 4 8 91.66 87.50 83.33 95.83 91.66第四阶段 90 11 4 8 11 4 87.50 95.83 91.66 87.50 95.83第五阶段 90 4 8 22 8 4 95.83 91.66 75.00 91.66 95.83合计 450 42 42 72 35 31 90.83 90.83 84.16 92.50 93.33平均相关系数(average correlation coefficient) 0.86 0.92 0.96 0.91 0.96

2 结果与分析

2.1 基于PCA的特征波长的选取

本实验利用 MATLAB2014b(The MathWorks,Natick,USA)进行数据的主成分分析(principal component analysis,PCA)。如图5为主成分分析的前5主成分的图像。总体而言,从累计贡献率可以看出前4个主成分的贡献率已经达到99.28%,本实验选取前4个主成分来表征原高光谱图像。因此,实验以前4个主成分进行特征波段的选取。由前述的主成分分析可以得到各主成分的权重系数矩阵,对所有实验样品取平均值可以得到前4个主成分的平均权重系数。在第一主成分(PC1)的平均权重系数曲线上选取 5个点权重系数分别为0.0165、0.0472、0.0374、0.0913和0.0682,对应特征波长为486.47 nm、648.45 nm、677.46 nm、875.70 nm和962.73 nm。在第二主成分(PC2)的平均权重曲线上选取3个点权重系数分别为-0.1268、-0.1243和-0.1321,对应特征波长为660.53 nm、672.62 nm和687.13 nm。在第三主成分(PC3)的平均权重曲线上选取 3个点权重系数分别为0.0391、-0.1233和0.0768,对应特征波长为554.16 nm、677.46 nm和728.23 nm。在第四主成分(PC4)的平均权重曲线上选取 6个点权重系数分别为-0.0064、-0.0032、-0.0906、0.1331、-0.0440和0.0758,对应特征波长为447.78 nm、486.47 nm、549.32 nm、679.87 nm、711.30 nm和962.73 nm。

表2 主成分分析统计表
Table 2 Statistics of the principal components analysis

主成分数 特征值 贡献率 累计贡献率PC1 12.6623 97.42% 97.42%PC2 0.2040 1.57% 98.99%PC3 0.0314 0.24% 99.23%PC4 0.0135 0.05% 99.28%PC5 0.0060 0.04% 99.32%PC6 0.0058 0.05% 99.37%PC7 0.0056 0.04% 99.41%PC8 0.0054 0.04% 99.45%

图5 5个阶段前5主成分图像
Fig.5 Images of five principal components before five stages

注:a,第1阶段;b,第2阶段;c,第3阶段;d,第4阶段;e,第5阶段。

观察所选的特征波长,发现所选部分波长相近,如第一主成分的 677.46 nm和第二主成分的 672.62 nm,第三主成分的677.46 nm和第四主成分的679.87 nm等。有些甚至重复如486.47 nm在第一主成分和第四主成分均被选取,677.46 nm在第一主成分和第三主成分均被选取等。由于相近波长相关性较强,因此可以适当合并舍去所选波段以降低后续所需处理的数据量。所以由主成分分析法得出可选取 447.78 nm、486.47 nm、554.16 nm、648.45 nm、677.46 nm、728.23 nm、875.70 nm和962.73 nm共8个波长作为特征波长。

2.2 基于连续投影方法的特征波段的选取

图6 SPA特征波长matIab处理结果
Fig.6 Matlab processing results of SPA characteristic wavelength

注:a,模型最佳光谱变量总数;b,相应的波长变量。

本文在利用主成分选取了特征波长的基础上再寻找另外的一种方法选取特征波长进行比较,通过优化算法的建模思想,选择确定主成分组合的角度引进连续投影算法(Successive projections algorithm,SPA)来最大限度解决光谱数据谱峰重叠而导致光谱信息冗余、特征吸收峰不明显的问题。

连续投影算法SPA算法的步骤如下:设矩阵Xn*p,其中 n为样本容量,p为原始光谱矩阵的变量数。N为需要提取的变量个数,N的最大可能取值 M=min(n,p)。xk(0)为初始的迭代向量:

步骤0:迭代开始前,任选光谱矩阵的一列j,把建模集的第j列赋值给xj,记为xk(0)

步骤 1:把未选入的列向量位置的集合记为 SS={j,1≤jJj∉{k(0),…,k(n-1)}}

步骤2:分别计算xj对剩下列向量的投影,

步骤3:令xj=pxjjsn=n+1,如果n,循环计算,最终提取的变量为:{xk(n)=0,1,...,N-1}。而本次实验选取每个阶段的18个样本数据作为建模集,而剩下的6个样本数据为预测集。

利用SPA算法对经过预处理的样本光谱进行特征波长的选取,MATLAB R2014b处理所得结果如图6。从图6中的a可以看出在光谱变量总数小于25之前,曲线有较大的波动,而在变量总数为20时,波动明显减少,也就是说当特征波段数为25时,RMSE的值较少并随着波段数的增加也没有明显变化。在图6b中可以得到相应的特征波段的对于位置。故通过SPA选取的873.28 nm、648.44 nm、708.88 nm、691.96 nm、619.43 nm、423.60 nm、428.44 nm、892.62 nm、406.68 nm、401.84 nm、438.11 nm、500.97 nm、389.76 nm、421.19 nm、409.10 nm、824.92 nm、399.43 nm、459.87 nm、418.77 nm、447.78 nm、416.35 nm、382.50 nm、776.57 nm、411.52 nm和384.92 nm共25个波长作为特征波段。

2.3 RR-iPLS预测模型

表3 RR-PLS预测模型评价指标统计表
Table 3 RR-PLS evaluation index statistics of prediction model

统计信息 可溶性固形物(Brix%) 坚实度/(kg/cm2)实测值 预测值 实测值 预测值最大值 25.22 24.18 1.92 1.938最小值 18.92 19.16 0.60 0.68平均值 22.36 22.16 1.36 1.36标准方差 1.729 1.613 0.335 0.326

表4 RR-PLS成熟度指标实测值与预测值统计表
Table 4 RR-PLS between the measured and predicted maturity index statistics

评价指标 可溶性固形物 坚实度决定系数R2 0.92 0.94预测集均方根误差RMSEP 0.47 0.08校正集均方根误差RMSEC 0.39 0.08预测结果平均相对误差 2.09% 5.51%

实验所测理化指标数据变量一般存在多重的相关性,当仅仅使用iPLS进行理化指标与成熟度之间的相关性预测时,反射光谱有效建模置信区间比原本的宽,接受假设H0假设的概率更大,虽然多重相关性并不影响iPLS估计量的无偏性及最小方差,最小二乘估计量在所有线性无偏估计量中是方差最小的,但这个方差却不一定小。于是考虑尝试找一个有偏估计量,这个估计量虽然有微小的偏差,但它的精度能够大大高于无偏的估计量。这是应用岭回归分析(ridge regression,RR-iPLS)对本实验进行修正预测的出发点。

结果表明,可溶性固形物预测集决定系数为R2=0.92,预测集均方根误差RMSEP=0.47,校正集均方根误差 RMSEC=0.39。坚实度预测集决定系数R2=0.94,预测集均方根误差RMSEP=0.08,校正集均方根误差RMSEC=0.08。香蕉成熟度指标可溶性固形物和坚实度 RR-PLS预测模型均具有较好的预测性能,可用该两项理化指标对没有去果皮香蕉的成熟度进行预测与划分。统计如表3和表4。

2.4 基于特征波长的ELM模型

图7 神经元个数对ELM性能影响
Fig.7 Effect of neuron number on the performance of ELM

表5 支持向量机判别模型结果
Table 5 Results of SVM discrimination model

特征波长选取方法 PCA SPA特征波段数/个 8 25隐含层神经元个数 350 350预测集均方根误RMSEP 0.27 0.26预测集决定系数R2 0.85 0.87预测集准确率/100% 99 98

本文采用极限学习机(Extreme Learning Machine,ELM)算法随机产生输入层与隐含层间的连接权值及隐含层神经元的阀值。若隐含成神经元个数与训练样本个数相等时,对于任意的w和b,单隐含层前馈神经网络SLFN都可以零误差逼近训练样本[32]。如图7,根据样本个数对 ELM 性能影响情况选取的神经元个数为350。利用SPA和PCA得到的特征波段作为训练数据,所得结果如表5所示。从表5可以看出两种特征波段的选取方法建立的 ELM 判别模型正确率都较高,其中 PCA-ELM 判别模型验证准确率为 99%,SPA-ELM 判别模型准确率为 96.9%。综合评价PCA-ELM判别模型较SPA-ELM好。基于岭回归分析的PLS算法以光谱矩阵为自变量,样本理化值为因变量建立预测模型。在不选取波长利用灰度共生矩阵对全波长样本进行交叉验证。可溶性固形物评价指标的R2为0.92,坚实度R2为0.94。研究结果表明PLS模型识别率为93.33%。而基于PCA-ELM的判别模型准确率为99%,预测集决定系数为0.85。ELM作为一种非线性建模方法,综合了建模过程中的非线性因素。结果表明,ELM判别模型优于PLS判别模型。

3 结论

本文以5个不同成熟阶段含果皮的香蕉样本为研究对象,利用高光谱成像技术获取果皮光谱数据,采用不同的预处理方法进行降噪矫正以及降维。利用全波数据建立RR-PLS判别模型。运用主成分分析的方法对香蕉光谱进行分析,发现光谱数据主要信息集中在前5个主成分。分析权重系数矩阵并统计各个主成分贡献率,选取了8个特征波段。再通过SPA划分出25个特征波段。利用特征波长通过PCA-ELM建模交叉验证,预测集的分类判别率达到了99%,明显优于PLS判别模型。综合研究证明将高光谱技术运用于含果皮香蕉成熟度分类与预测是可行的。

参考文献

[1]P Rajkumar, N Wang, G EImasry, et al. Studies on banana fruit quality and maturity stages using hyperspectral imaging[J]. Journal of Food Engineering, 2012, 108: 194-200

[2]薛建新,张淑娟,张晶晶,等.基于高光谱成像技术的沙金杏成熟度判别[J].农业工程学报,2015,31(11):301-307 XUE Jian-xin, ZHANG Shu-juan, ZHANG Jing-jing, et al.Ripeness classification of Shajin apricot using hyperspectral imaging technique [J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(11): 301-307

[3]徐贞贞,孙洁,赵靓,等.香蕉产地初加工技术分类及集成[J].农业工程学报,2015,31(1):332-336 XU Zhen-zhen, SUN Jie, ZHAO Liang, et al. Classification,integration of preliminary processing technology in banana producing areas of China [J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(1): 332-336

[4]陈惠萍,蔡世英.香蕉不同成熟度果实活性氧、乙烯与淀粉酶活性相关性研究[J].亚热带植物科学,2005,34(3):8-10 CHEN Hui-ping, CAI Shi-ying. Correlation between active oxygen, ethylene and amylase of banana fruit in different grades of maturity [J]. Subtropical Plant Science, 2005, 34(3):8-10

[5]李洪涛,陈玮,朱国忠,等.针对香蕉品质检测的专用电子鼻系统[J].传感技术学报,2010,23(11):1541-1545 LI Hong-tao, CHEN Wei, ZHU Guo-zhong, et al. Special electronic nose system for banana quality detection [J].Chinese Journal of Sensors and Actuators, 2010, 23(11):1541-1545

[6]胡耀华,刘聪,熊来怡,等.基于近红外光谱的香蕉品质检测方法研究[J].农机化研究,2011,33(9):169-172 HU Yao-hua, LIU Cong, XIONG Lai-yi, et al. Measurement of banana quality by near infrared spectroscopy [J].Agricultural Mechanization Research, 2011, 33(9): 169-172

[7]Goetzafh, Vaneg, Solomonje, et al. Imaging spectroscopy for earth remote sensing [J]. Sccience, 1985, 228: 1147-1153

[8]刘木华,赵杰文,郑建鸿,等.农畜产品品质无损检测中高光谱图像技术的应用进展[J].农业机械学报,2005,36(9):139-143 LIU Mu-hua, ZHAO Jie-wen, ZHENG Jian-hong, et al.Review of hyperspectral imaging in quality and safety inspections of agricultural and poultry products [J].Transactions of the Chinese Society of Agricultural Machinery, 2005, 36(9): 139-143

[9]洪添胜,乔军,Ning,等.基于高光谱图像技术的雪花梨品质无损检测[J].农业工程学报,2007,23(2):151-155 HONG Tian-sheng, QIAO Jun, Ning, et al. Non-destructive inspection of Chinese pear quality based on hyperspectral imaging technique [J]. Transactions of the Chinese Society of Agricultural Engineering, 2007, 23(2): 151-155

[10]赵杰文,陈全胜,Saritporn V,等.利用高光谱成像技术和多变量校正方法检测苹果的坚实度[J].农业工程学报,2009,25(11):226-231 ZHAO Jie-wen, CHEN Quan-sheng, Saritporn V, et al.Determination of apple firmness using hyperspectral imaging technique and multivariate calibrations [J]. Transactions of the Chinese Society of Agricultural Engineering, 2009,25(11): 226-231

[11]徐爽,何建国,马瑜,等.高光谱图像技术在水果品质检测中的研究进展[J].食品研究与开发,2013,34(10):4-8 XU Shuang, HE Jian-guo, MA Yu, et al. Research progress of hyperspectral imaging technology for nondestructive detection of fruit quality [J]. Food Research and Development, 2013, 34(10): 4-8

[12]单佳佳,彭彦昆,王伟,等.基于高光谱成像技术的苹果内外部品质同时检测[J].农业机械学报,2011,42(3):140-144 SHAN Jia-jia, PENG Yan-kun, WANG Wei, et al.Simultaneous detection of external and internal quality parameters of apples using hyperspectral technology [J].Transactions of the Chinese Society of Agricultural Machinery, 2011, 42(3): 140-144

[13]Zhu D Z, Wang C, Pang B S, et al. Identification of wheat cultivars based on the hyperspectral image of single seed [J].J Nanoelectronics Optoe., 2012, 7(2): 167-172

[14]周竹,李小昱,陶海龙.基于高光谱成像技术的马铃薯外部缺陷检测[J].农业工程学报,2012,28(21):221-228 ZHOU Zhu, LI Xiao-yu, TAO Hai-long. Detection of potato external defects based on hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(21): 221-228

[15]高海龙,李小昱,徐森淼,等.透射和反射高光谱成像的马铃薯损伤检测比较研究[J].光谱学与光谱分析,2013,33(12):3366-3371 GAO Hai-long, LI Xiao-yu, XU Sen-miao, et al.Comparative study of transmission and reflection hyperspectral imaging technology for potato damage detection [J]. Spectroscopy and Spectral Analysis, 2013,33(12): 3366-3371

[16]NY/Y 1066-2006,中华人民共和国农业行业标准-马铃薯等级规格[S]

[17]王琲,繆冶炼,陈介余,等.香蕉果皮中谷氨酸脱羧酶的活力及分布[J].中国食品学报,2014,14(3):211-217 WANG Bei, MIAO Ye-lian, CHEN Jie-yu, et al. Activity and distribution of glutamate decarboxylase in banana peel [J].Journal of Chinese Institute of Food Science and Technology,2014, 14(3): 211-217

[18]Araujo M C U, Saldanha T C B, Galvao R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis [J]. Chemometrics and Intelligent Laboratory Systems, 2001, 57(2): 65-73

[19]Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing [M]. Chapter 11 Object Recognition, 2010

[20]Noriaki Suetake, Ejjj Uchino, Kanae Hirata. Generalized fuzzy Hough transform for detecting arbitrary shapes in a vague and noisy image [J]. Soft Comput., 2006, 10(12):1161-1168

[21]Shih-Hsuan Chiu, Che-Yen Wen, Jun-Huei Lee, et al. A fast randomized generalized Hough transform for arbitrary shape detection [J]. International Journal of Innovative Computing,Information and Control, 2012, 8(2): 2012

[22]H Ruppertshofen, C Lorenz, G Rose, et al. Discriminative generalized Hough transform for object localization in medical images [J]. Int. J CARS, 2013, 8(4): 593-606

[23]Ferdianad Hahmann, Inga Bergen, H Ruppertshofen, et al.Bone age assessment using the classifying generalized Hough transform [M]. University of Applied Sciences Kiel, Philips Technologie GmbH, Department of Medical Informatics,RWTH Aachen University, 2014

[24]V Cantoni, A Ferone, A Petrosino, et al. Motifs and structural blocks retrieval by GHT [M]. Eur. Phys. J. Plus, 2014, 129(6):131

[25]Joseph L Mundy. Object recognition in the geometric era A retrospective [J]. Toward Category-Level Object Recognition,2006, 4170: 3-28

[26]Tung-Hsu Hou, Ming-Der Pem. A computer vision-based shape-classification system using image projection and a neural network [J]. Int. J Adv. Manuf. Technol., 1999, 15(11):843-850

[27]Janes L, Crowley. Recognition without correspondence using multidimensional receptive field histograms [J]. International Journal of Computer Vision, 2000, 36(1): 31-50

[28]David G Lowe. Object recognition from local scale-invariant features [J]. Proc. of the International Conference on Computer Vision, Corfu, 1999

[29]David G Lowe. Distinctive image features from scale-invariant keypoints [J]. Proc. of the International Conference on Computer Vision, 2004, 60(2): 91-110

[30]H Bay, T Tuytelaars, L V Goo. SURF: speeded up robust features [J]. Computer Vision & Image Understanding, 2006,110(3): 404-417

[31]Rafael C Gonzalez, Richard E Woods. Digital image processing [M]. Prentice-Hall, Inc., 2010

Banana Maturity Characteristic Prediction Based on Hyperspectral and PCA-ELM

LI Yuan-hong1, WANG Hong-jun1, DENG Jian-meng1, LI Zou-zou1, ZHOU Wei-liang2, JIN Jun-dong2
(1.College of Engineering, South China Agricultural University, Guangzhou 510642, China) (2.Machinery and Equipment Laborator of National Citrus Industry Research and Development Center, Guangzhou 510642, China)

Abstract: Spectral data of 450 unbarked banana samples, stored at room temperature, were collected by hyperspectral imaging tecchique.The single factor analysis of variance was used to measure the soluble solid content (TSS) and firmness (FIM), and then a spectral and image feature classification model of banana maturity physicochemical index was established using partial least squares linear regression analysis method of ridge optimization (RR-iPLS). The results showed that the correlation coefficient values (R2) of the soluble solid content of spectral data predicting banana and the firmness were 0.92 and 0.94. Then, characteristic wavelengths were selected by continuous projection method(successive projections algorithm, SPA) and principal component analysis (principal component, analysis, PCA) and the extreme learning machine (extreme learning machine, ELM) was established for the cross validation of spectral data based on characteristic wavelengths. , The PCA-ELM classification model based on characteristic wavelength had a better prediction performance with a high accuracy by comparing the RR-iPLS, SPA-ELM and PCA-ELM classification prediction models. The accuracy of cross validation reached to 99%, which could provide an effectively predictive study for the rapid and non-destructive identification of banana quality. The proposed method basically fulfilled the classification and detection of banana maturity and could achieve effective economic benefits.

Key words: hyperspectral technology; Successive projection; Characteristics of the wavelength; Principal component analysis; Extreme learning machine

文章篇号:1673-9078(2017)10-268-274

DOI:10.13982/j.mfst.1673-9078.2017.10.037

收稿日期:2017-04-18

基金项目:广东省科技计划项目(2016A010102013)

作者简介:黎源鸿,男,在读硕士研究生,研究方向:机器视觉、图像处理技术

通讯作者:王红军(1966-),女,博士,教授,硕士生导师