中国电子技术网

设为首页 网站地图 加入收藏

 
 

基于机器视觉的AGV导航标识符识别方法研究

关键词:机器视觉 AGV导航 标识符

时间:2014-01-16 16:14:16      来源:eccn

前言

自动导引车(automated guided vehicle,agv)是自动化物流运输系统、柔性生产组织系统的核心设备。agv的引导方式有电磁感应式、磁铁—螺旋仪式、激光引导式、视觉引导式等。不同的引导方式不仅决定着由其组成的物流系统的柔性,也影响着系统运行的可靠性和系统成本。视觉引导式agv的基本原理是通过模拟人的视觉系统从而引导agv的运行,它具有理论上最佳的引导柔性[1]。视觉引导式agv在实际应用中存在多种运行工况,如加速、减速、停车、匀速行驶以及不同工位判别等。因此,对视觉引导式agv进行导航标识符识别研究是必要的,这也是反映视觉引导式agv优越于其他引导方式的标志之一。

导航标识符的设计

agv在实际应用中存在多种工况,这些是实现agv多分支路径识别的基础。根据agv实际运行的情况,设计了两类导航标识符:一种是控制标识符;另一种是数字标识符。控制标识符的识别是根据不同标识符水平所截线段宽度的变化规律来判断是加速、减速、停车还是正常行驶,加速标识符变化规律为小>中>大,减速标识符变化规律为大>中>小,停车标识符变化规律为小>大>小。数字标识符的识别是通过对路径上的0~9这十个字符的识别,然后根据各个字符被赋予不同含义完成agv的自动导航。



图1 控制标识符设计图

各种控制标识符如图1所示。加速符的形状为短边朝下的等腰梯形,下底边长30mm,上底边长60mm,高为30mm;减速符的形状为短边朝上的等腰梯形,下底边长60mm,上底边长30mm,高为30mm;停车标识符的形状是直径为30mm的实心圆。路径导航线是宽度为30mm的矩形条,它表示匀速行驶。导航标识符和导航线的颜色都为黑色,以和路面背景相区分。

由于工厂及物流中心多以数字表示不同的工位,数字的准确识别充分的体现视觉导航agv所具有的最佳引导柔性,也将直接影响到以agv为核心的生产物流智能配送系统的实现。

视觉引导式agv在实际运行的过程中,是沿固定路线行驶的,数字标识符一般出现在导航线上,放置在黑色标示线中间,同时数字纵向的中心线尽可能与导航线中心线重合,导航线与数字下边界之间有一个减速符,与数字上边界之间有一段空缺距离,这样便于提取数字标识符。实验中采集到的数字以及数字的形式如图2所示。本文所设计的数字工位0~9的数字字体是类似于led七段码形状的数字,高度为80mm,宽度为60mm。在实际运用中,我们发现将“1”设计成“”更容易识别。



图2 数字标识符的设计图

标识符的识别方法

特征的提取与选择

在一个完善的模式识别系统中,特征的提取与选择这一技术环节是必不可少的,它通常处于对象特征数据采集和分类识别这两个环节之间,起着承上启下的作用。特征提取与选择品质的优劣极大地影响着分类器的设计和性能,它是模式识别三大核心问题之一。特征提取与选择的基本任务是如何从众多特征中找出那些最有效的特征,即把高维特征空间压缩到低维特征空间,同时保留住绝大部分样本信息,以便更有效地设计分类器。

目前,用于图像处理的特征主要有:(1)几何特征,如边缘、纹理、轮廓、焦点(或角点);(2)灰度统计特征,如灰度直方图、频谱、矩;(3)变换特征,如fourier描绘子、walsh变换系数等[1]。为了有效地完成识别或匹配,常常要求所提取的特征具有旋转不变性。关于特征不变量,一是直接从原始的目标中提取,二是从已抽取的特征中构造不变量。本文以全局特征为立足点,通过控制标识符本身的形状特征构造特征向量来实现对它的识别,采用图像的灰度均值为主要特征量实现对数字特征的提取与识别。

整个识别流程如图3所示:图像采集卡采集到一帧图像后,首先对图像进行预处理以除字符图像中的噪声、压缩冗余信息,得到规范化的点阵;然后判断当前图像中是否有导航标识符出现,如果没有则进入路径识别模块(这里假设自动导引车没有偏离导航线);反之,则判断是数字标识符还是控制标识符,如果是控制标识符则进行控制标识符识别,如果是数字标识符将采取以下步骤:(1)抽行扫描,分析每行交点数目和边界信息,确定数字标识符的感兴趣区域,(2)提取数字标识符的特征,(3)应用特征匹配法进行数字识别并输出,(4)回归导航线。



图3 路径标识符识别流程图


标识符分类识别

(1) 控制标识符识别

在图像处理技术中,图像区域的边界往往对应景物的边缘,而且人类的视觉系统也多是根据目标的边缘进行识别的。在经过图像预处理,获得了感兴趣区域内目标的单纯边界信息之后,对于控制标识符而言,加速减速标识符的两条斜边和停车符的圆弧边即是模式识别中的特征。因此,可以依据标识符本身的形状特征构造特征向量,从而进行目标识别。

具体的识别方法如下:对感兴趣区域内控制标识符进行水平抽行扫描,得到三个关于扫描线截得标识符线段宽度的数值,并分别赋给三个变量:e1,e2,e3。它们分别大致体现了控制标识符前端宽度,中部宽度,后部宽度;然后依据线段宽度的变化规律,采用特征匹配法识别控制标识符,对应关系如表1所示。



表1 控制标识符与agv运行情况对照表

(2) 数字标识符识别

数字标识符的引入是视觉引导agv较其它类型agv的一大优势,数字标识符可以为agv导航提供丰富的信息,并且此标识符设置简单,容易识别,具有很高的实用价值。利用数字标识符可以标记停车位置、停车时间和行使中的分岔路选择等操作,这是其它类型的agv所无法比拟的[3]。数字标识符识别的步骤一般要经过以下四部分:图像的预处理、数字区域的搜索、数字的特征提取、数字的识别[4]。

对采集到的一帧数字图像经过预处理及数字区域的搜索后,原图像转化为由像素点组成的二值图像,如图4左边图所示。分析led七段码格式数字的组成结构,并且使数字的基本特征在分割后仍将能够反映其本身的特性不变,将图像共分割成5×3个子块,5行的划分比例为1:2.5:1:2.5:1;3列的划分比例为1:4:1,以apq (p=0,1,2,3,4;q=0,1,2)来标记各个子块,见图4右边图。



图4 数字符“6”的分割及各子块的表示

a00 a01 a02

a10 a11 a12

a20 a21 a22

a30 a31 a32

a40 a41 a42

图4 数字符“6”的分割及各子块的表示

同时用apq记录每个子块内所有像素点的灰度值均值。用公式表示为:

(1)

式中:n为每个小块所包含的像素点个数;i为每个小块的行;j为每个小块的列;aij为每个小块每个像素点的灰度值。通过式(1)计算出的apq是一个没有规律的数值,为了进一步突出特征,在得到apq的值之后,将apq进行归一化,公式为:

(2)

式中:t为每个小块所允许的最小灰度均值。

表2列出了0~9十个数字归一化后apq的值。





表2 数字0~9的apq计算结果

如果直接通过提取待识别数字标识符感兴趣区域的这15个特征值,然后与模板数字的特征值一一进行比对,再通过比较找到差异最小来判定感兴趣区域的数字,那么计算耗费时间较长。通过分析我们发现,在表2中对于任意数字符的a11、a31、a02、a42这四个值都是相同的,那么可以利用这4个特征值来初步判定待识别字符是不是完整规范的数字,然后再比对其他11个特征,这样将提高识别效率。算法如下:

(a)令 ,若x≠1则说明待识别数字符不完整,退出整个识别流程;若x=1则进入下一步骤。

(b)对余下11个特征值与模板数字的特征值一一进行比对,识别数字并输出结果。


标识符识别测试实验

为验证本文提出的算法及理论的有效性、可靠性和准确性,在实验室的水磨石路面背景下,铺设agv导航线,并在导航路径上放置控制标识符和数字标识符。图5所示为控制标识符实验现场,图6为20幅验证数字标识符识别算法的图像样本,包含了0~9十个数字的两组不同旋转角度的图像。

在控制标识符识别实验中,本文所设计的控制标识符能很好地模拟出现场环境,依据控制标识符的几何特征来识别标识符的方法,能够在较为复杂的环境下快速、准确地识别控制标识符。

在识别数字标识符的实验中,图6中的样本对应的特征值计算结果正确无误。这种简单识别数字的方法的准确率较高,而且每次识别数字耗时仅为1ms。在实际应用中,决定识别效率的主要瓶颈在于图像分割环节中从感兴趣区域里面抽取出标识符的精确轮廓,而本文提出的对标识符完整性的初步判断,大大减少了对非完整数字标识符的冗余识别,提高了整个agv导航过程的流畅性。



图5 控制标识符识别实验



图6 数字标识符识别实验样本

结束语

基于机器视觉的agv导航是目前智能车领域的热门研究课题,视觉引导的agv可以高效地进行运动速度控制,识别多分支路径以及各种停车工位,是其智能化的重要表现。本文设计了两类导航标识符并给出识别方法,经实验验证,这两类导航标识符的应用,大大的提高了agv的智能性,满足对标识符识别实时性、准确性以及鲁棒性的要求,达到了预期目标。为视觉导航agv的高智能化发展提供了新思路。

作者简介

范莹莉(1986-) 女 硕士,主要研究方向为机器视觉、图像处理及应用。



参考文献

[1] 齐正罡.基于统计特征的agv特殊标识符识别方法研究[d].吉林:吉林大学,2005.

[2] x. l. bian, b. a. song, r. walter. optimization of steering linkage and double—wishbone suspension via r—w multi—body dynamic analysis, forschung im ingenieurwesen, 69(2004):38~43.

[3] 刘宁.普通光源下小型视觉引导agv图像处理技术研究[d].吉林:吉林大学,2006.

[4] maya r. guptn, nathaniel p. jacobson, eric k. garcia. ocr binarization and image pre-processing for searching historical documents. pattern recognition. seattle, washington:2007, 389~397.

[5] 李介谷.计算机视觉的理论与实践[m].上海:上海交通大学出版社,1999.

[6] 孔月萍,曾平,李智杰,郑海红,徐培培,等.基于组合特征的高效数字识别算法[j].计算机应用研究,2006(10):172~174.
 

猜你喜欢

  • “任意媒体任意网络”系列:在 Zynq MPSoC上实现多路视频流转码的方案 本次研讨会中,来自赛灵思公司的视频系统主任架构师,酆毅先生将向大家演示 Zynq UltraScale+ MPSoC EV器件的相关内容,以及如何在多路视频流的转码应用中使用它们。Zynq UltraScale+ MPSoC EV器件包括了一个视频编解码单元(VCU),一个硬核多码流 AVC/HEVC 编解码模块,该模块支持 UHD-4Kp60标准。该系列器件整合了来自赛灵思、客户以及合作伙伴的IP,为用户提供了一个更加易用且更加高效的解决方案,以帮助他们快速满足有关多路视频流实时转码应用的需求。 赛灵思     2018年03月22日     注册