1 自动识别技术的基本概念
在我们的现实生活中,各种各样的活动或者事件都会产生这样或者那样的数据,这些数据包括人的、物质的、财务的,也包括采购的、生产的和销售的,这些数据的采集与分析对于我们的生产或者生活决策来讲是十分重要的。如果没有这些实际工况的数据支援,生产和决策就将成为一句空话,将缺乏现实基础。
在计算机信息处理系统中,数据的采集是信息系统的基础,这些数据通过数据系统的分析和过滤,最终成为影响我们决策的信息。
在信息系统早期,相当部分数据的处理都是通过人工手工录入,这样,不仅数据量十分庞大,劳动强度大,而且数据误码率较高,也失去了实时的意义。为了解决这些问题,人们就研究和发展了各种各样的自动识别技术,将人们从繁沉的重复的但又十分不精确的手工劳动中解放出来,提高了系统信息的实时性和准确性,从而为生产的实时调整,财务的及时总结以及决策的正确制定提供正确的参考依据。
在当前比较流行的物流研究中,基础数据的自动识别与实时采集更是物流信息系统(LMIS,Logistics Management Information System)的存在基础,因为,物流过程比其他任何环节更接近于现实的"物",物流产生的实时数据比其他任何工况都要密集,数据量都要大。
那么,究竟什么是自动识别技术呢?
自动识别技术就是应用一定的识别装置,通过被识别物品和识别装置之间的接近活动,自动地获取被识别物品的相关信息,并提供给后台的计算机处理系统来完成相关后续处理的一种技术。举例说明。商场的条形码扫描系统就是一种典型的自动识别技术。售货员通过扫描仪扫描商品的条码,获取商品的名称、价格,输入数量,后台POS系统即可计算出该批商品的价格,从而完成顾客的结算。当然,顾客也可以采用银行卡支付的形式进行支付,银行卡支付过程本身也是自动识别技术的一种应用形式。
自动识别技术是以计算机技术和通信技术的发展为基础的综合性科学技术,它是信息数据自动识读、自动输入计算机的重要方法和手段,归根到底,自动识别技术是一种高度自动化的信息或者数据采集技术。
自动识别技术近几十年在全球范围内得到了迅猛发展,初步形成了一个包括条码技术、磁条磁卡技术、IC卡技术、光学字符识别、射频技术、声音识别及视觉识别等集计算机、光、磁、物理、机电、通信技术为一体的高新技术学科。
一般来讲,在一个信息系统中,数据的采集(识别)完成了系统的原始数据的采集工作,解决了人工数据输入的速度慢、误码率高、劳动强度大、工作简单重复性高等问题,为计算机信息处理提供了快速、准确地进行数据采集输入的有效手段,因此,自动识别技术作为一种革命性的高新技术,正迅速为人们所接受。自动识别系统通过中间件或者接口(包括软件的和硬件的)将数据传输给后台处理计算机,由计算机对所采集到的数据进行处理或者加工,最终形成对人们有用的信息。在有的场合,中间件本身就具有数据处理的功能。中间件还可以支持单一系统不同的协议的产品的工作。
完整的自动识别计算机管理系统包括自动识别系统(Auto Identification System, 简称 AIDS),应用程序接口(Application Interface, 简称API )或者中间件(Middleware)和应用系统软件(Application Software)。
也就是说,自动识别系统完成系统的采集和存储工作,应用系统软件对自动识别系统所采集的数据进行应用处理,而应用程序接口软件则提供自动识别系统和应用系统软件之间的通讯接口包括数据格式,将自动识别系统采集的数据信息转换成应用软件系统可以识别和利用的信息并进行数据传递。
2 自动识别技术的种类与特征比较
自动识别系统根据识别对象的特征可以分为两大类,分别是数据采集技术和特征提取技术。这两大类自动识别技术的基本功能都是完成物品的自动识别和数据的自动采集。
数据采集技术的基本特征是需要被识别物体具有特定的识别特征载体(如标签等,仅光学字符识别例外),而特征提取技术则根据被识别物体的本身的行为特征(包括静态的、动态的和属性的特征)来完成数据的自动采集。
数据采集技包括:
(1) 光存储器:
条码(一维、二维)
矩阵码
光标阅读器
光学字符识别(OCR)
(2) 磁存储器:
磁条
非接触磁卡
磁光存储
微波
(3) 电存储器:
触摸式存储
RFID射频识别(无芯片、有芯片)
存储卡(智能卡、非接触式智能卡)
视觉识别
能量扰动识别
特征提取技术包括:
(1) 动态特征
声音(语音)
键盘敲击
其他感觉特征
(2) 属性特征
化学感觉特征
物理感觉特征
生物抗体病毒特征
联合感觉系统
我们在以下的内容里简单介绍自动识别技术的条码技术、磁条(卡)技术、IC卡识别技术、射频识别技术RFID、声音识别技术、视觉识别技术、光学字符识别OCR等自动识别技术,并给出其基本特性的简单比较。
可以说,自动识别技术从条码开始,以无线射频结束,也就是说,条码技术是自动识别技术的始祖,而无线射频技术则是自动识别技术的未来终极。
(一) 条码技术
条码是由一组规则排列的条、空以及相应的数字组成,这种用条、空组成的数据编码可以供条码阅读器识读,而且很容易译成二进制数和十进制数。这些条和空可以有各种不同的组合方法,构成不同的图形符号,即各种符号体系(也称码制),适用于不同的应用场合。
目前使用频率最高的几种码制是EAN、UPC、39码,交叉25码和EAN128码,其中UPC条码主要用于北美地区,EAN条码是国际通用符号体系,它们是一种定长、无含义的条码,主要用于商品标识。 EAN128条码是由国际物品编码协会(EAN International )和美国统一代码委员会(UCC)联合开发、共同采用的一种特定的条码符号。它是一种连续型、非定长有含义的高密度代码,用以表示生产日期、批号、数量、规格、保质期、收货地等更多的商品信息。另有一些码制主要是适应特殊需要的应用方面,如库德巴码用于血库、图书馆、包裹等的跟踪管理、25码用于包装、运输和国际航空系统为机票进行顺序编号,还有类似39码的93码,它密度更高些,可代替39码。
上述这些条码都是一维条码。为了提高一定面积上的条码信息密度和信息量又发展了一种新的条码编码形式--二维条码。从结构上讲,二维条码分为两类,其中一类是由矩阵代码和点代码组成,其数据是以二维空间的形态编码的,另一类是包含重叠的或多行条码符号,其数据以成串的数据行显示。重叠的符号标记法有CODE 49、CODE l6K和PDF417。
PDF是便携式数据文件(Portable Data File )的缩写,简称为PDF417条码。417则与多宽度代码有关,用来对字符编码。PDF417是由Symbol Technologies Inc设计和推出的。重叠代码中包含了行与行尾标识符以及扫描软件,可以从标签的不同部分获得数据,只要所有的行都被扫到就可以组合成一个完整的数据输入,所以这种码的数据可靠性很好,对PDF417而言,标签上污损或毁掉的部分高达50%时,仍可以读取全部数据内容,因此具有很强的修正错误的能力。
PDF417条码是一种高密度、高信息含量的便携式数据文件,其特点为:信息容量大、编码应用范围广、保密防伪性能好、译码可靠性高、条码符号的形状可变。美国的一些州、加拿大部分省份已经在车辆年检、行车证年审及驾驶证年审等方面,将PDF417选为机读标准。巴林、墨西哥、新西兰筹国家将其应用于报关单、身份证、货物实时跟踪等方面。
矩阵代码如:Maxicode,Data Matrix,Code One,Vericode和DotCode A, 矩阵代码标签可以做得很小,甚至可以做成硅晶片的标签,因此适用于小物件。
条码成本最低、适于大量需求且数据不必更改的场合。例如商品包装上就很适宜,但是较易磨损、且数据量很小。而且条码只对一种或者一类商品有效,也就是说,同样的商品具有相同的条码。
(二) 卡识别技术
(1) 磁条(卡)技术
磁条技术应用了物理学和磁力学的基本原理。对自动识别设备制造商来说,磁条就是一层薄薄的由定向排列的铁性氧化粒子组成的材料(也称为涂料),用树脂粘合在一起并粘在诸如纸或者塑料这样的非磁性基片上。
磁条技术的优点是数据可读写,即具有现场改写数据的能力;数据存储量能满足大多数需求,便于使用,成本低廉,还具有一定的数据安全性;它能粘附于许多不同规格和形式的基材上。这些优点,使之在很多领域得到了广泛应用,如信用卡、银行ATM卡、机票、公共汽车票、自动售货卡、会员卡、现金卡(如电话磁卡)、地铁AFC(据说北京13号城铁的小磁票成本在4分钱左右)等。
磁条技术是接触识读,它与条码有三点不同:一个是其数据可做部分读写操作,另一个是给定面积编码容量比条码大,还有就是对于物品逐一标识成本比条码高,接触性识读最大的缺点就是灵活性太差。
磁卡的价格也很便宜,但是很容易磨损,磁条不能折叠、撕裂,数据量较小。
(2) IC卡识别技术
IC(Integrated Card)卡是1970年由法国人Roland Moreno发明的,他第一次将可编程设置的IC芯片放于卡片中,使卡片具有更多功能。通常说的IC卡多数是指接触式IC卡。
IC卡(接触式)和磁卡比较有以下特点:
安全性高;
IC卡的存储容量大,便于应用,方便保管;
IC卡防磁、防一定强度的静电,抗干扰能力强,可靠性比磁卡高,使用寿命长,一般可重复读写10万次以上;
IC卡的价格稍高些;由于它的触点暴露在外面,有可能因人为的原因或静电损坏。
在我们生活中,IC卡的应用也比较广泛,我们接触得比较多的有电话IC卡、购电(气)卡、手机SIM卡、牡丹交通卡(一种磁卡和IC卡的复合卡)、以及即将大面积推广的智能水表、智能气表等。
(三) 射频识别技术(RFID)
射频技术的基本原理是电磁理论。射频系统的优点是不局限于视线,识别距离比光学系统远,射频识别卡可具有读写能力,可携带大量数据、难以伪造和智能性较高等。射频识别和条码一样是非接触式识别技术,由于无线电波能"扫描"数据,所以RFID挂牌可做成隐形的,有些RFID识别产品的识别距离可以达到数百米,RFID标签可做成可读写的。
射频标签最大的优点就在于非接触,因此完成识别工作时无须人工干预、适于实现自动化且不易损坏,可识别高速运动物体并可同时识别多个射频标签,操作快捷方便。射频标签不怕油渍、灰尘污染等恶劣的环境,短距离的射频标签可以在这样的环境中替代条码,例如用在工厂的流水线上跟踪物体。长距离的产品多用于交通上,可达几十米,如自动收费或识别车辆身份。
RFID识别的缺点是标签成本相对较高,而且一般不能随意扔掉,而多数条码扫描寿命结束时可扔掉。
RFID适用的领域:物料跟踪、运载工具和货架识别等要求非接触数据采集和交换的场合,由于RFID标签具有可读写能力,对于需要频繁改变数据内容的场合尤为适用。
(四) 声音识别技术
声音识别的迅速发展以及高效可靠的应用软件的开发,使声音识别系统在很多方面得到了应用、这种系统可以用声音指令实现"不用手" 的数据采集、其最大特点就是不用手和眼睛,这对那些采集数据同时还要完成手脚并用的工作场合,以及标签仅为识别手段,数据采集不实际或不合适的场合尤为适用。如汉字的语音输入系统就是典型的声音识别技术,但是误码率很高。我们可以再举一个例子,GSM手机上的语音电话存储也是一个典型的语音识别的例子,但是我们都知道,电话号码的语音准确呼出距实用还有一段相当长的距离。
(五) 视觉识别
视觉识别系统可以看作是这样的系统:它能获取视觉图像,而且通过一个特征抽取和分析的过程,能自动识别限定的标志、字符、编码结构或可作为确切识断的基础呈现在图象内的其它特征。
随着自动化的发展,视觉技术可与其他自动识别技术结合起来应用。
(六) 光学字符识别OCR
光学字符识别OCR已有三十多年历史,近几年又出现了图象字符识别ICR(Image Character Recognition)和智能字符识别ICR(Intelligent Character Recognition),实际上这三种自动识别技术的基本原理大致相同。
OCR的三个重要的应用领域是:办公室自动化中的文本输入;邮件自动处理;与自动获取文本过程相关的其它领域,这些领域包括:零售价格识读,定单数据输入、单证、支票和文件识读,微电路及小件产品上状态特征识读等。由于在识别手迹特征方面的进展,目前探索在手迹分析及鉴定签名方面的应用。
OCR 的优点是人眼可视读、可扫描,但输入速度和可靠性不如条码,数据格式有限,通常要用接触式扫描器。
采自动化处理方法,使票据上加印的磁性墨水字输入电子阅读分类机,阅读票面上磁字的银行代号、金额、日期等等资讯,再予以分类并核计,这是全世界各大票据交换所采用的一种技术,也就是"磁性墨水字体辨认", 通称磁码, 英文全名为"Magnetic Ink Character Recognition ",简称MICR。MICR是银行界用于支票的专用技术,在特定的领域中应用,但成本较高,而接触识读,可靠性高。
最新的OCR政府应用莫过于国家税务局的增值税进项发票的验证识读扫描了。扫描系统通过扫描持票者持有的增值税发票抵扣联上的相关信息,包括发票号码、单位税号、金额、日期等七项指标,通过后台加密算法,计算出该张发票的正确的密押,与抵扣联上右上角载明的密押进行比对,由此判定该发票的真伪。这种算法的应用从根本上杜绝了假增值税发票的存在的可能。
8/1/2005
|