眨眼之间,纸质文档中的信息即刻“复印”在电脑中。刚才的一堆图文资料似乎被施了“魔法”,在电脑中一律变为可编辑的文字信息。这不是幻想,神奇的OCR技术已经为人们圆梦。1929年,德国科学家Tausheck提出了OCR(Optical Character Recognition)的概念,几年后美国科学家Handel也提出了利用技术对文字进行识别的想法,这些梦想自计算机诞生后变为了现实。在国外,OCR技术已形成产业,应用于各个领域,如大规模的人口普查、针对个人的信贷业务、个人所得税申报以及金融行业中大量的存单、储单、保单以及户籍登记等。
虽然我国研究OCR技术起步较晚,有些人至今仍感到陌生,但OCR技术在国内日益风行已是事实。它见诸于各个行业并逐步走向专业领域与大众化的普及应用。十几年来,文通一直深耕OCR技术,并坚持把科技的魅力辐射到各个领域。既在OCR市场中抢占了先机,又加速了OCR技术在中国的产业化进程。
OCR技术有了自主知识产权
纵观OCR的发展历程,清华大学电子工程系吴佑寿院士、丁晓青教授带领的智能图文信息处理研究室,在国家863计划项目、国家自然科学基金项目及国家科技部、教育部等的支持下,自上世纪80年代开始从事印刷体汉字识别研究,并已取得了10项具有国际领先水平的科技鉴定成果。并获得发明专利及提出专利申请10项,软件著作权12项,荣获国家科技进步奖二等奖两次(1999年、2003年)、三等奖一次(1993年)以及多项部委奖励。
研究室与微软、诺基亚、西门子、三星、IBM、惠普等多家国际知名公司开展了技术授权与研究合作。研究成果成功地将产业化转化为TH-OCR系列文字识别软件;在原国家科委的支持下,于1992年成立的北京文通信息技术有限公司,负责将具有自主知识产权的TH-OCR文字识别系列软件产品在国内外市场上推广,在技术创新的基础上,文通信息还积极与市场应用紧密结合,全面实现了科研成果的产品转化。
敲开OCR市场应用之门
自主技术打造了企业最需要的核心竞争力。国内的OCR技术已占很大优势,但这些技术能否推向全面应用化,推向更为广阔的市场?早期国内市场,面对国外OCR技术的成熟应用,不少人早早地提出了“OCR只适合于专业领域”“OCR难成大气候”、“OCR只是扫描仪的附属”的种种定论,对OCR技术的市场化抱怀疑态度,但随着全球信息化浪潮的来临,疑问已逐步消除。
为了将OCR技术推向应用,让各行各业都能领会到其价值,根据各行业特点,文通打造了五大系列、二十多种产品的产品线。目前,清华TH-OCR2005数据录入工厂已升级到2007版本,其中增加的多语言界面等功能完全能满足新形势下各行业用户的不同需求。广泛用于大量高保真数字化文档和电子出版物制作,百万册数字图书馆内容制作等领域。产品还销往美、日、韩、新加坡及港台地区。清华TH-OCR中日韩识别技术在国际竞标中夺标,授权微软公司在Office 2003亚洲版中使用。
在行业应用市场,依靠十余年的经验积累和对行业用户需求的不断探索,文通信息已经在金融、税务、工商、电力、公安、电子政务等多个领域取得了成功应用,并在相关行业的推广及应用中起典范作用,为我国信息化建设的顺利进行奠定了坚实的基础。