前几天,四川仪陇县的一篇字公文被挑出有4个错别字,事情被曝出来后在网上引起了不少人议论。我看到这消息时第一反应是好奇,一共个字,咋能做到这么高错误率的?于是把那片出错的文件图片找了出来。如果是以前,我看到这种文件上的错别字,总喜欢自作聪明地推断一下敲文档的人用到是什么输入法,谐音错误肯定是拼音了,笔画问题可能会是五笔等等,不过这次这篇文档看一眼就一目了然了,从这几个错别字的字形上就能看出来,不是输入法的锅,这锅得OCR软件来背。看到这个新闻后一方面我和广大网友一样在指责办公人员的不用心,另一方面却也在感慨科技进步之快,前几年OCR文字识别技术还处于一帮好事的极客尝鲜的阶段,现在已经真正地走进大众的视野了。早些时候,OCR实用软件的天花板还是俄罗斯开发的泰比(ABBYY),不得不说ABBYY的识别率是真的强!但这几年,国内的一众OCR软件如雨后春笋般出现了。而一路用下来,PC端目前我用着最舒服的是天若,移动端则是今天介绍的白描。在白描的
转载请注明原文网址:http://www.13801256026.com/pgzl/pgzl/6493.html |