侠客风云传手游杜康鸡:OCR文字识别软件哪个易用可网上下载

来源：百度文库编辑：高校问答时间：2024/04/30 04:34:34

那种OCR文字识别软件好用,而且可以从网上下到完全免注册激活中文版本的?一定要效率又高又不用注册的``````````

尚书七号ocr 已注册版
本软件系统是应用OCR（Optical Character Recognition）技术，为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
目前，许多信息资料需要转化成电子文档以便于各种应用及管理，但因信息数字化处理的方式落后，不但费时费力，而且资金耗费巨大，造成了大量文档资料的积压，因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
●识别字符
简体字符集：国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。
简繁字集：除了简体汉字外，还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类
能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体，并支持多种字体混排。
●识别字号
初号小六号字体。
●表格识别
可以自动判断、拆分、识别和还原各种通用型印刷体表格。

●可支持繁体WINDOWS系统
一定要使用迅雷下载
http://www.d3down.com/down.asp?id=1124&no=2

已经测试过了，可以下载，速度很快

尚书七号ocr 注册版
http://www.anxz.com/down/284.html

尚书六号
http://www.0518cn.com/html/2006/2006228214824.shtml
*********************
建议你用尚书六号，实际使用中发现尚书七号的识别率还不如尚书六号，除了界面漂亮一些其他功能都不如六号，如：存文本文件时没有存为软回车选项，行数少时手工改还不觉怎样，行数多时简直是一种折磨，去杂点橡皮没有的点状橡皮，拖鼠标经常误删有用的文字部分，如果不信，两个都下对比使用一下就知道了。

微软白送的Office 2003 OCR文字识别工具
时间: 2006-01-07 10:23:58 | [<<] [>>]
--------------------------------------------------------------------------------

单位准备把原来重要的文档全部电子化，储存在电脑中，如果把所有文件扫描为图像，又不方便文件检索，重新输入文本有太浪费时间，最近发现Office 2003中集成了先进的文字识别功能（简称OCR），下面就一起来体验一下吧！

首先将扫描仪安装好，接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描（如图1）。

提示：Office 2003默认安装中并没有这个组件，如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。

由于是文字扫描通常我们选择“黑白模式”，点击扫描，开始调用扫描仪自带的驱动进行扫描。这里也要设置为“黑白模式”，建议分辨率为300dpi。扫描完毕后回将图片自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中（如图2）。

点击工具栏中的“使用OCR识别文字”按键，就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。如果你要获取部分文字，只需要用鼠标框选所需文字，然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中了

OCR文字识别软件 Mini Ocr

xdowns.com/view_soft/3/7/OCRwenzishibieruanjian Mini Ocr.html

件

本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中，出现
的汉字显示字体。Ocr的中文含意是光学字符识别。
为什么叫Mini呢？因为现有的识别汉字的商业Ocr软件，动辄二三十兆，而本软件解
压后，也不过三兆多，身材比较纤小，再加上本软件主要用于识别字体比较小的汉字，所
以叫Mini，中文的发音是“迷你”，中文含义是超小型。

既然有了商业Ocr软件，为什么还要开发这个软件？

不同于商业Ocr软件，本软件是免费的，可以自由使用。第二个不同之处，本软件的
识别对象是屏幕出现的“显示汉字”，而不是针对扫描仪扫出来的“打印汉字”。二者有什
么不同呢？最重要的一点：扫描出来的打印汉字的高度和宽度一般都在30多个像素点之
上，这是我用画图软件，打开某个商业Ocr的samples\sample1.tif，然后一点一点数出
来的。从文件名和目录名的中文含意可以看出，这个点数应该是一个典型值。那么，如果
用商业Ocr识别屏幕上出现的小五号字，汉字的高度是12个像素点，会出现什么情况呢？
测试方法：用记事本随便写几行汉字，设置字体为小五号字。这大概是看着还算舒服
的最小号的汉字字体了（高度是12个像素点），如果再小，字体就很难看了。然后，按拷
屏键PrtSc，把屏幕的图像拷贝、粘贴到画图软件中，修剪尺寸后，保存为bmp的格式。
然后，我找了两个国内最著名的Ocr软件进行测试，结果让人大吃一惊，识别率几乎为零。
把图像放大两倍，再测试，结果仍然很不理想，大概也只有百分之二三十的样子。

开发Mini Ocr软件的由来

我在开发护花使者反黄图像识别软件的时候，遇到有些图像里,嵌有某些文字，如果能
把文字识别出来，图像的含义就很容易让计算机理解了。预算有限，我连扫描仪都舍不得
买，就更别想买商业Ocr的开发包了，大概几十万,或者更多，或者别人压根就不卖。况且
它们的识别率对小字体几乎为零，不符合我的要求。看来，只好自力更生，重新写一个了。

开发Mini Ocr的历程

经过三个多月的努力，终于诞生了这款Mini Ocr 软件。第1个月做出了汉字识别的
核心模块，第2个月做出了文章段落切分的算法，并加入了对英文，数字，标点的支持，
第三个月继续调整英汉混排和汉字切分的算法，并用MFC 做了一个界面。

Mini Ocr的软件架构

为了让更多的人能使用到这个软件，我在windows系统下，采用VC进行编程，界面当
然只好用MFC写了。软件架构是一个SDI框架下的多窗口切分界面，左上角的窗口是一个
CFormView，用来显示常用的按钮；左下角是一个CEditView,用来显示帮助信息；右上角
是一个CView,用来显示要识别的图像；右下角是一个CEditView,用来存放识别出来的文
字。识别部分采用了工作者线程，以避免显示界面的主线程僵掉。识别部分是整个软件的
核心，与操作系统无关，可以单独摘出来放在dos窗口里跑，也可以移植到Linux系统中跑。

汉字识别软件的难点所在：

英文识别有一些开放源码的软件，我看过的软件，主要采取两种识别方法：基于规则
的方法，和采用神经网络方法。而这两种方法，在识别汉字时，都不宜采用。因为汉字数
目众多，最常用的国标2312的一级汉字就有3755个。如果借用基于规则的方法，需要对
三千多个汉字，逐一人工写出分类规则，工作量太大，我一个人无法完成；如果采用神经
网络的方法，这么多汉字，我不敢想象，需要多少层网络和神经节点呀！如果采用网格法，
抗位移的效果太差；而采用不变矩法，识别人和入，土和士，相似度又难于控制。除此之
外，汉字切分也是一大难题。英文宽度大概只有汉字一半，标点符号大概只有汉字三分之
一宽，数字大概只有四分之一的宽度。而汉字本身又有二分字，和三分字。某些字，如“啊”，
字体小时可能是独体字，字体大些，变为二分字，字体再大，又变为三分字。加上汉字与
汉字之间的粘连、汉字与英文的混排，英文与英文的粘连，造成汉字切分模块的算法，甚
至比汉字识别模块的算法还要复杂得多。为了克服这些难点，并加快识别速度，我在算法
设计时，采用了一些优化和简化的策略。经过实践检验，证明行之有效。

Mini Ocr进行汉字识别的策略：
1) 采用复合特征的分类方法。
2) 字符集选择3755个一级汉字。
3) 字体选择最常用的宋体。
4) 字号选择从小五号到一号汉字，主要针对20个点之内的小字体。
5) 英汉混排时，汉语优先。
6) 汉字粘连时，进行动态优化切分。

展望与下一步的开发计划：
1) 重新优化英文识别的算法；
2) 对英文粘连的切分算法进行调整；
3) 移植进入Linux；

选择Ocr软件的建议：

如果您选择Ocr软件，目的是用来识别扫描仪出来打印字体，推荐还是选用知名的商业Ocr。
如果您要识别屏幕上显示的汉字，Mini Ocr是一个比较不错的选择。真诚地希望您在使用
中，能喜欢上它

tryocr建议用的

OCR文字识别软件哪个易用可网上下载谁能提供苹果机的OCR文字识别软件啊？求汉王OCR识别的软件下载地址 (最佳答案追加分数)请问哪里可以下载到最新的OCR文字识别系统？ OCR(光学字符识别)软件在哪里有谁有可以识别英语的OCR软件请问谁知道龙卷风OCR识别软件和IBM ViaVoice语音软件在哪下载，谢谢！关于OCR文字识别:清华紫光OCR7.5和清华文通TH-OCR v9.0是不是一种软件的不同版本啊?? 如何下载扫苗仪文字转换编辑用的软件？是不是ocr软件吗？谁能给我一个汉王OCR识别的软件下载地址