汉王ocr 导出的文字为什么是乱码
汉王最新版本的OCR软件。我把PDF转换成WORwww.rixia.ccD 为什么全是乱码?
PDF转换成TXT.文字到是清晰了.但是从TXT复制出去的文字(包含表格)到WORD。表格全乱了?有解决方法吗 如何解决?请达人指教 有分!或者留下你的联系方法 我向您请教。TXT文件是纯文本文件,不含表格,想到得到完整表格不能存成TXT格式
汉王OUT了,请改用ABBYY.FineReader
OFFICE2013 PDF转word完美解决
用OCR转换文字,到这步!提取出的文字乱码,不知道怎么处理了
汉字乱码现象有4种类型:
1.文本乱码:是Windows系统显示乱码,如:菜单、桌面、提示框等。这是由于注册表中有关字体部分的设置不当引起的;
2.文档乱码:是各种应用程序、游戏本来显示中文的地方出现乱码。这种乱码形成的原因比较复杂,有第1类的乱码原因,也可能是软件中用到的中文动态链接库被英文动态链接库覆盖所造成的;
3.文件乱码:主要是指邮件乱码;
4.网页乱码:是由于港台的繁体中文大五码(BIG5)与大陆简体中文(GB2312)不通用而造成的。
消除各类乱码的方法
一 系统乱码的消除方法
这类乱码是由于在Windows注册表中,关于字体部分配置不正常造成的,即使你用内码翻译软件处理也不会消除这类乱码。那怎么办呢?请跟我来:
方法一:找一台与你的Windows版本相同且显示正常的机器,依下列步骤进行:
1.在正常机器上选择“开始”→“运行”,在对话框中键入“regedit”,打开注册表编辑器;
2.请你将光标定位到“HKEY_LOCAL_MACHINE\ system\CurrentControlSet\Control\ Fontassoc”,然后选择“注册表”→“导出注册表文件”,再选择“分支”,导出该分支注册表信息到文件(如ZT.REG)中;
3.把ZT.REG文件拷贝到你那显示乱码的机器上,方法是:在显示乱码的机器上运行“regedit”,打开注册表编辑器,选择“注册表”→“导入注册注册表”,把ZT.REG文件导入注册表中即可。
方法二:如果你找不到KYegEV一台与你的Windows版本相同且显示正常的机器,则需要手工恢复字体部分的注册表
项,其步骤是:
1.首先在显示乱码的机器上选择“开始”→“运行”,在对话框中键入“regedit”,打开注册表编辑器;
2.选择“HKEY_LOCAL_MACHINE\System\ CurrentControlSet\Control\Fontassoc”,正常情况下,会有Associated DeaultFonts、Associated CharSet两个文件夹,其正确的内容应是:
子目录内容
中文Win98
中文Win98(OEM版)
中文Win2000
Associated CharSet
ANSI(00)=“yes”
GB2312(86)=“yes”
DEN(FF)=“yes”
SYMBOL(02)=“no”
ANSI(00)=“yes”
GB2312(86)=“yes”
OEM(FF)=“yes”
SYMBOL(02)=“no”
ANSI(00)=“yes”
OEM(FF)=“yes”
SYMBOL(02)=“no”
Associated DefaultFonts
AssocSystemFont=“simsun.ttf”
FontPackageDecorative=“宋体”
FontPackageDontcare=“宋体”
FontPackageModern=“宋体”
FontPackageRoman=“宋体”
FontPackageScript=“宋体”
FontPackageSwiss=“宋体”
或
AssocSystemFont=“simsun.ttf”
FontPackage=“新宋体”
FontPackageDecorative=“新宋体”
FontPackageDontcare=“新宋体”
FontPackageModern=“新宋体”
FontPackageRoman=“新宋体”
FontPackageScript=“新宋体”
FontPacwww.rixia.cckageSwiss=“新宋体”
3.当出现汉字乱码时,上述两个文件夹中的内容就会不完整,有的没有Associated CharSet文件夹或其中的内容残缺不全;有的 Associated DefaulFonts下的内容残缺。如果遇到这种情况怎么办呢?其日夏养花网实你只要打开注册表编辑器,在 “HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Fonassoc”下,根据以上的正确内容恢复即可。
二 应用程序、游戏乱码的消除方法
明明是中文软件,可显示界面上却出现乱码,这可能是由于注册表中关于字体设置的信息不正确地被改变而造成的,一般是因为软件的中文链接库被英文链接库覆盖而引起的,这种现象经常发生在用微软开发工具,例如VB、VC开发的中文软件上。在这类软件中,菜单等显示界面上的汉字都是受一个动态链接库“.DLL文件”控制,而软件的这个动态链接库一般是安装在Win 98/2000的System目录下的,如果以后你安装了某个英文软件也使用同名的动态链接库,则英文软件的动态链接库就会覆盖掉你原先的Windows\System下的中文软件的动态链接库。这样,日夏养花网当你运行中文软件时就会调用英文的动态链接库,因此出现乱码。解决办法是重新安装中文软件,恢复中文动态链接库即可。
1.文本乱码:是Windows系统显示乱码,如:菜单、桌面、提示框等。这是由于注册表中有关字体部分的设置不当引起的;
2.文档乱码:是各种应用程序、游戏本来显示中文的地方出现乱码。这种乱码形成的原因比较复杂,有第1类的乱码原因,也可能是软件中用到的中文动态链接库被英文动态链接库覆盖所造成的;
3.文件乱码:主要是指邮件乱码;
4.网页乱码:是由于港台的繁体中文大五码(BIG5)与大陆简体中文(GB2312)不通用而造成的。
消除各类乱码的方法
一 系统乱码的消除方法
这类乱码是由于在Windows注册表中,关于字体部分配置不正常造成的,即使你用内码翻译软件处理也不会消除这类乱码。那怎么办呢?请跟我来:
方法一:找一台与你的Windows版本相同且显示正常的机器,依下列步骤进行:
1.在正常机器上选择“开始”→“运行”,在对话框中键入“regedit”,打开注册表编辑器;
2.请你将光标定位到“HKEY_LOCAL_MACHINE\ system\CurrentControlSet\Control\ Fontassoc”,然后选择“注册表”→“导出注册表文件”,再选择“分支”,导出该分支注册表信息到文件(如ZT.REG)中;
3.把ZT.REG文件拷贝到你那显示乱码的机器上,方法是:在显示乱码的机器上运行“regedit”,打开注册表编辑器,选择“注册表”→“导入注册注册表”,把ZT.REG文件导入注册表中即可。
方法二:如果你找不到KYegEV一台与你的Windows版本相同且显示正常的机器,则需要手工恢复字体部分的注册表
项,其步骤是:
1.首先在显示乱码的机器上选择“开始”→“运行”,在对话框中键入“regedit”,打开注册表编辑器;
2.选择“HKEY_LOCAL_MACHINE\System\ CurrentControlSet\Control\Fontassoc”,正常情况下,会有Associated DeaultFonts、Associated CharSet两个文件夹,其正确的内容应是:
子目录内容
中文Win98
中文Win98(OEM版)
中文Win2000
Associated CharSet
ANSI(00)=“yes”
GB2312(86)=“yes”
DEN(FF)=“yes”
SYMBOL(02)=“no”
ANSI(00)=“yes”
GB2312(86)=“yes”
OEM(FF)=“yes”
SYMBOL(02)=“no”
ANSI(00)=“yes”
OEM(FF)=“yes”
SYMBOL(02)=“no”
Associated DefaultFonts
AssocSystemFont=“simsun.ttf”
FontPackageDecorative=“宋体”
FontPackageDontcare=“宋体”
FontPackageModern=“宋体”
FontPackageRoman=“宋体”
FontPackageScript=“宋体”
FontPackageSwiss=“宋体”
或
AssocSystemFont=“simsun.ttf”
FontPackage=“新宋体”
FontPackageDecorative=“新宋体”
FontPackageDontcare=“新宋体”
FontPackageModern=“新宋体”
FontPackageRoman=“新宋体”
FontPackageScript=“新宋体”
FontPacwww.rixia.cckageSwiss=“新宋体”
3.当出现汉字乱码时,上述两个文件夹中的内容就会不完整,有的没有Associated CharSet文件夹或其中的内容残缺不全;有的 Associated DefaulFonts下的内容残缺。如果遇到这种情况怎么办呢?其日夏养花网实你只要打开注册表编辑器,在 “HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\Fonassoc”下,根据以上的正确内容恢复即可。
二 应用程序、游戏乱码的消除方法
明明是中文软件,可显示界面上却出现乱码,这可能是由于注册表中关于字体设置的信息不正确地被改变而造成的,一般是因为软件的中文链接库被英文链接库覆盖而引起的,这种现象经常发生在用微软开发工具,例如VB、VC开发的中文软件上。在这类软件中,菜单等显示界面上的汉字都是受一个动态链接库“.DLL文件”控制,而软件的这个动态链接库一般是安装在Win 98/2000的System目录下的,如果以后你安装了某个英文软件也使用同名的动态链接库,则英文软件的动态链接库就会覆盖掉你原先的Windows\System下的中文软件的动态链接库。这样,日夏养花网当你运行中文软件时就会调用英文的动态链接库,因此出现乱码。解决办法是重新安装中文软件,恢复中文动态链接库即可。
用“汉王OCR”文字识别软件,识别扫描的(.JPEG)文件,识别后显示的都是乱码为什么?
另外,如何保存为WORD文档?谢谢帮助!识别效果不好,或者你的原始JPG图上的字不够清晰,你可以试着把图放大,然后局部识别~ 识别出来是TXT,你自己复制到WORD吧~
识别不好吧,我以前也用过,效果不好,部分能识别出来,但大部分都不行,识别不出来的就成乱码了
如果是网上下载的倒版 那识别会有这样的问题
不要太乱的文件还可以
正版应该不会有这样的问题
如果有建议杀毒 杀木马
可能会影响正常使用
也有可能是你使用的问题
可以资讯汉王
8008108818
不要太乱的文件还可以
正版应该不会有这样的问题
如果有建议杀毒 杀木马
可能会影响正常使用
也有可能是你使用的问题
可以资讯汉王
8008108818
你最好用清晰的图片,300dpi左右,保存word很简单,按那个输出为word文档的按钮就行
试试尚书七号OCR,这款很不错。
赛酷OCR,不错,可以试试
百度搜索 赛酷OCR 就找到了
百度搜索 赛酷OCR 就找到了
为什么用ocr识别的文字是乱码呢,怎样才能改变呢?
我用ocr软件识别扫描的文件,结果识别出来的是乱码,怎么才能不出现乱码出现乱码的原因有很多,在这里只能猜了。
可能是扫描出来的图片比较斜,用OCR自身的纠正功能纠正后再识别。不行的话重新扫描,尽量摆正文字。
还可以分割识别,可以提高识别率。
用的哪个OCR?汉王文本王识别表格没问题。如果是用 Office2003带的Microsoft Office Document Imaging,那就只能望天了。
可能是扫描出来的图片比较斜,用OCR自身的纠正功能纠正后再识别。不行的话重新扫描,尽量摆正文字。
还可以分割识别,可以提高识别率。
用的哪个OCR?汉王文本王识别表格没问题。如果是用 Office2003带的Microsoft Office Document Imaging,那就只能望天了。
用汉王PDF识别文字后 倒出呈txt档出现乱码 怎么弄
出现乱码,从经验看,可能与pdf文件本身有关,比如设置了某种限制权限;也可能与软件有关,比如没有相应的语言编码
因为没用过汉王pdf,所以不知道具体原因
不过建议你用更专业的abbyy finereader,通常都用这个软件
你也可以把pdf发来帮你看看,先
因为没用过汉王pdf,所以不知道具体原因
不过建议你用更专业的abbyy finereader,通常都用这个软件
你也可以把pdf发来帮你看看,先
文字识别的话目前功能最强大的软件是ABBYY,我空间有介绍和下载的哦
文章标签:
本文标题: 汉王ocr 导出的文字为什么是乱码
本文地址: http://www.rixia.cc/wenda/242340.html
上一篇:墨兰花放在向阳的卧室好不好
下一篇:家里养莲花可以吗?
相关推荐