怎样在Linux下设置和使用扫描仪使用

点击联系发帖人 时间：2017-10-18 05:52

bf0505扫描仪怎么使用

君，已阅读到文档的结尾了呢~~
扫扫二维码，随身浏览文档
手机或平板扫扫即可继续访问
怎样在Linux下设置和使用扫描仪
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由：
将文档分享至：
分享完整地址
文档地址：
粘贴到BBS或博客
flash地址：
支持嵌入FLASH地址的网站使用
html代码：
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布，请您等待！
3秒自动关闭窗口比特客户端
您的位置：
详解大数据
详解大数据
详解大数据
详解大数据
Linux实用教程：自动批量扫描文档
关键字：Linux技巧
　　本文将为读者介绍如何构建一套文档批量。为了实现这个目标，我们将使用众多工具。这种方法具有的优点是，这个过程可以定制，以符合你特定的需求。这为你提供了一套可处理重大任务，又能灵活定制的系统。
　　我们将着眼于两种可能的最终产品：每一页都是原始页扫描件的文件，以及含有原始页文本内容的文本文件。文本文件的内容可以搜索，我们探讨了将文本文件转换成PDF文件的若干方法。
　　本教程具有化特点。比如说，如果你在处理一组预先扫描的图像，那么就可以略过头几个步骤，直接进入到使用光学字符识别(OCR)软件处理图像，或者将它们转换成PDF文件。同样，如果你偏爱使用图形用户界面(GUI)工具来处理这个过程的某些环节，也没有什么可以阻止你。话虽如此，我们还是尽量让这个过程的每个环节编写脚本，以便实现全面。
　　我们通过充分使用基于命令行的工具，确保这个项目的每个阶段都是可以定制、可以编写脚本。
　　相关资源
　　Linux机器
　　扫描仪
　　具体步骤
　　第1步：安装SANE
　　你可以使用程序包管理器，安装主要的扫描仪程序包SANE(Scanner Now Easy)。要是你已安装了SANE，但是扫描仪访问起来还是有困难，网上可能有面向该扫描仪的针对特定厂商的SANE后端工具。如果是这种情况，不妨用搜索一下。
　　第2步：找到扫描仪
　　在命令行键入scanimage -L命令，检查一下SANE能否与你的扫描仪兼容。要是你的扫描仪得到支持，文本输出就会含有设备名称。你需要的那部分就是冒号前面的第一个元素。
　　第3步：扫描图像
　　键入scanimage -d [设备名称] & test.pnm，快速测试扫描某个对象。这会使用默认设置来扫描一页内容。在图形查看器中打开扫描后的文件，检查一下。要是遇到了问题，可以添加-v选项，以便排查故障。
　　第4步：完善scanimage选项
　　如果你打算使用OCR处理文本，或者不需要颜色，那么300 DPI分辨率和黑白是两个典型的选项。首先，这缩小了文件尺寸。scanimage -d [设备名称] -format=tiff -mode Lineart -resolution和300 & [文件名称]是两个典型的选项。
　　第5步：创建扫描脚本
　　我们将使用进行扫描的命令行字符串创建第一个脚本。使用一个文本编辑器，创建一个名为scan.sh的文件。添加#!/bin/bash作为头一行。添加你的扫描仪系列作为第二行。保存该文件。在命令行键入chmod +x scan.sh，让这个脚本成为可执行脚本。将./scan.sh键入到终端，以便运行它。接下来，我们在必要的阶段可以创建诸如此类的额外脚本。你可以把这些脚本合并成一个长脚本，也可以单独调用不同的阶段。
　　第6步：计算裁剪尺寸
　　用不着为这个阶段的旋转文档而操心。你可以使用程序包管理器，安装GIMP。在GIMP中打开扫描后文档，从工具面板中选择裁剪工具。让裁剪区覆盖文档的有效部分，然后在裁剪框中记下裁剪尺寸。如果你打算把迎面页分割成不同页面，就要记下适当的页面尺寸。别在GIMP中进行裁剪，因为我们稍后会从命令行来进行裁剪。
　　第7步：安装ImageMagick
　　使用程序包管理器，将ImageMagick安装到你的系统上。我们使用convert命令，与这个图像工具进行交互。我们可以用它来旋转和裁剪图像，还可以用它来分割页面。要注意：convert在选项前面使用了单破折号。
　　第8步：裁剪页面
　　利用通过使用GIMP获得的相关参数，执行裁剪任务。键入convert [图像名称] +repage -crop [x width]x[y width]+[x offset]+y[offset] [输出名称]。比如说，convert page1.png +repage -crop +1+1 page1_crop.png就会裁剪从上边和左边1个像素开始、尺寸为2244 x 3113的矩形页面。
　　第9步：旋转页面
　　如果你不得不双面扫描页面，不妨使用ImageMagick来旋转页面。convert [输入名称] -rotate 90 [输出名称]可以完成这项任务。
　　第10步：分割迎面页
　　与之前一样，使用GIMP的裁剪功能，算出裁剪页面的确切尺寸。convert page1.tiff +repage -crop +0+1529 page1_a.tiff以及随后的convert page1.tiff +repage -crop +0+0 page1_b.tiff，可以从两个迎面页创建两个不同的文件。
　　第11步：创建预先处理的脚本
　　上面是一个示例的预先处理脚本。它创建了一个名为splits的目录，然后旋转每个扫描件，之后将其分割成按顺序编号的两个页面。最后，它删除经过旋转的文件。保存它，然后键入chmod +x命令，让它成为可执行脚本。
　　第12步：扫描仪批处理模式
　　使用针对多个页面的-batch系列选项。要是你没有送纸器，那就添加-batch-prompt选项，以便每次扫描之间加以提示。此外，可以添加-batch=./$page_%03d.tiff，提供以"page"开头、以带三个0的数字结尾的文件名称。
　　第13步：在扫描仪中预先裁剪
　　你也许能够在扫描仪中裁剪页面，这可以带来更小的文件和更快的操作，因为扫描头没必要扫过很远的距离。使用GIMP中的裁剪工具，在对话框中将单位由px(像素)改成mm(毫米)，算出你所需要的尺寸和偏移量。要是结果证明以这种方式获得的信息不准确，不妨考虑改用原始的办法，使用直尺。在scanimage命令行上，额外标志的格式是-l [左边] -x [宽度] -t [上边] -y [高度].
　　第14步：双面文档
　　如果你要扫描双面文档，使用之前所说的batch选项，但要添加-batch-double选项，以便将页面数递增2个。在第二次扫描时，针对另一面，再次进行同一番操作，不过添加-batch-start=2，让编号递增。
　　第15步：将扫描件转换成PDF
　　你可以使用ImageMagick，将装满扫描后图像的目录转换成PDF"书册"。convert *.tiff output.pdf这个命令会创建一个多页文档。如果你需要插入标题页，将其命名为page000.tiff，然后放到该目录中。
　　第16步：借助Tesseract，使用OCR处理文本
　　不妨在测试页上试一下OCR引擎。为此，键入tesseract [输入文件名称] [输出文件]。别给输出文件名称添件扩展名，因为文件扩展名会由Tesseract来添加。请注意：Tesseract可以检测出多列文本和迎面页。
　　第17步：OCR批处理
　　使用下列Bash代码，使用OCR处理装满扫描后页面的目录：for i in *. do tesseract $i outtext$i;最终结果是一组文本文件。使用cat *.txt &[输出文本文件]，将这些文件结合起来。
　　第18步：文本格式化
　　默认情况下，Tesseract会将回车符插入到之前源文本中出现的同一个位置。你可以使用下面这个命令：fmt -u [输入文件] & [输出文件]，重新为文本文件制作格式。
　　第19步：在LibreOffice中编辑文本
　　只要将从前几个步骤所得的输出结果剪贴到LibreOffice Writer中。在这个阶段，你可以控制编辑，并手动编辑节头等参数。你甚至可以插入来自原文档的图像。
　　第20步：从LibreOffice导出PDF文件
　　LibreOffice有一些内置工具，可用于创建PDF文件。如果你最终敲定了布局和格式，就进入到File(文件)&Export as PDF(导出为PDF文件)。由此处，点击Export(导出)，为文档取个名称。
　　第21步：可以编写脚本的PDF创建
　　使用程序包管理器，安装iconv、ps2pdf和enscript这几个程序包。键入iconv -f UTF-8 -t-8859-1 -c [输入文本文件][输出文本文件]，准备好文本文件。键入enscript [文本文件] -p [输出postscript文件.ps]。键入ps2pdf [.ps文件]，将PostScript转换成PDF。
[ 责任编辑：jj ]
去年，手机江湖里的竞争格局还是…
甲骨文的云战略已经完成第一阶段…
软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯，最新的软件技巧，最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中，与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊！
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧，帮助网管答疑解惑，成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一，主要关注x86服务器，RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析，让您第一时间了解服务器行业的趋势。
比特存储周刊长期以来，为读者提供企业存储领域高质量的原创内容，及时、全面的资讯、技术、方案以及案例文章，力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
比特安全周刊通过专业的信息安全内容建设，为企业级用户打造最具商业价值的信息沟通平台，并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比，比特安全周刊运作模式更加独立，对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事，为企业级用户打造重点突出，可读性强，商业价值高的信息共享平台；同时为互联网、IT业界及通信厂商提供一条精准快捷，渗透力强，覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展，全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托，汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通、促进交流的平台，并持续提供丰富的资讯和服务，探讨信息化建设，推动中国信息化发展引领CIO未来职业发展。
IT专家新闻邮件长期以来，以定向、分众、整合的商业模式，为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容，包括IT新闻、评论、专家答疑、技巧和白皮书。此外，IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊是一份IT人的技术娱乐周刊，给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍，同时用户还能参与我们推荐的互动游戏，给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。
微信扫一扫
关注Chinabyte怎样在Linux下设置和使用扫描仪!-红联Linux系统门户
您的位置：
&& 查看内容－－－
怎样在Linux下设置和使用扫描仪!
pkncoin发布于
&&字号: &&&&(网友评论&3&条)&
　　使用扫描仪如果想像一个典型的办公计算机，用户会想到运行特定程序(比如字处理程序和电子表格)的系统。桌面办公系统的原型具有有一台显示器、一个键盘、一个鼠标作为人机接口，并且连接打印机作为输出。在这个老套的桌面办公系统里缺少一个组件：扫描仪。不是每台计算机都具有或是需要扫描仪，对于很多程序来说，扫描仪都是可有可无的。通过使用扫描仪，用户可以将打印的照片转换文件，从而使用图处理形处理程序对其进行编辑，也可以将文档转换为文字处理文件。用户什至可以利用扫描仪(在打印机和调制解调器的协助下) 将计算机变成一台复印机和传真机。
　　在Linux下扫描仪需要两种主要的支持类型：对底层接口的支持，比如SCSI或USB；以及对特定扫描仪型号的支持。Linux的主要扫描仪程序包Scanner Access Now Easy（SANE），它包含很多扫描仪的驱动程式。用语可以把SANE当做单独的程序进行配置和使用，也可以在其他软件中调用它。用户什至可以配置SANE来实现通过网络进行操作，从而让多台计算机共享一台扫描仪，就像共享打印机一样。
　　查找扫描仪支持
　　很多主流Linux里都包含SANE，如果用户想得到最新的版本，可以查看SANE的Web主页：http://www.sane-project.org/。这个站点还包含相应扫描仪的信息。所有的支持被分为stable(稳定的：经过测试并且工作正常)、beta(beta测试版：工作情况相当不错)、alpha(alpha测试版：非常新的支持，可能包含重大错误)、untested 未测试的：理论上是可行的，但没有经过测试)和unsuppoted(不支持的：不能正常工作）。有些设备可能不被某个驱动程序支持，但可以使用其他驱动程序。
　　如果征官方SANE站点不能找到需要的扫描仪驱动程序，您可以在Web上进行搜索，这样可能会发现没有被被收集到SANE主程序包里的试验驱动程序。如果用户的扫描仪是USB摸式的，还呵以查看http://www.linux-usb.org。这个站点包含了关于USB开发的信息，还具有指向新驱动程序的链接。很多新的和试验性的驱动程序并不是很稳定，它们可能还需要用户重新编译SANE的源代码。如果找不到驱动程序，您最好淘汰先有的扫描仪并且购兴一个新的。
　　配置扫描仪软件
　　从根本上讲SANE是一个应用程序接口(API)，它提供了一组例程，其他程序可以调用这些例程来使用任何扫描仪。SANE主要由三个部分组成：
　　● 实现API的库(也就是“中间件”或“后端程序的后端”)
　　● 访问扫描仪的驱动程序(也就是“后端程序”)
　　● 调用SANE API的程序(也就是“前端程序”)
　　不同的前端程序可能能是差别很大的。举例来说，文本模式的前端程序能够在命令行下进行扫描，而基于X窗口的前端程序提供GUI预览扫描和其它常见扫描特性。
　　配置SANE的工作主要是为扫描仪设置正确的后端程序，这是通过编辑两个文件来完成的：
　　/etc/sane.d/dll.conf这个文件包含了SANE后端程序的列表，SANE在被调用时可能搜索这个列表。后端程序通常是以扫描仪制造商来命名的，有时会附加型号数字，比如mustek或umaxl220u。文件中以井号“#”开始的行是注释，在执行程序时它们会被忽略。
　　特定扫描仪的配置文件除了dll.conf文件之外，/etc/sane.d目录里还包含特定扫描仪的配置文件。这些文件是根据后端程序进行命名的，后缀是.conf，比如mustek.conf或umax1220u。在大多数情况下用户不需要调整这些文件，然而有时用户可以调整这些设置来提高扫描仪的性能。大多数都包含描述参数的说明，按照说明修改一些参数可以改变扫描仪的性能。
　　说明：所有主流Linux将SANE配置存放在/etc/sane.d，然而如果用户在没有改变默认设置的情况下重新编译SANE的源代码，这些文件将会被保存在/usr/local/etc/sane.d。
　　用户可以通过输人两个命令来查看可用的扫描仪。第一个命令是sane-find-scanner，这个命令在本地扫描仪接口搜索本地扫描仪，其结果可能是一个或多个输出行，指明了扫描仪所在的设备文件名，比如/dev/usb/scanner0(设备文件之间的符号化链接或重复的设备文件有时会让扫描仪出现两次)。如果sane-find-scanner没有发现肯定存在的扫描仪，请确定它是否连接到了计算机并且打开它，同时还要检查是否加载了合适的驱动程序。USB扫描仪需要scanner驱动程序，SCSI扫描仪需要SCSI主适配器的驱动程序和SCSI类(sg)驱动程序，并口扫描仪需要Linux并口支持(parpor, 在IA-32系统上还需要parport_pc)。sane-find-scanner程序不能检测网络扫描仪(关于这个问题请参见后面的小节“网络扫描”)。
　　当确定了扫描仪硬件可以访问之后，用户可以查看SANE是否正确地识别了扫描仪型号，为此可以输入scanimage -L命令。这个命令调用scanimage前端程序，这个程序通常是用于扫描图像的，然而在使用了-L参数后，这个程序只是识别可用的扫描仪。如果一切工作正常，用户会看到如下信息：CODE:device ‘umaxl220u:/dev/usb/scanner0’is a UMAX Astra 1220U flatbed scanner　　大多数提供SANE配置的Linux在默认情况下关闭了大多数或全部扫描仪。如果scanimage -L命令没有得到希望的结果，用户可以查看/etc/sane.d/dll.conf，并且删除相应后端程序行前面的注释标记。如果需要添加很新的后缀程序，用户应该根据它提供的指令进行操作。Red Hat在这方面是与众不同的，它为很多描仪提供未被注释的配置，因此在安装之后不需要修改就可以正常工作。然而这种设置会稍微降低扫描仪检测的速度。
　　用户还需要注意另一个配置细节：设备文件权限。设备文件(比如/dev/usb/scanner0，这是前一个例子里scanimage -L返回的结果）对于所有使用扫描仪的用户必须都是可读可写的。很多Linux在默认情况下将这些设置为全局可读可写的，但用户还是应该查看它的设置是否正确。如果文件权限没有设置全局可读可写，用户可以使用chmod来改变权限。如果这个文件属于具有可读可写权限的特殊的扫描仪组，那么就可以将需要使用扫描仪的用户添加到这个组。
　　实现基本扫描
　　在scanimage -L命令能够发现扫描仪之后，用户就可以真正使用扫描仪了。由于SANE从技术上讲是个API而不是个程序，用户使用SANE的方式取决于访问SANE的程序。在使用这些程序时需要注意的一个细节是扫描仪的“设备名称”，虽然设备文件包含设备标识符，但“设备名称”不仅仅是设备文件(在/dev目录树里)。设备名称是由后端程序名、一个冒号和设备文件名组成的。举例来说，这个名称可能是mustek:/dev/sg2或umaxl220u:/dev/usb/scanner0。这是由scanimage -L返回的名称。
作者: pkncoin&发布日期:
　　下面介绍一些常见的基本扫描仪程序包：
　　scanimage这个程序是SANE的文本模式前端程序，它能够处理很多选项(详细内容请查看它的手册页)，但是只需要输入scanimage -d device > scanfile.pnm命令就可以执行基本的扫描操作，其中device是设备名称，比如mustek:/dev/sg2。输出文件是Portable Anymap(PNM)格式，用户可以使用- -format format选项修改输出文件格式。虽然这个程序是一个前端程序，但它通常包含在SANE后面程序包里。
　　xscanimagc 这个程序是SANE的基本GUI前端程序，它的功能与scanimage类似，但它使用GUI控件来访问大多数选项。它通常是SANE前端程序包的组成部分(sane或sane fontends)。
　　Xsane这个程序并不是SANE主程序包的组成部分，但却是紧密相关的。它是基于X窗口的前端程序，具有更多的特性。它的站点是。大多数Linux提供了名为xsane的程序包。
　　Kooka 这是使用K Desktop Environment(KDE) 的前端程序。Kooka提供图象管理的功能和库文件，可以为其他KDE应用程序提供Kooka类型的扫描。详细内容请查看。
　　还有其他一些基于SANE的特殊扫描程序，比如xcam用SANE作为与相机的接口)和scanadf(支持通过自动文档进纸器进行的扫描)。在下面的“网络扫描”小节里会介绍一种不常见的SANE应用。
　　我们将XSane作为使用SANE的范例。使用XSane扫描档的步骤如下所示：
　　1. 输入xsane来加载这个程序。它可能会询问用户使用哪一个扫描仪，即使只有一个描仪时也可能是这样，因为程序可能使用多余的设备文件来检测扫描仪。在这种情况下，用户选择哪个扫描仪都是一一样的。XSane 具有多个窗口，如图3.4所示。从左下角开始按照顺时针方向依次是选项窗口、主把控制窗口、颜色柱状图窗口和预览窗口。从主控制窗口里的View菜单里，用户可以打开或关闭这些窗口，以及其他默认时没确显示的窗口。
400) {this.resized= this.width=400; this.alt='Click here to open new window';}" onmouseover="if(this.resized) this.style.cursor='hand';" onclick="window.open('http://www.linuxunion.net/uploads/xsane2.gif');">
图3.4 Xsane提供了多个窗口，用户可以输入扫描的选项和控制
　　2. XSane在默认情况下启动为Viewer(查看器)模式，这意味着当用户开始扫描时，程序会打开另一个窗口来显示扫瞄的情况，然后用户可以在查看器里操纵和保存扫描的图像。在主控制窗口上方的Sane Mode(XSane模式)选项型可以选择其他模式。在这个范例里需要选择Save（保存)。，这个选项让用户能够将扫描结果保存到一个文件。主控制窗口会进行扩展，从而显示出输入文件名和文件类型的字段。
　　3. 如果默认的out.pnm不是需要的文件名，用户可以在文件名字段里输入更好的名称，或是单击窗口里像软盘一样图标从而在文件选择对话框里选择一个文件名。
　　4. 在主控制窗口里的分辨率选择钮里选择扫描分辨率(图3.4中的设置为150)。有些扫描仪使用滑块设置扫描分辨率。
　　5．如果文档是灰度级的，比如黑白照片，用户可以在选项窗口里单击Grayscale Scan(灰度扫描)框。有些扫描仪还提供额外的位深度或线条选项。
　　6．将需要扫描的文档放置到扫描仪的平板上。
　　7．在预览窗口里单击Acquire view(获取预览)按钮，这时扫描仪应该开始进行操作，以低分辨率进行扫描，并且在预览窗口里显示结果。
　　8．如果用户不想扫描整页内容，可以在预览窗口里用鼠标选择需要的区域，就像在其他图像程序中所做的操作一样。
　　9．单击主控制窗口里的Scan(扫描)按钮。XSane应该开始扫描文档，并且将扫描结果保存到用户在第3个步骤指定的文件。
　　10．如果需要扫描更多的文档，用户只需要重复第3到第9个步骤。否则可以选择File►Quit来退出这个程序。
　　在XSane里用户可以设置一些额外的属性。举例来说，用户可以使用XSane Mode选项选择扫描结果的发送目的地(使用Copy项形成影印结果、使用Fax选项传真文档、使用E-mail选项把文档用电子邮件发送出去) 用户还可以使用主控制窗口里的滑块调整亮度、对比和伽马值。有些选项只适用于特定的扫描仪，因此用户看到的选项可能与图3.4不同。
　　说明：在使用某些扫描仪时，当用户退出SANE前端程序时SANE会关闭扫描仪的灯。很多SANE前端程序也提供了手工关闭扫描仪灯的方式，比如图3.4中选项窗口里的Lamp Off 按钮。有些扫描仪只有在关闭扫描仪时才套会关灯。
　　将扫描仪集成到其他软件
　　由于SANE是个API，因此在理论上所有程序都可以调用SANE来实现扫描。当然对于某些程序来说实现这种效果比其他程序更有意义。这种编程工作包括调用SANE、让用户访问SANE选项，这意味着提供扫描仪访问的程序通常使用另一个程序包提供的接口工具集。举例来说，GNU Image Manipulatio Program(GIMP)使用XSane接口，Kooka提供的工具可以作为基于KDE的程序与扫描仪接口。
　　非扫描仪程序的扫描工作细节是不同的。在GIMP里，用户从File►Acquire菜单里选择扫描仪选项(具有多台扫描仪时会有多个选项)，其结果通常如图3.4所示XSane窗口，似是主控制窗口里没有XSane Mode选项。以这种方法扫描的结果直接进入GIMP窗口，用户就可以像处理其他图像一样对其进行操作了 (在往后的另一篇文章里，我将会详细地介绍GIMP)。
　　图像转化为文本：OCR
　　扫描仪从本质上讲是个图形设备，它的输出是位图图形数据流，能够很方便地在X窗口里显示，也能够保存到图形文件。然而有时候我们扫描一个文档的目的是将其转化为文本，从而使用文字处理程序编辑它、将数据加载到电子表格或是以非图形方式进行处理。为了实现这个目的，就产生了“光学字符识别(OCR)”程序。这些程序以图形文件作为输入，生成输入文件所包含字符的文本文件。基本上来说，OCR程序“取”输入文件的字符。然而这对于计算机程序来说是相当复杂的，这些软件必须克服很多障碍，其中包括输入文件上的条纹和斑点、不同字体的体的字符在外观和尺寸上的变化、字符中夹夹的非文本信息(比如内嵌的图像)。因此OCR软件总是有一定缺陷的，但它的性能还是相当好的，值得一用。通常情况下，用户可以扫瞄文档，然后与原始文档进行对比，进行适当的修改。下面介绍一些主要的
Linux OCR软件包：
　　Clara这个程宇来自于，它倾向于完成大规模的OCR项目，比如将印刷的书籍转化为数字格式。这个程序包含基于X窗口的GUI，但它没有与扫描仪的直接接口。因此用户必须首先将文档扫描为文件，然后使用Clara处理这些文件。
　　GOCR这个程序来自于，它是在命令行运行的OCR程序，因此它可以被其也程序调用，比如XSane或Kooka，从而让其它程序具有OCR功能。
　　OCR Shop还是Linux下的商业OCR软件包，它比开放源码的Clara或GOCR更加成熟，但是价格不菲，入门级软件包的价格大约是1500美元。OCR Shop不使用SANE作为后端程序，因此在购买这个软件之前要确保它支持用户使用的扫描仪。详细信息可以查看。
　　作为一个OCR的范例，我们使用来自XSane的GOCR。操作步骤如下：
　　1．根据需要安装GOCR软件包。
　　2．加载XSane，将XSane Mode设置为Viewer。用户将把图形扫描到查看器里，然后让查看器运行GOCR。
　　3．将XSane设置为获取灰度或线条图像。
　　4．单击预览窗口里的Acquire Preview按钮来获取预览图象。
　　5．在预览窗口里选中要扫描的文档部分。
　　6．将扫描分辨率设置在150dpi到300dpi之间，这样会得到最佳的OCR结果。
　　7．单击Scan按钮来扫描文档。XSane会打开一个窗口来显示描的文档，这个窗口可能是很大的。
　　8．在扫描得到的文档窗口里选择File►OCR - Save as Text，程序会显示一个文件选择对话框，用户可以输入适当的文件名。
　　9．在文件选择对话框里输入文件名并且单击OK按钮。XSane不会有任何标记来表示GOCR正在运行，但它的确在运行。几秒钟之后，用户指定的文件就会创建完毕，其中包含着对应于扫描文档的文本。
　　GOCR的输出结果不一定总是满足用户要求的。在编写文章时，GOCR的版本是0.37，也就是说它是一个很早的版本。随着版本的提高，它的精确度也应该相应提高，因此如果OCR对于用户来说是十分重要，就应该常查看GOCR的站点。用户可以通过调整各种扫描参数来提高GOCR的精确度，比如调整分辨率、对比和亮度。
作者: pkncoin&发布日期:
　　网络扫描
　　SANE在设计时就考虑到了灵活性，特别是由单独的后端程序、SANE库和前端程序构成SANE的方法，让我们可以方便地用特殊方法将组件连接在一起。像scanimage这种文本模式下的扫描程序就是这种效果的一个很好的例子。另一个更生动的例子是SANE通过网络处理扫描的能力。举例来说，如果用户需要配置一组计算机，比如大学计算机中心的公共工作站，或是同一间办公室里两个职员使用的两台计算机；但是只有一台扫描仪，而且房间的大小使得屋内所有人都能够实际使用这台扫描仪。利用SANE，用户可以将扫描仪连接到一台计算机上，并且让屋内所有计算机都可以使用扫描仪，就像扫描仪直接连接到每台计算机上一样。
　　警告:网络扫描需要在连接扫描仪的算机上运行服务程序，这种操作会引入一定的危险，因此用户在实施网络扫描配置时应该多加小心。用户应该使用防火墙、TCP Wrappers或xinetd 全选项来限制对扫描仪服务器的访问。
　　建立网络扫描需要在每台计算机上进行不同的配置。最复杂的配置工作在于服务器端―直接连接扫描仪的计算机。这个系统必须运行SANE服务程序，它就是一个“中间件”，它位于控制扫描仪的后端程序与客户计算机上的前端程序之间。这个SANE服务程序被称为saned，大多数Linux将其保存在/usr/sbin。用户应该将它配置为从超级服务程序(比如inetd或xinetd)上运行。具体操作步骤如下：
　　1．配置扫描仪，使它能够在服务器上正常工作，具体方法参见前面的“配置扫描仪软件”小节。
　　2．检查是否安装了saned。它通常是sane或sane-backends软件包的一部分。如果它还没有被安装，用户就要找到并且安装适当的软件包。
　　3．根据需要在/etc/services下添加SANE端口的条目。有些Linux具有这个条目，而有些没有。如果这个条目不存。就添加如下内容：CODE:sane 6556/tcp # SANE network scanner access　　4．为saned创建一个超级服务程序配置。
　　A．Debian、Slackware和SuSE都默认使用inetd。/etc/inetd.conf中用于saned的设置如下所示，但用户应该使用自己系统上的用户名和组。CODE:sane stream tcp nowait saned.saned /usr/sbin/saned saned　　B．Mandrake和Red Hat都使用xinetd作为超级服务程宇。对于这些Linux，用户应该创建一个包含如下内容的/etc/xinetd.d/saned文件：CODE:service sane
disable =no
socket_type=stream
protocol =tcp
user =saned
group =saned
server =/usr/sbin/saned
}　　5．向超级服务程序传递SIGHUP信号。输入ps ax | grep inetd 令来查找进程ID (PID)号码，然后输入kill -SIGHUP pid命令，其中pid是前面找出的PID号码。
　　6．确保加载saned时超级服务程序所使用的用户或组存在，并且能够访问扫描仪文件。这个用户最好不具有计算机上的其他权限，而且根本就不能登录。
　　7．在/etc/sane.d/saned.conf文件里添加能够访问扫描仪的主机名称，每台主机占据文件的一行。这个文件是saned使用的主要访问控制方法。
　　现在saned服务程序应该能够对扫描请求产生响应了，但是我们需要告诉客户端如何访问这个服务程序。为此，用户需要执行如下配置过程：
　　1．在客户端下的/etc/sane.d/dll.conf文件中添加net选项，这个选项告诉客户端上的SANE库搜索网络扫描仪。
　　2．编辑客户端上的/etc/sane.d/net.conf文件，添加SANE服务程序的主机名称。
　　现在客户端可以访问扫描仪了。sane-find-scanner程序不能工作，但scanimage -L能够发现网络扫描仪：CODE:$ scanimage -L
device ‘net:scan.luna.edu:umaxl220u:/dev/usb/scanner0’is a UMAX Astra 1220U
→flatbed scanner　　我们注意到扫描仪的设备名称增加了两个元素：标识符以关键字net开始，在关键字之后是服务程序所在的主机名。用户可以将完整的扫描仪设备名称传递给需要使用扫描仪的前端程序，也可以依靠象XSane这类程序的自动检测机能。
　　提示:用户可以从非Linux操作系统上访问基于SANE服务的网络扫描仪。在/sane/sane-frontends.html 上用户可以找到用于各种操作系统的SANE前端程序的链接。特别值得注意的是用于Windows的前端程序，它们能够用于很多Windows的扫描程序。
　　外围设备通过各种端口连接到计算机，但最广泛使用而且非常灵活的三种端口是USB、RS-232串口和并行端口。总的来说，这些端口支持键盘、鼠标、调制解调器、扫描仪、打印机、移动磁盘和其它很多设备。了解如何优化这些端口有助于发挥外围设备的最佳性能。作为基术的输入设备，键盘和鼠标的配置对系统操作来说是特别重要的，用户可以利用几个配置文件和命令来调整键盘重复速率、键盘布局和支持滚轮鼠标等设置。扫描仪只是众多外围设备中的一种，但它们约配置通常不如其他设备(比如打印机)那样明显。幸运的是，Linux在它的SANE软件包里寸扣描仪提供了很好的支持，只要Linux支持用户所使用的扫描仪，用户只需要对配置文件进行少许修改就可以在Linux下扫描图像了。
作者: benny_feng&发布日期:
好东东，收藏楼主反不反对呀。呵呵
共有评论数 3/每页显示数 10
发表评论，与各位同人交流。回复请点击下方的我要评论按钮(游客可回复)，要发表贴子请点击
Linux教程下载？“”（请点击），Linux教程免费下载。
求助Linux问题？论坛有39版块，覆盖所有Linux技术层面。前往“”
　|　　|　　|　　|　　|　　|　　|　　|　　|　　|　　|　　|　
&2017 红联 Powered by SupSite}

我爱游戏网