什么是材料扫描件?
“材料扫描”,一般是指将纸质材料上的文字、表格、图片等经扫描设备扫描进电脑,形成电子版。 利用扫描件来收集资料,具有方便、快捷,可保存,可重复利用和检索等优势。特别是对于大量需要录入文档的岗位来说,效率非常高! 那么如何实现将纸质版材料快速电子化呢?
方法1.人工录入法 用摄像机或手机拍下需要录入的文档,再转成电子文档的方式进行处理。虽然简单,但过程繁琐,效率低下且易出错。 方法2.借助扫描仪或扫描软件 通过扫描的方式把需要的材料扫描进去得到pdf文件。
如果是有扫描功能的手机或相机,可直接拍照扫描;如果没有扫描功能,则需使用扫描工具进行扫描。 扫描完后,需要使用OCR识别技术对扫描的文件进行文本内容识别,将图片中的文字转换成可编辑的格式。 最后,再把识别出的文字粘贴至Word中,完成材料的电子化工作。 但是这种方法得到的文字只是一串字符,并没有考虑文字与标点符号的位置信息,因此无法准确还原文件的原文本意。
而且,对于复杂图像中所包含的文字,这类软件识别人名地名机构名称等未登录词以及排版变化等复杂特征的能力较差,会存在识别率较低的问题。 方法3.利用PDF转换器 在网上搜索下载一个PDF转换器安装到电脑端,然后开启程序,选择“文件转Excel”的功能按钮,进入到操作界面后添加需要转换的PDF文件。
之后设置输出路径,点击开始转换即可。这样就能将PDF里的内容完整转到Excel里。 但是这种软件广告较多,每次打开都会有弹窗出现,比较烦人。而且部分软件可能会自带病毒或者窃取用户隐私的木马,在运行时一定要小心谨慎。