2012年5月3日

数字化遗产言论

相当几个图书馆出来了模拟,硬通格式的论文。在许多情况下,他们可供学生参考图书馆访问。在整个学年中需求各种各样,但在最后一年的学生对他们的项目上工作时,往往会在时间内和周围的峰值。关于这个问题的半空架子和疯狂的询问或本文是典型的讲解标志。

摆脱硬拷贝并用数字化版本替换它们有很好的理由。
  • 在图书馆货架上创建空间
  • 消除了丢失和可能不可替代的论文的事件
  • 通过在线归档能够安全和永久访问
  • 促进多用户访问(可以满足波动需求)
  • 可以更轻松地检索e-ches(全文可搜索,可通过OPAC / Online Archive访问)
  • 抄袭风险显着减少(所有作品变得透明和可追溯)
  • 搁架负荷减少(备用员工时间)
  • 减少年度股票工作量(数量减少)

但也有风险。过去几天的学生仍然拥有其作品的版权。可以说,追逐这些学生让他们分享他们的版权(通过,例如,创造性的公共许可证)往往不实用。出于这个原因,提供公众,全文开放访问存档作品可能成为一个问题。解决方案是限制校园IP范围内的访问。从转换过程的视图,只有足以承受的鲁棒牢固的文字可以可公开处理手动处理。因此,剩下的套装仍然可能最终坐在架子上。

I’d想强调那里’在迅速实现转换项目时,没有正确或错误的工作流程。当地条件,如资金,可用设备,时间等。以下是我如何通过对我提供的工具来实现这项工作的简要概述了这项工作(最近推出)。

可用的设备:
  • Fujitsu Fi-6140多板,高速扫描仪
  • Adobe Acrobat Pro 9(不是ACOS的理想选择’SOCR校正功能最多是狡猾的; ab is king)
涉及的步骤(高级大纲):
  1. 拆卸和准备扫描源文件
  2. 扫描300dpi(通用捕获图)
  3. 插入版权免责声明
  4. 调整图像尺寸(裁剪图像等)
  5. 保留未压缩/无损.pdf主文件
  6. 优化文件大小
  7. 转换为PDF / A-1B
  8. 在存储库中发布项目
  9. 清理库管理系统中持有的现有目录记录,并嵌入全文链接指向存档的项目
关于OCR的一个注释......
一个目标是尽可能地实现全文索引。但是,它’重要的是强调occring旨在找到/搜索能力而不是原始来源的真实副本。 OCR几乎没有理解布局,格式,字线 - 段落结构等。

关于PDF / A-1B的注释......
PDF / A标准定义了在不同平台上的PDF格式中长期存档电子文件的规定。必须包含PDF / A文件中的所有内容,以便在很长一段时间内可靠地实现文件的观看或打印文件。 PDF / A-1B要求显示或打印文档所需的所有页面内容和资源都包含在PDF文件中。页面内容不必构建。每当没有满足内容时,建议使用PDF / A-1B,如在没有结构信息的情况下创建的扫描文档或PDF中。

从开始结束时处理论文需要多长时间?同样,这取决于包括源文档的条件,扫描仪速度,OCR速度等的各种变量。我对转换过程的每个步骤进行了分解并定时。平均约55次–每篇论文80页,每篇论点约45分钟(给予或采取)。

清楚地,在这里的底线是一些输入涉及将传统词从模拟到数字转移。然而,基本的利益不仅仅是依据所涉及的努力。

0 comments:

发表评论