2015年5月8日

数字保存:不仅仅是云& Unicorns (ANLTC – NLI 29th April – 1st 可能 2015 – Report)

来宾留言者 伊莱恩·哈灵顿,特别收藏馆员, UCC图书馆

我以前参加了由 DPC 关于“数字保存入门”。这个为期三天的课程由 DPTP 是数字保存从业人员的中级课程。在过程中 埃德·平森,数字档案管理员和 斯蒂芬·泰勒,一位高级顾问 伦敦大学计算机中心 (ULCC)向我们展示了进行数字保存的工具,方法和策略。我们查看了实际示例,研究了案例研究以及具有挑战性和复杂性的对象,并参加了小组练习,以更好地理解什么是数字保存。

在三天的时间里,有段时间我以为自己在另一个世界中,首字母缩略词占主导地位(AIP,SIP,DIP, JHOVE,PLATO,SCAPE,SCOUT,METS,MODS,TDR)或《星球大战》’设置(恒定引用DROID)或查看古董车(寻找零件以替换汽车或旧技术中的磨损的并行情况)。到第三天结束时,我开始回到地球。

该课程分为多个模块,每个模块持续约45分钟。尽管该课程是密集课程,但仍有很多机会提出问题,并且Ed和Steph包括了很多示例。在某些时候,例如当我们讨论时‘migration’在数字保存方法中,我们注意到‘migration’还将以文件格式显示,并作为‘迁移策略练习。 ’

由于这三天中涉及的概念和信息非常多,因此无法撰写所有模块。

什么是数字保存?
根据邱园国家档案馆的说法,数字保存政策是档案馆的一项任务,即通过结构化和管理的数字保存策略来支持数字记录的保存。”实际上,数字保存需要以下内容:
一个数据库来管理保存和存储元数据
执行提取功能的工具
一个存储数字对象的地方
访问或交付平台
规则,工作流程,政策
IT基础架构
人与技能

OAIS模型
Ed和Steph使用了 OAIS模型 及其在整个课程中的用语,以阐明数字保存过程。

礼貌的 伦敦大学计算机中心



Day 1
在第一天,我们检查了OAIS模型是什么以及使用它的一些含义。这很有用,因为它将在接下来的三天内用于某些小组练习中,并且我们将使用适当的术语。本节后面是有关数字保存和练习方法的模块;重要属性和绩效模型;文件格式:其结构和处理方式;和从业者的元数据。重要属性取决于文件类型:运动图像有16个重要属性,而音频有6个重要属性。

It was clear from the exercise on digital preservation methods that while we understood what was being said to us it was another matter entirely to be given a method 和 to discuss the pros 和 cons of that method. Approaches included: 移民, emulation 和 technology preservation. The group I was in was given the bit-level only approach which focuses on maintaining only the 1s 和 0s of code.

礼貌的 伊莱恩·哈灵顿


当Ed说某人(不在课程中!)认为保存技术的一种方法是将笔记本电脑浸入Perspex,然后在20年后淘汰时,这有点令人担忧。如果计算机规格已知并且20年后3D打印机仍然存在’也许有可能3D打印修复物理技术所需的任何零件。

真实的例子用来解释每个模块。例如 迪奥斯里 用来演示仿真的工作原理。国立图书馆&荷兰的档案馆使用DIOSCURI运行旧的操作系统,例如DOS和WordPerfect 5.1。

礼貌的 伦敦大学计算机中心


Ed和Steph还提到了Atari系统和Pac-Man。 剑桥计算机历史中心 通过探索个人计算机发展的历史,社会和文化影响来讲述信息时代的故事。

礼貌的 剑桥计算历史中心。


Day 2
On the second day we covered XML格式for digital preservation; tools for ingest; how to do 移民 including an exercise; METS; PREMIS 和 an exercise; making a business case 和 an exercise; assessment, audit 和 TDR.

XML是可扩展标记语言。像HTML一样,XML使用标签,而HTML描述表示XML描述内容。可能有:
XML模式,其中包含要使用的元素和标签的规范。在数字保存计划中,必须声明正在使用的架构。
XML样式表,用于显示基础XML并以对读者有用的方式呈现文本
XML文档是您正在编写的文档,它描述了对象。

XML是一种可保存的文本格式,因为它是开放的,有文档证明的,并且与供应商或平台无关。这对于存储和传输元数据都很好。元数据有不同类型:描述性,技术性,权利,结构性和保留性,XML可以用来描述它们。国会图书馆使用XML表示MARC,MODS和METS中的元数据记录。 XML可以封装一个数字对象,并用于构建和AIP(请参阅OAIS模型)。 XML允许互操作性。

礼貌的 伦敦大学计算机中心


XML格式& Migration
仅仅对文件进行数字保存还对元数据进行数字保存是不够的。元数据可以在数据库内与对象分开存储,也可以将元数据嵌入需要保存的文件中。元数据可用于源文件格式,以及在迁移到新的目标文件格式时(例如,将单词移动到pdf)。迁移演习就像搏击俱乐部:总会有损失。我们必须决定何时迁移可能丢失的东西,什么是可接受的损耗,什么不应该丢失的东西(例如重要属性)以及需要做出什么选择以便仅发生可接受的损耗。 Ed和Steph建议在迁移之前做非常详细的用例。

Day 3
第三天,我们看了元数据练习;电子邮件保存;社交媒体:与用户社区进行交流;社交媒体:用户社区和参与度;了解有关保存和获取的法律问题;保存数据库;和托管存储。

元数据练习
在纸上,我们看到了一幅画及其博物馆编目记录。这幅画已被数字化并且存在元数据。元数据中存在空白,需要识别,还需要哪些保存数据。此练习强调了无论元数据的来源如何,都不会出现某些元数据。

礼貌的 伊莱恩·哈灵顿


云储存
云存储提供商应符合ISO标准,并应注意审核标准。演习中的讨论表明,拥有云存储的机构至少应将持有量限制在欧盟范围内。如果将资料保存在云上并转移到美国,则它受制于不同的版权法和不同的数据保护。版权法尚未赶上数字内容。确实,如果数字保存项目得到欧盟的资助,则可能需要将存储,云或其他方式留在欧盟。云公司不’提及对象将被存储多长时间,并考虑技术变化有多快(谁还记得VHS或Betamax?),对象是否需要在很短的时间内建立新的数字保存存储设施?同样值得关注的是成本:将对象插入云存储可能需要很少的钱,但是从云存储中提取对象可能需要很长时间,并且要花费更多的钱。如果请求一个对象,它将通过多个国家’在到达目的地之前?随着云提供商定期移动数据,可能会发生这种情况。 我们建议您务必仔细阅读细则!

结论
数字保存比将对象放置在云存储中要多得多,所有过程和细节都是真实的,而不像独角兽那样虚构。无论选择哪种数字保存方法,无论选择哪种存储方法进行数字保存,以及在此过程中使用哪种工具,都需要进行大量讨论。显然,我们所有人都应该参与数字保存,并且我们现在应该参与。

感谢Ed Pinsent和Steph Taylor如此自由地分享他们的经验和专业知识。可通过知识共享和UCLC获得这些幻灯片。也感谢 美国国家训练中心 NLI 用于组织和举办活动。

0 comments:

发表评论