2012年5月14日

Libfocus Journal Club - 使用FRBR和链接数据改进图书馆数据的演示

以下帖子是libfocus上的一个新功能:虚拟期刊俱乐部。请随时对下面链接的文章进行评论。

使用中改进图书馆数据的演示 FRBR. 和链接数据 由Anne-Lena Westrum,
Asgeir rekkavik和Kimtallerås

抽象的

当库最终用户搜索在线目录以进行工作 由一个特定的作者,他通常会收到一个包含的长名单 那个作者的所有书籍的不同翻译和版本, 按标题或问题日期进行排序。试图赚取一些订单 Pode Project,Pode Project应用了一种自动冻结的方法 根据MARC记录中包含的信息。该项目有 还尝试了RDF代表,以展示作者的方式’s 完整的生产可以作为简短和清晰的清单呈现 独特的作品,可以轻松地由他们的不同表达式浏览 和表现。此外,通过将数据集中的实例链接到 匹配或相应的外部集中的实例,演示文稿 已经丰富了有关作者和作品的更多信息。
Anne-Lena Westrum,Asgeir Rekkavik和KimTallerås

这里提供全文


作者 使用了一个新的公共图书馆的建筑作为探索他们的元数据如何以有助于提高用户体验的方式使用的方法。他们使用了一个作者的工作来检查通过目录访问他的工作是多么容易。他们发现的核心问题是他们现有的目录没有区分作者的作品和不同版本的一项工作。作者的中央假设是,顾客通常只关心寻找他们对此感兴趣的标题,而不是特定版本的工作。

他们发现现有的MARC记录不适合此目的,因此开发了一种工具,用于自动化碎片 现有的MARC记录。不幸的是,现有的MARC记录的巨大清理过程必须在碎解之前进行。当新的和丰富的数据集完成后,该项目开发了一个Web应用程序,以允许最终用户通过从A中选择来浏览该部分集合的这一部分工作列表更短。

他们的最终结论是,虽然图书馆可能会发现它诱人诱人皈依元数据质量的现代原则 - 如rdf-这可能是一种乏味而长的方法。他们单独的清理服用了60小时的劳动力,他们只是在一个非常有限的数据集上工作。然而,作者确实表明,通过这个过程实现了最终用户的积极结果,但是艰苦的。我认为这对几个小时的投资似乎是一个相当有限的结果。这里的关键问题是,这不是一个完整的图书馆目录,只有一个小的比例;因此,问题是实现现代元数据标准的时间和努力的支出

1条评论:

  1. 不错的选择ronan,谢谢:)

    当他们说明这一点时,我认为作者在头上击中了钉子“一个人不能根据现有的元数据创建更好的服务,而不是元数据的质量将支持”。随着时间的推移和现有MARC记录的编目实践中的不一致性使自动化的碎片(或确实任何转换)是一种耗时的挑战。附录甚至突出显示了物质人为错误问题,例如需要在245字段(!)中纠正拼写错误,并不正确的ISBD语法。清理如此的基本错误显然是理想的,即使没有易碎过程,但质量差或不准确的元数据可能不会对所有目录(*一厢情愿思维*)那么普遍。因此,由于在这种情况下,成本可能不一定像作者一样重要。

    效率和可用性从被呈现有40个工作,而不是585个结果在我的观点中非常有价值。如果用于搜索的接入点继续从库目录中转移,并且还向资源发现图层提供,这也提供了杂乱的分组,在此上下文中查看您的目录也是有意义的。但是,较大的库可能有时间和资源来清理其元数据,但对于用户经常使用的较小库‘check the shelf’方法,清理记录和元数据可能产生很少的有形益处,特别是鉴于所涉及的潜在成本。

    回复删除