介绍DOI:数字对象标识符(Digital Object Identifier)用于数据集和模型

DOI是数字对象标识符,用于数据集和模型

在Hugging Face,我们的使命是使良好的机器学习变得民主化。这包括采用最佳实践,使机器学习模型和数据集更具可重复性,更好地记录和易于使用和共享。

为了解决这个挑战,我们很高兴地宣布,现在您可以直接从Hub生成您的模型或数据集的DOI

您可以直接从存储库设置中生成DOI,并且任何人都可以通过在您的模型或数据集页面上点击“引用此模型/数据集”来引用您的工作🔥。

DOI简介及其重要性

DOI(数字对象标识符)是唯一标识数字对象的字符串,可以是任何东西,从文章到图表,包括数据集和模型。DOI与对象的元数据相关联,包括对象的URL、版本、创建日期、描述等。它们是研究和学术界对数字资源的普遍接受引用;它们类似于图书的ISBN。

DOI使查找模型或数据集的信息更加容易,并通过永久链接与世界共享,永不过期或更改。因此,具有DOI的数据集/模型旨在永久存在,只能在向我们的支持部门提出请求后才能删除。

Hugging Face如何分配DOI?

我们与DataCite合作,允许注册的Hub用户为其模型或数据集请求DOI。一旦填写了必要的元数据,他们将收到一个全新的闪亮DOI🌟!

如果模型或数据集有新版本,DOI可以轻松更新,先前版本的DOI将过时。这使得可以引用特定版本的对象变得容易,即使它已经发生了变化。

有关我们可以进行更多改进的想法吗?许多功能就像这样,都来自社区的反馈。请给我们留言或在Twitter上@HuggingFace上给我们发推文,分享您的想法或在huggingface/hub-docs上提开一个问题🤗

感谢DataCite团队的合作!还要感谢Alix Leroy、Bram Vanroy、Daniel van Strien和Yoshitomo Matsubara在这个hub-docs GitHub问题上开始和促进讨论。