模型卡片
Model Card
介绍
模型卡是理解、共享和改进机器学习模型的重要文档框架。当做得好时,模型卡可以作为边界对象,一个能够被具有不同背景和目标的人们访问的单一工件,包括开发人员、学生、政策制定者、伦理学家和受到机器学习模型影响的人们。
今天,我们发布了一个模型卡创建工具和一个模型卡指南,详细介绍如何填写模型卡、用户研究和机器学习文档的最新进展。这项工作是在许多其他人和组织的基础上进行的,重点是包容具有不同背景和角色的人们。我们希望它成为改进机器学习文档的一块垫脚石。
总之,今天我们宣布发布以下内容:
-
一个模型卡创建工具,用于简化卡片创建过程,无需编程,并帮助团队共享不同部分的工作。
-
一个更新的模型卡模板,发布在
huggingface_hub
库中,汇集了学术界和整个行业的模型卡工作。 -
一个带注释的模型卡模板,详细说明如何填写卡片。
-
关于Hugging Face模型卡使用的用户研究。
-
模型文档的现状分析和文献综述。
迄今为止的模型卡
自从Mitchell等人(2018年)提出了模型卡的概念,受到了自然语言处理数据陈述(Bender和Friedman,2018年)和数据集数据表(Gebru等人,2018年)等主要文档框架工作的启发,机器学习文档的领域已经扩展和演变。已经提出和开发了大量数据、模型和机器学习系统的文档工具和模板,反映了数百名研究人员、受影响社区成员、倡导者和其他利益相关者的不可思议的工作。关于机器学习文档与负责任人工智能变革理论之间关系的重要讨论也影响了机器学习文档生态系统的发展。
迄今为止,在机器学习的文档工作中为不同的受众提供了许多想法。我们将这些想法中的许多汇集到了今天分享的工作中。
我们的工作
我们的工作展示了模型卡目前的现状以及未来的发展方向。我们对日益增长的机器学习文档工具的现状进行了广泛的分析,并在Hugging Face内进行了用户访谈,以补充我们对模型卡的各种观点的理解。我们还为Hugging Face Hub上的机器学习模型创建或更新了数十个模型卡,并根据所有这些经验,提出了一个新的模型卡模板。
标准化模型卡结构
通过我们的背景研究和用户研究,进一步讨论可在指南中详细了解的内容,我们旨在为“模型卡”建立一个新的标准,这个标准可以被普通公众所理解。
根据这些发现,我们创建了一个新的模型卡模板,不仅标准化了HF模型卡的结构和内容,还提供了默认的提示文本。这些文本旨在帮助撰写模型卡的各个部分,特别是偏见、风险和限制部分。
可访问性和包容性
为了降低创建模型卡的门槛,我们设计了模型卡撰写工具,这是一个具有图形用户界面(GUI)的工具,使具有不同技能和角色的人们和团队能够轻松合作创建模型卡,无需编码或使用Markdown。
这个撰写工具鼓励那些尚未撰写模型卡的人更轻松地创建它们。对于那些之前撰写过模型卡的人,这种方法邀请他们补充提示的信息,同时将伦理组成部分置于核心位置。
随着机器学习与不同领域的日益交织,以可访问性、伦理和包容性为中心的协作和开源机器学习流程是机器学习生命周期的重要组成部分,也是机器学习文档的垫脚石。
今天的发布是机器学习文档工作的一个组成部分:数据和模型文档已经被许多技术公司采用,包括Hugging Face 🤗。我们优先考虑了数据集卡和模型卡的“存储库卡”,重点关注多学科领域。在这一工作线上继续努力,模型卡创建UI工具注重包容性,提供格式化指导和提示,以便为具有不同背景的人们创建模型卡。
呼吁行动
让我们展望未来
这项工作是对模型卡片当前状态的”快照”,它基于对许多机器学习文档工件实例化方式的景观分析。模型手册和这些发现代表了在当前状态和更具抱负的模型卡片愿景方面的一个观点。
- Hugging Face生态系统将继续通过代码和用户界面来推进模型卡片的创建方法,包括将更多功能直接集成到存储库和产品中。
- 随着我们进一步开发模型工具,例如在Hub上进行评估,我们将将它们的使用集成到模型卡片的开发工作流程中。例如,随着跨分解因素自动评估模型性能变得更加容易,这些结果将能够导入到模型卡片中。
- 还有进一步研究可以推动研究模型和模型卡片的配对,例如构建研究论文→模型文档的流水线,使从论文到模型卡片的创建变得轻松。这将允许更广泛的跨领域覆盖和更进一步的模型文档标准化。
我们将继续学习有关模型卡片的创建和使用方式以及卡片对模型使用的影响。根据这些学习,我们将进一步更新模型卡片模板、说明和Hub集成。
在努力纳入更多声音和利益相关者的模型卡片使用案例时,请收藏我们的模型卡片编写工具并尝试一下!
我们很期待了解您对模型卡片、我们的模型卡片编写GUI以及人工智能文档如何支持您的领域的想法。🤗
致谢
没有Omar Sanseviero、Lucain Pouget、Julien Chaumond、Nazneen Rajani和Nate Raw的广泛贡献,本发布将无法实现。