欢迎 PaddlePaddle 加入 Hugging Face Hub

Welcome PaddlePaddle to join Hugging Face Hub.

我们很高兴与Hugging Face和PaddlePaddle开展开源合作,共同推动和民主化AI技术的发展!

PaddlePaddle于2016年由百度首次开源,使得各个技术水平的开发者都能够在规模上采用和实施深度学习。截至2022年第四季度,PaddlePaddle已经被超过535万开发者和20万家企业使用,是中国市场份额最大的深度学习平台。PaddlePaddle拥有广受欢迎的开源代码库,例如Paddle深度学习框架,跨不同模态的模型库(如PaddleOCR,PaddleDetection,PaddleNLP,PaddleSpeech),用于模型压缩的PaddleSlim,用于模型部署的FastDeploy等等。

在PaddleNLP的引领下,PaddlePaddle将逐渐将其库与Hugging Face Hub集成。您很快就能够在Hub上使用全套强大的预训练PaddlePaddle模型,涵盖文本、图像、音频、视频和多模态任务!

查找PaddlePaddle模型

您可以通过使用PaddlePaddle库标签进行筛选,在模型Hub上找到所有PaddlePaddle模型。

目前,Hub上已经有超过75个PaddlePaddle模型。例如,您可以找到我们的多任务信息抽取模型系列UIE,最先进的中文语言模型ERNIE 3.0系列,具有整个工作流程中的布局知识增强的新型文档预训练模型Ernie-Layout等等。

欢迎您还可以查看HuggingFace Hub上的PaddlePaddle组织。除了上述模型外,您还可以探索我们的Spaces,包括我们的文本到图像模型Ernie-ViLG,跨模态信息抽取引擎UIE-X和强大的多语言OCR工具包PaddleOCR。

推理API和小部件

PaddlePaddle模型可以通过推理API获得,您可以通过HTTP使用cURL、Python的requests库或您首选的网络请求方法进行访问。

支持任务的模型配备了一个交互式小部件,您可以直接在浏览器中与模型进行交互。

使用现有模型

如果您想了解如何加载特定的模型,您可以点击Use in paddlenlp(或将来的其他PaddlePaddle库),您将得到一个可用于加载模型的工作代码片段!

分享模型

根据PaddlePaddle库的不同,您可以通过推送到Hub来分享您的模型。例如,您可以使用save_to_hf_hub方法来分享PaddleNLP模型。

from paddlenlp.transformers import AutoTokenizer, AutoModelForMaskedLM

tokenizer = AutoTokenizer.from_pretrained("PaddlePaddle/ernie-3.0-base-zh", from_hf_hub=True)
model = AutoModelForMaskedLM.from_pretrained("PaddlePaddle/ernie-3.0-base-zh", from_hf_hub=True)

tokenizer.save_to_hf_hub(repo_id="<my_org_name>/<my_repo_name>")
model.save_to_hf_hub(repo_id="<my_org_name>/<my_repo_name>")

结论

PaddlePaddle是一个源于工业实践的开源深度学习平台,自2016年以来一直在开源创新和产业级项目。我们很高兴加入Hub与HuggingFace社区分享我们的工作,您可以期待我们很快会有更多有趣和最新技术的项目!要及时了解最新消息,您可以在Twitter上关注我们的账号@PaddlePaddle。