‘Hugging Face Hub 中的 Sentence Transformers’
Hugging Face Hub 中的 Sentence Transformers
在过去的几周中,我们与机器学习生态系统中的许多开源框架建立了合作关系。其中一个让我们特别兴奋的是Sentence Transformers。
Sentence Transformers是一个用于句子、段落和图像嵌入的框架。这使得我们可以得到语义上有意义的嵌入(1),这对于语义搜索或多语言零样本分类等应用非常有用。作为Sentence Transformers v2版本的一部分,有许多很酷的新功能:
- 轻松在Hub中共享您的模型。
- 用于句子嵌入和句子相似度的小部件和推理API。
- 提供更好的句子嵌入模型(在Hub中的基准和模型)。
在Hub中有超过90个预训练的Sentence Transformers模型,覆盖100多种语言,任何人都可以从中受益并轻松使用它们。预训练模型可以使用几行代码直接加载和使用:
from sentence_transformers import SentenceTransformer
sentences = ["Hello World", "Hallo Welt"]
model = SentenceTransformer('sentence-transformers/paraphrase-MiniLM-L6-v2')
embeddings = model.encode(sentences)
print(embeddings)
但不仅如此。人们可能还想要轻松地演示他们的模型或尝试其他模型,因此我们很高兴地宣布在Hub中发布了两个新的小部件!第一个是feature-extraction
小部件,显示句子嵌入。