‘Hugging Face Hub 中的 Sentence Transformers’

Hugging Face Hub 中的 Sentence Transformers

在过去的几周中,我们与机器学习生态系统中的许多开源框架建立了合作关系。其中一个让我们特别兴奋的是Sentence Transformers。

Sentence Transformers是一个用于句子、段落和图像嵌入的框架。这使得我们可以得到语义上有意义的嵌入(1),这对于语义搜索或多语言零样本分类等应用非常有用。作为Sentence Transformers v2版本的一部分,有许多很酷的新功能:

  • 轻松在Hub中共享您的模型。
  • 用于句子嵌入和句子相似度的小部件和推理API。
  • 提供更好的句子嵌入模型(在Hub中的基准和模型)。

在Hub中有超过90个预训练的Sentence Transformers模型,覆盖100多种语言,任何人都可以从中受益并轻松使用它们。预训练模型可以使用几行代码直接加载和使用:

from sentence_transformers import SentenceTransformer
sentences = ["Hello World", "Hallo Welt"]

model = SentenceTransformer('sentence-transformers/paraphrase-MiniLM-L6-v2')
embeddings = model.encode(sentences)
print(embeddings)

但不仅如此。人们可能还想要轻松地演示他们的模型或尝试其他模型,因此我们很高兴地宣布在Hub中发布了两个新的小部件!第一个是feature-extraction小部件,显示句子嵌入。