为什么LLaVa-1.5是开源人工智能的伟大胜利

为什么LLaVa-1.5成为开源人工智能的伟大胜利

战争变得多模式

Photo by svklimkin on Unsplash

我已经多次谈论过开源和私有模型之间的人工智能战争,但结果似乎是一样的。

开源看起来很棒,充满了希望,但往往是一种空想和不切实际。

现在,情况可能已经改变了。

Source: Dall-e3

微软与威斯康辛大学麦迪逊分校和哥伦比亚大学一起推出了最新版本的 LLaVa 模型,即 LLaVa-1.5。

LLaVa 是首批真正出色的大型多模式模型 (LMMs) 之一,已经进行了升级,结果非常令人印象深刻,考虑到它的体积比 GPT-4 Vision 这样的模型小了数个数量级,而且我指的是数百倍。

最近发布的论文不仅向我们展示了最先进的多模式模型是如何构建的,还成功地证明了整个行业的错误。

是的,所有人都对开源有所误解,包括我在内。

这篇文章最早几天之前在我的免费每周通讯中发表,即 TheTechOasis

如果您想要跟上人工智能的迅猛发展,同时感到受到启发以采取行动,或者至少为我们前方的未来做好准备,那么这是适合您的。

🏝请在下方订阅🏝,成为同行中的 AI 领军人物,并接收其他平台上没有的内容,包括 VoAGI:

订阅 | TheTechOasis

AI 领域的先驱通讯

thetechoasis.beehiiv.com

哦,我的甜蜜嫁接

首先,我们必须澄清多模态是什么,因为这个词经常被随意使用。

多模态的真正含义