这篇AI论文发布了对开源大规模语言模型的详细评价,这些模型声称在不同任务中赶超或超越了ChatGPT
研究文章详细评价了开源大规模语言模型,在多种任务中超越甚至超过了ChatGPT
“`html
去年ChatGPT的发布引起了人工智能界的轰动。基于GPT的Transformer架构,这是最新的大型语言模型,ChatGPT在学术和商业应用上都产生了重大影响。该聊天机器人可以轻松回应人类,生成内容,回答查询,并通过利用人类反馈的增强学习(RLHF)和监督微调进行指导。
在最近的研究中,新加坡国立大学,SalesForce AI和I2R的研究团队进行了一项广泛的调查,以编制关于开源大型语言模型(LLM)的最新研究,并提供ChatGPT在各种环境下与其相当或更好的模型的完整概述。ChatGPT的发布和成功导致了LLM相关研究的激增,因为学术界和产业界观察到了大量新的LLM,这些LLM经常来自专门从事此领域的初创企业。
虽然像Anthropic的Claude这样的闭源LLM普遍比开源LLM表现得更好,但OpenAI的GPT等模型发展得更快。越来越多的声音声称在某些任务上达到了相等甚至更好的性能,这使得闭源模型在历史上的主导地位受到了威胁。
- Perplexity 推出两个新的在线 LLM 模式:‘pplx-7b-online’ 和 ‘pplx-70b-online’
- 数据建模对于数据工程师来说
- 发现LangChain:与您的文件聊天,聊天机器人翻译器,与维基百科聊天,合成数据生成器
从研究的角度来看,新开源LLM不断发布和其所声称的成功迫使人们重新评估这些模型的优点和缺点。开源语言建模软件的发展给希望将语言模型纳入业务运营的组织带来了与业务相关的挑战。由于可以获得与专有替代品相媲美或更好性能的可能性,企业现在在选择最佳模型时有更多的选择和选择。
该团队分享了三个主要类别,用于描述他们调查的贡献。
- 评估综合:调查汇编了各种关于开源LLM的评估,以便对这些模型与ChatGPT基准之间的优劣势提供客观全面的观点。这种综合使读者对开源LLM相对于ChatGPT的优点和缺点有全面的了解。
- 模型的系统审查:检验了在各种任务上进行得和ChatGPT一样好或更好的开源LLMs。此外,团队还分享了他们的网页,他们将实时更新,以便读者可以看到最新的变化,这反映了开源LLM发展的动态性。
- 建议和见解:除了评论和评估,调查还提供了有关影响开源LLM发展的模式的深入信息。它还讨论了这些模型的潜在问题,并探讨了教育开源LLM的最佳实践。这些发现为现有的上下文和未来潜力提供了详细的视角,满足了企业界和学术界的需求。
“`