Learn more about language model - Section 12
稳定AI宣布发布StableCode:它的第一个LLM生成式AI编码产品
稳定AI刚刚推出了一款名为StableCode的改变游戏规则的产品,标志着其在AI辅助编码方面的首次亮相。StableCode旨在为经验丰富...
隐喻 API:为 LLM 构建的革命性搜索引擎
互联网曾经是一个乌托邦,每个人都可以获取关于任何话题的最新信息。然而,为争夺用户的注意力,网站已经变得扭曲。Metaphor...
这项AI研究介绍了LISA:大型语言指导分割助手,它继承了多模式大型语言模型(LLM)的语言生成能力
想象一下,你想喝咖啡,然后你指示一个机器人来制作。你的指示包括“制作一杯咖啡”,但不包括“去厨房,找到咖啡机,然后打开它...
AI是否变得太人类化了?谷歌AI的研究人员发现,LLMs现在可以仅通过工具文档使用ML模型和APIs!
在这个人工智能似乎正在接管地球的时代,大型语言模型比以往更接近人类大脑。谷歌的研究人员证明了大型语言模型可以以零样本...
遇见Retroformer:一种优雅的AI框架,通过学习插件回顾模型来迭代改进大型语言代理
一种强大的新趋势出现了,即将大型语言模型(LLMs)增强为能够独立进行活动并最终为目标提供服务的自主语言代理,而不仅仅是...
一致性AI视频编辑器已经到来:TokenFlow是一种使用扩散特征进行一致视频编辑的AI模型
扩散模型是您现在应该熟悉的内容。它们在过去一年中成为人工智能领域的关键话题。这些模型在图像生成方面取得了显著的成功,...
想象一下,用任何LLM代替OpenAI,而且只需要一行代码!来见识一下Genoss GPT:一个与OpenAI SDK兼容,并且建立在像GPT4ALL这样的开源模型之上的API
Genoss GPT是一种先进的语言模型,通过数千行代码和数千行文本的广泛改进,能够产生比早期语言模型更有组织、更具信息性和更...
“大型语言模型能帮助视频中的长期动作预测吗?介绍AntGPT:一个用于基于视频的长期动作预测任务的AI框架,将大型语言模型纳入其中”
从视频观察中,研究侧重于长期动作预测(LTA)任务。对于一个感兴趣的参与者在一般较长的时间范围内的动词和名词预测序列是其...
LightOn AI发布了Alfred-40B-0723:一种基于Falcon-40B的新开源语言模型(LLM)
在一次开创性的举措中,LightOn自豪地宣布推出Alfred-40B-0723,这是一种基于Falcon-40B的创新开源语言模型(LLM)。这款最先...
“遇见CREATOR:一种新颖的AI框架,通过文档和代码实现,赋予LLMs创造自己的工具的能力”
大型语言模型(LLMs)近年来取得了显著进展,如GPT-3、Codex、PaLM、LLaMA、ChatGPT以及更近期的GPT4。由于这些模型在上下文...
认识LEVER:一种简单的人工智能方法,通过学习验证生成的程序和执行结果来改进语言到代码生成
大型语言模型(LLMs)最近取得了重大进展。这些模型在人工智能领域有着重要的推动作用,并具有完成各种任务的巨大潜力。从模...
CMU的一项新的人工智能研究提出了一种简单而有效的攻击方法,可以导致对齐的语言模型生成令人反感的行为
像ChatGPT、Bard AI和Llama-2这样的大型语言模型(LLM)可能会生成不良和冒犯性的内容。想象一下有人向ChatGPT询问如何操纵选...
遇见ToolLLM:一种数据构建和模型训练的通用工具使用框架,增强了大型语言模型的API使用
为了高效地连接众多工具(API)并完成困难的任务,工具学习试图利用大型语言模型(LLMs)的潜力。通过与API连接,LLMs可以显...
使用OpenAI和Langchain的语言电子邮件撰写器Web应用程序
介绍 在本文中,我们将看到如何使用OpenAI和Langchain构建一个Web应用程序。这个Web应用程序可以将非结构化的电子邮件转换为...
大型语言模型作为税务律师:这篇人工智能论文探讨了大型语言模型在应用税法方面的能力
人工智能取得了进展。大型语言模型(LLMs)是快速进展的地方。现代LLMs可以使用工具、规划和通过标准化评估。但即使对于其创...
揭开作者面纱:AI还是人类?探索IBM创新的文本检测工具中AI取证的出现
在人工智能快速发展的时代,一个重要的挑战需要关注:生成式人工智能的透明度和可信度。IBM的研究人员致力于为世界提供AI检测...
遇见 Skill-it:一种基于数据驱动的技能框架,用于理解和训练语言模型
大型语言模型(LM)在编写源代码、创作艺术作品和与人交谈方面具有非凡的能力。用于训练模型的数据使它们能够执行这些任务。...
认识QLORA:一种高效的微调方法,可以降低内存使用量,使得在单个48GB的GPU上微调一个65B参数的模型,并保持完整的16位微调任务性能
大型语言模型(LLM)可以通过微调来改进,这也允许添加或删除所需的行为。然而,微调大型模型成本过高;例如,一个65B参数的L...
LLM(大型语言模型)用于更好地开发者学习您的产品
探索如何利用LLM(大型语言模型)和LLM应用程序来提高开发者教育的效果和效率,从而提升您产品的利用率
使用LangChain、Activeloop和DeepInfra逆向工程Twitter算法的简明英文指南
在本指南中,我们将对Twitter的推荐算法进行逆向工程,以更好地理解代码库并提供洞察力,从而打造更好的内容
- You may be interested
- 使用StarCoder创建一个编码助手
- 步调、努力和耐力
- “中风让她在30岁失去了说话能力多年后,人...
- Samet被ACM SIGSPATIAL终身影响奖表彰
- 罪犯们已经创建了他们自己的ChatGPT克隆
- 谷歌AI研究呈现Translatotron 3:一种新颖...
- 一个新的AI研究介绍了AttrPrompt:一种用...
- AI对齐的两面性
- 解码情绪:用EmoTX,一种新的基于Transfor...
- 普林斯顿大学和Meta AI的研究人员介绍了Me...
- “认识Ego-Exo4D:一套支持视频学习和多模...
- OpenAI对人工智能安全的方法
- MIT发布了一款革命性的人工智能工具:通过...
- 用RAG增强LLMs
- DeepMind 推出 AlphaDev:一种深度强化学...