Learn more about Thesequence

FunSearch内幕:谷歌DeepMind的新LLM,能够发现新的数学和计算机科学算法

探索新的科学可能是对AI模型最完整的图灵测试新的科学方法需要复杂的推理技能,结合多个领域的知识,不断实验...

“《鲸鱼2号内部:微软教授小型语言模型推理的新方法》

在今年初,Microsoft Research推出了Orca,这是一个可以模拟其他LLM所展示的复杂推理过程的130亿参数模型具体地说,Orca是从G...

‘内部 AGENTS 用于构建半自主 LLM 代理的新开源框架’

“自主代理是基础模型生态系统中最受欢迎的话题之一像AutoGPT或BabyAGI这样的项目的早期迭代激发了开发者对……的想象力”

理解Flash-Attention和Flash-Attention-2:扩展语言模型的上下文长度的路径

扩展大型语言模型(LLM)的上下文仍然是扩大使用案例宇宙的最大挑战之一最近几个月,我们看到了Anthropic或OpenAI等供应商...

“遇见SeamlessM4T:Meta AI的新一代语音翻译基础模型”

“语音正迅速成为基础模型的下一个前沿之一尽管语言和计算机视觉等领域仍然占据头条,但语音正变得越来越重要…”

AVIS内部:Google的新视觉信息搜索LLM

多模态是基础模型研究中最热门的领域之一尽管像GPT-4这样的模型在多模态场景中展示出了惊人的进展,但仍面临着许多挑战

在XGen-Image-1之中:Salesforce Research如何构建、训练和评估一个庞大的文本到图像模型

Salesforce一直是新一波基础模型研究实验室中最活跃的之一近几个月来,Salesforce研究团队已经发布了各种不同领域的模型,比...

Google的Symbol Tuning是一种新的微调技术,它在LLMs中进行上下文学习

由于扩展语言模型,机器学习经历了一次革命性的激增,通过上下文学习实现了挑战性推理任务的完成然而,...