Jais:阿拉伯语-英语大型语言模型的重大突破

Jais Breakthrough in Arabic-English large-scale language model

来源:MBZUAI

新闻

Inception、MBZUAI和Cerebras的开创性合作

罗伯托·伊里昂多撰稿

纽约,纽约州——2023年8月30日:在一项合作努力中,Inception(G42旗下公司)、穆罕默德·本·扎耶德人工智能大学(MBZUAI)(全球首个研究生级别的人工智能研究大学)和Cerebras共同开发了Jais——一个专门用于阿拉伯语和英语语言处理任务的130亿参数生成式预训练变压器(GPT)模型。该模型是在Condor Galaxy 1(CG-1)平台上开发的,这是由G42和Cerebras共同开发的高容量人工智能超级计算机。CG-1具有多个艾克斯字节级的计算能力,并作为Jais的训练基础设施。

这一发展对于G42与Condor Galaxy的持续合作具有实际意义。该模型将通过专用的实时聊天界面提供,并计划将其纳入Hugging Face模型库。Jais旨在满足阿拉伯语使用者的巨大用户群体需求,据估计该群体超过4亿人,从而填补了该人口群体高级语言模型的空白。

来源:Cerebras, G42, MBZUAI
来源:Cerebras, G42, MBZUAI

为什么需要一种阿拉伯语大型语言模型(LLM)?

Jais的开发填补了人工智能领域的一个长期空白,专注于阿拉伯语,这是全球25个国家有超过4亿人口使用的语言。虽然许多公司都在讨论“普惠人工智能”的概念,但Jais项目通过提供实质性的、数据驱动的阿拉伯语解决方案,超越了口头宣传。通过以Apache 2.0许可证的形式开源该模型,我们旨在推动阿拉伯语言AI生态系统的发展。Jais项目有望成为其他在人工智能领域代表性不足的语言的典范,从而为语言包容性设定新的标准。