在非洲和中东地区遇见五位生成式人工智能创新者
遇见五位生成式人工智能创新者' (Meet five generative AI innovators in Africa and the Middle East)
从非洲西海岸到阿拉伯沙漠的东部,企业家们正在培育生成式人工智能。
Gen AI是科菲·根菲(Kofi Genfi)和尼·奥赛(Nii Osae)15年前在加纳首都阿克拉高中相识以来筹划的最新大计划。阿克拉坐落在几内亚湾上。
“我们观察到过去几年中这股最新的人工智能浪潮的到来,”软件工程师奥赛说道,他在大学期间发现了自己对机器学习的热情。
![](https://blogs.nvidia.com/wp-content/uploads/2023/08/Nii-and-Kofi-of-Mazzuma-CROP-596x500.jpg)
因此,去年底,他们将已经处理过1.5亿美元交易的移动支付创业公司Mazzuma扩展到了MazzumaGPT。
这个大型语言模型(LLM)是在两种流行的区块链语言上进行训练的,因此它可以帮助开发人员快速起草智能合约,这是国际数据公司预计明年可能达到190亿美元的Web3市场。
数千次点击
在第一个月,来自70个国家的400名开发人员使用了这个拥有1750亿参数的LLM,参数是模型大小和强度的粗略衡量。
这对夫妇在2018年入选了福布斯30位非洲30岁以下企业家榜单。
“考虑到高速增长和庞大的人口基数,这个地区存在巨大的机遇,”Genfi说道,他19岁时创办了自己的第一家公司,一家苹果设备的经销商。
作为加纳人工智能协会的创始人和主席,奥赛培养了该地区的潜力。“我认为我们正在成为其他地方进步的跳板,”他说。
LLM说阿拉伯语
大约两年前,在东北方向6000英里处,在波斯湾的迪拜酋长国,另一个创业团队推出了一个生成式人工智能业务,迪拜是世界最高的建筑——哈利法塔的所在地。
当AI研究员埃利·布拉金斯基(Eli Braginskiy)带着与家族关系有关的想法来找亚科夫·利夫西茨(Yakov Livshits)时,利夫西茨已经拥有了大约十几个活跃的创业公司。这个创业公司建立了第一个支持阿拉伯语和英语的LLM,它是一个训练在世界上最大的阿拉伯语/英语数据集之一上的70亿参数模型。
“我们称之为Baby,因为我们为此感到自豪,并且我们正在构建一个更大的、有400亿参数的模型,”布拉金斯基说道。
“我们的Baby LLM目前已经整合到该地区最大的政府系统中,并且我们正在与其他三个有兴趣使用它的政府进行洽谈,”利夫西茨说道。
迪拜在仅13平方英里的区域内拥有超过300万人口,是该地区一个充满活力的中心。
“中东各国政府对人工智能和先进技术的思考方式非常大胆——他们希望快速行动,因此我们正在对不同语言进行定制模型的训练,并将在GITEX会议上展示它们,”利夫西茨说道,他之前在俄罗斯、以色列和美国生活。
仅在今年2月,沙特阿拉伯就宣布了24亿美元的创业基金,以帮助实现国家经济的多元化。
企业需要定制的LLM
在阿布扎比,就在沿海100英里处,Hussein Al-Natsheh领导着Beyond Limits的一支工程师和数据科学家团队,他们正在训练和优化LLM。其中一个模型已经在为一家大型能源公司起草文件,并验证其符合公司标准。
Beyond Limits还为能源公司、公用事业公司和其他客户开发模型,用于索引和搜索企业文件、起草营销材料等等。
“公司需要基于他们自己的机密数据训练自己的LLM,因此我们让机器阅读他们的数据,而不是我们自己,”阿尔-纳特舍赫说道,他是约旦安曼人,在加入Beyond Limits之前曾参与开发了最早的阿拉伯语语音助手之一Salma。
数据开采
现在数据是新的石油,Beyond Limits正在开发工具包,从非结构化文件中提取数据,包括企业电子邮件、PowerPoint等来源,以帮助公司训练接近700亿参数规模的定制LLM。
这些工具包可以帮助解决缺乏来自许多阿拉伯方言的数据样本的问题。事实上,阿联酋政府关于100个顶级通用人工智能应用的报告呼吁在阿拉伯语方面进行更多的工作,阿拉伯语是近50亿人口使用的语言。
好消息是,政府和像G42这样的大公司正在投入资源解决这个问题。例如,由于上一轮的资金主要来自G42,Beyond Limits能够在迪拜设立其区域总部。
Inception的巨大助力
这三家公司都是NVIDIA Inception的成员,这是一个帮助从事生成式人工智能等前沿技术的初创公司的免费计划。
作为Inception的一部分,Beyond Limits可以访问NVIDIA NeMo中的库,这是一个用于构建大规模生成式人工智能模型的框架,在某个案例中,将训练时间从五天减少到一天。
“NVIDIA的软件使我们的工作更加容易,我们的客户也对NVIDIA的技术充满信任,”Al-Natsheh说。
作为Inception的一部分,Mazzuma获得了云GPU服务,加速了其实验并引入了潜在投资者。
“这真的给了我们一个推动,与最好的人和工具合作带来了很多保证,”Genfi说。
善待合作伙伴
就其部分而言,MetaDialog使用由Databricks最近收购的MosaicML运营的服务,在440个NVIDIA A100 Tensor Core GPU上训练了其Baby LLM。
“我建立过很多初创公司,没有一家公司像NVIDIA一样善待其合作伙伴,”Livshits说。
上图:从左到右,Nii Osae、Hussein Al-Natsheh、Eli Braginskiy、Yakov Livshits和Kofi Genfi。