印度创业公司发布了OpenHathi:首个印地语LLM
印度创业公司发布 OpenHathi:印地语学习管理系统的创新者
在语言创新的重要一步中,印度AI初创公司Sarvam AI发布了OpenHathi LLM,标志着印地语语言模型领域的重大跃进。在获得令人印象深刻的4100万美元的A轮融资仅一周后,该公司推出了OpenHathi-Hi-v0.1,这是OpenHathi系列的首个版本。
OpenHathi的起源
Sarvam AI最新的创作根植于Meta AI的Llama2-7B架构,专为印地语这种印度使用最广泛的语言的特点量身定制。作为OpenHathi系列中的首个印地语大型语言模型(LLM),它承诺在印度语种中与GPT-3.5性能相当。该模型的基础是一个经济实惠的平台,扩展了Llama2-7B的功能。
揭秘训练过程
OpenHathi-Hi-v0.1经历了一个细致的两阶段训练过程。首先,重点是嵌入对齐,对齐随机初始化的印地语嵌入。随后,该模型参与双语语言建模,掌握跨语言的注意力。其结果是在各种印地语任务中具有鲁棒的性能,展示出对本地和罗马化脚本的娴熟运用。
合作与学术贡献
Sarvam AI与AI4Bharat的学术合作伙伴共同开发的OpenHathi-Hi-v0.1受益于这些合作伙伴提供的语言资源和基准。这一合作努力跨越语言界限,如KissanAI最近宣布的开创性农业大型语言模型Dhenu 1.0所示。这一双语奇迹直接满足了农民在英语、印地语和Hinglish方面的语言需求。
Sarvam AI的未来道路
Sarvam AI的联合创始人Pratyush Kumar和Vivek Raghavan于2023年7月将这家初创公司推向市场。在由Lightspeed Ventures领导的大规模A轮融资的支持下,这对创始人致力于通过生成式AI整合针对多样化印度语言的解决方案。他们的重点还在于与企业合作,利用数据作为支撑开展领域特定的AI模型开发。
我们的观点
在语言多样性至关重要的背景下,Sarvam AI的OpenHathi-Hi-v0.1是一个有希望的新增选项,体现了对印度语言AI创新的承诺。与学术合作伙伴的合作精神和对未来的明确路线使Sarvam AI成为生成式AI领域的旗手。随着该模型吸引开发者探索其潜力,我们预期将产生创造力和专门模型的涟漪效应,进一步丰富印度的AI领域。
遵循透明和合作的原则,Sarvam AI从研究和数字基础设施开发到开拓性的语言模型,展示了对印度独特语言画卷的认真态度。