Ola创始人的人工智能初创公司推出了印地语、泰米尔语和孟加拉语的LLM - 彭博社
Saritha Rai
巴维什·阿加瓦尔
摄影师:阿帕娜·贾亚库玛/BloombergKrutrim,由连续创业者巴维什·阿加瓦尔创立的人工智能初创公司,推出了印度首个多语言大型语言模型,可以生成10种印度语言的文本。
“我们的LLM支持语音,能够理解多种语言,甚至是混合语言,比如印地英混合语言,” 阿加瓦尔在周五在班加罗尔举行的活动上说,该活动在Ola集团的校园内举行,他是该集团的首席执行官。“这是独一无二的印度特色。”
Krutrim在梵文中意为“人工”,还在开发数据中心,并最终旨在为人工智能生态系统创建服务器和超级计算机。该聊天机器人将于明年1月推出测试版。服务器的原型将于2024年中期推出,生产将于2025年底开始,该初创公司在一份声明中表示。
在OpenAI一年前推出ChatGPT之后,一批印度初创公司和学术团体正在竞相构建印度语言的大型语言模型,即所谓的Indic LLMs。各国希望构建自己的竞争性人工智能系统,而不是依赖美国或中国的技术。在欧洲,投资者正在向法国的Mistral AI大举注资,该公司现在估值$20亿。阿联酋吹捧其猎鹰模型,该模型得到了阿布扎比政府研究机构的支持。
印度拥有14亿人口,正在专注于构建更小、更具成本效益的人工智能系统。生成式人工智能初创公司Sarvam利用现有的开源模型构建了其系统,本周推出了其首个开源印地语LLM OpenHathi。 公告发布后几天,该公司从Lightspeed Venture Partners、亿万富翁Vinod Khosla和其他投资者那里筹集了4100万美元的投资。
在活动上,Aggarwal让开源Krutrim模型用英语欢迎客人,用泰米尔语写诗,用孟加拉语创作一首赞美雨季的颂歌,并生成软件代码。“世界各地知名的AI模型主要是用英语训练的,”他说。“它们无法捕捉我们的文化、语言和精神。”
该公司还专注于开发芯片,包括一种“多芯片组”策略,据称将降低成本并使数据中心设计更加灵活。他说。
Krutrim广泛部署在Ola集团的出租车服务公司内,用于语音聊天、销售电话和客户支持邮件,该公司还计划在下一季度推出名为Krutrim Pro的企业模型。Aggarwal说,他使用该软件为团队撰写绩效评估,并撰写招聘职位描述。