印度企业发布可离线运行的本地化AI模型
印度班加罗尔人工智能公司Sarvam AI在新德里举行的印度AI影响峰会上发布一系列新模型和本地化平台,展示其AI助手可在无需互联网连接的基础手机上运行。
总部位于班加罗尔的Sarvam AI本周在新德里举行的印度AI影响峰会上发布两款大型语言模型、升级后的语音与视觉系统,以及一款可在基础功能手机上运行的AI助手。该公司在现场演示中通过电话方式,让用户在无网络连接情况下使用印度本地语言与AI互动。
此次峰会是印度首次主办的全球性人工智能会议。印度政府借此展示本土训练的人工智能系统,涵盖教育、语音技术、医疗和公共治理等领域。
Sarvam表示,其名为“Edge”的平台可直接在智能手机和笔记本电脑等终端设备上运行,而无需依赖远程数据中心。这意味着在网络覆盖不稳定或无法联网的地区,仍可实现语音识别、翻译和文本转语音等功能。世界银行数据显示,截至2024年,全球约71%人口接入互联网,但不少地区网络质量仍不稳定。
公司产品经理阿迪提亚·达瓦拉(Aditya Dhawala)在发布会上表示,开发体量较小、效率更高的模型,是为了覆盖更广泛用户群体。Sarvam称,终端侧运行可减少云端计算费用,并增强数据隐私保护,因为用户数据无需上传至服务器。
据介绍,该公司与获得诺基亚品牌授权的HMD以及芯片制造商Qualcomm合作,优化模型在现有移动处理器上的表现。
在模型规模方面,Sarvam发布了一款300亿参数语言模型和一款1050亿参数模型。两者均采用“专家混合”(Mixture-of-Experts)架构,在运行时仅激活部分参数,以降低算力需求。相比之下,包括OpenAI开发的GPT-4在内的前沿模型被普遍认为拥有更高的参数规模。
独立分析人士指出,终端侧AI并非全新概念,多家大型科技企业已推出轻量化版本模型。但关键挑战在于如何在低成本设备和弱网环境下保持性能稳定。美国康奈尔科技学院教授卡兰·吉罗特拉表示,如果该技术能够在实际应用中稳定运行,其市场潜力可能超出印度本土。
除Sarvam外,印度企业Tech Mahindra、Gnani.ai、BharatGen和Fractal Analytics等也在峰会上发布面向本地语言或特定行业的模型产品。
印度本次峰会的重点议题之一是人工智能“主权”问题,即在全球人工智能技术由美国和中国主导的背景下,发展中国家如何保持技术自主。Sarvam联合创始人维韦克·拉加万(Vivek Raghavan)表示,发展本土AI能力对维护数字独立性具有战略意义。