IT之家 8 月 13 日消息,新华社研究院中国企业发展研究中心昨日发布了《人工智能大模型体验报告 2.0》(下称《报告》)。
《报告》指出,当前国产大模型产品已具有显著进步,但与接受过高等教育的人类相比,在智商、情商等方面仍存在一定程度差距。
(资料图片)
《报告》选取 360 智脑、百度文心一言、澜舟 Mchat、商汤商量、讯飞星火、阿里通义千问、昆仑天工、智谱 ChatGLM 共 8 种大模型产品进行评测,根据基础能力、智商能力、情商能力、工具提取四个维度计算总分。IT之家附总分排名如下:
讯飞星火:1013 分
百度文心一言:1010 分
商汤商量:983 分
智谱 ChatGLM:983 分
360 智脑:951 分
昆仑万维天工:943 分
阿里通义千问:935 分
澜舟 Mchat:932 分
据介绍,讯飞星火“在工作提效方面优势明显”,百度文心一言“地基深厚、基础能力仍处领军水准”,商汤商量则“在情商方面表现优秀”,智谱 AI 的 ChatGLM 整体表现优秀。
同时,AI 技术发展的重点已经从大模型的盲目追求转向了实用性和可持续性的发展,AI 大规模落地需要更多时间来验证。