商汤“商量SenseChat 2.0”多个评测基准综合表现超GPT-3.5水平 速看
(资料图片)
近日,商汤科技公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。
根据评测结果,“商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT(即GPT-3.5),部分已十分接近GPT4的水平。实现了我国语言大模型研究的重要突破。
以MMLU为例,该测试是由美国加州大学伯克利分校、哥伦比亚大学、芝加哥大学及伊利诺伊大学厄巴纳-香槟分校联合打造的大规模多任务语言理解的评测基准,涵盖了科学、技术、工程、数据,人文、社会科学等领域的57个科目,难度从初级水平到高级专业水平,考验世界知识和解决问题的能力。
在该评测中,“商量SenseChat 2.0”综合得分为68.6,远超GLM-130B(45.7分)的得分,同时还超过了ChatGPT(67.3分)、LLaMA-65B(63.5分)仅落后GPT-4(86.4分),位居第二。在各主要子评测集中的表现如下:
今年4月,商汤正式发布“商汤日日新SenseNova”大模型体系以及自研中文语言大模型“商量SenseChat”。截至6月,全球范围内正式发布的大语言模型已超过40款,其中由中国厂商、高校、科研院所等发布的大语言模型近20款。
截至目前,已有近千家企业客户通过申请,应用和体验“商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且“商量SenseChat 2.0”还在服务客户过程中,持续实现着快速迭代和提升,以及知识的实时更新。
(文章来源:上海证券报·中国证券网)
关键词:
相关阅读
-
商汤“商量SenseChat 2.0”多个评测基...
近日,商汤科技公布了自研中文语言大模型“商量SenseChat2 0”在MMLU、 -
世界即时看!交大昂立两大股东角力,退...
企查查APP显示,近日,成都元隆雅图文化科技有限公司成立,法定代表人 -
沃尔沃亚太S60L T5及劳斯莱斯魅影古思...
奔驰C完成形象塑造,奥迪A4也刚刚更新完装备,而沃尔沃S60呢?虽然面世 -
界隈歌词个人翻译 - 6-最新快讯
夢見(梦见)原作者:全て此の世の所為です。(全都是这世道的所作所为 -
当前快讯:东丽区召开国家卫生区复审工作...
日前,我区召开国家卫生区复审工作培训会。培训会邀请了全国爱卫会专家 -
环球热文:扬长避短的近义词有哪些 扬...
1、集思广益(注释:集:集中;思:思考,意见;广:扩大。2、指集中群众 -
天天头条:卡布西游黑水河的惊天事件(...
1、卡布西游冲霄秘技,冲霄秘技怎么得?将会详细给大家介绍关于卡布西 -
全球资讯:卤代烃的系统命名
有机物是由含有碳元素的化合物组成的,命名这些化合物需要遵循一定的规 -
宏观专题:债市“获利”幅度够大吗?-快...
宏观专题:债市“获利”幅度够大吗? -
全球新资讯:贵阳高新区:知识产权服务...
近日,贵阳市市场监督管理局高新区分局组织知识产权专家一行到贵州金域 -
交付推迟,股价大跌37%!贾跃亭微博道歉...
24小时财经资讯平台,依托新锐财经日报《每日经济新闻》(NationalBusin -
世界观焦点:恒玄科技跌6.44% 2020年上...
恒玄科技跌6 44%2020年上市超募27 6亿元 -
2023年安徽省住房和城乡建设系统“安康...
6月20至21日,经过32支队伍为期两天的激烈角逐,由安徽省住房和城乡建 -
阿里CEO张勇卸任,二把手蔡崇信上位,淘...
但2019年,马云就宣布,正式卸任阿里巴巴CEO,由张勇接任,而这也是阿 -
昆明地铁5号线开通将满1年 3大活动邀您参与
昆明地铁5号线的开通加强了城市北片区与西南片区的交通联络,不仅方便 -
圆信永丰基金总经理离任 董事长胡荣炜代任
上证报中国证券网讯(记者赵明超)6月21日,圆信永丰基金公告称,原总 -
全球快资讯丨推进卫生健康事业高质量发...
wordContentCss_16873462279811{font-family:宋体;font-size:14pt;fon -
存款利率降了,对我们有哪些影响?
多家银行陆续下调人民币存款利率最近,不少银行纷纷调整人民币存款利率 -
维也纳酒店加速西北扩张,助推甘肃旅游...
近月来,作为国内传统热门长线旅游目的地的甘肃省热度大增,尤其是2023 -
快手、五菱打造线上卖车新高度:7200辆...
今年618,超过7200辆五菱汽车通过快手电商进入家庭,销售额总计超过3亿