中文通用大模型基准测试发布 “讯飞星火”排全国第一|世界今热点


(资料图片)

大皖新闻讯 5月9日,中文通用大模型综合性评测基准 SuperCLUE 正式发布。该机构利用 SuperCLUE 测试基准,对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中看到,GPT-4 一骑绝尘,已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三,国内排名第一。

中文大模型在不同任务上的表现如何;与国际代表性模型相比,中文大模型的表现达到了何种程度;中文大模型与人类表现相比如何……该模型可通过多个层面,考验市面上主流的中文 GPT 大模型的能力。其中,基础能力 包括了常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力;专业能力包括了中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等 50 多项能力;中文特性能力针对有中文特点的任务,包括了中文成语、诗歌、文学、字形等 10 项多种能力。

排行榜会定期更新,并于CLUEbenchmarks 官方网站网站进行公示。

大皖新闻记者 项磊

编辑 张思平

标签:

最近更新

中文通用大模型基准测试发布 “讯飞星火”排全国第一|世界今热点
2023-05-10 15:31:47
当前热门:5月10日国内钆铕钇稀土部分价格上涨
2023-05-10 15:08:40
每日看点!煌上煌(002695):5月10日技术指标出现观望信号-“黑三兵”
2023-05-10 14:26:36
南宁市积极应对2023年入汛以来第一场强降雨
2023-05-10 13:42:15
全球速讯:《别叫我“赌神”》定档6月21日《无双》班底为周润发量身打造
2023-05-10 13:13:49
在透明花瓶中隐藏花茎的技巧_给刚生完孩子的老婆送生日礼物 环球精选
2023-05-10 12:37:27
宜州区:世行项目赋能桑蚕产业提质
2023-05-10 11:53:37
环球热讯:2023年河北衡水冀州区定向招聘“三支一扶”服务期满考核合格志愿者2人公告
2023-05-10 11:39:38
完胜!76人五虎106+38,塔图姆36+10+5,里程碑诞生,NBA格局巨变
2023-05-10 11:08:20
对华形成“不健康依赖”?德国图林根州明确表态:中国投资是好事!
2023-05-10 10:49:27
当前动态:购销两旺带动农民增收 江苏徐州3万多亩西瓜成熟上市
2023-05-10 10:39:44
保时捷继承人与患病妻子离婚,被批“年度最薄情”-天天快报
2023-05-10 09:48:18
多个商品的利润率怎么算(商品的利润率怎么算)_热门
2023-05-10 09:31:06
感恩节的含义和意义_感恩节的含义和意义有哪些
2023-05-10 09:00:09
山东58所!教育部公示首批全国健康学校建设单位名单 世界视讯
2023-05-10 08:18:32
我国研究团队发现玻璃材料性能调控“基本参数”
2023-05-10 08:01:38
A股头条:利空!多家AI、中字头大牛股宣布减持消息,高位股情绪再被打压?官宣!“史上最严”国六B来了 天天通讯
2023-05-10 07:06:00
5月9日基金净值:嘉实浦盈一年持有期混合A最新净值1.0033,跌0.2%
2023-05-10 06:15:50
琥珀猫儿坠·庄严七宝_关于琥珀猫儿坠·庄严七宝介绍
2023-05-10 04:56:50
完美育儿一日一页|焦点快播
2023-05-10 02:49:28
他乡的童年观后感中国篇-他乡的童年观后感
2023-05-10 01:02:22
煮水煮牛肉可以放些肉丸吗?|视讯
2023-05-09 22:44:06
无法找到第三方不计免赔是什么意思_无法找到第三方特约险是什么意思
2023-05-09 21:58:08
监管点名,高管出走,破发股近岸蛋白陷多事之秋_全球观点
2023-05-09 20:59:00
师范专业和非师范有什么区别(师范专业和非师范专业的区别)
2023-05-09 20:30:54
兄弟科技:“储能领域”有望成为未来铬盐行业最重要的增长点|环球热讯
2023-05-09 19:50:22
1000次抗议也不如一次立竿见影的反制,中国已经对加拿大对等反制_每日视点
2023-05-09 19:17:15
四川宜宾父子遭群殴还手被拘,警方认定“互殴”:双方均有过错|当前要闻
2023-05-09 18:34:40
《跟着课本去旅行》株洲站——探访“神州第一陵”,领略神农福地之美
2023-05-09 17:55:58
河南宝丰:工厂建在家门口 群众日子有奔头|当前通讯
2023-05-09 17:48:24