中文通用大模型基准测试 SuperCLUE 发布,讯飞星火认知大模型国内领先
时间:2023-05-10 14:24:25 来源:鲁网
(相关资料图)
5月9日,中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题:中文大模型在不同任务上的表现如何?与国际代表性模型相比,中文大模型的表现达到了何种程度?中文大模型与人类表现相比如何?
该模型可通过多个层面,考验市面上主流的中文 GPT 大模型的能力:
基础能力: 包括了常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。
专业能力: 包括了中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等 50 多项能力。
中文特性能力: 针对有中文特点的任务,包括了中文成语、诗歌、文学、字形等 10 项多种能力。
该机构利用 SuperCLUE 测试基准,对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出,GPT-4 一骑绝尘,已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三,国内排名第一。
以下为该机构公布的各个子项目的具体得分。排行榜会定期更新,并于CLUEbenchmarks 官方网站网站进行公示。(本网记者)
标签:
最新文章推荐
- 什么是BMI?《中国居民膳食指南(2022)》来了
- 新中国对外汉语教育事业的开创者之一杜荣逝世,享年102岁
- 56分!北京新能源指标家庭入围“分数线”揭晓
- 安徽省休宁县解除静态管理
- 四川新增本土无症状感染者12例:成都1例广安11例
- 合伙盗掘苏州地区商周至清代14座古墓 3人被判刑
- 北京海淀清河街道辖区实行重点区域提级管控
- 解锁“云面试” 过半受访者自感在智能面试中表现不错
- 京昆高速雅西段因暴雨突发泥石流 实行交通管制
- 教师招聘20分进资格复审?为何分设男女岗?厦门教育局回应
X 关闭
资讯中心

2022-09-16
2021-10-18

2021-10-18

2021-10-18
X 关闭
热点资讯
-
1
中文通用大模型基准测试 SuperCLUE 发布,讯飞星火认知大模型国内领先
-
2
环球头条:情侣名称诗意昵称大全唯美 唯美诗意情侣名字大全
-
3
欧美sexovideotv越南
-
4
伤春悲秋是什么意思_伤春悲秋
-
5
萧县多举措推进国家创新型县建设 打造皖北创新发展示范区
-
6
汽车整车板块再度拉升,金龙汽车触及涨停
-
7
港股异动 | STERLING GP(01825)盈喜后飚涨逾78%创逾1年新高 预期年度盈利大幅改善
-
8
全球新动态:2023高三三模成绩查询网址 如何查询成绩
-
9
央企ESG主题指数密集发布 ESG主题基金整体表现较为稳健-全球信息
-
10
当前速讯:四川宜宾父子被群殴后还手遭拘 起诉警方“互殴”认定错误
-
11
天天观热点:简讯:快消息!环球即时:港人跨境就医便捷免轮候-当前观察 天天热消息_世界要闻_环球消息_世界快看-天天微速讯
-
12
信息:有研硅(688432)736.54万股限售股将于5月10日解禁上市,占总股本0.59%
-
13
撤销党内职务包括哪些职务
-
14
超话是什么意思网络用语_什么是超话 滚动
-
15
量化巨头另辟蹊径,密集调研藏玄机|前沿热点
-
16
欢乐解压玩具官网在哪下载 最新官方下载安装地址
-
17
迈入五月夏日到 风光不与春日同
-
18
港龙中国地产(06968.HK):5月9日南向资金增持210.9万股 环球快看
-
19
小盆种花长旺盛
-
20
instrumental music_instrumental