C-Eval评估结果-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

C-Eval评估结果

研究报告节选:

Zeno Build 对 GPT-2、LLaMA、Alpaca、Vicuna、MPT-Chat、Cohere Command、ChatGPT（gpt-3.5-turbo）七个模型测评，结果与 GPT-4 评价结果相近。ChatGPT 有明显优势，Vicuna 在开源模型中表现最佳。

阅读研究报告

最后更新: 2023-05-31

相关行业研究图表

Zeno Build评结果

Zeno Build评结果-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

C-Eval评估结果

C-Eval评估结果-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

部分开源大摸型的预鸿练摸型开源与两用情况

部分开源大摸型的预鸿练摸型开源与两用情况-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

2021年，中国服务器操作系统市场，Lux装机量市占率远超Un心

2021年，中国服务器操作系统市场，Lux装机量市占率远超Un心-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

开源大模型与Open4IGPT系大模型能力对比

开源大模型与Open4IGPT系大模型能力对比-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

弊分开粥大换生指数塔装的井3与尚用清说

弊分开粥大换生指数塔装的井3与尚用清说-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

相关行业研究报告

通信行业深度：开源竞速：AI大模型的“Linux时刻”降临

Cross-Modal Retrieval-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

弊分开粥大换生指数塔装的井3与尚用清说-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

部分开源大摸型的预鸿练摸型开源与两用情况-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

国盛证券 | 2023-05-31 | 18个图表

图表内容

表14：C-Eval评估结果
Model
STEM
Social Science
Humanities
Other
Average
Random
25.0
25.0
25.0
25.0
25.0
GPT-4
67.1
77.6
64.5
67.8
68.7
ChatGPT
52.9
61.8
50.9
53.6
54.4
Claude-v1.3
51.9
61.7
52.1
53.7
54.2
MiniMax
40.6
60.3
56.6
46.6
49.0
Claude-instant-v1.0
43.1
53.8
44.2
45.4
45.9
GLM-130B
34.8
48.7
43.3
39.8
40.3
Bloomz-mt
35.3
45.1
40.5
38.5
39.0
LLaMA-65B
37.8
45.6
36.1
37.1
38.8
ChatGLM-6B
30.4
39.6
37.4
34.5
34.5
Chinese-LLaMA-13B
31.6
37.2
33.6
32.8
33.3
MOSS
28.6
36.8
31.0
30.3
31.1
Chinese-Alpaca-13B
26.0
27.2
27.8
26.4
26.7
Table 3:Five-shot average accuracy (%)in answer-only setting.We report the average accuracy over the subjects
within each category."Average"column indicates the average accuracy over all the subjects.

其他行业调研报告

锡业股份: 公司信息更新报告：锡价易涨难跌，看好公司2024Q2业绩同环比抬升 - 2024-04-26

东芯股份: 公司简评报告：短期承压不改长期趋势，存算联一体布局前景可期 - 2024-04-26

立讯精密: FY23 in-line with better-than-feared 1H24 earnings guidance; Solid outlook ahead - 2024-04-26

高能环境: 2023年年报及2024年一季报点评：静待资源化产能释放，环保运营夯实现金流 - 2024-04-26

学大教育: 董事长辞职，提速还款，再起航 - 2024-04-26

日本酱油行业专题一：龟行稳健“甲”天下，“万”千风味再出发 - 2024-04-26

太极股份: 2023年报点评：业绩基本稳定，云与数据业务表现亮眼 - 2024-04-26

华凯易佰: 2023年报及2024年一季报点评：业绩稳健增长，关注新兴平台及市场拓展 - 2024-04-26

新乳业: 2023年报及2024一季报点评：逻辑兑现超预期，盈利提升看全年 - 2024-04-26

华利集团: 2024年一季报点评：新老客户发力+内部强化管理，业绩大超预期 - 2024-04-26

微信小程序

添加到"我的小程序", 随时随地访问

小牛行研小程序码

微信服务号

关注产品动态、获知行业资讯

小牛行研服务号二维码

产品吐槽|意见|建议|BUG >