由GPT-4评估的回答质量-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

由GPT-4评估的回答质量

研究报告节选:

目前大部分开源大模型性能未进行系统评价，更多处在起步试验阶段。在对性能进行评价的开源大模型中，Vicuna 的报告中利用 GPT-4 进行的评估相对较为系统，结果也最令人瞩目。

阅读研究报告

最后更新: 2023-05-31

相关行业研究图表

弊分开粥大换生指数塔装的井3与尚用清说

弊分开粥大换生指数塔装的井3与尚用清说-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

大模型训练和推理的一殷流程

大模型训练和推理的一殷流程-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

ChatGPT RLHF三步骤

ChatGPT RLHF三步骤-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

开源大模型与Open4IGPT系大模型能力对比

开源大模型与Open4IGPT系大模型能力对比-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

缸帽公司的部分产品及其定价（战至2023年5月9日）

缸帽公司的部分产品及其定价（战至2023年5月9日）-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

歌工程师发文阑述对大模型竞争格局的担忧

歌工程师发文阑述对大模型竞争格局的担忧-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

相关行业研究报告

通信行业深度：开源竞速：AI大模型的“Linux时刻”降临

Cross-Modal Retrieval-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

弊分开粥大换生指数塔装的井3与尚用清说-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

部分开源大摸型的预鸿练摸型开源与两用情况-小牛行研(hangyan.co)-AI驱动的行业研究数据服务

国盛证券 | 2023-05-31 | 18个图表

图表内容

图表12：由GPT-4评估的回答质量
100%
100%
92%
93%
90%
76%
80%
68%
70%
60%
50%
LLaMA-13B Alpaca-13B Vicuna-13B
Bard
ChatGPT

其他行业调研报告

小商品城: 23年业绩符合预告，24年一季度主业贡献加大 - 2024-04-22

贝斯特: 23年报+24Q1点评：Q1归母净利同比+29%，多梯次布局持续推进 - 2024-04-22

中炬高新: 三年再造一个新厨邦，24年蓄势腾飞 - 2024-04-22

巨子生物: 巨子生物首次覆盖报告：好风凭借力，重组胶原蛋白龙头青云直上 - 2024-04-22

振江股份: 业绩增速亮眼，24年仍有望高增 - 2024-04-22

青达环保: 23年传统主业稳步提升，钢渣新业务助业绩增量 - 2024-04-22

德赛西威: 中小盘信息更新：一季度营收延续高增长，看好公司长期发展 - 2024-04-22

兰石重装: 2023年报点评：多领域订单快速增长，核电市场前景广阔 - 2024-04-22

兆易创新: 1Q24业绩增速如期回升 - 2024-04-22

光线传媒: 业绩符合预期，《小倩》五一档上映在即，《哪吒2》年内可期 - 2024-04-22

微信小程序

添加到"我的小程序", 随时随地访问

小牛行研小程序码

微信服务号

关注产品动态、获知行业资讯

小牛行研服务号二维码

产品吐槽|意见|建议|BUG >