图表内容 图表12:由GPT-4评估的回答质量 100% 100% 92% 93% 90% 76% 80% 68% 70% 60% 50% LLaMA-13B Alpaca-13B Vicuna-13B Bard ChatGPT