본문으로 건너뛰기

LLM 순위 및 가격

순위

LMSYS

模型分数
GPT-4-Turbo-2024-04-091258
Claude 3 Opus1253
Gemini 1.5 Pro API-0409-Preview1249
Meta Llama 3 70b Instruct1213
Claude 3 Sonnet1201
Command R+1192
Claude 3 Haiku1181
Mistral-Large-24021158
Qwen1.5-72B-Chat1153
Command R1150
Mistral Medium1147
Meta Llama 3 8b Instruct1147
Mixtral-8x22b-Instruct-v0.11145
Qwen1.5-32B-Chat1134
GPT-3.5-Turbo-06131119
Qwen1.5-14B-Chat1119
Mixtral-8x7b-Instruct-v0.11114
Yi-34B-Chat1109
WizardLM-70B-v1.01108

图片

평가 기준

baichuan13B-表格

RAG 점수

https://mp.weixin.qq.com/s/EdoA5fcyzgTw3LarMMe00g

image-20240424170230823

LMSYS

🏆 LMSYS Chatbot Arena Leaderboard

梯队分数代表
第一梯队200分以上GPT-4
Claude 3中杯和大杯
第二梯队150分以上Mistral中杯和大杯
Claude 3小杯
千问72B
第三梯队110分以上GPT-3.5

GPT - 4 는 GPT - 3. 5 에 비해 12% 향상되었습니다.

Claude 3 작은 컵은 GPT - 3. 5 에 비해 6% 향상되었습니다.

image-20240329152610807

image-20240329152736938

CLUE 중국어 리뷰

CLUE中文语言理解测评基准

https://mp.weixin.qq.com/s/cI92Fp2ic13_BKaRSgZw4g

图片

价格

Claude

Mistral

Gemini:暂时只有 1.0 Pro的价格