Nhảy tới nội dung

Bảng xếp hạng LLM và giá cả

thứ hạng / thứ hạng

LMSYS

模型分数
GPT-4-Turbo-2024-04-091258
Claude 3 Opus1253
Gemini 1.5 Pro API-0409-Preview1249
Meta Llama 3 70b Instruct1213
Claude 3 Sonnet1201
Command R+1192
Claude 3 Haiku1181
Mistral-Large-24021158
Qwen1.5-72B-Chat1153
Command R1150
Mistral Medium1147
Meta Llama 3 8b Instruct1147
Mixtral-8x22b-Instruct-v0.11145
Qwen1.5-32B-Chat1134
GPT-3.5-Turbo-06131119
Qwen1.5-14B-Chat1119
Mixtral-8x7b-Instruct-v0.11114
Yi-34B-Chat1109
WizardLM-70B-v1.01108

图片

tiêu chuẩn đánh giá / tiêu chuẩn đánh giá

baichuan13B-表格

Đánh giá của RAG

https://mp.weixin.qq.com/s/EdoA5fcyzgTw3LarMMe00g

image-20240424170230823

LMSYS LMSYS LMSYS

🏆 LMSYS Chatbot Arena Leaderboard

梯队分数代表
第一梯队200分以上GPT-4
Claude 3中杯和大杯
第二梯队150分以上Mistral中杯和大杯
Claude 3小杯
千问72B
第三梯队110分以上GPT-3.5

GPT-4 tăng 12% so với GPT-3.5

Cốc Claude 3 tăng 6% so với GPT-3.5

image-20240329152610807

image-20240329152736938

CLUE Đánh giá bằng tiếng Trung

CLUE中文语言理解测评基准

https://mp.weixin.qq.com/s/cI92Fp2ic13_BKaRSgZw4g

图片

giá cả / giá cả

Claude

Mistral

Gemini:暂时只有 1.0 Pro的价格