Benchmark โมเดล Text Embedding สำหรับภาษาไทย ครอบคลุม 28 ชุดทดสอบ ใน 7 ประเภทงาน ประมวลผลบน LANTA Supercomputer ด้วย NVIDIA A100 GPUs สนับสนุนทรัพยากรโดย ThaiSC/NSTDA
Leaderboard — เรียงตามคะแนนเฉลี่ย (Average Score) จาก 28 ชุดทดสอบภาษาไทย · คลิกหัวคอลัมน์เพื่อเรียงลำดับ · โมเดลที่ไม่ครบ 28 task เกิดจาก CUDA OOM บน A100 40GB
| # ▼ | Model ▲▼ | Size ▲▼ | AVG Score ▲▼ | BitextMining ▲▼ | Classification ▲▼ | Clustering ▲▼ | PairCls ▲▼ | Reranking ▲▼ | Retrieval ▲▼ | Tasks ▲▼ |
|---|
Head-to-Head Comparison — เลือกโมเดล 2–3 ตัวเพื่อเปรียบเทียบคะแนนรายชุดทดสอบ
Task Types — รายละเอียดการทดสอบแต่ละประเภทสำหรับภาษาไทย
Radar Chart — เปรียบเทียบคะแนนรวมตามประเภทงาน สำหรับโมเดลหลัก
Task Breakdown — คะแนนแยกตามชุดทดสอบย่อย แบ่งตามประเภทงาน
Model Details — ข้อมูลสำคัญของแต่ละโมเดล
Methodology — รายละเอียดสภาพแวดล้อมและขั้นตอนการทดสอบ
LANTA Supercomputer
MTEB v2.10.0
28 Thai Tasks
Full / Auto
A100 40GB Limit
ผลการทดสอบครั้งนี้ได้รับการสนับสนุนทรัพยากรการประมวลผลจาก ศูนย์ทรัพยากรคอมพิวเตอร์เพื่อการคำนวณขั้นสูง (ThaiSC) ภายใต้ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช./NSTDA) ผ่านระบบ LANTA Supercomputer โดยไม่มีค่าใช้จ่าย ขอขอบคุณ ThaiSC ที่เปิดโอกาสให้นักวิจัยและชุมชน AI ไทยเข้าถึงทรัพยากรคำนวณระดับโลก
This benchmark was made possible by the free computing resources provided by the Thailand Supercomputer Center (ThaiSC) under the National Science and Technology Development Agency (NSTDA) through the LANTA Supercomputer. We are deeply grateful for ThaiSC's commitment to supporting AI research and the Thai developer community.