ByteDance ค้นพบ Scaling Law ใหม่ - AI Agent ยิ่งใช้งานจริงยิ่งฉลาด
Scaling Law แบบเดิมกำลังถึงทางตัน
Scaling Law ที่ขับเคลื่อน AI ตั้งแต่ GPT-3 จนถึงปัจจุบันคือ Pre-training Scaling - ยิ่งเพิ่มพารามิเตอร์ ยิ่งเพิ่มข้อมูล ยิ่งได้โมเดลที่เก่งขึ้น แต่แนวทางนี้กำลังเจอปัญหา: ข้อมูลคุณภาพสูงเริ่มหมด ค่าใช้จ่ายในการเทรนพุ่งสูง และผลตอบแทนเริ่มลดลง (diminishing returns) [3]
หลายฝ่ายในวงการเริ่มตั้งคำถามว่า "แล้วไงต่อ?" ถ้าการทำให้โมเดลใหญ่ขึ้นและป้อนข้อมูลมากขึ้นไม่ให้ผลลัพธ์ที่ดีขึ้นอีกต่อไป อนาคตของ AI จะไปทางไหน
ByteDance Seed ตอบคำถามนั้น
ทีมวิจัย ByteDance Seed (ทีม AI หลักของบริษัทแม่ TikTok) ตีพิมพ์ผลงานวิจัยที่ชื่อ EdgeBench เมื่อวันที่ 2 กรกฎาคม 2026 [2] งานนี้สร้างเกณฑ์วัดแบบใหม่ที่ไม่ได้วัดว่า AI "รู้" อะไร แต่วัดว่า AI "เรียนรู้" จากสภาพแวดล้อมจริงได้ดีแค่ไหน
EdgeBench คืออะไร
EdgeBench ประกอบด้วย 134 ภารกิจ ในโลกจริง แบ่งเป็น 6 หมวดหมู่:
- วิทยาศาสตร์และ Machine Learning
- ระบบและวิศวกรรมซอฟต์แวร์
- การหาค่าเหมาะที่สุด (Optimization)
- ความรู้
- งานเชิงรูปนัย (Formal)
- เกม [4]
แต่ละภารกิจใช้เวลาทำงานต่อเนื่อง 12-72 ชั่วโมง - ยาวนานกว่า benchmark ทั่วไปหลายเท่า ทีมวิจัยบันทึกเวลาที่มนุษย์เชี่ยวชาญใช้ทำงานแต่ละภารกิจไว้เฉลี่ย 57.2 ชั่วโมง [2] เพื่อใช้เป็นเกณฑ์เปรียบเทียบ
ตัวอย่างภารกิจจริง
ภารกิจใน EdgeBench ไม่ใช่โจทย์ง่ายๆ เช่น "สร้างแอป Todo" แต่เป็นงานที่ต้องใช้ความเชี่ยวชาญระดับสูง:
- สร้างแบบจำลองทางธรณีวิทยา - วิเคราะห์ข้อมูลการปนเปื้อนน้ำใต้ดินจากบ่อตรวจวัดแบบกระจายตัว เพื่อสร้างแบบจำลองและปรับปรุงเครือข่ายตรวจวัดให้มีประสิทธิภาพสูงสุด [2]
- พยากรณ์อายุการใช้งานแบตเตอรี่ - ทำนายสถานะสุขภาพและอายุการใช้งานที่เหลือของแบตเตอรี่ภายใต้สภาวะการใช้งานที่เปลี่ยนไป [2]
- ปรับปรุงคุณภาพสัญญาณคลื่นความโน้มถ่วง - แก้ไขสัญญาณรบกวนในข้อมูลคลื่นความโน้มถ่วงจาก LIGO เพื่อเพิ่มความแม่นยำในการตรวจจับ [2]
ผลลัพธ์ที่เปลี่ยนเกม
หลังจากวิเคราะห์ Learning Curve กว่า 38,000 ชั่วโมง จาก AI Agent หลายรุ่น - Claude Opus 4.8, GPT 5.5, GPT 5.4, GLM 5.1 และ DeepSeek V4 Pro [1] - ทีม ByteDance พบรูปแบบที่ชัดเจน:
1. Learning Curve เป็น Log-Sigmoid
Learning Curve คือกราฟที่แสดงว่า AI เก่งขึ้นเรื่อยๆ เมื่อเวลาผ่านไป Log-Sigmoid คือรูปทรงของกราฟที่เริ่มช้า ค่อยๆ เร่ง แล้วค่อยๆ คงที่ ประสิทธิภาพของ AI Agent ไม่ได้เพิ่มแบบสุ่ม แต่เป็นไปตามสมการทางคณิตศาสตร์ที่แม่นยำ (R² = 0.998) [5] R² คือค่าที่บอกว่าสมการสามารถอธิบายข้อมูลจริงได้ดีแค่ไหน - ยิ่งใกล้ 1 ยิ่งแม่นยำ นั่นหมายความว่าสามารถคาดการณ์ได้ว่า Agent จะเก่งขึ้นแค่ไหนเมื่อใช้งานไปนานเท่าไหร่
2. ความเร็วในการเรียนรู้เพิ่มเท่าตัวทุก 3 เดือน
AI Agent ที่ทำงานในโลกจริงจะเรียนรู้และปรับปรุงตัวเองได้เร็วขึ้นเป็นสองเท่าทุกไตรมาส [1] นี่ไม่ใช่การปรับปรุงแบบคร่าวๆ แต่เป็นรูปแบบที่วัดซ้ำได้
3. Post-deployment Learning ≠ Pre-training
Post-deployment Scaling คือการเรียนรู้ที่เกิดขึ้นหลังจาก AI ถูก deploy ไปใช้งานจริง - ไม่ใช่การเทรนในแลป การเรียนรู้หลัง deploy ไม่ได้มาแทนที่ pre-training แต่เป็นอีกมิติหนึ่งที่เพิ่มขึ้นต่างหาก [3] ยิ่ง Agent ถูกใช้งานมาก ยิ่งมีโอกาสเรียนรู้จาก feedback และสภาพแวดล้อมจริง
เปรียบเทียบ: Pre-training Scaling vs Post-deployment Scaling
| มิติ | Pre-training Scaling | Post-deployment Scaling (EdgeBench) |
|---|---|---|
| กลไก | เพิ่มพารามิเตอร์ + ข้อมูล | เรียนรู้จาก feedback จริง |
| ทรัพยากรหลัก | GPU, ชุดข้อมูล | Distribution, User base |
| ต้นทุน | สูงขึ้นเรื่อยๆ | ลดลงเมื่อ scale |
| ข้อจำกัด | ข้อมูลหมด, ผลตอบแทนลด | ต้องมี environment จริง |
| ผู้ได้เปรียบ | บริษัทที่มีทุนสูง | บริษัทที่มีผู้ใช้มาก |
ทำไมถึงสำคัญ
การค้นพบนี้เปลี่ยนสมการทางเศรษฐศาสตร์ของวงการ AI จากเดิมที่การแข่งขันอยู่ที่ "ใครมี GPU มากที่สุดและข้อมูลมากที่สุด" กลายเป็น "ใครมีระบบ distribution และ deployment ที่ดีที่สุด" [1]
ถ้า AI Agent เก่งขึ้นเรื่อยๆ จากการถูกใช้งานจริง บริษัทที่เข้าถึงผู้ใช้จำนวนมากและมี infrastructure ที่ดีจะได้เปรียบ ไม่ใช่แค่บริษัทที่มีพลังคำนวณมหาศาล
สำหรับนักพัฒนาและธุรกิจที่ใช้ AI Agent นี่หมายความว่า: ยิ่งคุณ integrate AI เข้ากับ workflow จริงมากเท่าไหร่ AI ของคุณจะยิ่งฉลาดขึ้นเรื่อยๆ โดยอัตโนมัติ - โดยไม่ต้องรอให้ผู้ผลิตโมเดลอัปเกรด
ข้อควรระวัง
แม้ผลวิจัยจะน่าตื่นเต้น แต่ก็มีข้อควรระวัง:
- งานวิจัยนี้ทำโดย ByteDance ซึ่งเป็นบริษัทจีน ยังต้องรอการยืนยันจากทีมวิจัยอิสระ เช่น DeepMind หรือ OpenAI ว่าสามารถ replicate ผลลัพธ์นี้ได้หรือไม่
- 134 ภารกิจอาจไม่ครอบคลุมทุกกรณีการใช้งานจริง - งานส่วนใหญ่เป็นงานด้านวิทยาศาสตร์และวิศวกรรม ยังไม่รวมงานด้านการเงิน การแพทย์ หรือกฎหมาย
- ยังไม่ชัดเจนว่า Scaling Law นี้จะคงอยู่ต่อไปอีกนานแค่ไหนหรือจะเริ่ม plateau เมื่อ Agent ถึงระดับความชำนาญหนึ่ง [5]
- งานวิจัยก่อนหน้านี้จาก Stanford และ MIT ชี้ว่า AI Agent อาจ overfit กับ environment เฉพาะที่มันถูกทดสอบ - หมายความว่ามันอาจเก่งเฉพาะงานนั้นๆ แต่ไม่สามารถ transfer skill ไปงานอื่นได้
สรุป
ByteDance Seed ค้นพบว่า AI Agent ยิ่งถูกใช้งานในโลกจริงยิ่งฉลาดขึ้นอย่างมีแบบแผน - ความเร็วในการเรียนรู้เพิ่มเท่าตัวทุก 3 เดือน นี่อาจเป็น Scaling Law ใหม่ที่ขับเคลื่อน AI ยุคต่อไป หลังจาก Pre-training Scaling Law เริ่มถึงขีดจำกัด
สำหรับคนทำธุรกิจและนักพัฒนา: ถึงเวลาแล้วที่จะเริ่ม deploy AI Agent ในงานจริง ไม่ใช่แค่ทดลองในแลป - เพราะยิ่งใช้มาก ยิ่งฉลาด
👉 ติดตาม AI News Digest ได้ที่ https://dev.to/sarantoon/series - กด Follow ที่โปรไฟล์ Nokka เพื่อรับอัปเดตทุกครั้งที่มีบทความใหม่
บทความนี้เขียนโดย AI (deepseek-v4-flash) ผ่าน Hermes Agent ภายใต้การควบคุมและตรวจสอบคุณภาพโดยมนุษย์ - Nokka (นก-กา)
เอกสารอ้างอิง
[1] Crypto Briefing, "ByteDance discovers new scaling law that could sustain the AI boom past its current limits," 4 กรกฎาคม 2026 - https://cryptobriefing.com/bytedance-new-scaling-law-ai-agents/
[2] ByteDance Seed, "EdgeBench: Unveiling Scaling Laws of Learning from Real-World Environments," 2 กรกฎาคม 2026 - https://edge-bench.org/
[3] SCMP, "China's ByteDance discovers new scaling law that could sustain AI boom," 4 กรกฎาคม 2026 - https://www.scmp.com/tech/big-tech/article/3359373/chinas-bytedance-discovers-new-scaling-law-could-sustain-ai-boom
[4] ByteDance Seed, "EdgeBench Paper," 2 กรกฎาคม 2026 - https://edge-bench.org/paper.pdf
[5] AI Weekly, "ByteDance's EdgeBench measures 12-hour AI agent progress," 4 กรกฎาคม 2026 - https://aiweekly.co/alerts/bytedances-edgebench-measures-12-hour-ai-agent-progress
Comments
No comments yet. Start the discussion.