DEV Community

ByteDance ค้นพบ Scaling Law ใหม่ - AI Agent ยิ่งใช้งานจริงยิ่งฉลาด

Scaling Law แบบเดิมกำลังถึงทางตัน

Scaling Law ที่ขับเคลื่อน AI ตั้งแต่ GPT-3 จนถึงปัจจุบันคือ Pre-training Scaling - ยิ่งเพิ่มพารามิเตอร์ ยิ่งเพิ่มข้อมูล ยิ่งได้โมเดลที่เก่งขึ้น แต่แนวทางนี้กำลังเจอปัญหา: ข้อมูลคุณภาพสูงเริ่มหมด ค่าใช้จ่ายในการเทรนพุ่งสูง และผลตอบแทนเริ่มลดลง (diminishing returns) [3]

หลายฝ่ายในวงการเริ่มตั้งคำถามว่า "แล้วไงต่อ?" ถ้าการทำให้โมเดลใหญ่ขึ้นและป้อนข้อมูลมากขึ้นไม่ให้ผลลัพธ์ที่ดีขึ้นอีกต่อไป อนาคตของ AI จะไปทางไหน

ByteDance Seed ตอบคำถามนั้น

ทีมวิจัย ByteDance Seed (ทีม AI หลักของบริษัทแม่ TikTok) ตีพิมพ์ผลงานวิจัยที่ชื่อ EdgeBench เมื่อวันที่ 2 กรกฎาคม 2026 [2] งานนี้สร้างเกณฑ์วัดแบบใหม่ที่ไม่ได้วัดว่า AI "รู้" อะไร แต่วัดว่า AI "เรียนรู้" จากสภาพแวดล้อมจริงได้ดีแค่ไหน

EdgeBench คืออะไร

EdgeBench ประกอบด้วย 134 ภารกิจ ในโลกจริง แบ่งเป็น 6 หมวดหมู่:

  • วิทยาศาสตร์และ Machine Learning
  • ระบบและวิศวกรรมซอฟต์แวร์
  • การหาค่าเหมาะที่สุด (Optimization)
  • ความรู้
  • งานเชิงรูปนัย (Formal)
  • เกม [4]

แต่ละภารกิจใช้เวลาทำงานต่อเนื่อง 12-72 ชั่วโมง - ยาวนานกว่า benchmark ทั่วไปหลายเท่า ทีมวิจัยบันทึกเวลาที่มนุษย์เชี่ยวชาญใช้ทำงานแต่ละภารกิจไว้เฉลี่ย 57.2 ชั่วโมง [2] เพื่อใช้เป็นเกณฑ์เปรียบเทียบ

ตัวอย่างภารกิจจริง

ภารกิจใน EdgeBench ไม่ใช่โจทย์ง่ายๆ เช่น "สร้างแอป Todo" แต่เป็นงานที่ต้องใช้ความเชี่ยวชาญระดับสูง:

  • สร้างแบบจำลองทางธรณีวิทยา - วิเคราะห์ข้อมูลการปนเปื้อนน้ำใต้ดินจากบ่อตรวจวัดแบบกระจายตัว เพื่อสร้างแบบจำลองและปรับปรุงเครือข่ายตรวจวัดให้มีประสิทธิภาพสูงสุด [2]
  • พยากรณ์อายุการใช้งานแบตเตอรี่ - ทำนายสถานะสุขภาพและอายุการใช้งานที่เหลือของแบตเตอรี่ภายใต้สภาวะการใช้งานที่เปลี่ยนไป [2]
  • ปรับปรุงคุณภาพสัญญาณคลื่นความโน้มถ่วง - แก้ไขสัญญาณรบกวนในข้อมูลคลื่นความโน้มถ่วงจาก LIGO เพื่อเพิ่มความแม่นยำในการตรวจจับ [2]

ผลลัพธ์ที่เปลี่ยนเกม

หลังจากวิเคราะห์ Learning Curve กว่า 38,000 ชั่วโมง จาก AI Agent หลายรุ่น - Claude Opus 4.8, GPT 5.5, GPT 5.4, GLM 5.1 และ DeepSeek V4 Pro [1] - ทีม ByteDance พบรูปแบบที่ชัดเจน:

1. Learning Curve เป็น Log-Sigmoid

Learning Curve คือกราฟที่แสดงว่า AI เก่งขึ้นเรื่อยๆ เมื่อเวลาผ่านไป Log-Sigmoid คือรูปทรงของกราฟที่เริ่มช้า ค่อยๆ เร่ง แล้วค่อยๆ คงที่ ประสิทธิภาพของ AI Agent ไม่ได้เพิ่มแบบสุ่ม แต่เป็นไปตามสมการทางคณิตศาสตร์ที่แม่นยำ (R² = 0.998) [5] R² คือค่าที่บอกว่าสมการสามารถอธิบายข้อมูลจริงได้ดีแค่ไหน - ยิ่งใกล้ 1 ยิ่งแม่นยำ นั่นหมายความว่าสามารถคาดการณ์ได้ว่า Agent จะเก่งขึ้นแค่ไหนเมื่อใช้งานไปนานเท่าไหร่

2. ความเร็วในการเรียนรู้เพิ่มเท่าตัวทุก 3 เดือน

AI Agent ที่ทำงานในโลกจริงจะเรียนรู้และปรับปรุงตัวเองได้เร็วขึ้นเป็นสองเท่าทุกไตรมาส [1] นี่ไม่ใช่การปรับปรุงแบบคร่าวๆ แต่เป็นรูปแบบที่วัดซ้ำได้

3. Post-deployment Learning ≠ Pre-training

Post-deployment Scaling คือการเรียนรู้ที่เกิดขึ้นหลังจาก AI ถูก deploy ไปใช้งานจริง - ไม่ใช่การเทรนในแลป การเรียนรู้หลัง deploy ไม่ได้มาแทนที่ pre-training แต่เป็นอีกมิติหนึ่งที่เพิ่มขึ้นต่างหาก [3] ยิ่ง Agent ถูกใช้งานมาก ยิ่งมีโอกาสเรียนรู้จาก feedback และสภาพแวดล้อมจริง

เปรียบเทียบ: Pre-training Scaling vs Post-deployment Scaling

มิติ Pre-training Scaling Post-deployment Scaling (EdgeBench)
กลไก เพิ่มพารามิเตอร์ + ข้อมูล เรียนรู้จาก feedback จริง
ทรัพยากรหลัก GPU, ชุดข้อมูล Distribution, User base
ต้นทุน สูงขึ้นเรื่อยๆ ลดลงเมื่อ scale
ข้อจำกัด ข้อมูลหมด, ผลตอบแทนลด ต้องมี environment จริง
ผู้ได้เปรียบ บริษัทที่มีทุนสูง บริษัทที่มีผู้ใช้มาก

ทำไมถึงสำคัญ

การค้นพบนี้เปลี่ยนสมการทางเศรษฐศาสตร์ของวงการ AI จากเดิมที่การแข่งขันอยู่ที่ "ใครมี GPU มากที่สุดและข้อมูลมากที่สุด" กลายเป็น "ใครมีระบบ distribution และ deployment ที่ดีที่สุด" [1]

ถ้า AI Agent เก่งขึ้นเรื่อยๆ จากการถูกใช้งานจริง บริษัทที่เข้าถึงผู้ใช้จำนวนมากและมี infrastructure ที่ดีจะได้เปรียบ ไม่ใช่แค่บริษัทที่มีพลังคำนวณมหาศาล

สำหรับนักพัฒนาและธุรกิจที่ใช้ AI Agent นี่หมายความว่า: ยิ่งคุณ integrate AI เข้ากับ workflow จริงมากเท่าไหร่ AI ของคุณจะยิ่งฉลาดขึ้นเรื่อยๆ โดยอัตโนมัติ - โดยไม่ต้องรอให้ผู้ผลิตโมเดลอัปเกรด

ข้อควรระวัง

แม้ผลวิจัยจะน่าตื่นเต้น แต่ก็มีข้อควรระวัง:

  • งานวิจัยนี้ทำโดย ByteDance ซึ่งเป็นบริษัทจีน ยังต้องรอการยืนยันจากทีมวิจัยอิสระ เช่น DeepMind หรือ OpenAI ว่าสามารถ replicate ผลลัพธ์นี้ได้หรือไม่
  • 134 ภารกิจอาจไม่ครอบคลุมทุกกรณีการใช้งานจริง - งานส่วนใหญ่เป็นงานด้านวิทยาศาสตร์และวิศวกรรม ยังไม่รวมงานด้านการเงิน การแพทย์ หรือกฎหมาย
  • ยังไม่ชัดเจนว่า Scaling Law นี้จะคงอยู่ต่อไปอีกนานแค่ไหนหรือจะเริ่ม plateau เมื่อ Agent ถึงระดับความชำนาญหนึ่ง [5]
  • งานวิจัยก่อนหน้านี้จาก Stanford และ MIT ชี้ว่า AI Agent อาจ overfit กับ environment เฉพาะที่มันถูกทดสอบ - หมายความว่ามันอาจเก่งเฉพาะงานนั้นๆ แต่ไม่สามารถ transfer skill ไปงานอื่นได้

สรุป

ByteDance Seed ค้นพบว่า AI Agent ยิ่งถูกใช้งานในโลกจริงยิ่งฉลาดขึ้นอย่างมีแบบแผน - ความเร็วในการเรียนรู้เพิ่มเท่าตัวทุก 3 เดือน นี่อาจเป็น Scaling Law ใหม่ที่ขับเคลื่อน AI ยุคต่อไป หลังจาก Pre-training Scaling Law เริ่มถึงขีดจำกัด

สำหรับคนทำธุรกิจและนักพัฒนา: ถึงเวลาแล้วที่จะเริ่ม deploy AI Agent ในงานจริง ไม่ใช่แค่ทดลองในแลป - เพราะยิ่งใช้มาก ยิ่งฉลาด

👉 ติดตาม AI News Digest ได้ที่ https://dev.to/sarantoon/series - กด Follow ที่โปรไฟล์ Nokka เพื่อรับอัปเดตทุกครั้งที่มีบทความใหม่

บทความนี้เขียนโดย AI (deepseek-v4-flash) ผ่าน Hermes Agent ภายใต้การควบคุมและตรวจสอบคุณภาพโดยมนุษย์ - Nokka (นก-กา)

เอกสารอ้างอิง

[1] Crypto Briefing, "ByteDance discovers new scaling law that could sustain the AI boom past its current limits," 4 กรกฎาคม 2026 - https://cryptobriefing.com/bytedance-new-scaling-law-ai-agents/

[2] ByteDance Seed, "EdgeBench: Unveiling Scaling Laws of Learning from Real-World Environments," 2 กรกฎาคม 2026 - https://edge-bench.org/

[3] SCMP, "China's ByteDance discovers new scaling law that could sustain AI boom," 4 กรกฎาคม 2026 - https://www.scmp.com/tech/big-tech/article/3359373/chinas-bytedance-discovers-new-scaling-law-could-sustain-ai-boom

[4] ByteDance Seed, "EdgeBench Paper," 2 กรกฎาคม 2026 - https://edge-bench.org/paper.pdf

[5] AI Weekly, "ByteDance's EdgeBench measures 12-hour AI agent progress," 4 กรกฎาคม 2026 - https://aiweekly.co/alerts/bytedances-edgebench-measures-12-hour-ai-agent-progress

Comments

No comments yet. Start the discussion.