AI summary 3 แหล่ง · วันนี้ · 05:08

AI agents ต้องเรียนรู้ขอบเขตตนเอง — ปัญหา overestimation และวิธีแก้

ทีมวิจัยพบว่า LLM agents ไม่รู้จักตัวเอง — พวกมันประเมินความสามารถสูงเกินไป แล้วพยายามทำงานที่ไม่มีทางสำเร็จได้ ปัญหาเรื่องเชื่อถือได้ของ agent (ว่าจะทำตามเหตุผลที่บอกหรือไม่) และการตัดสินใจเมื่อไหร่ควร delegate งานต่อเป็นเรื่องจริง การแก้คือการสอนให้ model ประเมินตัวเองแบบ policy learning พร้อมระบบตรวจสอบ runtime ที่เข้มข้นขึ้น

แหล่งข่าว

ประเด็น

วันนี้ · 05:08

อัปเดต

LLM agents systematically overestimate ความสามารถตัวเอง และพยายามแก้ปัญหาที่จริงๆ ไม่สามารถแก้ได้
ปัญหา agent faithfulness: อาจ reason ถูก แต่ action ผิด หรือกลับกัน — ต้องวัดแต่ละขั้น
Runtime verification (harness + intervention timing) ที่ดี มีความสำคัญมากกว่าเลือก model ใหญ่ๆ

แหล่งต้นทาง · 15

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

arXiv — cs.AI วันนี้ · 04:00

The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents

Latent.Space วันนี้ · 19:27

🔬Scaling Past Informal AI - Carina Hong, Axiom Math

arXiv — cs.AI 2 วันก่อน

Capability Self-Assessment: Teaching LLMs to Know Their Limits

arXiv — cs.AI 2 วันก่อน

Doing What They Say, Not What They Reason: Locating the Faithfulness Gap in LLM Agents

arXiv — cs.AI 3 วันก่อน

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents