AI summary 1 แหล่ง · วันนี้ · 05:16

LLM ไทยควรเทสความเสถียรต่อข้อมูลไม่เกี่ยว ก่อนลงระบบกฎหมาย

นักวิจัยระบุว่า LLM ในงานกฎหมายต้องแยกความแตกต่างระหว่างข้อเท็จจริงสำคัญกับรายละเอียดไม่เกี่ยว พบว่า Claude/GPT-4 อนุมานข้อมูลเกินไปจากข้อความต้นฉบับ และคำถามคุณภาพสูง (legal intake triage) ต้องใช้โมเดลแพงกว่า ส่วนระบบ agent ที่เรียนรู้จากผลลัพธ์เองช่วยปรับตัวกับกฎหมายใหม่และเคส case-by-case ได้ดีขึ้น

แหล่งข่าว

ประเด็น

วันนี้ · 05:16

อัปเดต

โมเดลประหยัด (GPT-3.5, Llama) อนุมานเกินไป — ไม่เชื่อได้ในงานที่เปลี่ยนข้อเท็จจริงโดยละเอียด
คำถาม intake ที่ชัดเจนต้องโมเดล tier สูง (Claude 3.5/Opus) ไม่ใช่ ensemble ประหยัด
Agent ที่เรียนรู้จากผลลัพธ์ (Parthenon Law) ช่วยรับมือ regulation/precedent ที่เปลี่ยนไป

แหล่งต้นทาง · 4

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

arXiv — cs.AI วันนี้ · 04:00

Parthenon Law: A Self-Evolving Legal-Agent Framework

arXiv — cs.AI 2 วันก่อน

On Wednesdays, We Ask Questions: Optimizing "Active Listening" in Automated Legal Triage and Referral

arXiv — cs.AI 27 พ.ค.

Which Changes Matter? Towards Trustworthy Legal AI via Relevance-Sensitive Evaluation and Solver-Grounded Reasoning

arXiv — cs.AI 16 พ.ค.

Bridging Legal Interpretation and Formal Logic: Faithfulness, Assumption, and the Future of AI Legal Reasoning

แชร์