AI summary 1 แหล่ง · วันนี้ · 05:16

LLM ไทยควรเทสความเสถียรต่อข้อมูลไม่เกี่ยว ก่อนลงระบบกฎหมาย

นักวิจัยระบุว่า LLM ในงานกฎหมายต้องแยกความแตกต่างระหว่างข้อเท็จจริงสำคัญกับรายละเอียดไม่เกี่ยว พบว่า Claude/GPT-4 อนุมานข้อมูลเกินไปจากข้อความต้นฉบับ และคำถามคุณภาพสูง (legal intake triage) ต้องใช้โมเดลแพงกว่า ส่วนระบบ agent ที่เรียนรู้จากผลลัพธ์เองช่วยปรับตัวกับกฎหมายใหม่และเคส case-by-case ได้ดีขึ้น

01
แหล่งข่าว
03
ประเด็น
วันนี้ · 05:16
อัปเดต
  • โมเดลประหยัด (GPT-3.5, Llama) อนุมานเกินไป — ไม่เชื่อได้ในงานที่เปลี่ยนข้อเท็จจริงโดยละเอียด
  • คำถาม intake ที่ชัดเจนต้องโมเดล tier สูง (Claude 3.5/Opus) ไม่ใช่ ensemble ประหยัด
  • Agent ที่เรียนรู้จากผลลัพธ์ (Parthenon Law) ช่วยรับมือ regulation/precedent ที่เปลี่ยนไป
แหล่งต้นทาง · 4

ลิงก์ต้นทางอยู่ครบ เพื่อให้เปิดอ่านเต็มและเทียบข้อมูลเองได้

แชร์
ข่าวที่เกี่ยวข้อง