ข่าว AI ที่กำลังขยับตอนนี้
ข่าวจากหลายแหล่งที่รวมเป็นเรื่องเดียวให้แล้ว เหมาะสำหรับเช็กระหว่างวัน ก่อนเลือกอ่านต้นทางต่อ
Google Phone แจงเตือนเมื่อสแกมเมอร์ปลอมเสียงคนรู้จัก ใช้ AI deepfake
Google Phone app เพิ่มฟีเจอร์ตรวจจับการเลียนแบบเสียง AI — ถ้าสแกมเมอร์โทรมาจากหมายเลขคนรู้จักของคุณ แต่เสียงปลอม ระบบจะแจงเตือน suspicious call ให้เลย ตัวเลขหลุดออกจากที่ไหน ไม่รู้ แต่เทคนิคนี้ใช้ deepfake voice ดึงน้ำหนักมากขึ้นเพราะคนหลีกเลี่ยงจริงแล้วหาเลขแปลกๆ
Microsoft Scout — AI agent ใน Microsoft 365 ที่ทำงานในพื้นหลังแบบ 24/7
Microsoft เปิดตัว Scout ซึ่งเป็น AI agent ทำงานแบบ OpenClaw ที่อยู่ใน Microsoft 365 แอปฯ เช่น Outlook, OneDrive, Teams — ใช้จัดแคลนดาร์, ตรวจสอบค่าใช้จ่าย, ร่างอีเมล แล้วทำเรื่องงานซ้ำ ๆ โดยอัตโนมัติ ต่างจาก Copilot ที่ต้องคลิก — Scout ทำงานตัวเองเหมือนเพื่อนร่วมงาน
CEO เหมือนป่วยด้วย AI — ตัดสินใจลัดเลาะแทนทำความเข้าใจงาน
หลาย CEO กำลังตัดสินใจเลิกจ้างพนักงานเพื่อแทนที่ด้วย AI agents โดยไม่เข้าใจลึกว่างานเหล่านั้นทำอะไรจริง ปรากฏการณ์นี้เรียกว่า \"AI psychosis\" — ความเชื่ออย่างไม่สมเหตุสมผลว่า AI แก้ทุกปัญหา ClickUp เลิกจ้าง 22% ของคนงาน Meta ก็ลดหัว พร้อมเหล่านักสำเร็จการศึกษาเริ่มโวยวายในพิธีรับปริญญา ตัวอย่างว่า CEO ไม่ได้ลงลึกไปเห็นความจริงของการทำงาน
AI ที่ใช้งานจริงต้องการ domain expertise ไม่ใช่แค่ AI skills
บริษัทต่างๆ ตระหนักว่า 'AI fluency' บนเรซูเมไม่มีค่า สิ่งที่ต้องการจริงคือคนที่รวมความเข้าใจ domain ลึก ความเข้มงวดในการประเมิน และการตัดสินใจที่ดี AI ต้องทำงานร่วมกับความเชี่ยวชาญของมนุษย์ ไม่ใช่แทนที่ และเมื่อใช้ AI มากเกินไป มันอาจทำให้ทักษะของคนลดลง ไม่เพิ่มขึ้น
AI ใช้งานแล้ว แต่ใครรับผิดชอบ? บริษัทต้องสร้าง accountability ก่อนวิกฤต
ตอนนี้บริษัทกระจายการตัดสินใจ AI ไปทั่ว แต่ไม่มีใครรับผิดชอบชัดเจน ปัญหาคือ fraud และ compliance ไม่ติดตาม — fraudster ใช้ AI สร้าง deepfake ได้เร็ว แต่防御ยังช้า บริษัติเหมือน ZeroDrift เริ่มสร้างเครื่องมือ filter AI output ก่อนถึงผู้ใช้ แต่ปัญหาใหญ่คือ accounting และ entry-level job หายไป ไม่มีใครฝึก junior ได้
บริษัทเปลี่ยนมุมมองคลาวด์ จากเครื่องมือเป็นกลยุทธ์แข่งขัน
คลาวด์ไม่ใช่แค่เทคโนโลยีอีกต่อไป — กลายเป็นโครงสร้างพื้นฐานเหมือนไฟฟ้า ขนส่ง โทรคมนาคม บริษัทเริ่มคิดแบบ platform thinking และ multicloud เพื่อให้ระบบยืดหยุ่นได้ตามความต้องการ โดยเฉพาะเวลาย้ายไปใช้ sovereign cloud ต้องวางแผนการวาง workload อย่างชาญฉลาด ไม่ใช่แค่ย้ายแบบตรงๆ
AI Agent Cloud เป็นตลาดใหม่ — Cognition筹1B, Railway/Daytona/Modal ขึ้นยูนิคอร์น
ตลาด AI agent infrastructure กำลังระเบิด Cognition เพิ่งเก็บ $1B ที่ valuation $26B ขณะที่ Railway, Daytona, Modal, Exa, Fireworks, Baseten ทั้งหมดขึ้นยูนิคอร์นหรือเดคาคอร์นในช่วงเดียวกัน ปัญหาหลัก: agent ต้องการ compute ที่ reliable (bare metal sandbox, full VM, own-metal data center) และ infrastructure ที่ async-first เพื่อให้ agent ทำงานแบบ spec-to-PR ได้ตามจริง Railway เห็น $200K+ monthly spend จาก coding agent ผู้ใช้เพียงคนเดียว
Anthropic ปล่อย Claude Mythos หาช่องโหว่ในโครงสร้างพื้นฐาน 15+ ประเทศ
Anthropic เปิดตัว Claude Mythos รุ่นใหม่ที่ออกแบบมาเพื่อค้นหาช่องโหว่ความปลอดภัยในระบบวิกฤต เช่น ไฟฟ้า น้ำ สุขภาพ และการสื่อสาร ผ่านโครงการ Project Glasswing ขยายให้ 150 องค์กรใน 15+ ประเทศ Anthropic เตือนว่าโมเดลนี้มีความเสี่ยงสูงจึงไม่ปล่อยให้สาธารณชน แต่ Firefox ได้ใช้มันค้นพบบั๊กร้ายแรงหลายตัวแล้ว
AI เปลี่ยนการจัดซื้อจากตอบโต้เป็นคาดการณ์ล่วงหน้า ลดความล่าช้า
องค์กรใช้ AI เพื่อเปลี่ยนจากการดูแลผู้ขายแบบ reactive scorecard มาเป็นการตัดสินใจแบบ real-time ที่คาดการณ์ได้ ช่วยจับปัญหาห่วงโซ่อุปทานก่อนเกิด ลดความล่าช้า และทำให้ทีมสามารถปรับเส้นทางสินค้า ปรับตารางเวลา และแก้ปัญหาฉุกเฉินได้เร็วขึ้น ไม่ต้องรอการตัดสินใจจากชั้นบน
ช่องว่างระหว่างค้นหาปัญหากับแก้ปัญหา — ทำไม security tools ไม่เท่ากับ security
ปัญหาใหญ่ของ cybersecurity วันนี้ไม่ใช่เรื่องค้นหาช่องโหว่ — tools ทำได้ดี แต่เรื่องการตอบสนองและแก้ไข ระบบ observability บอกว่า \"เกิดอะไรขึ้น\" แต่ไม่บอก \"ใครกำลังทำอะไรกับมัน\" ทีมต้องเชื่อมระหว่าง detection, incident response, และ governance ให้เป็นระบบเดียว ไม่งั้นการค้นหาปัญหาเร็วแค่ไหนก็ไม่ช่วย
องค์กรเลิกรอ: AI agents ขึ้นมาแล้ว ต้องเปลี่ยนวิธีทำงานตอนนี้
เทคโนโลยี AI agents กำลังเปลี่ยนจากเครื่องมือให้ความช่วยเหลือเป็นระบบที่ทำงานอัตโนมัติจริง OpenAI ปล่อย SDK ใหม่ให้ build agents ได้ปลอดภัยกว่า Notion เปิด platform ให้ connect agents เข้า workspace ส่วน Choco ใช้ AI agents ลดเวลาจัดสินค้าอาหารลง ปัญหาคือองค์กรส่วนใหญ่ยังคิดว่า AI คือเครื่องมือ ไม่ใช่ partner ที่ต้องฝึกให้เข้าใจ business logic ของตัวเอง
GitHub เตรียมรับมือ AI Coding Agents — Copilot ขยายตัวเกินความคาดหมาย
GitHub เผชิญความท้าทายจากการระเบิดของ AI coding agents หลังจากเปิดตัว Copilot — ปริมาณการใช้งาน metrics เพิ่มขึ้นอย่างต่อเนื่อง ทำให้แพลตฟอร์มต้องปรับตัว Kyle Daigle จาก GitHub เล่าแผนรับมือ ซึ่งรวมถึงการออกแบบใหม่เพื่อรองรับ agentic workflows ที่ซับซ้อนมากขึ้น
3 วิธีใหม่สร้างข้อมูลฝึก AI ให้คิดเหมือนคน โดยไม่ต้องมีคำตอบเตรียมไว้
นักวิจัย arXiv เพิ่งโพสต์ 3 เฟรมเวิร์กใหม่ (MindLoom, OSCToM, MindZero) ที่แก้ปัญหาเดิม: สร้างข้อมูลฝึก reasoning ระดับสูงให้ LLM ได้ยาก ควบคุมความยากได้ยาก และต้องใช้คำตอบที่มนุษย์ทำไว้ MindLoom ใช้ \"thought modes\" (หน่วยย่อยของการคิด) เพื่อควบคุมความยาก OSCToM เน้นความขัดแย้งในความเชื่อซ้อนกัน MindZero ใช้RL ที่ไม่ต้องคำตอบเตรียมไว้ ทั้งหมดมุ่งให้ AI เข้าใจจิตใจคนได้ดีขึ้น
วิจัยใหม่แก้ปัญหา LLM Agent ในงานยาว: จัดการ Context อัจฉริยะ ตรวจสอบความน่าเชื่อถือ
นักวิจัยเผยวิธีแก้ปัญหาหลักของ LLM agents ในงานระยะยาว — context degradation, distribution shift, และ prompt drift ที่ทำให้ agent ล้มเหลว งานวิจัยใหม่ๆ เสนอ AdaCoM (adaptive context management), event-sourced architecture, runtime verification, และ write-time intelligence เพื่อให้ agents ทำงานได้เสถียรและตรวจสอบได้ในระบบจริง ปัญหาเดิมคือ context ยาวขึ้น agent ใจลอย หรือ prompt เปลี่ยนแปลงเงียบๆ ตอนนี้มีวิธีควบคุมและตรวจสอบแบบ fine-grained แล้ว
AI ของคุณพูดเหมือนคนอื่น เพราะปล่อยให้โมเดลออกแบบการสนทนา
บริษัทส่วนใหญ่ใช้ AI voice agent โดยไม่รู้ตัวว่าปล่อยให้โมเดลตัดสินใจว่าจะคุยกับลูกค้าอย่างไร ผลคือเนื้อหา generic เหมือนกันหมด ปัญหาแท้จริงอยู่ก่อนพิมพ์ prompt — ต้องออกแบบการสนทนาเอง แล้วค่อยให้โมเดลทำงาน ไม่ใช่ให้โมเดลเป็นผู้ออกแบบ
งานวิจัยใหม่เสนนวิธีฝึก LLM ด้วยสัญญาณอ่อน แทนการติดป้ายข้อมูลแพง
ทีมวิจัยพบว่าแทนจะรอข้อมูล labeled ที่มีคุณภาพสูง เราสามารถรวมสัญญาณ \"อ่อน\" (weak signals) จากโมเดลตัวน้อยได้ — เช่นเอาความแตกต่างระหว่าง Qwen 4B กับ 1.7B มาใช้ฝึก 8B ให้แข็งแรง งานที่เกี่ยวข้องเน้นปัญหาจริง: rubric ของ LLM judge ต้องชัด ถ้าวาง \"helpful\" โดยไม่ระบุเพิ่มเติม มันก็ให้คะแนนตัวเลือกที่โพล่งแต่ผิด และการเปรียบเทียบ RAG ต้องควบคุมตัวแปรให้ขาด (budget, pool size, clustering) ไม่งั้นคะแนนเดียวกันอาจหมายถึงคนละอย่าง
วิศวกร AI ประเมินปัญหา latency-reliability-cost ใน agentic workflows
ทีม researcher เพิ่งจัดเรียงแบบจำลองสำหรับ workflow ที่มี agent หลายตัว — บางตัวเป็น LLM บางตัวเป็น module ปกติ — เพื่อให้เห็นการแลกเปลี่ยน (tradeoff) ระหว่าง latency (ไว), reliability (ยังงัน), กับ cost (เสียเงิน). ปรากฏว่าพยายามเพิ่ม output quality ของ agent บ้านต่อด้วย reasoning tokens มากขึ้นมีราคา: ลดความเร็ว หรือเพิ่มค่าใช้จ่าย. วิธีอื่นคือออกแบบ workflow ให้ agent ทำงานขนานกัน หรือข้ามข้อมูลไม่จำเป็น.
วิธีเทรนโมเดล AI ให้เหตุผลได้ดีขึ้น — จากการแข่งกันของวิธีการ 6 แบบใน arXiv
นักวิจัย arXiv ทดสอบวิธีการเทรนหลังจากที่เทรนหลัก (post-training) สำหรับ LLM ที่ต้องเหตุผลเชิงคณิตศาสตร์ — เช่น Lean theorem proving ผลการศึกษาพบว่า on-policy distillation (OPD) และ self-distillation (OPSD) ช่วยให้ได้ feedback หนาแน่นในระดับ token ได้ดีกว่า GRPO เดิม แต่มีปัญหาเรื่องความเสถียรและการล่มสลายแบบ mode collapse งานนี้มีค่าต่อ dev ที่อยากให้โมเดลของตัวเองเรียนรู้จากคำแนะนำของตัวเอง
AI เอเจนต์เรียนรู้ออกแบบ 3D และจำลองวิศวกรรม—ไม่ต้องเป็นผู้เชี่ยวชาญ
ทีมวิจัยเปิดตัวระบบ AI หลายตัวที่ทำงานร่วมกัน: BrickAnything สร้างโครงสร้าง LEGO ที่สร้างได้จริง, TO-Agents แปลงความต้องการของดีไซเนอร์เป็นปัญหาปรับแต่งรูปร่าง, และ AbaqusAgent ช่วยให้วิศวกรทำการวิเคราะห์ความแข็งแรง (FEA) โดยพูดธรรมชาติ ไม่ต้องเรียนรู้ขั้นตอนซับซ้อน
AI ต้องเข้าใจฟิสิกส์จริง ไม่ใช่แค่ยัน สิ่งที่ LLM/robot ทำผิดในโลกจริง
ปัญหาใหญ่ของ AI วันนี้คือมันเข้าใจโลกจากการทำนายเชิงสัญลักษณ์ แต่ในการปฏิบัติงานจริง (robot ขยับ diagram วาดกฎฟิสิกส์) มันต้องเข้าใจเหตุและผล ไม่ใช่แต่การจำรูปแบบ วิจัยล่าสุดแสดงว่า multimodal LLM ล้มเหลวตั้งแต่การคำนวณการชนของลูก billiard ไปถึง causal reasoning และ world model ที่มีชีวิต ซึ่งแก้ได้ด้วย neuro-symbolic pipeline กับการให้ AI เรียนรู้ผ่านการกระทำและความล้มเหลว