ข่าว AI ที่กำลังขยับตอนนี้

บริษัทเปลี่ยนมุมมองคลาวด์ จากเครื่องมือเป็นกลยุทธ์แข่งขัน

คลาวด์ไม่ใช่แค่เทคโนโลยีอีกต่อไป — กลายเป็นโครงสร้างพื้นฐานเหมือนไฟฟ้า ขนส่ง โทรคมนาคม บริษัทเริ่มคิดแบบ platform thinking และ multicloud เพื่อให้ระบบยืดหยุ่นได้ตามความต้องการ โดยเฉพาะเวลาย้ายไปใช้ sovereign cloud ต้องวางแผนการวาง workload อย่างชาญฉลาด ไม่ใช่แค่ย้ายแบบตรงๆ

AI summary 3 แหล่ง · 2 วันก่อน

AI Agent Cloud เป็นตลาดใหม่ — Cognition筹1B, Railway/Daytona/Modal ขึ้นยูนิคอร์น

ตลาด AI agent infrastructure กำลังระเบิด Cognition เพิ่งเก็บ $1B ที่ valuation $26B ขณะที่ Railway, Daytona, Modal, Exa, Fireworks, Baseten ทั้งหมดขึ้นยูนิคอร์นหรือเดคาคอร์นในช่วงเดียวกัน ปัญหาหลัก: agent ต้องการ compute ที่ reliable (bare metal sandbox, full VM, own-metal data center) และ infrastructure ที่ async-first เพื่อให้ agent ทำงานแบบ spec-to-PR ได้ตามจริง Railway เห็น $200K+ monthly spend จาก coding agent ผู้ใช้เพียงคนเดียว

Latent.SpaceStratecheryHugging Face Blog

AI summary 2 แหล่ง · 2 วันก่อน

Anthropic ปล่อย Claude Mythos หาช่องโหว่ในโครงสร้างพื้นฐาน 15+ ประเทศ

Anthropic เปิดตัว Claude Mythos รุ่นใหม่ที่ออกแบบมาเพื่อค้นหาช่องโหว่ความปลอดภัยในระบบวิกฤต เช่น ไฟฟ้า น้ำ สุขภาพ และการสื่อสาร ผ่านโครงการ Project Glasswing ขยายให้ 150 องค์กรใน 15+ ประเทศ Anthropic เตือนว่าโมเดลนี้มีความเสี่ยงสูงจึงไม่ปล่อยให้สาธารณชน แต่ Firefox ได้ใช้มันค้นพบบั๊กร้ายแรงหลายตัวแล้ว

StratecheryTechCrunch — AI

AI เปลี่ยนการจัดซื้อจากตอบโต้เป็นคาดการณ์ล่วงหน้า ลดความล่าช้า

องค์กรใช้ AI เพื่อเปลี่ยนจากการดูแลผู้ขายแบบ reactive scorecard มาเป็นการตัดสินใจแบบ real-time ที่คาดการณ์ได้ ช่วยจับปัญหาห่วงโซ่อุปทานก่อนเกิด ลดความล่าช้า และทำให้ทีมสามารถปรับเส้นทางสินค้า ปรับตารางเวลา และแก้ปัญหาฉุกเฉินได้เร็วขึ้น ไม่ต้องรอการตัดสินใจจากชั้นบน

ช่องว่างระหว่างค้นหาปัญหากับแก้ปัญหา — ทำไม security tools ไม่เท่ากับ security

ปัญหาใหญ่ของ cybersecurity วันนี้ไม่ใช่เรื่องค้นหาช่องโหว่ — tools ทำได้ดี แต่เรื่องการตอบสนองและแก้ไข ระบบ observability บอกว่า \"เกิดอะไรขึ้น\" แต่ไม่บอก \"ใครกำลังทำอะไรกับมัน\" ทีมต้องเชื่อมระหว่าง detection, incident response, และ governance ให้เป็นระบบเดียว ไม่งั้นการค้นหาปัญหาเร็วแค่ไหนก็ไม่ช่วย

AI summary 4 แหล่ง · 2 วันก่อน

องค์กรเลิกรอ: AI agents ขึ้นมาแล้ว ต้องเปลี่ยนวิธีทำงานตอนนี้

เทคโนโลยี AI agents กำลังเปลี่ยนจากเครื่องมือให้ความช่วยเหลือเป็นระบบที่ทำงานอัตโนมัติจริง OpenAI ปล่อย SDK ใหม่ให้ build agents ได้ปลอดภัยกว่า Notion เปิด platform ให้ connect agents เข้า workspace ส่วน Choco ใช้ AI agents ลดเวลาจัดสินค้าอาหารลง ปัญหาคือองค์กรส่วนใหญ่ยังคิดว่า AI คือเครื่องมือ ไม่ใช่ partner ที่ต้องฝึกให้เข้าใจ business logic ของตัวเอง

TechCrunch — AIOpenAI BlogForbes - AI +1

GitHub เตรียมรับมือ AI Coding Agents — Copilot ขยายตัวเกินความคาดหมาย

GitHub เผชิญความท้าทายจากการระเบิดของ AI coding agents หลังจากเปิดตัว Copilot — ปริมาณการใช้งาน metrics เพิ่มขึ้นอย่างต่อเนื่อง ทำให้แพลตฟอร์มต้องปรับตัว Kyle Daigle จาก GitHub เล่าแผนรับมือ ซึ่งรวมถึงการออกแบบใหม่เพื่อรองรับ agentic workflows ที่ซับซ้อนมากขึ้น

Latent.Space

3 วิธีใหม่สร้างข้อมูลฝึก AI ให้คิดเหมือนคน โดยไม่ต้องมีคำตอบเตรียมไว้

นักวิจัย arXiv เพิ่งโพสต์ 3 เฟรมเวิร์กใหม่ (MindLoom, OSCToM, MindZero) ที่แก้ปัญหาเดิม: สร้างข้อมูลฝึก reasoning ระดับสูงให้ LLM ได้ยาก ควบคุมความยากได้ยาก และต้องใช้คำตอบที่มนุษย์ทำไว้ MindLoom ใช้ \"thought modes\" (หน่วยย่อยของการคิด) เพื่อควบคุมความยาก OSCToM เน้นความขัดแย้งในความเชื่อซ้อนกัน MindZero ใช้RL ที่ไม่ต้องคำตอบเตรียมไว้ ทั้งหมดมุ่งให้ AI เข้าใจจิตใจคนได้ดีขึ้น

AI summary 2 แหล่ง · 2 วันก่อน

วิจัยใหม่แก้ปัญหา LLM Agent ในงานยาว: จัดการ Context อัจฉริยะ ตรวจสอบความน่าเชื่อถือ

นักวิจัยเผยวิธีแก้ปัญหาหลักของ LLM agents ในงานระยะยาว — context degradation, distribution shift, และ prompt drift ที่ทำให้ agent ล้มเหลว งานวิจัยใหม่ๆ เสนอ AdaCoM (adaptive context management), event-sourced architecture, runtime verification, และ write-time intelligence เพื่อให้ agents ทำงานได้เสถียรและตรวจสอบได้ในระบบจริง ปัญหาเดิมคือ context ยาวขึ้น agent ใจลอย หรือ prompt เปลี่ยนแปลงเงียบๆ ตอนนี้มีวิธีควบคุมและตรวจสอบแบบ fine-grained แล้ว

arXiv — cs.AIImport AI

AI ของคุณพูดเหมือนคนอื่น เพราะปล่อยให้โมเดลออกแบบการสนทนา

บริษัทส่วนใหญ่ใช้ AI voice agent โดยไม่รู้ตัวว่าปล่อยให้โมเดลตัดสินใจว่าจะคุยกับลูกค้าอย่างไร ผลคือเนื้อหา generic เหมือนกันหมด ปัญหาแท้จริงอยู่ก่อนพิมพ์ prompt — ต้องออกแบบการสนทนาเอง แล้วค่อยให้โมเดลทำงาน ไม่ใช่ให้โมเดลเป็นผู้ออกแบบ

งานวิจัยใหม่เสนนวิธีฝึก LLM ด้วยสัญญาณอ่อน แทนการติดป้ายข้อมูลแพง

ทีมวิจัยพบว่าแทนจะรอข้อมูล labeled ที่มีคุณภาพสูง เราสามารถรวมสัญญาณ \"อ่อน\" (weak signals) จากโมเดลตัวน้อยได้ — เช่นเอาความแตกต่างระหว่าง Qwen 4B กับ 1.7B มาใช้ฝึก 8B ให้แข็งแรง งานที่เกี่ยวข้องเน้นปัญหาจริง: rubric ของ LLM judge ต้องชัด ถ้าวาง \"helpful\" โดยไม่ระบุเพิ่มเติม มันก็ให้คะแนนตัวเลือกที่โพล่งแต่ผิด และการเปรียบเทียบ RAG ต้องควบคุมตัวแปรให้ขาด (budget, pool size, clustering) ไม่งั้นคะแนนเดียวกันอาจหมายถึงคนละอย่าง

วิศวกร AI ประเมินปัญหา latency-reliability-cost ใน agentic workflows

ทีม researcher เพิ่งจัดเรียงแบบจำลองสำหรับ workflow ที่มี agent หลายตัว — บางตัวเป็น LLM บางตัวเป็น module ปกติ — เพื่อให้เห็นการแลกเปลี่ยน (tradeoff) ระหว่าง latency (ไว), reliability (ยังงัน), กับ cost (เสียเงิน). ปรากฏว่าพยายามเพิ่ม output quality ของ agent บ้านต่อด้วย reasoning tokens มากขึ้นมีราคา: ลดความเร็ว หรือเพิ่มค่าใช้จ่าย. วิธีอื่นคือออกแบบ workflow ให้ agent ทำงานขนานกัน หรือข้ามข้อมูลไม่จำเป็น.

วิธีเทรนโมเดล AI ให้เหตุผลได้ดีขึ้น — จากการแข่งกันของวิธีการ 6 แบบใน arXiv

นักวิจัย arXiv ทดสอบวิธีการเทรนหลังจากที่เทรนหลัก (post-training) สำหรับ LLM ที่ต้องเหตุผลเชิงคณิตศาสตร์ — เช่น Lean theorem proving ผลการศึกษาพบว่า on-policy distillation (OPD) และ self-distillation (OPSD) ช่วยให้ได้ feedback หนาแน่นในระดับ token ได้ดีกว่า GRPO เดิม แต่มีปัญหาเรื่องความเสถียรและการล่มสลายแบบ mode collapse งานนี้มีค่าต่อ dev ที่อยากให้โมเดลของตัวเองเรียนรู้จากคำแนะนำของตัวเอง

AI เอเจนต์เรียนรู้ออกแบบ 3D และจำลองวิศวกรรม—ไม่ต้องเป็นผู้เชี่ยวชาญ

ทีมวิจัยเปิดตัวระบบ AI หลายตัวที่ทำงานร่วมกัน: BrickAnything สร้างโครงสร้าง LEGO ที่สร้างได้จริง, TO-Agents แปลงความต้องการของดีไซเนอร์เป็นปัญหาปรับแต่งรูปร่าง, และ AbaqusAgent ช่วยให้วิศวกรทำการวิเคราะห์ความแข็งแรง (FEA) โดยพูดธรรมชาติ ไม่ต้องเรียนรู้ขั้นตอนซับซ้อน