ข่าว AI ที่กำลังขยับตอนนี้
ข่าวจากหลายแหล่งที่รวมเป็นเรื่องเดียวให้แล้ว เหมาะสำหรับเช็กระหว่างวัน ก่อนเลือกอ่านต้นทางต่อ
AI agents ต้องเรียนรู้ขอบเขตตนเอง — ปัญหา overestimation และวิธีแก้
ทีมวิจัยพบว่า LLM agents ไม่รู้จักตัวเอง — พวกมันประเมินความสามารถสูงเกินไป แล้วพยายามทำงานที่ไม่มีทางสำเร็จได้ ปัญหาเรื่องเชื่อถือได้ของ agent (ว่าจะทำตามเหตุผลที่บอกหรือไม่) และการตัดสินใจเมื่อไหร่ควร delegate งานต่อเป็นเรื่องจริง การแก้คือการสอนให้ model ประเมินตัวเองแบบ policy learning พร้อมระบบตรวจสอบ runtime ที่เข้มข้นขึ้น
ทำให้ AI เห็นกราฟและแผนผัง ก็เหตุผลได้ดีขึ้น — ตั้ง benchmark VAMPS
นักวิจัยพบว่า multimodal LLM เวลาต้องใช้เครื่องมือแสดงผล (เช่นเขียนกราฟ) แล้วเหตุผลจากภาพออกมา มักจะช่วยได้ แต่ AI ยังไม่รู้จะออร์แกไนซ์การคิดแบบนั้นเก่งอยู่ งานวิจัยใหม่ลองใช้กราฟ-โครงสร้างคิดแบบแผนผังเป็นตัวเรียงความเห็นภายในของโมเดล ไม่ใช่เพียงข้อมูลเข้า ผลลัพธ์คือ AI ไขปัญหาแบบวิศวกรรมจริงที่พึ่ง visualization ได้ดีขึ้น
AI Agent ที่ทำงานเป็นทีมต้องหลีกเลี่ยงข้อผิดพลาดหมู่ — วิจัยบอกวิธีแก้
เมื่อ AI agent หลายตัวช่วยกันแก้ปัญหา มันไม่ใช่แค่ให้ผลดีกว่าเสมอ วิจัยใหม่พบว่า multi-agent debate บางทีทำให้เกิด \"critique-induced confusion\" — agent ยอมรับ feedback ผิดจากพวกมันเอง โดยไม่คิดหนัก ในขณะเดียวกัน agent network ที่ไม่มีโครงสร้างความเชื่อถือ กับการจัดการข้อมูลท่วม อาจทำให้ escalate ความผิดพลาด แต่ถ้าออกแบบให้ดี — เช่น ใช้ trace-level synthesis แทน majority vote — ผลลัพธ์ดีขึ้นอย่างเห็นได้ชัด
OpenAI เปิด GPT-Rosalind และ GPT-5.4-Cyber ให้นักพัฒนาและหน่วยงานรัฐ เพื่อเสริมความเข็มแข็งด้านชีววิทยาและไซเบอร์
OpenAI ขยายการเข้าถึง GPT-Rosalind ให้กับนักพัฒนาที่ผ่านการตรวจสอบและพันธมิตรรัฐบาลสหรัฐฯ เพื่อสนับสนุนการป้องกันภัยทางชีววิทยา การเตรียมความพร้อมต่อการแพร่ระบาด และการวิจัยวิทยาศาสตร์ชีวิต พร้อมเปิดตัว GPT-5.4-Cyber ให้บริษัทความปลอดภัยชั้นนำใช้ในการป้องกันภัยไซเบอร์ โดยมีทุนสนับสนุน 10 ล้านดอลลาร์ และเรียกชวนให้ผู้เชี่ยวชาญค้นหาช่องโหว่ความปลอดภัยผ่านการแข่งขัน Bug Bounty ที่มีรางวัลสูงถึง 25,000 ดอลลาร์
Gemini Spark ตัวแรกของ Google ทำงานได้ดี แต่ค่าใช้จ่ายและความเป็นส่วนตัวเป็นปัญหา
Google เปิดตัว Gemini Spark — AI agent ที่ทำงานแทนผู้ใช้ได้ 24/7 ตัวอย่างเช่นวางแผนการเดินทาง ค้นหาตัวเลือกเที่ยว และจัดการงานต่างๆ ได้อย่างมีประสิทธิภาพ แต่ผู้ทดสอบจาก The Verge พบว่า Spark รู้ข้อมูลส่วนตัว (ชื่อสัตว์เลี้ยง ชื่อคู่สมรส) โดยไม่ได้บอกอย่างชัดแจ้ง ซึ่งเป็นสัญญาณเตือนเรื่องความเป็นส่วนตัวและต้นทุนการใช้งาน
AI พยากรณ์อากาศเอาชนะหน่วยงานรัฐ Windborne เปิด framework ของ Google
Windborne Systems ใช้ AI พยากรณ์อากาศได้แม่นยำกว่าหน่วยงานรัฐหลายวัน Google เองก็เปิด hydrology framework ให้ dev ใช้ฟรี เพื่อพัฒนาระบบเตือนน้ำท่วมฉับพลัน ทั้งสองเคลื่อนไหวเดียวกัน — ใช้ ML ทำให้พยากรณ์อากาศและน้ำท่วมแม่นขึ้น เร็วขึ้น ช่วยเมืองเตรียมตัวได้ทันก่อนเกิดเหตุ
TeamPCP โจมตีซัพพลายเชน: OpenAI, Trivy, Dashlane ถูกบุกรุก
แก๊งแฮกเกอร์ TeamPCP ทำการโจมตีซัพพลายเชนในระดับที่ไม่เคยเห็นมาก่อน โดยบุกรุก GitHub, OpenAI, Trivy scanner และ Dashlane ผ่านมัลแวร์ infostealer ที่ติดตั้งบน devices ของพวกเขา OpenAI ยืนยันไม่มีข้อมูลผู้ใช้รั่ว แต่ Dashlane เงียบเชื่อ โดยเพียงแจ้งว่า 20 encrypted vaults ถูกขโมย ปัญหาแสดงให้เห็นว่าการติดตามการเข้าถึงข้อมูลของบุคคลที่สามนั้นยากเหมือนการติดตามการควบคุมของตัวเอง
บริษัทต้องสร้าง '憲法AI' เพื่อควบคุมตัวแทนอัจฉริยะ ไม่ให้วุ่นวายระบบ
เมื่อ AI agents เริ่มทำงานจริง (เขียนโค้ด อัปเดต database) บริษัทไม่สามารถรอให้ผิดพลาดแล้วค่อยตรวจสอบได้ ต้องสร้างกฎเกณฑ์ชัดเจน (ประมาณ constitution) ให้ AI ปฏิบัติตั้งแต่ต้น พร้อมระบบ monitoring แบบเรียลไทม์ เพราะเมื่อ AI ทำการกระทำ ความรับผิดชอบกระจายไปหลายทีม ไม่มีจุดเดียวที่ต้องรับผิด
เอเจนต์ AI ไม่ใช่ปัญหา AI — ปัญหาคือข้อมูลและสถาปัตยกรรม
องค์กรที่เตรียมตัวสำหรับ agentic AI กำลังค้นพบว่าความสำเร็จไม่ได้มาจากโมเดลที่ดีกว่า แต่มาจากการจัดการข้อมูล บริบท และกระบวนการให้พร้อม ปัญหาแท้คือ data infrastructure ที่ไม่เร็ว ไม่เชื่อถือได้ และสถาปัตยกรรมที่ยังไม่รองรับการทำงานอัตโนมัติแบบ role-aware พร้อมการควบคุมสิทธิ์ที่ชาญฉลาด
Microsoft เปิดตัวระบบควบคุม AI Agent ผ่านไฟล์นโยบายแบบพกพา
Microsoft ให้ dev teams สามารถกำหนดนโยบายสำหรับ AI agents ผ่านไฟล์นโยบายแบบพกพา ที่ compliance และ security teams สามารถใช้ร่วมกันได้ ไม่ต้องสร้าง agent ใหม่ทุกครั้ง แนวคิดนี้เรียกว่า \"governance by construction\" — ฝังการควบคุมเข้าไปในสถาปัตยกรรมระบบตั้งแต่เริ่มต้น แทนที่จะเพิ่มเข้ามาภายหลัง
องค์กรติดอยู่ AI pilot — ปัญหาจริงคือเลือกเครื่องมือก่อนเข้าใจปัญหา
บริษัทส่วนใหญ่ล้มเหลวในการนำ AI ไปใช้จริง ไม่ใช่เพราะเลือกโมเดลผิด แต่เพราะสับสนระหว่าง \"นำ AI มา\" กับ \"มีกลยุทธ์ AI\" พวกเขาวิ่งไปหา agentic ERP หรือ LLM ใหม่ๆ ก่อนที่จะถามตัวเองว่า \"ปัญหาธุรกิจจริงคืออะไร\" ผลคือติดอยู่ใน pilot loop ไม่ขึ้น production — เพราะไม่มี operational readiness ที่ชัด
Meta ขยายสินค้า: subscription ทั่วโลก, AI บน WhatsApp, Ray-Ban Display เขียนข้อความด้วยท่ามือ
Meta กำลังปล่อยตัวใหม่หลายด้านพร้อมกัน — subscription plans สำหรับ Instagram, Facebook, WhatsApp ทั่วโลก, AI agent บน WhatsApp Business คิดค่าตามการใช้ token, และ Ray-Ban Display smart glasses ที่เพิ่มฟีเจอร์เขียนข้อความด้วยท่ามือ นอกจากนี้ WhatsApp ยังเพิ่ม incognito mode สำหรับ Meta AI ที่ Meta เองไม่สามารถอ่านข้อความได้
โค้ดซับซ้อนไม่ใช่ป้อมปราการแล้ว GenAI ทำให้ legacy modernization ติดขัด
เทคโนโลยีที่ซับซ้อนเคยเป็นสินทรัพย์ป้องกัน แต่ GenAI ทำให้เขียนโค้ดยากไม่ยากอีกต่อไป ปัญหาคือองค์กรลงทุนเยอะ ทดลองเร็ว แต่ governance กับการวัด value ไม่ทันตัว ส่วน legacy system กลายเป็นภาระเงียบ ๆ ที่สะสมเรื่อย ๆ ขณะเดียวกัน attacker ใช้ AI หาช่องโหว่เร็วขึ้น ทำให้ bug hunting เป็น arms race
Google AI Search พังหลายจุด ผู้จัดพิมพ์ได้สิทธิ์ปฏิเสธ CMA บังคับ
Google AI Overviews เจอปัญหาใหญ่: ค้นหาคำบางคำแล้ว AI ตอบผิด (เช่น \"disregard\" ทำให้ interface พัง) ยิ่งไป SEO strategy เดิมไม่ใช้ได้แล้ว ส่วน UK CMA บังคับให้ Google ให้ผู้จัดพิมพ์เลือกปฏิเสธการใช้เนื้อหาในฟีเจอร์ AI Search ซึ่งจะทดสอบที่ UK แล้วขยายไปทั่วโลก ผู้ใช้บางคนเลยหันไปใช้ search engine อื่น
บริษัทยังไม่พร้อม: AI Governance กลายเป็นความเสี่ยงที่ไม่มีใครจัดการ
ขณะที่ทีมต่างๆ ทดลอง AI อย่างไม่มีการควบคุม ปัญหาเรื่อง prompt governance, security, compliance และ bias กำลังสะสมตัว บริษัทส่วนใหญ่ยังขาดระบบบริหารจัดการ prompt ที่เป็นทางการ ทำให้ AI agents ทำงานแบบ probabilistic ไม่สามารถรับประกันผลลัพธ์ที่ deterministic ได้ ปัญหาเพิ่มเติมคือ generic AI agents ไม่เหมาะสำหรับอุตสาหกรรมที่มีกฎระเบียบเข้มงวด และทีม security ยังคิดแบบ binary (human vs threat) แทนที่จะเข้าใจ bot diplomacy
Trump ลงนามคำสั่งให้บริษัท AI ส่งโมเดลให้รัฐตรวจสอบก่อนเปิดตัว
Trump ลงนามคำสั่งบริหารให้บริษัท AI ส่งโมเดล frontier ให้รัฐตรวจสอบความปลอดภัยก่อนเปิดตัวต่อสาธารณะ แต่เป็นระบบ voluntary ไม่บังคับ หลังจากอุตสาหกรรม AI คัดค้านเวอร์ชันแรกที่เข้มงวดกว่า เป้าหมายคือเสริมความปลอดภัยสำหรับโครงสร้างพื้นฐานสำคัญ พร้อมให้อุตสาหกรรม AI ของสหรัฐฯ ยังคงเติบโตได้
Google และ Amazon เพิ่ม AI ลงในค้นหา ผู้ใช้หนีไป DuckDuckGo
Google และ Amazon ปรับค้นหาให้เต็มไปด้วย AI — Google เพิ่ม Gemini chatbot และโฆษณา AI ลงใน search results ส่วน Amazon แสดง AI-generated product images ตอนค้นหา แต่ผู้ใช้ไม่ชอบ: DuckDuckGo ที่ไม่มี AI ดาวน์โหลดเพิ่ม 30% ในเดือนที่ผ่านมา ขณะที่ Glean (enterprise AI search) ยังโตขึ้น 3 เท่า เพราะบริษัทต้องการ AI ที่ประหยัดงบประมาณ
Google I/O เปิด AI agents ทั่วไป แต่ Pope และ CEO ต่างกังวลเรื่องงาน
Google I/O เสนอ AI agents ใหม่ในอีเมล YouTube และ world models (Genie) ที่จำลองสถานการณ์จริง ขณะที่ Pope ออกจดหมายเตือนว่า AI ไม่ใช่เรื่องเทคนิคแค่อย่างเดียว แต่ส่งผลต่อสิทธิและอิสระของคน Demis Hassabis เรียกนี้ว่า \"foothills of singularity\" แต่ผู้บริหาร Google DeepMind และนักเศรษฐศาสตร์แรงงานต่างเน้นว่า AI ควรเพิ่มผลผลิต ไม่ใช่ตัดงาน
AI agents ทำการค้าขายคริปโตอัตโนมัติ — วิจัยเปิดสถาปัตยกรรมและผลประมาณการ
สามบทความวิจัยใหม่จาก arXiv วิเคราะห์ AI agents ที่ใช้ LLM สำหรับการค้าขายในตลาดการเงิน โดยเฉพาะ DeFi บน Solana — มูลค่ารวม 3 พันล้านดอลลาร์ตั้งแต่ปลายปี 2024 งานวิจัยตรวจสอบ 1,900+ โปรเจกต์ AI-tagged และวิเคราะห์โครงสร้างของ ElizaOS กับ Virtuals Protocol พร้อมประเมินผลประมาณการ on-chain ของ 11 agent treasuries บน Solana ขณะเดียวกัน AuditFlow เสนอวิธีใหม่ให้ AI agentsตรวจสอบรายงานการเงินแบบมีโครงสร้าง
AI ต้องการพลังงานเท่าประเทศ: ปัญหาโครงสร้างพื้นฐานที่ tech giants กำลังเผชิญ
Tech giants ตั้งแต่ OpenAI ถึง xAI กำลังสร้างข้อมูลเซ็นเตอร์ขนาดกิกะวัตต์เพื่อรองรับ AI แต่พบปัญหาใหญ่: ไฟฟ้า น้ำ และการปฏิบัติตามกฎหมาย xAI ใช้เครื่องกำเนิดไฟฟ้าแบบแก๊สโดยไม่ได้รับอนุญาต Microsoft ในเคนยาต้องหยุดโครงการเพราะกริดไฟไม่พอ ส่วน SpaceX ลงทุน 2.8 พันล้านเหรียญซื้อเครื่องกังหัน ทำให้ปัญหาพลังงานกลายเป็นคอขวดแท้ของ AI infrastructure ไม่ใช่ compute หรือ chip