ข่าว AI ที่กำลังขยับตอนนี้
ข่าวจากหลายแหล่งที่รวมเป็นเรื่องเดียวให้แล้ว เหมาะสำหรับเช็กระหว่างวัน ก่อนเลือกอ่านต้นทางต่อ
สตาร์ทอัพ AI เสนอทำความสะอาดบ้านฟรี แลกกับวิดีโอฝึกหุ่นยนต์
Shift เป็นสตาร์ทอัพ AI ที่เสนอให้ทำความสะอาดบ้านฟรีสำหรับผู้อยู่อาศัยในนิวยอร์ก แต่เงื่อนไขคือต้องให้บันทึกวิดีโอของพนักงานทำความสะอาดเพื่อใช้เป็นข้อมูลฝึกหุ่นยนต์ในอนาคต ในขณะเดียวกัน Figure AI ก็เผยแพร่วิดีโอหุ่นยนต์ Figure 03 ที่ทำงานคัดแยกพัสดุเป็นเวลา 8 ชั่วโมง แม้ว่าบางคนสงสัยความเป็นจริงของการสาธิตนี้
FBI รีเซ็ตเราเตอร์นับพันตัวเพื่อขับแฮกเกอร์รัสเซีย TP-Link อาจได้รับผลกระทบ
FBI ได้รับอนุญาตจากศาล (court order) ให้รีเซ็ตเราเตอร์ผู้บ้านและออฟฟิศเล็กนับพันตัวจากระบบไกล เพื่อขับไล่แฮกเกอร์รัสเซีย ที่ใช้เราเตอร์เหล่านี้เป็นส่วนหนึ่งของ botnet ขนาด 17 ล้านอุปกรณ์ ที่เชื่อมโยงกับเครือข่าย proxy ที่ใช้ทางทหารรัสเซีย เราเตอร์รุ่นเก่าที่หมดสนับสนุนในกว่า 120 ประเทศถูกเป้าหมาย
ปัญหาแท้ของ AI ในองค์กร: ไม่ใช่เทคโนโลยี แต่คนและกระบวนการ
บทความจากหลายแหล่งชี้ว่าเหตุผลที่โครงการ AI ล้มเหลวไม่ใช่เพราะโมเดลไม่ดี แต่เพราะองค์กรไม่พร้อมในด้านคน กระบวนการ และการปรับตัว บริษัทส่วนใหญ่ยังถามว่า \"ควรซื้อเครื่องมือ AI ตัวไหน\" แทนที่จะถาม \"เราพร้อมใช้มันหรือยัง\" ความสำเร็จมาจากการเชื่อมโยงเทคโนโลยีกับการเปลี่ยนแปลงองค์กร ไม่ใช่จากการเลือกโมเดลที่ดีที่สุด
Agentic AI ต้องมีระบบ governance — ไม่ใช่แค่ patch prompt ไปเรื่อยๆ
เมื่อ agentic AI systems ทำงานในโปรดักชั่น (เรียก tools, จำ context, ตัดสินใจหลายขั้น) มันสร้าง technical debt ที่ต่างจาก ML ทั่วไป — prompts, memory, tool schemas, orchestration graphs ถูก patch เร็วกว่าการ validate และ standardize ได้ ปัญหาคือ accountability boundaries ไม่ชัด เมื่อ AI output ต้องมีคนลงนาม หรือต้องเป็นไปตามกฎ ทีมต้องสร้าง governance infrastructure ที่ executable ไม่ใช่แค่เอกสาร
ChatGPT เชื่อมบัญชีธนาคารได้แล้ว — ผู้ใช้ Pro ในสหรัฐฯ ลองแล้ว
OpenAI เปิดฟีเจอร์ให้ ChatGPT Pro subscribers ในสหรัฐฯ เชื่อมบัญชีธนาคารผ่าน Plaid เพื่อรับคำแนะนำการเงินและวิเคราะห์รายจ่ายแบบ personalized ขณะเดียวกัน MUFG ใช้ ChatGPT Enterprise สร้างบริการการเงินที่ขับเคลื่อนด้วย AI ในองค์กร
AI เรียนรู้การให้เหตุผลเชิงพื้นที่ — ทำให้สร้างวิดีโอและแอนิเมชันได้แม่นยำขึ้น
นักวิจัยเพิ่งเปิดตัว framework และ benchmark ใหม่สำหรับให้ AI เข้าใจการให้เหตุผลเชิงพื้นที่ (spatial reasoning) — ซึ่งช่วยให้ LLM สร้างโค้ดวิดีโอและแอนิเมชันที่ถูกต้องทางเรขาคณิตได้ดีขึ้น แทนที่จะพึ่งพิกเซล diffusion ที่มักเกิด overlap หรือ misalignment ทีม Hugging Face ก็ปล่อย fine-tuning guide สำหรับ NVIDIA Cosmos ที่ใช้ LoRA/DoRA ให้ dev ลองทำได้เลย
AI ทำวิจัยเอง แต่ปัญหาคือ: ประเมินผลไม่ได้ อ้างอิงแต่งขึ้น
เอกสารใหม่จาก arXiv เปิดปัญหาใหญ่ของ AI ที่ทำวิจัยอัตโนมัติ: ผลลัพธ์ดูเหมือนจริง แต่อ้างอิงเป็นเท็จ คะแนนไม่ซ้ำได้ วิธีการไม่ตรงกับโค้ด ทีมวิจัยเลยสร้าง Chain-of-Evidence framework และระบบ ScientistOne ที่บังคับให้ AI ติดตามหลักฐานทุกอ้างสิ่ง พร้อมเปิดแพลตฟอร์ม AiraXiv สำหรับ AI-generated papers ที่ตรวจสอบได้
Hugging Face เปิด Storage Buckets และ Delta Weight Sync — ทำให้ฝึก LLM ขนาดเทราพารามิเตอร์ง่ายขึ้น
Hugging Face Hub เพิ่มฟีเจอร์ Storage Buckets ให้เก็บไฟล์โมเดลใหญ่ๆ ได้ และ Delta Weight Sync ใน TRL ที่ช่วยซิงค์เฉพาะการเปลี่ยนแปลงน้ำหนัก ไม่ต้องอัปโหลดโมเดลทั้งหมด ทำให้ dev ที่ฝึก LLM ขนาดใหญ่สามารถจัดการ checkpoint และ iteration ได้เร็วขึ้น ลดเวลารอและ bandwidth
LLM จริงๆ คิดได้หรือแค่จำแบบ? นักวิจัยสงสัยเรื่องความรู้ตัวของ AI
กลุ่มนักวิจัยตั้งคำถามว่า LLM สามารถรู้ตัวเกี่ยวกับสถานะภายในของตัวเองได้จริงหรือแค่จำรูปแบบจากข้อมูล พวกเขาเสนอว่าการทดสอบปัจจุบันไม่เพียงพอ และเปิดตัว OmniToM — เบนช์มาร์กใหม่ที่วัด Theory of Mind ผ่านการสร้างแบบจำลองความเชื่อที่ชัดเจน ไม่ใช่แค่คำตอบสุดท้าย นอกจากนี้ยังมีสถาปัตยกรรม CCT ที่ใช้ category theory ลดค่า perplexity ลง 12% เทียบกับ GPT-2
OpenAI และ Adobe เพิ่มเครื่องมือตรวจจับ AI-generated content ขณะที่ฟิล์มและเพลง AI เข้าสู่ตลาดจริง
ตลาด AI content กำลังเข้าเฟสใหม่: ฟิล์ม 75 นาทีสร้างด้วย AI ราคา $2,000 เตรียมฉายที่ Tribeca Festival ขณะเดียวกัน OpenAI และ Adobe ปล่อยเครื่องมือตรวจจับ AI-generated media ผ่าน Content Credentials และ SynthID เพื่อให้ผู้ใช้ตรวจสอบต้นกำเนิดภาพและวิดีโอ ปัญหาคือระบบเหล่านี้ยังต้องพิสูจน์ว่าจริงจังในการตรวจจับ deepfake และ AI content ที่ปล่อยออกมาเพิ่มขึ้น
คณะลูกขุนชี้ Musk ฟ้อง OpenAI ช้าเกินกำหนด — แพ้คดีเป็นเอกฉันท์
คณะลูกขุน 9 คนในแคลิฟอร์เนียใช้เวลาแค่ 2 ชั่วโมงตัดสินว่า Elon Musk แพ้คดีทุกข้อฟ้องต่อ Sam Altman และ OpenAI เหตุผลหลักคือยื่นฟ้องเกิน statute of limitations ไม่ใช่แพ้เรื่องเนื้อหาข้อกล่าวหา ผู้พิพากษารับคำตัดสินนั้นเป็นคำพิพากษาสุดท้ายทันที Musk ประกาศจะอุทธรณ์ แต่ผู้พิพากษาส่งสัญญาณว่าจะยกคำร้องนั้นด้วยเช่นกัน คดีนี้ตีกรอบประเด็นสำคัญว่า OpenAI ซึ่งเริ่มเป็น nonprofit มีพันธะผูกพันกับผู้ก่อตั้งคนแรกแค่ไหน และใครควรเชื่อถือได้ในการดูแล AI ที่กำลังใหญ่ขึ้นเรื่อยๆ
AI กำลังกัดเซาะความน่าเชื่อถือในวงการวรรณกรรม งาน และการศึกษา
สัปดาห์นี้มีสัญญาณหลายจุดที่ชี้ว่า AI กำลังสร้างความเสียหายต่อความไว้วางใจในสาขาต่างๆ พร้อมกัน Commonwealth Short Story Prize พบว่าผู้ชนะ 3 ใน 5 คนถูกสงสัยว่าใช้ chatbot เขียนแทน ArXiv ประกาศแบนนักวิจัยที่ปล่อยให้ AI เขียนงานทั้งหมด 1 ปี นักศึกษาจบใหม่ในสาย finance ถูกบริษัทมองว่าวิเคราะห์ตื้น เพราะพึ่ง generative AI มากเกินไป และนักศึกษา University of Arizona โห่ Eric Schmidt กลางพิธีรับปริญญาเมื่อเริ่มพูดเรื่อง AI ภาพรวมคือคนที่ใช้ AI แบบไม่มีทักษะรองรับกำลังถูก detect และถูกปฏิเสธเร็วขึ้นในทุกวงการ
AI Agent ในองค์กร: ใช้ได้จริง แต่ต้องออกแบบสถาปัตยกรรมและควบคุม identity ให้ดีก่อน
หลายแหล่งพูดตรงกันว่า AI agent กำลังเข้ามาในเวิร์กโฟลว์จริง แต่ปัญหาไม่ได้อยู่ที่ตัว AI — มันอยู่ที่การออกแบบที่ไม่ดี งานวิจัยจาก UC Riverside พบว่า computer-use agent ยังทำงานแบบ unsafe หรือ irrational ในงานรูทีน ขณะที่ฝั่ง enterprise เจอปัญหา agent cost spiral จากสถาปัตยกรรมที่ไม่เหมาะ, identity ของ agent ที่ยังจัดการไม่ได้, และ DevOps discipline ที่หย่อนลงเพราะเชื่อ AI มากเกินไป สำหรับ dev และ founder ข้อเตือนที่ชัดคือ AI เขียนโค้ดแทนได้ แต่แทน critical thinking ไม่ได้ — และ red teaming สำหรับ agent ยังเป็นช่องว่างใหญ่ที่องค์กรส่วนใหญ่ยังไม่ทำ
SpaceX ยื่น IPO มูลค่า $1.75T — xAI ขาดทุน $6.4B และ Anthropic จ่าย $1.25B/เดือนค่า compute
SpaceX ยื่น S-1 ต่อสาธารณะแล้ว เปิดเผยตัวเลขที่ซ่อนอยู่หลายชุด xAI ของ Musk ขาดทุน 6.4 พันล้านดอลลาร์ในปี 2025 และกำลังซื้อ turbine ก๊าซธรรมชาติเพิ่ม 2.8 พันล้าน ขณะที่ Anthropic ตกลงจ่าย 1.25 พันล้านต่อเดือนเพื่อใช้ Colossus data center ในเมมฟิส ฝั่ง Anthropic เองก็ประกาศปิด Series H ที่ 6.5 หมื่นล้านดอลลาร์ ใกล้แตะมูลค่า 1 ล้านล้าน และบอกนักลงทุนว่าจะมีกำไรครั้งแรกใน Q2 ส่วน filing ของ SpaceX ยังระบุชื่อ Musk เป็น risk factor โดยตรง รวมถึง Grok mode ที่อาจก่อคดีความ
Microsoft ทดสอบ Windows 11 ย้าย Taskbar ได้ + ปรับขนาด Start Menu ใน Insider Channel
Microsoft กำลังทดสอบการปรับ UI ครั้งใหญ่ใน Windows 11 Experimental channel โดย Insider สามารถย้าย taskbar ไปวางด้านบน ซ้าย หรือขวาได้แล้ว ไม่ต้องติดแค่ด้านล่าง รวมถึงปรับขนาด Start menu ได้ด้วย นอกจากนี้ยังมีฟีเจอร์ Cloud-Initiated Driver Recovery ที่คอย rollback driver เสียอัตโนมัติโดยไม่ต้องแก้มือ และมีการลด ad ใน UI ลงด้วย ฟีเจอร์ taskbar แบบย้ายได้ยังไม่ออก stable แต่ Microsoft บอกว่า coming soon
AI ในการเงิน: ปัญหาจริงไม่ใช่โมเดล แต่การควบคุมและการตัดสินใจที่อธิบายได้
องค์กรการเงินที่ทำ AI ได้สำเร็จไม่ใช่ผู้ที่มีโมเดลใหญ่สุด แต่ผู้ที่ออกแบบ infrastructure ให้การตัดสินใจเป็น auditable ตัวจริง การลงทุนจึงไม่ควรไปที่โมเดล แต่ที่ data plumbing, การจัดการความไม่แน่นอน (decision routing), และ feedback loops ที่ทำให้ AI เรียนรู้จากการตัดสินใจจริง ในขณะเดียวกัน embedded payments และ real-time fraud detection ต้องการความชัดเจนเดียวกัน
Meta ปิดล้อมข้อมูล AI Chat ให้เป็นส่วนตัว WhatsApp และ Sesame ดึงผู้ใช้จากเพื่อนร่วมก่อตั้ง Oculus
Meta ปล่อย Incognito Chat บน WhatsApp — ให้คุยกับ AI โดยที่ Meta เองไม่เห็นข้อความ ขณะเดียวกัน Sesame (ทีมเก่า Oculus) เปิดตัว iOS app ของเขา มุ่งทำให้ AI ฟังดูเป็นบุคคลจริงมากกว่า chatbot แบบเดิม ทั้งคู่จับตาเรื่องความเป็นส่วนตัวและสัมพันธ์ที่เป็นธรรมชาติมากขึ้น
อิลลินอยส์ผ่านกฎ AI Safety ที่เข้มงวดที่สุดในสหรัฐ บังคับตรวจสอบบุคคลที่สาม
อิลลินอยส์เพิ่งผ่านกฎหมาย AI Safety ที่เข้มงวดที่สุดในอเมริกา บังคับให้บริษัทเช่น OpenAI, Anthropic, Google มีบุคคลที่สามตรวจสอบว่าปฏิบัติตามมาตรฐานความปลอดภัย ผู้ว่าการ JB Pritzker ประกาศว่าจะลงนาม ข่าวนี้เกี่ยวข้องกับการถกเถียงเรื่องความเชื่อถือได้ของ AI ในการตรวจสอบข้อเท็จจริง ซึ่งแสดงว่าการกำกับดูแลกำลังมาถึง
Agents ต้องจัดการความล้มเหลว Tool ให้ได้จริง ไม่ใช่สมมติว่าลงตัวเสมอ
ห้องแล็บ AI ทั่วโลกค้นหาวิธีให้ agents ทำงานจริงในสภาวะปัญหา: tool ล้มเหลวกลางคน query แอ็ตทริบิวต์กระจายไม่ชัด, workflow multiagent คาด่ว errors ไม่ได้ เทคนิค recovery (semantic rollback, evidence-verifiable training, rubric-guided steps) กำลังพัฒนาเร็ว องค์กรที่อัปเดต agent infrastructure ให้ handle partial failures ตอนนี้จะได้เปรียบในการ scale ปีหน้า
ห้องแล็บ AI ต่างแก้ปัญหา Multimodal LLM — จากแก้ความรู้ถึงตัดโทเค็นภาพ
นักวิจัยหลายทีมโพสต์บน arXiv สัปดาห์นี้ล้วนแล้งแต่พูดเรื่องเดียว: Multimodal LLM (ที่เห็นภาพและอ่านข้อความได้) มีปัญหาเหมือนกัน — ใช้ทรัพยากรมากเกินไป หรือไม่ยืดหยุ่นพอ ทีมต่างๆ เลยเสนอวิธีแก้ที่ไม่ต้องฝึกใหม่: บางทีแก้เรื่องการอัปเดตความรู้ให้ไม่ทำลายความสามารถเดิม บางทีตัดโทเค็นภาพอย่างฉลาด บางทีช่วย GUI agent หาจุดที่สำคัญบนหน้าจอ ลักษณะเดียวกัน — ทำให้ระบบเร็วขึ้นและแม่นยำขึ้นโดยไม่ต้องเทรนใหม่