AI News: อัปเดตใหญ่จาก Anthropic, OpenAI และ Google ที่น่าจับตาในสัปดาห์เดียว

สรุปจากคลิป ดูคลิปต้นฉบับ

โลก AI ยังเดินหน้าแบบไม่พัก และสัปดาห์นี้ถือว่าแน่นเป็นพิเศษ เพราะทั้ง OpenAI, Anthropic, Google, Perplexity, Canva, Microsoft และอีกหลายค่ายต่างปล่อยอัปเดตที่มีผลต่อการใช้งานจริงอย่างชัดเจน โดยเฉพาะใน 3 ทิศทางสำคัญคือ แอปเดสก์ท็อปที่ฉลาดขึ้น, เอเจนต์ AI ที่ทำงานบนคอมพิวเตอร์ได้จริง และ โมเดลใหม่ที่เฉพาะทางและทรงพลังขึ้น

ภาพรวมของสัปดาห์นี้จึงไม่ใช่แค่การแข่งกันออกโมเดลใหม่ แต่เป็นการขยับจาก “แชตบอต” ไปสู่ “ระบบปฏิบัติการสำหรับงาน” มากขึ้นเรื่อยๆ AI ไม่ได้แค่ตอบคำถามอีกต่อไป แต่เริ่มเห็น คลิก พิมพ์ เปิดแอป ทดสอบงาน และทำงานต่อเนื่องแทนมนุษย์ได้มากขึ้น

Codex ของ OpenAI กำลังกลายเป็นมากกว่าเครื่องมือเขียนโค้ด

หนึ่งในอัปเดตที่น่าสนใจที่สุดคือ Codex เวอร์ชันใหม่จาก OpenAI ซึ่งสะท้อนภาพชัดเจนว่า OpenAI อาจกำลังมุ่งไปสู่แนวคิด “super app” ที่รวมทุกอย่างไว้ในที่เดียว ไม่ใช่แค่แชต ไม่ใช่แค่เขียนโค้ด แต่รวมถึงการใช้คอมพิวเตอร์ สร้างภาพ จดจำความชอบ และทำงานซ้ำๆ ได้แบบเอเจนต์

ความสามารถใหม่ที่โดดเด่นของ Codex มีดังนี้

ควบคุมคอมพิวเตอร์ร่วมกับผู้ใช้ได้ โดยเห็นหน้าจอ คลิก และพิมพ์ด้วยเคอร์เซอร์ของตัวเอง
ทำงานแบบ background computer use คือให้ AI ทำงานในแอปหนึ่ง ขณะที่เจ้าของเครื่องทำงานอีกแอปได้พร้อมกัน
สร้างภาพได้ในแอปโดยตรง ด้วย GPT image 1.5
จำค่าตั้งค่าและเรียนรู้จากการใช้งานก่อนหน้า
รองรับงานต่อเนื่องและงานประจำ มากขึ้นในเชิงเอเจนต์
มีเบราว์เซอร์ในตัว และสามารถคอมเมนต์บนหน้าเว็บเพื่อส่งบริบทให้ AI แก้ไขงานได้ทันที

หน้าจอ Codex โหมดคอมเมนต์บนดีไซน์ โดยมีการไฮไลต์พื้นที่และข้อความสั่งงานสำหรับปรับฟอนต์

จุดที่น่าสนใจมากคือประสบการณ์แบบ “คอมเมนต์บนของจริง” เช่น เลือกบางส่วนของหน้าเว็บแล้วพิมพ์ว่าให้ทำส่วนนั้นเล็กลง หรือใส่โลโก้สไตล์เฉพาะ AI จะนำบริบทจากตำแหน่งบนหน้าจอไปใช้กับงานทันที นี่ทำให้การพัฒนาแบบ vibe coding หรือ rapid prototyping เป็นธรรมชาติกว่าเดิมมาก

ตัวอย่างการใช้งานจริงของ Codex

มีการทดลองให้ Codex สร้าง mockup เว็บไซต์สำหรับร้านที่ขาย “กระดานโต้คลื่นและทาโก้” จากนั้นสั่งให้สร้างเว็บตามภาพ mockup ที่เพิ่งสร้างขึ้น เมื่อเปิดผลงานภายใน Codex แล้ว ยังสามารถเข้าสู่โหมดคอมเมนต์ เลือก section บนหน้าเว็บ และขอให้ AI สร้างภาพพื้นหลังใหม่ที่มี surfboard และรถขายทาโก้ โดยต้องไม่รบกวนข้อความด้านหน้า

หน้าจอ Codex แสดงเว็บ Surfboards and Tacos พร้อมผลการปรับแต่งพื้นหลังและสไตล์ตัวอักษร

ผลลัพธ์คือ Codex สร้างภาพใหม่และแทนที่พื้นหลังให้ตรงตามเจตนาได้ค่อนข้างแม่นยำ แสดงให้เห็นว่าแอปไม่ได้เป็นเพียงเครื่องมือ generate code แต่เป็นสภาพแวดล้อมที่เชื่อมภาพ อินเทอร์เฟซ และโค้ดเข้าด้วยกัน

อีกตัวอย่างหนึ่งคือการสั่งให้ Codex สร้างแอป Connect 4 แบบรันบน Mac ได้จริง จากนั้นให้ AI เปิดแอปและเล่นเกมแทนผู้ใช้เพื่อทดสอบประสบการณ์ใช้งานเองด้วย นี่คือก้าวสำคัญของแนวคิดที่ AI ไม่ได้แค่ “สร้างซอฟต์แวร์” แต่ยังสามารถ “ใช้งานและตรวจสอบซอฟต์แวร์” ที่สร้างขึ้นได้ด้วย

Codex กำลังเล่น Connect Four บนหน้าต่างเดสก์ท็อปด้วยการวางหมากหลายตำแหน่ง

สำหรับคนทำงานสายพัฒนา นี่คือสัญญาณว่าพื้นที่ทำงานแบบ IDE กำลังเปลี่ยนจากเครื่องมือช่วยเขียน ไปสู่ผู้ช่วยร่วมงานจริง

Claude Code ปรับโฉม และรองรับการทำงานหลายเซสชันพร้อมกัน

Anthropic ก็เดินหน้าในทิศทางคล้ายกัน โดยอัปเดต Claude Code ให้ใช้งานได้สะดวกขึ้นในเดสก์ท็อปแอป จุดเด่นที่สุดคือ การรันหลายเซสชันพร้อมกัน ทำให้สามารถสั่งงานหลาย repository หรือหลายฟีเจอร์ในโปรเจกต์เดียวกันได้พร้อมกัน แล้วสลับกลับมาดูผลลัพธ์ตามที่เสร็จ

หน้าต่าง Claude Code แสดงภาพรวมสถิติการใช้งานและการรันหลายเซสชัน

ฟีเจอร์นี้อาจดูเป็นเพียง quality of life improvement แต่สำหรับคนที่ใช้ AI เขียนโค้ดจริงทุกวัน มันช่วยลดแรงเสียดทานได้มาก เพราะงานพัฒนาซอฟต์แวร์ไม่ได้มีแค่ task เดียวในแต่ละครั้ง การเปิดหลายเธรดพร้อมกันทำให้ Claude เข้าใกล้บทบาท “เพื่อนร่วมทีม” มากขึ้น

นอกจากนั้น Claude Code ยังเพิ่มความสามารถอื่น เช่น

เทอร์มินัลในแอป
ตัวแก้ไขไฟล์ในแอป
ตัวดู diff ที่เร็วขึ้น
พรีวิว HTML, PDF และ local app server ในแอป

แนวคิดหลักคือ ลดความจำเป็นในการกลับไปใช้ command line หรือเครื่องมือภายนอกให้มากที่สุด ใครที่ทำงานอยู่ใน ecosystem ของ Anthropic จึงเริ่มทำ workflow ได้แทบครบในแอปเดียว

Google ขยายเกมจากเบราว์เซอร์สู่เดสก์ท็อปเต็มตัว

Google มีหลายอัปเดตในสัปดาห์นี้ และทั้งหมดสะท้อนว่า Google กำลังพยายามทำให้ AI กลายเป็นส่วนหนึ่งของ workflow ประจำวันมากขึ้น

Google Desktop App และ Gemini บน Mac

Google เปิดให้ใช้งานแอปเดสก์ท็อปบน Windows ได้ในวงกว้างมากขึ้น ขณะที่ฝั่ง Mac ก็มี Gemini app แล้ว จุดสำคัญคือแอปนี้ไม่ได้จำกัดแค่การแชต แต่รวมความสามารถที่ปกติใช้ในเบราว์เซอร์ไว้แทบทั้งหมด เช่น

แชตกับ Gemini
สร้างภาพด้วย Nano Banana
สร้างวิดีโอ
สร้างเพลง
ใช้ Canvas
Deep Research
Guided Learning

แอป Gemini บนเดสก์ท็อป แสดงแถบเมนูการใช้งาน เช่น Canvas และ Guided learning

นี่อาจดูเรียบง่าย แต่มีความสำคัญในเชิงพฤติกรรมผู้ใช้ เพราะแอปแยกบนเดสก์ท็อปทำให้ AI กลายเป็นเครื่องมือถาวร ไม่ใช่แค่แท็บหนึ่งในเบราว์เซอร์

Chrome เพิ่ม “Skills” หรือ slash commands สำหรับงานซ้ำ

อีกฟีเจอร์ที่น่าจับตาคือ Google กำลังนำแนวคิดคล้าย slash commands มาใส่ใน Chrome ผู้ใช้สามารถบันทึก prompt ที่ใช้บ่อยให้กลายเป็นเครื่องมือแบบ one-click ได้

ตัวอย่างเช่น

สรุปบทความข่าวเป็น bullet points
วิเคราะห์ความคิดเห็นในหน้าเว็บ
ดึงสาระสำคัญจากหลายแท็บพร้อมกัน

หากฟีเจอร์นี้ถูกใช้อย่างเต็มที่ มันจะเปลี่ยน prompt จากสิ่งที่ต้องพิมพ์ใหม่ทุกครั้ง ให้กลายเป็น “macro สำหรับงานความคิด” ซึ่งมีประโยชน์มากสำหรับงานรีเสิร์ชและวิเคราะห์ข้อมูลบนเว็บ

บทความ CNBC แสดงหัวข้อ ChatGPT to fuel new drink discovery พร้อมส่วนเนื้อหาและไทม์ไลน์

Gemini 3.1 Flash TTS ปรับ text-to-speech

Google ยังเปิดตัว Gemini 3.1 Flash TTS ซึ่งโดดเด่นเรื่องการควบคุมอารมณ์และน้ำเสียงในการพูดได้ละเอียดขึ้น ไม่ว่าจะเป็นตื่นเต้น กระซิบ ตื่นตระหนก หัวเราะ หรือเว้นจังหวะแบบ dramatic pause

Google AI Studio Playground หน้าสร้างพอดแคสต์/เสียงด้วย Gemini 3.1 Flash TTS พร้อมการตั้งค่า speaker

ประโยชน์ของโมเดลนี้ไม่ได้อยู่แค่การอ่านข้อความออกเสียง แต่คือการทำให้เสียงสังเคราะห์มี “การกำกับการแสดง” มากขึ้น เหมาะกับงานอย่าง

เสียงพากย์
คอนเทนต์เสียงหลายผู้พูด
สไตล์ podcast แบบ NotebookLM
งานเล่าเรื่องและงานสื่อการเรียนรู้

แม้การเดโมยังมีจุดที่ไม่สมบูรณ์ เช่น เสียงบางช่วงยังไม่เนียน 100 เปอร์เซ็นต์ แต่ระดับการควบคุมถือว่าก้าวหน้ามาก

Nano Banana เริ่มใช้ข้อมูลส่วนตัวเพื่อสร้างภาพที่เฉพาะบุคคลขึ้น

อีกอัปเดตที่น่าสนใจคือ Gemini สามารถใช้ personal intelligence จากบริการต่างๆ ของ Google เช่น Gmail, Calendar, Drive และ Photos เพื่อช่วยสร้างภาพที่เกี่ยวกับชีวิตจริงของผู้ใช้ได้ดีขึ้น

ในเชิงแนวคิด นี่คือการเปลี่ยนจาก image generation แบบทั่วไป ไปสู่ image generation แบบมีบริบทเฉพาะบุคคล หากบัญชี Google มีข้อมูลครบ AI ก็อาจสร้างภาพที่สื่อถึงครอบครัว สัตว์เลี้ยง ตารางชีวิต หรือสภาพแวดล้อมส่วนตัวได้แม่นยำขึ้น

Perplexity Personal Computer ดัน AI agent ลงมาทำงานบนเครื่องของผู้ใช้

Perplexity เปิดตัวฟีเจอร์ใหม่ชื่อ Personal Computer ซึ่งเป็นการนำแนวคิดเอเจนต์จากระบบคลาวด์มาสู่เครื่องของผู้ใช้เอง โดยสามารถทำงานกับไฟล์ในเครื่อง แอป native ตัวเชื่อมต่อภายนอก และเว็บ เพื่อจัดการ workflow ที่ซับซ้อนได้

หน้า Perplexity Personal Computer is here พร้อมส่วนนำและคำอธิบาย

จุดสำคัญคือ แม้โมเดล AI ยังรัน inference บนเซิร์ฟเวอร์ของ Perplexity แต่ตัวระบบสามารถเข้าถึงสภาพแวดล้อมในเครื่องได้ เช่น ไฟล์ อีเมล iMessage หรือแอปอื่นๆ ที่เชื่อมต่อไว้ จึงใกล้เคียงกับการมี “ผู้ช่วยดิจิทัลบนคอมพิวเตอร์จริง” มากกว่าเดิม

ตัวอย่างการใช้งานที่ถูกยกขึ้นมาคือการอ่านรายการสิ่งที่ต้องทำจากโน้ต แล้วลงมือทำผ่านหลายระบบให้เอง โดยมีจุดขายเรื่อง ตรวจสอบย้อนหลังได้ และ ย้อนกลับการกระทำได้ ซึ่งเป็นองค์ประกอบสำคัญของ AI agent ที่จะถูกนำมาใช้กับงานจริง

Canva AI 2.0 กำลังมุ่งสู่แพลตฟอร์มสร้างงานด้วยคำสั่งข้อความ

Canva ประกาศความสามารถชุดใหม่ภายใต้แนวคิด Canva AI 2.0 แม้บางฟีเจอร์ยังไม่เปิดใช้งาน แต่ทิศทางค่อนข้างชัดว่า Canva ต้องการให้ผู้ใช้ “พิมพ์สิ่งที่ต้องการ” แล้วระบบจัดการส่วนที่เหลือให้มากที่สุด

สิ่งที่ถูกกล่าวถึงมีทั้ง

การสั่งให้สร้างแคมเปญจาก brief ใน Notion
การเชื่อมต่อกับ Slack, Notion, Gmail และเครื่องมืออื่น
การตั้งเวลางานให้รันอัตโนมัติ
การเรียนรู้จากสไตล์งานออกแบบเดิมของผู้ใช้
การค้นหาเว็บและดึงองค์ประกอบมาใส่ในงาน
การสร้างกราฟิก เสียง และองค์ประกอบ 3D ภายใน editor

หน้าจอเดโม่ Canva AI ระหว่างการ refine งาน โดยมีคำสั่งและสถานะการปรับองค์ประกอบบนดีไซน์

หากทำได้จริงตามที่ประกาศ Canva จะขยับจากเครื่องมือออกแบบ ไปสู่ระบบผลิตชิ้นงานแบบครบวงจรที่มี AI เป็นแกนกลาง โดยเฉพาะสำหรับนักการตลาด ครีเอเตอร์ และทีมคอนเทนต์

Claude Opus 4.7 แรงขึ้นจริง แต่คนที่จะรู้สึกชัดที่สุดคือสายโค้ด

สำหรับข่าวโมเดลใหม่ที่ถูกพูดถึงมากที่สุดในสัปดาห์นี้ คงหนีไม่พ้น Claude Opus 4.7 จาก Anthropic

จากผล benchmark จุดเด่นหลักอยู่ที่งาน agentic coding และ software engineering ซึ่งทำได้ดีกว่า Opus 4.6 และเหนือกว่า GPT รุ่นที่ถูกนำมาเปรียบเทียบบางตัว โดยเฉพาะในงานที่ต้องวางแผนและลงมือทำหลายขั้นตอน

ตาราง benchmark ของ Claude Opus 4.7 แสดงคะแนนรายหมวด เช่น agentic coding และ multi-domain reasoning

อย่างไรก็ตาม ในการใช้งานทั่วไป ความต่างอาจไม่ได้รู้สึกชัดสำหรับทุกคน ผู้ที่น่าจะเห็นความเปลี่ยนแปลงชัดที่สุดคือคนที่ใช้โมเดลเพื่อเขียนโค้ดเป็นประจำ

สิ่งที่น่าจะสัมผัสได้ในวงกว้างกว่าคือ

การทำตามคำสั่งดีขึ้น
เข้าใจภาพและข้อมูลหลายรูปแบบได้ดีขึ้น
ใช้ความจำในบทสนทนาได้ดีขึ้น

สรุปง่ายๆ คือ ผู้ใช้ไม่จำเป็นต้อง prompt engineer ละเอียดเท่าเดิม โมเดลเข้าใจเจตนาได้ดีขึ้นตั้งแต่ต้น ซึ่งเป็นพัฒนาการสำคัญของ AI ที่ใช้งานจริง

โมเดลโอเพนซอร์สยังเดินหน้าต่อ: MiniMax และ Qwen

สัปดาห์นี้ยังมีโมเดลโอเพนซอร์สใหม่ที่น่าสนใจอย่าง MiniMax M2.7 และ Qwen 3.6-35B-A3B

MiniMax M2.7 ถูกระบุว่ามีคะแนนด้าน coding benchmark อยู่ในระดับสูงมากสำหรับโมเดลที่เปิดให้นำไปปรับแต่งต่อได้ แม้จะมีข้อสังเกตเรื่องใบอนุญาตที่อาจจำกัดการใช้งานเชิงพาณิชย์อยู่บ้าง

ส่วน Qwen 3.6-35B-A3B แม้คะแนนจะไม่ชนระดับโมเดล proprietary ชั้นนำล่าสุด แต่ข้อดีคือเป็นโอเพนซอร์สและขนาดโมเดลอาจเปิดโอกาสให้รันแบบ local ได้บนฮาร์ดแวร์ที่เหมาะสม

แนวโน้มนี้สำคัญ เพราะทำให้ตลาด AI ไม่ได้ขับเคลื่อนแค่โดยโมเดลปิดจากบริษัทยักษ์ใหญ่เท่านั้น แต่ยังมีทางเลือกสำหรับการ fine-tune และ deployment ที่ยืดหยุ่นกว่า

โมเดลเฉพาะทางเริ่มมีบทบาทมากขึ้น: GPT-Rosalind สำหรับชีววิทยาและการแพทย์

OpenAI เปิดตัว GPT-Rosalind สำหรับงานวิจัยด้าน life sciences โดยเฉพาะ เช่น ชีววิทยา การค้นคว้ายา และเวชศาสตร์เชิงแปลผล

โมเดลนี้ยังไม่เปิดให้ใช้ทั่วไป แต่เปิดให้เฉพาะนักวิทยาศาสตร์และนักวิจัยที่ผ่านการคัดเลือก จุดเด่นคือออกแบบมาเพื่อ workflow ทางวิทยาศาสตร์ ไม่ใช่แค่งานเขียนหรือแชตทั่วไป

ความสำคัญของข่าวนี้อยู่ที่ภาพใหญ่ AI กำลังถูกผลักไปสู่การค้นพบทางวิทยาศาสตร์ การออกแบบการทดลอง เคมี โปรตีน และจีโนมิกส์ ซึ่งเป็นพื้นที่ที่อาจสร้างผลกระทบต่อโลกจริงได้มากกว่าการเพิ่ม productivity รายวันหลายเท่า

Microsoft, Midjourney และ DaVinci Resolve ก็มีอัปเดตที่น่าสนใจ

Microsoft MAI-Image-2 Efficient

Microsoft ออกโมเดลสร้างภาพเวอร์ชันใหม่ที่เน้น เร็วขึ้นและถูกลง โดยยังคงคุณภาพไว้ในระดับดี เหมาะกับงานที่ต้องการผลิตภาพจำนวนมากอย่างมีประสิทธิภาพ แม้หากต้องการข้อความในภาพที่ซับซ้อนมาก อาจยังควรใช้โมเดลเวอร์ชันเดิม

Midjourney V8.1

Midjourney ปล่อย V8.1 พร้อมคำโปรยว่า “สไตล์ iconic แบบดั้งเดิมกลับมาแล้ว” และเรนเดอร์ 2K แบบ native ทั้งยังเร็วขึ้นและถูกลงหลายเท่า แม้การแข่งขันในตลาดภาพ AI วันนี้จะดุเดือดกว่าเดิม แต่ Midjourney ก็ยังเดินหน้าอัปเดตอย่างต่อเนื่อง

DaVinci Resolve 21 เพิ่ม AI ให้สายตัดต่อ

ในฝั่งเครื่องมือสร้างสรรค์ Blackmagic Design เพิ่มฟีเจอร์ AI ใหม่ใน DaVinci Resolve 21 โดยฟีเจอร์ที่น่าสนใจมากคือ AI IntelliSearch ซึ่งช่วยค้นหาคลิปด้วยวัตถุ คำพูด หรือแม้แต่ใบหน้าของบุคคลในคลังวิดีโอ

หน้าคำอธิบาย AI IntelliSearch พร้อมข้อความว่าใช้ค้นหา people, content และ individual faces ใน DaVinci Resolve

สำหรับคนทำงานตัดต่อ นี่เป็นฟีเจอร์ที่มีความหมายมาก เพราะช่วยลดเวลาค้นหา B-roll หรือช่วงสัมภาษณ์ที่ต้องการจากฟุตเทจจำนวนมากได้อย่างชัดเจน

ข่าวแปลกแต่สะท้อนบรรยากาศตลาด: บริษัทขายรองเท้าพลิกไปเป็นบริษัท AI

หนึ่งในข่าวที่ถูกพูดถึงในเชิง meme มากที่สุดคือบริษัท Allbirds ซึ่งเดิมขายรองเท้า ประกาศเปลี่ยนทิศทางไปสู่ธุรกิจ AI และ GPU ทำให้ราคาหุ้นพุ่งขึ้นอย่างรุนแรง

ข่าวลักษณะนี้สะท้อนอารมณ์ของตลาด AI ได้ดี ว่าคำว่า “AI” ยังมีแรงขับทางการเงินและความคาดหวังสูงมาก จนบางครั้งอาจเกินกว่าความสมเหตุสมผลเชิงธุรกิจ

แม้จะเป็นกรณีเฉพาะ แต่ก็เป็นสัญญาณเตือนว่าตลาด AI ไม่ได้มีแค่ความก้าวหน้าทางเทคโนโลยี ยังมีชั้นของกระแสและการเก็งกำไรซ้อนอยู่ด้วย

หุ่นยนต์ของ Boston Dynamics แสดงภาพระยะถัดไปของ AI ในโลกจริง

อีกข่าวที่น่าสนใจมากคือเดโมจาก Boston Dynamics ที่ให้หุ่นยนต์เดินไปอ่านไวท์บอร์ดซึ่งมีรายการงานบ้านเขียนอยู่ จากนั้นจึงไปลงมือทำแต่ละงาน เช่น เก็บรองเท้า รีไซเคิลกระป๋อง เก็บเสื้อผ้าลงตะกร้า และทำงานตามลำดับ

ภาพรวมไวท์บอร์ดคำสั่งงานและหุ่นยนต์ Boston Dynamics ในห้องเดียวกัน

สิ่งที่ทำให้เดโมนี้น่าสนใจกว่าหุ่นยนต์เคลื่อนที่ทั่วไป คือการเชื่อมโลกของภาษาเข้ากับโลกกายภาพโดยตรง ข้อความบนไวท์บอร์ดทำหน้าที่เหมือน prompt และหุ่นยนต์ตีความมันไปสู่การกระทำในโลกจริง

นี่คือภาพระยะถัดไปของ AI agent อีกรูปแบบหนึ่ง ไม่ใช่แค่ agent ในคอมพิวเตอร์ แต่เป็น agent ที่เคลื่อนไหว หยิบจับ และทำงานแทนมนุษย์ในสภาพแวดล้อมจริงได้

บทสรุป: สัปดาห์นี้บอกอะไรเกี่ยวกับทิศทาง AI

หากมองภาพรวม อัปเดตทั้งหมดในสัปดาห์นี้ชี้ไปในทิศทางเดียวกันอย่างชัดเจน

AI กำลังย้ายจากหน้าต่างแชตไปสู่สภาพแวดล้อมการทำงานจริง
แอปเดสก์ท็อปกำลังกลับมามีความสำคัญ เพราะเป็นจุดที่ AI เข้าถึงไฟล์ แอป และ workflow ได้ลึกกว่าเว็บ
เอเจนต์เริ่มใช้งานได้จริงมากขึ้น ทั้งใน Codex, Claude, Perplexity และแม้แต่หุ่นยนต์
โมเดลใหม่ไม่ได้แข่งกันแค่ความฉลาด แต่แข่งกันเรื่องการใช้งานเฉพาะทางและการเป็นส่วนหนึ่งของระบบงาน
โอเพนซอร์สยังมีบทบาทสำคัญ โดยเฉพาะสำหรับการปรับแต่งและรันในสภาพแวดล้อมที่ควบคุมเองได้

ประเด็นที่น่าจับตาต่อจากนี้จึงไม่ใช่แค่ว่าโมเดลไหนได้ benchmark สูงสุด แต่คือ ใครจะสร้างประสบการณ์ใช้งานที่ทำให้ AI กลายเป็นผู้ช่วยทำงานตัวจริงได้ก่อน

สัปดาห์นี้แสดงให้เห็นว่าเส้นแบ่งระหว่าง chatbot, IDE, desktop assistant และ autonomous agent กำลังเลือนลงอย่างรวดเร็ว และนั่นอาจเป็นการเปลี่ยนผ่านครั้งสำคัญของวงการ AI ในปีนี้