“Google I/O” หรืองานประชุมนักพัฒนาประจำปีของ “กูเกิล” (Google) วนกลับมาอีกครั้ง โดยปีนี้มาพร้อมกับการประกาศเข้าสู่ยุค “Agentic Gemini” ที่ฟีเจอร์และโซลูชั่นหลายอย่างได้รับการอัพเกรดความสามารถให้ประมวลผลเก่งขึ้น ครอบคลุมการใช้งานหลากหลายด้าน
ไฮไลต์ของฟีเจอร์และโซลูชั่นต่าง ๆ ที่ประกาศในงาน Google I/O 2026 ประกอบด้วย
Ask YouTube จะพลิกโฉมประสบการณ์ใช้งานทั้งหมด ทำให้ข้อมูลย่อยง่ายและเข้าถึงได้สะดวกยิ่งขึ้น ผู้ใช้จะเห็นวิดีโอที่ตรงกับความสนใจมากที่สุด และสามารถข้ามไปยังส่วนของวิดีโอที่เกี่ยวข้องกับผู้ใช้ที่สุดได้ทันที แก้ปัญหามีวิดีโอให้ดูเยอะมาก แต่ไม่รู้จะดูอะไรดี
ปัจจุบัน Ask YouTube อยู่ในช่วงของการทดสอบแล้ว และจะเปิดให้ใช้งานในสหรัฐอเมริกาช่วงซัมเมอร์นี้
ก่อนหน้านี้ Google ได้นำความสามารถของ Gemini มาใส่ในผลิตภัณฑ์แล้ว เช่น Google Maps ที่ได้รับการอัพเกรดครั้งใหญ่ที่สุดในรอบทศวรรษ และมีการเปิดตัวฟีเจอร์ใหม่ชื่อว่า Ask Maps สำหรับการถามคำถามที่มีความซับซ้อนและยาวขึ้นด้วย
เมื่อก่อนหากต้องการสร้างเอกสารด้วย Gemini ผู้ใช้ต้องพิมพ์พรอมต์อย่างแม่นยำ แต่ด้วย Docs Live ที่ผสานความก้าวหน้าของโมเดลเสียง ผู้ใช้สามารถ “พรั่งพรูความคิด” หรืออะไรก็ตามที่อยู่ในหัวของคุณออกมาเป็น “คำพูด” แล้วปล่อยให้ Gemini จัดการต่อ โดยอนาคตผู้ใช้จะสามารถสร้างเอกสารใหม่และแก้ไขได้โดยตรงด้วยเสียงของตนเอง
Docs Live จะทยอยเปิดตัวให้กับผู้ที่สมัครใช้บริการในช่วงซัมเมอร์นี้ และความสามารถในการสั่งการด้วยเสียงจะมีให้บริการใน Gmail และ Google Keep ด้วยเช่นกัน
Gemini Omni คือโมเดลใหม่ที่สามารถสร้างตัวอย่างเป็นเอาต์พุตได้หลากหลายรูปแบบจากการใช้อินพุตรูปแบบใดก็ได้ เช่น เริ่มต้นด้วยเอาต์พุตที่เป็นวิดีโอ แล้วต่อด้วยเอาต์พุตที่เป็นรูปภาพและข้อความ โดยโมเดลแรกในตระกูล Omni ที่จะเปิดตัว คือ Gemini Omni Flash
Gemini Omni Flash เปิดให้ใช้งานแล้วตั้งแต่วันนี้ (20 พ.ค.) ผู้ใช้สามารถทดลองใช้งานได้บนแอป Gemini, Google Flow และ YouTube Shorts โดยจะทยอยเปิดให้ใช้งานสำหรับนักพัฒนาซอฟต์แวร์และลูกค้าองค์กรผ่าน API ในอีกไม่กี่สัปดาห์ข้างหน้า
Gemini 3.5 Flash โมเดลตัวแรกในซีรีส์ใหม่ที่ผสมผสานความชาญฉลาดระดับแนวหน้าเข้ากับการทำงานจริง โดยมีไฮไลต์ที่น่าสนใจอยู่ 2 อย่าง คือ 1.เมื่อเทียบกับ Gemini 3.1 Pro แล้ว Gemini 3.5 Flash มีประสิทธิภาพเหนือกว่าในแทบทุกการทดสอบ โดยมีความก้าวหน้าอย่างมากในด้านการเขียนโค้ด และมีประสิทธิภาพอันน่าทึ่งในการทดสอบ GDPVal ซึ่งเป็นการวัดประสิทธิภาพในการทำงานด้านต่าง ๆ ที่ทำให้เกิดมูลค่าทางเศรษฐกิจได้จริง
2.Gemini 3.5 Flash เป็นโมเดลระดับแนวหน้าและเทียบเคียงได้กับโมเดลที่ดีที่สุด สามารถทำงานได้เร็วมาก และเมื่อดูปริมาณโทเค็นของเอาต์พุตต่อวินาที จะเห็นว่า Gemini 3.5 Flash เร็วกว่าโมเดลระดับแนวหน้าอื่น ๆ ถึง 4 เท่า ขณะที่ราคาถูกกว่าโมเดลชั้นนำรุ่นอื่น ๆ มากกว่าครึ่งหนึ่ง
Gemini 3.5 Flash เปิดให้ทุกคนใช้งานแล้วผ่านผลิตภัณฑ์และ API ส่วน Gemini 3.5 Pro จะเปิดตัวในเดือนหน้า ซึ่งปัจจุบันกำลังใช้งานกันภายในองค์กร
Antigravity กำลังเปลี่ยนไปเป็นแพลตฟอร์มสำหรับการพัฒนาและจัดการ AI Agent แบบอัตโนมัติ โดยรวมไปถึง Antigravity 2.0 ซึ่งเป็นแอปพลิเคชัjนบนเดสก์ท็อปแบบสแตนด์อโลนตัวใหม่ที่ทำหน้าที่เป็นศูนย์กลางการโต้ตอบกับ AI Agent ที่ใครๆ ก็สามารถควบคุมดู AI Agent สำหรับการทำงานทุกรูปแบบได้
Gemini Spark เป็น AI Agent ส่วนตัวในแอป Gemini ที่จะช่วยจัดการชีวิตดิจิทัล ลงมือทำสิ่งต่าง ๆ แทน และอยู่ภายใต้การควบคุมของผู้ใช้ โดยทำงานบนเครื่องเสมือนเฉพาะบน Google Cloud และพร้อมทำงานทุกวันตลอด 24 ชั่วโมง ผู้ใช้จึงไม่จำเป็นต้องเปิดแล็ปท็อปทิ้งไว้
โมเดลที่ขับเคลื่อนอยู่เบื้องหลัง คือ Gemini 3.5 และ Google Antigravity ซึ่งช่วยให้สามารถทำงานที่ซับซ้อนและต้องใช้ระยะเวลาดำเนินการให้เสร็จสมบูรณ์อย่างง่ายดาย พร้อมผสานการทำงานเข้ากับเครื่องมือต่าง ๆ อย่างราบรื่น
Google กำลังจะเริ่มทยอยเปิดให้กลุ่มผู้ทดสอบที่เชื่อถือลองใช้งาน Gemini Spark ในสัปดาห์นี้ และมีแผนเปิดตัวเวอร์ชั่นเบต้าสำหรับสมาชิก Google AI Ultra ในสหรัฐอเมริกาในสัปดาห์หน้า
Google เปิดตัว Information Agent ใน Search ซึ่งเป็น AI Agent ส่วนตัวที่ผู้ใช้สามารถตั้งค่าให้ทำงานอยู่เบื้องหลังได้ตลอด 24 ชั่วโมง เพื่อค้นหาสิ่งที่คุณต้องการในจังหวะเวลาที่เหมาะสม และช่วยทำสิ่งต่าง ๆ โดย Information Agent จะเปิดตัวในช่วงซัมเมอร์นี้ เริ่มต้นจากสมาชิก Google AI Pro และ Ultra ก่อน
อีกวิธีที่กำลังสร้าง Search ให้มีความเป็น Agentic อย่างแท้จริง คือการผสานขีดความสามารถด้านการเขียนโค้ดแบบ Agentic ลงไป ด้วยพลังของ Gemini 3.5 Flash และ Google Antigravity
โดย Search จะสร้างประสบการณ์แบบปรับแต่งเฉพาะตัวสำหรับคำถามส่วนบุคคล เช่น เลย์เอาต์แบบไดนามิกและภาพประกอบแบบอินเทอร์แอกทีฟ ความสามารถของ Generative UI เหล่านี้จะพร้อมให้บริการฟรีสำหรับทุกคนใน Search ในช่วงซัมเมอร์นี้
ขณะเดียวกัน Search ยังมีการสร้างแดชบอร์ดหรือเครื่องมือติดตามแบบคัสตอมที่ทำงานให้อย่างต่อเนื่อง ช่วยให้ผู้ใช้สามารถกลับมาสานต่อความคืบหน้าได้ตลอดเวลา และในอีกไม่กี่เดือนข้างหน้า ผู้ใช้จะสามารถสร้างประสบการณ์แบบกำหนดเองด้วย Antigravity ได้โดยตรงใน Search โดยจะเริ่มให้บริการแก่สมาชิก Google AI Pro และ Ultra ในสหรัฐอเมริกาก่อน
“ซุนดาร์ พิชัย” (Sundar Pichai) ประธานเจ้าหน้าที่บริหาร Alphabet กล่าวว่า การได้เห็นนวัตกรรมใหม่ ๆ ถูกปล่อยออกมาในผลิตภัณฑ์ต่าง ๆ ถือเป็นเรื่องที่น่าเหลือเชื่อมาก แต่การจะรองรับผู้ใช้งานในสเกลระดับนี้ พร้อม ๆ กับการให้บริการลูกค้าองค์กรและนักพัฒนาซอฟต์แวร์ทั่วโลก จำเป็นต้องใช้การลงทุนมหาศาลในด้านโครงสร้างพื้นฐาน
ในงาน Google I/O เมื่อ 10 ปีที่แล้ว ได้เปิดตัว Tensor Processing Unit (TPU) ซึ่งเป็นชิปประมวลผลเชิงพาณิชย์รุ่นแรก นับตั้งแต่นั้นมาก็ได้พลิกโฉมวิธีการที่อุตสาหกรรมใช้ในการพัฒนา AI
ล่าสุด Google เพิ่งเปิดตัวชิป TPU รุ่นที่ 8 ที่งาน Cloud Next และเป็นครั้งแรกที่ใช้แนวทางการพัฒนาแบบ Dual Chip ที่มีสถาปัตยกรรมเฉพาะสำหรับการเทรนโมเดล AI และการประมวลผล นั่นคือ TPU 8t และ 8i
“Google ลงทุนทั้งเพื่อปัจจุบันและเพื่ออนาคตมาโดยตลอด ในปี 2022 มีค่าใช้จ่ายในการลงทุน (Capex) ประมาณ 3.1 หมื่นล้านดอลลาร์สหรัฐ (1 ล้านล้านบาท) ขณะที่ปีนี้คาดว่าจะเพิ่มขึ้นประมาณ 6 เท่า หรือราว ๆ 1.9 แสนล้านดอลลาร์สหรัฐ (6.2 ล้านล้านบาท) ซึ่งส่วนสำคัญของการลงทุนนี้ คือชิปซิลิคอนแบบคัสตอม”
อ่านข่าวต้นฉบับ: เปิดตัว ‘Gemini Spark’ Agent บนคลาวด์ รันงานได้โดยไม่ต้องเปิดเครื่องทิ้งไว้
