Google ประกาศเป็นผู้นำด้าน AI มีครบจบในที่เดียว แถมยืนหนึ่งเรื่องคุณภาพและราคา!
Highlight งาน Google Cloud Next '2025 มีอะไรอัพเดตบ้าง?
จดสรุปจาก session “Spark the Next Big Thing: AI at Google Cloud Next '2025” ของงาน Cloud Next Extended Bangkok 2025 จากพี่ต้า Virot Chiraphadhanakul

.
งาน Google Cloud Next นอกจากเรื่อง developer แล้วยังมีเรื่อง business ที่เอาไปใช้งานในองค์กรด้วย
สิ่งที่ถูกประกาศในงาน แบ่งเป็น 4 Layer ใหญ่ คือ Agents, Vertex AI, Research and Model, AI Hypercomputer โดย agent เนี่ย เป็น keyword หลักที่ Google เน้นเยอะมาก ๆ และถูกพูดถึงในสื่อต่าง ๆ คนเริ่มเอา AI มาทำงานแทนเรา
🔑 Key Message: Google ส่งสัญญาณว่าเป็น platform ที่พร้อมที่สุด platform นึง ตั้งแต่ platform, model มีงานวิจัยหลายอย่างเกิดขึ้นที่ Google ซึ่ง LLM ที่เราใช้กันอยู่ทุกวันน้านนน เกิดจาก paper ที่ชื่อว่า Attention is All You Need ในเรื่อง cloud ก็มี Vertex AI เป็นแกนหลักในการ build model, deploy model ต่าง ๆ และมี industry แยกตาม usecase ต่าง ๆ มากกว่า 500 usecase เลยทีเดียว!
ใน session นี้จะเน้นที่ model, Vertex AI และ agent
.
🔵 AI Model Innovation
- model Gemini มีการเรียกบน Vertex AI มีการเติบโต 40 เท่า! มีการ adoption มากขึ้นเรื่อย ๆ
- เปิดตัว Gemini 2.5 Flash และ Pro ใช้งานบน Vertex AI
- media generative model ใช้ในการสร้างเสียง สร้างเพลง สร้างรูปภาพ สร้างวิดีโอ ซึ่ง Google I/O ปีนี้ เปิดตัว Veo3 ออกมาแล้ว (เราเห็นมีหลายเพจรีวิวกันอยู่)
- Gemini 2.5 Pro เน้นเรื่อง quality และทำเรื่องของ thinking ได้ค่อนข้างเยอะและดี ผลคะแนนจากผู้ใช้งานที่ Chatbot Arena ยังคงยืนหนึ่งอยู่ และอีก benchmark นึงที่ใช้วัดความฉลาด คือ Humanity’s Last Exam ได้คะแนนท้อปกว่าทุกตัวที่เคยออกมาก่อนหน้านี้
- Gemini 2.5 Flash จุดขาย คือ เราอยากได้ตัวที่เล็กลง ไม่แพงมาก ตัวนี้ไม่ตัด reasoning capability อยู่ ควบคุมการคิดเยอะคิดน้อยได้ ความฉลาด per dollar ดีกว่าตัว GPT-4o 24 เท่า และ Deepseek R1 5 เท่า
- การเลือกใช้ model สำหรับงาน software developer มี trade-off ที่ต้องเลือก เราอาจจะไม่ได้ใช้ตัวที่ดีที่สุด ตัวที่ใหม่ที่สุด ตัวที่ถูกที่สุด เราต้อง balance ให้ดี ซึ่งตัว Gemini 2.5 Pro เข้ามาแก้ pain point ตรงนี้ สามารถปิด thinking mode และมี thinking budget งบประมาณในการคิด สามารถ set ให้ถูกหน่อยได้ถ้าอยากให้คิดนิดนึง ถ้าอยากให้คิดเยอะก็ใส่เงินไปเยอะ ก็จะได้คำตอบที่ดีมากขึ้น
- จากงาน Google I/O ที่ผ่านมา เขาประกาศว่า quality และ cost model ของ Google อยู่ขอบจากทุกด้าน คิดจาก Arena Score และราคา
- คุณไทเอา model LLM หลาย ๆ เจ้า ไปทำข้อสอบ O-NET ตัว top ยังเป็น Gemini ที่ใช้ cost น้อย แต่ความถูกต้องมาก ในการใช้ต้องดู usecase ที่ใช้ อาจจะจ่ายถูกลงมาแต่ยังได้คะแนนดีอยู่ก็ได้ (หน้าเว็บล่าสุดตอนนี้ Gemini 2.5 Pro ยังคงยืนหนึ่ง แต่ใช้ cost ถูกกว่าในสไลด์พี่ต้า ตอนนี้ใช้ประมาณ 10 บาทก็สอบได้ที่หนึ่งแล้ว)
- อีกหนึ่งจุดขายของ Gemini คือ content context ยาวมาก 1 ล้าน token เช่น หนังสือ 1 เล่ม หรือวิดีโอ 1 ชั่วโมง ซึ่งพี่ต้าบอกว่า ยัดได้ ไม่เท่ากับควรยัด เดฟควรมี consider ในการ optimise ไม่ใช่อัดทุกอย่างใน model เราเลือกข้อมูลที่เกี่ยวข้องในการทำ RAG ทำให้ค่าใช้จ่ายถูกกว่า และมีประสิทธิภาพมากกว่า
- Live API โต้ตอบเหมือนคุยกับมนุษย์มากขึ้น ตอนนี้เป็น preview เปลี่ยนวิธี connect กับ API จากเดิม request เป็นครั้ง ๆ เพื่อเอาคำตอบกลับไป show user เป็นการโต้ตอบผ่าน web socket ทำให้คุยกันอยู่ตลอดเวลา ตัวอย่าง usecase เราแชร์จอแล้ว AI แนะนำเรา
- เปิดตัว model ใหม่ ในซีรีส์ media generation มี Imagen เป็น text-to-image, Veo เป็น text-to-video และ image-to-video, Lyria เป็น text-to-music พวกดนตรีประกอบใด ๆ, Chirp เป็น speech-to-text และตัวที่ปรับปรุงใหมอีก 2 ตัว คือ translation ของเดิมแปลคำต่อคำ แปลผิดแปลถูกอยู่ มี AI ช่วยให้เข้าใจบริบทมากขึ้น และ Embedded สามารถแสดงพวกข้อความ เสียง วิดีโอ เป็น vector ทำให้เขาเข้าใจพวกนี้ และ map แต่ละจุดให้มี semantic insight ทำให้ได้ใช้ multimedia ที่มีในฐานข้อมูล ให้เราเข้าใจรายละเอียดมากขึ้น เอาไปทำพวกแนะนำสินค้าได้ เช่น Etsy platform ขายของ handmade เอามาให้เข้าใจ product ต่าง ๆ ใน platform มากขึ้น
- Google บอกว่า Vertex AI มี generative media ครบทุกโหมด ทั้งเสียง รูปภาพ วิดีโอ อยากเจนอะไร เจนได้หมด อีกหน่อยการทำหนังโฆษณาจะเปลี่ยนไป เริ่มจาก storyboard ที่ใช้ Gemini หรือ LLM ตัวอื่นช่วยคิด ออกมาเป็นซีน และแต่ละซีนอยากเห็นอะไร ก็ใช้ Imagen ก็จะได้รูปตั้งต้นมาในแต่ละซีน และใช้ Veo ในการ animate รูปเหล่านั้น จบด้วยใส่เสียงประกอบด้วย Lyria และเสียงพากย์ด้วย Chirp ในตอนนี้ง่ายขึ้น แต่ยังใช้เงินเยอะอยู่ แต่ถูกกว่าถ่ายทำโดยจ้าง production house คลิปตัวอย่าง 23 วินาที เป็นหลักพัน สามารถลองเล่นได้ที่ Google AI Studio
- Veo3 เปิดตัวเรียบร้อยแล้ว ที่งาน Google I/O ที่ผ่านมา เราสามารถบอกได้ว่าอยากได้วิดีโออะไร เดี๋ยวมันทำให้หมดเลย ไม่ต้องไปเริ่มแบบข้อมะกี้ พร้อมเสียงพูด voice over เพลงประกอบ sound effect ตัวอย่างคือคลิปที่พี่ต้าเต้น ดูได้ที่หน้าเพจ Skooldio
.
🔵 AI Agents & Platforms
อยู่ level บนสุด ประกาศ 3 อันเด่น ๆ
- Google Agentspace: เป็น agent ให้ทุกคนในองค์กรเข้าถึงได้ง่าย ๆ
- Open Source Agent Development Kit and Agent Engine: สร้าง agent เป็นของตัวเองได้ง่ายขึ้น รวมถึงการ deploy ด้วย
- Agent Interoperability Protocol: อยากทำงานกับ agent ต้องคุยยังไง
ด้วยความที่ศัพท์มันเยอะมาก มาแยกด้วยวัถตุประสงค์กันก่อนเลย
📍 Agentspace: เป็นพื้นที่ให้คนในองค์กร เข้ามาใช้งานในที่สร้างมา ไม่ว่าจะเป็น model, agent
📍 Vertex AI: เป็น AI platform ที่ให้เรา build และ deploy model และ agent ต่าง ๆ แบ่งเป็น 3 theme
1️⃣ Model Garden: มี LLM หรือ Generative AI model ซึ่ง Google จะ provide model ในบ้านตัวเอง, open source ต่าง ๆ จะมี Gamma, deepseek, Meta (Llama) รวมไปถึง partner ที่เป็น model ปิด เราต้องจ่ายเงินใช้ก่อน เช่น Anthropic Claude
2️⃣ Model Builder: สร้าง model เป็นของตัวเอง เขาอัพเดตเรื่องของการ evaluate การ run operation ต่าง ๆ ในการทำ LLM
3️⃣ Agent Builder: เป็นอันใหม่ที่ประกาศออกมา ตอนสร้าง agent จะมี
- ADK (Agent Development Kit) เป็น Python library ช่วยให้เราสร้าง agent ได้ง่าย
- Agent Engine ให้เรา deploy ได้ง่าย มันเป็นเหมือนตัว orchestrate คือ agent จะทำงานได้ดี เมื่อมีตัว model ตัว orchestrate มีตัวที่ลิ้งไปใช้เครื่องมือต่าง ๆ ข้างนอก และมี process ตรงกลาง ว่าทุกอย่างยังทำงานโอเคไหม ช่วยจัดการพวกนี้ใน agent จุดขายคือ connect กับทุกอย่างที่ Google Cloud มีอยู่แล้ว
- A2A (Agent to Agent) เป็น protocol ที่ให้ agent คุยกันได้ง่าย ๆ ทำงานคุยกันรู้เรื่อง มีคนเปรียบเทียบกับ MCP ซึ่งมันเติมเต็มซึ่งกันแล้วกัน โดย MCP ช่วยต่อกับ tool และ API และ A2A ให้ agent สองตัวคุยกัน
ที่ Google ประกาศออกมา คือทำให้เรามีตัวเลือกในการเลือกใช้งาน model ในแอพของเราให้มากที่สุด องค์กรไม่อยากถูก lock กับ model ใด model นึง อยากให้ switch เปลี่ยนตัว model ได้ง่าย ๆ เลือกได้จาก Model Garden ในตัว Agentspace ก็เช่นกัน
.
⭐ Google Agentspace เป็นพื้นที่ที่องค์กรอยากให้พนักงาน เข้าถึง agent ต่าง ๆ แล้วเอาไปใช้งานได้ เลยมี connector เยอะมาก เช่น Dropbox, SAP, Slack, Gmail
Agentspace Agent Gallery มี agent หลายหมวดให้เราเลือกใช้ ทั้งของ Google และขององค์กร ส่วน marketplace ยังไม่เปิด สามารถไปช้อปได้ในอนาคต
ตัวที่ Google บิ้วเอง และคิดว่าต้องได้ใช้ usecase นี้เยอะแน่ ๆ ในองค์กร คือ Idea Generation Agent ช่วยคิดไอเดียและให้คะแนนว่าอันไหนดีกว่ากัน รวมไอเดียกันต่อยอดได้ และ Deep Research Agent ก็อย่างที่ทุกคนเล่นกันใน LLM แต่ละบ้าน
Agentspace Agent Designer อยากให้พนักงานสร้าง agent ง่าย ๆ เป็นของตัวเอง เขาช่วย generate plan การทำงานของ agent ให้ มี step อะไรบ้าง และสร้างเป็น agent ไว้ใช้ได้
.
คนพูดถึง agent กันในวงกว้าง จริง ๆ เราอาจจะไม่ได้ต้องการ agent ในงานของเราขนาดนั้น หลายงานเราอยากได้ predictability เราอยากทำงานประมาณนี้นะ อยากให้แต่ละ step เป็นแบบนี้นะ ส่วน agent เหมาะกับงานที่เป็นปลายเปิดนิดนึง ให้มันทำซํ้า เปรียบเทียบ ทำหลายรอบ ผลลัพธ์ดีขึ้นเรื่อย ๆ ข้อดีคือเราได้ผลลัพธ์ที่ดีขึ้นในทุกรอบได้ ข้อเสียคือใช้ resource เยอะ หรือออกทะเลไปแต่แรกถ้าเราตั้งเป้าหมายไม่ถูก
ดังนั้นเราอยากให้มันช่วยคิดขนาดไหน หรือกำหนด workflow เอง และมี human-in-the-loop มีคนช่วยตรวจความถูกต้อง และ workflow มีความเฉพาะเจาะจงมากขึ้น #siamstr