เมื่อปีที่แล้ว โลกเพิ่งเริ่มจินตนาการได้ว่าเทคโนโลยี Generative AI สามารถเปลี่ยนแปลงธุรกิจได้อย่างไร และในปัจจุบัน การเปลี่ยนแปลงดังกล่าวกำลังดำเนินไปด้วยดี และ Google เองก็มีจุดมุ่งหมายเดียวกัน นั่นคือการทำให้ AI เป็นประโยชน์สำหรับทุกคน เพื่อปรับปรุงชีวิตของผู้คนให้มากที่สุดเท่าที่จะเป็นไปได้
โลกของเอเจนท์ที่ขับเคลื่อนด้วย AI ที่เชื่อมต่อกับคลาวด์
ด้วยพอร์ตโฟลิโอ AI ทั้งหมดของเรา – โครงสร้างพื้นฐาน, Gemini, โมเดล และ Vertex AI ลูกค้าและคู่ค้ากำลังสร้างตัวแทน AI ที่ซับซ้อนมากขึ้น ซึ่งจะให้บริการลูกค้า สนับสนุนพนักงาน และช่วยพวกเขาสร้างเนื้อหา และอื่น ๆ อีกมากมาย
มาดูนวัตกรรมของผลิตภัณฑ์ที่เราประกาศในงาน Cloud Next 2024 เพื่อช่วยให้องค์กรทุกขนาดก้าวไปข้างหน้าในยุค AI
ศักยภาพของ Gen AI ในการขับเคลื่อนการเปลี่ยนแปลงอย่างรวดเร็วนั้นขึ้นอยู่กับประสิทธิภาพของโครงสร้างพื้นฐาน โดยเรากำลังสร้างความก้าวหน้าที่สำคัญ เพื่อสนับสนุนลูกค้าในทุกชั้นของโครงสร้างข้อมูล (stack):
- A3 mega: พัฒนาขึ้นกับ NVIDIA โดยใช้ Tensor Core GPU H100 อินสแตนซ์ที่ใช้ GPU ใหม่นี้พร้อมใช้งานโดยทั่วไปและเพิ่มแบนด์วิดท์การเชื่อมต่อระหว่างกันเป็นสองเท่าจากอินสแตนซ์ A3 นอกจากนี้เรายังเปิดตัว Confidential A3 ซึ่งช่วยให้ลูกค้ารักษาความลับและความสมบูรณ์ของข้อมูลที่ละเอียดอ่อนและเวิร์กโหลด AI ในระหว่างการฝึกอบรมและการอนุมานได้ดียิ่งขึ้น
- NVIDIA HGX B200 และ NVIDIA GB200 NVL72: แพลตฟอร์ม NVIDIA Balckwell ใหม่ล่าสุด จะเปิดตัวบน Google Cloud ในช่วงต้นปี 2025 ใน 2 รูปแบบ ได้แก่ HGX B200 และ GB200 โดยตัว B200 ได้รับการออกแบบมาเพื่อการฝึกอบรมและการให้บริการทั่วไป ในขณะที่ GB200 NVL72 ขับเคลื่อนการอนุมานโมเดลภาษาขนาดใหญ่แบบเรียลไทม์และประสิทธิภาพการฝึกอบรมขนาดใหญ่สำหรับโมเดลขนาดล้านล้านพารามิเตอร์
- TPU v5p: เรากำลังประกาศความพร้อมใช้งานทั่วไปของ TPU v5p ซึ่งเป็นตัวเร่ง AI ที่ทรงพลัง ปรับขนาดได้ และยืดหยุ่นที่สุดของเราสำหรับการฝึกฝนและการอนุมาน โดยมีพลังการประมวลผลมากกว่าต่อพ็อดถึง 4 เท่า เมื่อเทียบกับรุ่นก่อนหน้า นอกจากนี้ เรายังประกาศความพร้อมในการรองรับ Google Kubernetes Engine (GKE) สำหรับ TPU v5p ในปีที่ผ่านมา การใช้ GPU และ TPU บน GKE เพิ่มขึ้นมากกว่า 900%
- ตัวเลือกพื้นที่เก็บข้อมูลที่เพิ่มประสิทธิภาพโดย AI: เรากำลังเร่งความเร็วในการฝึกด้วยฟีเจอร์แคชใหม่ใน Cloud Storage FUSE และ Parallelstore ซึ่งจะเก็บข้อมูลไว้ใกล้กับ TPU หรือ GPU ของลูกค้ามากขึ้น นอกจากนี้ เรายังเปิดตัว Hyperdisk ML (ในหน้า preview) ซึ่งเป็นบริการพื้นที่เก็บข้อมูลแบบบล็อครุ่นถัดไปของเราที่ช่วยเร่งเวลาโหลดโมเดลได้สูงสุดถึง 7 เท่า เมื่อเทียบกับตัวเลือกอื่น ๆ
- ตัวเลือกใหม่สำหรับ Dynamic Workload Scheduler: โหมดปฏิทิน (Calendar) สำหรับการรับประกันเวลาเริ่มต้นและการเริ่มต้นแบบยืดหยุ่นเพื่อการประหยัดที่เหมาะสม จะช่วยให้ลูกค้ามั่นใจในการจัดการทรัพยากรที่มีประสิทธิภาพสำหรับการกระจายการฝึกอบรมและงานอนุมานที่ซับซ้อน
นอกจากนี้เรายังนำ AI เข้าใกล้จุดที่ข้อมูลถูกสร้างขึ้นและบริโภคมากขึ้น มาสู่ Edge สู่สภาพแวดล้อมใหม่ ๆ และมาสู่ Google Sovereign Clouds และ Cross-Cloud โดยเรายังเปิดใช้งาน AI Anywhere ผ่าน Google Distributed Cloud (GDC) ซึ่งช่วยให้คุณสามารถเลือกสภาพแวดล้อม การกำหนดค่า และการควบคุมที่เหมาะกับความต้องการเฉพาะขององค์กรของคุณมากที่สุด
วันนี้เราได้ประกาศความสามารถใหม่ ๆ มากมายใน GDC ได้แก่:
- NVIDIA GPUs ไปยัง GDC: เรากำลังนำ NVIDIA GPUs มาสู่ GDC สำหรับการกำหนดค่าทั้งแบบเชื่อมต่อและแบบ Air-gapped แต่ละรายการจะรองรับอินสแตนซ์ที่ใช้ GPU ใหม่ เพื่อรันโมเดล AI ได้อย่างมีประสิทธิภาพ
- GKE บน GDC: เทคโนโลยี GKE แบบเดียวกับที่บริษัท AI ชั้นนำใช้บน Google Cloud จะพร้อมใช้งานใน GDC
- การสนับสนุน AI โมเดล: เราให้บริการโมเดล AI แบบเปิดที่หลากหลาย รวมถึง Gemma, Llama และอื่น ๆ บน GDC เพื่อให้ทำงานในสภาพแวดล้อม Air-gapped และ Edge ที่เชื่อมต่อกัน
- Vector Search บน GDC: เรายังนำพลังของ vector search มาใช้เพื่อให้สามารถค้นหาและดึงข้อมูลบน GDC สำหรับข้อมูลส่วนตัวและข้อมูลที่ละเอียดอ่อนของคุณ โดยมีเวลาแฝงที่ต่ำมาก
- Sovereign Cloud: สำหรับข้อกำหนดด้านกฎระเบียบที่เข้มงวดที่สุด เรานำเสนอ GDC ในการกำหนดค่าแบบ Fully Air-gapped พร้อมการดำเนินงานในพื้นที่ ความอยู่รอดเต็มรูปแบบ จัดการโดย Google หรือผ่านพันธมิตรที่คุณเลือก คุณสามารถควบคุมได้อย่างสมบูรณ์ และเมื่อกฎระเบียบเปลี่ยนแปลง เราก็มีความยืดหยุ่นเพื่อช่วยให้คุณตอบสนองได้อย่างรวดเร็ว
แม้ว่าไม่ใช่ทุกงานจะเป็นเวิร์กโหลด AI แต่ทุกปริมาณงานที่คุณเรียกใช้ในระบบคลาวด์จำเป็นต้องมีการปรับให้เหมาะสม และแต่ละแอปพลิเคชันก็มีความต้องการทางเทคนิคที่แตกต่างกัน ดังนั้นเราจึงแนะนำตัวเลือกการคำนวณอเนกประสงค์ ที่ช่วยให้ลูกค้าเพิ่มประสิทธิภาพสูงสุด ช่วยให้สามารถทำงานร่วมกันระหว่างแอปพลิเคชัน และบรรลุเป้าหมายด้านความยั่งยืน ทั้งหมดนี้ในขณะเดียวกันก็ลดต้นทุนอีกด้วย
- Google Axion: Arm-based CPU ตัวแรกของเราที่ออกแบบมาสำหรับศูนย์ข้อมูล มอบประสิทธิภาพที่ดีขึ้นสูงสุด 50% และประสิทธิภาพการใช้พลังงานที่ดีขึ้นสูงสุด 60% เมื่อเทียบกับอินสแตนซ์ที่ใช้ x86 รุ่นปัจจุบันที่เทียบเคียงได้
- นอกจากนี้ เรายังประกาศเปิดตัว N4 และ C4 ซึ่งเป็นแมชชีนซีรีส์ใหม่ในกลุ่มผลิตภัณฑ์ พอร์ทโฟลิโอ General VM Purpose ของเรา, Native Bare-metal Machine Shapes ใน C3 Machine Family, ความพร้อมใช้งานทั่วไปของ Hyperdisk Advanced Storage Pools และอื่น ๆ อีกมากมาย
สร้างเอเจนท์ ด้วย Vertex AI
Google Cloud นำเสนอโมเดลจากบุคคลที่หนึ่งและบุคคลที่สามมากกว่า 130 โมเดลบน Vertex AI และเรากำลังขยายการเข้าถึงโมเดลต่างๆ เพื่อให้ลูกค้ามีทางเลือกมากที่สุดในการเลือกโมเดล:
- Gemini 5 Pro: Gemini 1.5 Pro มีหน้าต่างบริบทสองขนาด – โทเค็น 128K และโทเค็น 1 ล้าน และขณะนี้เปิดให้ใช้งานในรูปแบบตัวอย่างสำหรับสาธารณะแล้ว ลูกค้าสามารถประมวลผลข้อมูลจำนวนมหาศาลได้ในสตรีมเดียว รวมถึงวิดีโอ 1 ชั่วโมง, เสียง 11 ชั่วโมง, โค้ดเบสที่มีโค้ดมากกว่า 30,000 บรรทัด หรือมากกว่า 700,000 คำ
- Claude 3: โมเดลใหม่ล่าสุดในตระกูล Anthropic พร้อมให้บริการลูกค้าบน Vertex AI แล้ว
- CodeGemma: Gemma คือกลุ่มผลิตภัณฑ์รุ่นเปิดที่ทันสมัยและมีน้ำหนักเบาซึ่งสร้างโดยการวิจัยและเทคโนโลยีเดียวกับที่ใช้สร้างแบบจำลองราศีเมถุน Gemma เวอร์ชันที่ได้รับการปรับแต่งใหม่ซึ่งออกแบบมาสำหรับกรณีการใช้งานการเขียนโค้ด เช่น การสร้างโค้ดและการให้ความช่วยเหลือด้านโค้ด CodeGemma พร้อมใช้งานแล้วบน Vertex AI
- Imagen 2: เทคโนโลยีการแปลงข้อความเป็นรูปภาพขั้นสูงสุดของเรามีคุณลักษณะการสร้างรูปภาพที่หลากหลาย เพื่อช่วยให้ธุรกิจต่าง ๆ สร้างภาพที่ตรงกับข้อกำหนดเฉพาะของแบรนด์ ความสามารถใหม่ในการแสดงข้อความเป็นภาพสดช่วยให้ทีมการตลาดและทีมสร้างสรรค์สามารถสร้างภาพเคลื่อนไหว เช่น GIF ซึ่งติดตั้งตัวกรองความปลอดภัยและลายน้ำดิจิทัล นอกจากนี้ เรายังประกาศความพร้อมใช้งานทั่วไปของฟีเจอร์การแก้ไขภาพขั้นสูง รวมถึงการลงสีและลงสีภายนอก และอื่น ๆ อีกมากมาย
- ลายน้ำดิจิทัล: ขับเคลื่อนโดย SynthID ของ Google DeepMind เราภูมิใจที่จะประกาศว่าขณะนี้ลายน้ำดิจิทัลพร้อมใช้งานแล้วสำหรับรูปภาพที่สร้างโดย AI ที่ผลิตโดย Imagen 2
เมื่อคุณเลือกโมเดลที่ถูกต้อง ปรับแต่งและกราวด์แล้ว Vertex ยังสามารถช่วยคุณปรับใช้ จัดการ และตรวจสอบโมเดลได้อีกด้วย วันนี้เราจะประกาศความสามารถเพิ่มเติมของ ML opps ได้แก่:
- เครื่องมือ Prompt Management: เครื่องมือเหล่านี้ช่วยให้คุณสามารถทำงานร่วมกันบนพร้อมท์ในตัวพร้อมบันทึกและบอกสถานะ ติดตามการเปลี่ยนแปลงเมื่อเวลาผ่านไป และเปรียบเทียบคุณภาพของการตอบกลับจากพร้อมท์ต่าง ๆ
- Automatic side-by-side: Auto SxS จะให้คำอธิบายว่าเหตุใดคำตอบหนึ่งจึงมีประสิทธิภาพเหนือกว่าอีกคำตอบหนึ่ง และให้คะแนนความมั่นใจ ซึ่งช่วยให้ผู้ใช้เข้าใจความถูกต้องของการประเมิน โดยขณะนี้มีให้บริการโดยทั่วไปแล้ว
- ฟีเจอร์ Rapid Evaluation: ขณะนี้อยู่ในหน้า preview ซึ่งจะช่วยให้ลูกค้าประเมินแบบจำลองบนชุดข้อมูลที่เล็กลงได้อย่างรวดเร็วเมื่อทำการออกแบบพร้อมท์
ในที่สุด Vertex AI Agent Builder ก็รวบรวมโมเดลพื้นฐานต่าง ๆ ตัว Google Search และเครื่องมือสำหรับนักพัฒนาอื่น ๆ เข้าด้วยกัน เพื่อให้คุณสามารถสร้างและปรับใช้ตัวแทนได้อย่างง่ายดาย โดยมอบความสะดวกสบายของคอนโซลตัวสร้างเอเจนท์แบบไม่ต้องเขียนโค้ด ควบคู่ไปกับความสามารถในการกราวดิ้งการเรียบเรียง และการเพิ่มที่มีประสิทธิภาพ ซึ่งด้วย Vertex AI Agent Builder คุณสามารถสร้างเอเจนท์ Gen AI ต่าง ๆ ได้อย่างรวดเร็ว โดยอาศัย Google Search และข้อมูลองค์กรของคุณ
เร่งการพัฒนาให้ดียิ่งขึ้น
Gemini Code Assist เป็นโซลูชัน AI Code Assistance ที่มุ่งเน้นสำหรับองค์กรของเรา ทั้งนี้ เพื่อสนับสนุนนักพัฒนาเรากำลังประกาศการปรับปรุงอื่น ๆ ดังนี้:
- Gemini 5 Pro ใน Gemini Code Assist: การอัปเกรดนี้ได้มอบ 1 ล้าน token context window ซึ่งปฏิวัติการเขียนโค้ดสำหรับโปรเจ็กต์ที่ใหญ่ที่สุด ขณะนี้ Gemini Code Assist ให้คำแนะนำโค้ดที่แม่นยำยิ่งขึ้น ข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้น และขั้นตอนการทำงานที่คล่องตัวยิ่งขึ้น
- Gemini Cloud Assist: ให้ความช่วยเหลือ AI ตลอดวงจรการใช้งานแอปพลิเคชันของคุณ ทำให้ง่ายต่อการออกแบบ รักษาความปลอดภัย ดำเนินการ แก้ไขปัญหา และเพิ่มประสิทธิภาพและต้นทุนของแอปพลิเคชัน
เราใช้ Gemini Code Assist กับกลุ่มนักพัฒนาของ Google และพบว่าพวกเขาทำงานเสร็จเร็วขึ้น 40% สำหรับงานพัฒนาทั่วไป และการใช้เวลาเขียนโค้ดใหม่น้อยลง 55% โดย Gemini Code Assist สามารถรองรับฐานรหัสส่วนตัวของคุณได้ทุกที่ รวมถึงภายในองค์กร, GitHub, GitLab, Bitbucket หรือแม้แต่หลาย ๆ แห่งในเวลาเดียวกัน
ปลดล็อกศักยภาพของ AI ด้วยข้อมูล
Google Cloud ช่วยให้คุณามารถดึงความสามารถที่ดีที่สุดของ AI เข้ากับข้อมูลองค์กรของคุณ และในขณะเดียวกันก็รักษาข้อมูลของคุณให้เป็นส่วนตัวและปลอดภัย วันนี้ เรากำลังประกาศการปรับปรุงใหม่ ๆ เพื่อช่วยให้องค์กรต่าง ๆ สร้างเอเจนท์ข้อมูลที่ยอดเยี่ยม ดังนี้:
- Gemini ใน BigQuery: Gemini ใน BigQuery ใช้ AI เพื่อช่วยทีมข้อมูลของคุณในการเตรียมข้อมูล การค้นพบ การวิเคราะห์ และการกำกับดูแล เมื่อใช้ร่วมกับสิ่งนี้ คุณจะสามารถสร้างและดำเนินการไปป์ไลน์ข้อมูลด้วย BigQuery Data Canvas ใหม่ของเรา ซึ่งมอบประสบการณ์เหมือนสมุดบันทึกใหม่ด้วยภาษาที่เป็นธรรมชาติและการแสดงภาพแบบฝัง ซึ่งทั้งสองรายการพร้อมใช้งานในหน้า preview
- Gemini ในฐานข้อมูล: ช่วยให้ย้ายข้อมูลได้อย่างปลอดภัยจากระบบเดิม เช่น การแปลงฐานข้อมูลของคุณเป็นฐานข้อมูลคลาวด์สมัยใหม่อย่าง AlloyDB
- Gemini ใน Looker: เรากำลังเปิดตัวความสามารถใหม่ ๆ ที่กำลังแสดงตัวอย่าง ซึ่งช่วยให้ตัวแทนข้อมูลของคุณผสานรวมกับเวิร์กโฟลว์ของคุณได้อย่างง่ายดาย นอกจากนี้เรายังได้เพิ่มความสามารถ Gen AI ใหม่เพื่อให้คุณสามารถแชทกับข้อมูลธุรกิจของคุณได้ และได้ผสานรวมกับ Google Workspace
ยกระดับความปลอดภัยทางไซเบอร์ ด้วยเครื่องมือที่ขับเคลื่อนด้วย AI
Gen AI มีศักยภาพในการสร้างสมดุลให้กับผู้ปกป้อง โดยมี Security Agent ที่ให้ความช่วยเหลือในทุกขั้นตอนของวงจรการรักษาความปลอดภัย นวัตกรรมในกลุ่มผลิตภัณฑ์ความปลอดภัยของ Google Cloud ที่ให้ผลลัพธ์ด้านความปลอดภัยที่แข็งแกร่งขึ้น และทำให้ทุกองค์กรทำให้ Google เป็นส่วนหนึ่งของทีมการรักษาความปลอดภัยได้แก่:
- Gemini ในระบบกรองภัยคุกคาม: ใช้ภาษาที่เป็นธรรมชาติเพื่อให้ข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมของผู้คุกคาม ด้วย Gemini เราสามารถวิเคราะห์ตัวอย่างโค้ดที่อาจเป็นอันตรายได้มากขึ้น ทั้งนี้ บริบทที่ใหญ่ขึ้นของ Gemini ช่วยให้สามารถวิเคราะห์การโต้ตอบระหว่างโมดูล และให้ข้อมูลเชิงลึกใหม่เกี่ยวกับจุดประสงค์ที่แท้จริงของโค้ด
- Gemini ในการปฏิบัติการด้านความปลอดภัย: คุณลักษณะการสืบสวนที่ได้รับความช่วยเหลือใหม่จะแปลงภาษาธรรมชาติเป็นการตรวจจับ สรุปข้อมูลเหตุการณ์ แนะนำแนวทางการดำเนินการเพื่อจัดการ และนำทางผู้ใช้ผ่านแพลตฟอร์มผ่านการแชทแบบสนทนา
เพิ่มประสิทธิภาพการผลิตด้วย Google Workspace
Gemini for Workspace (Gemini สำหรับ Workspace) ช่วยให้ธุรกิจต่าง ๆ มีเอเจนท์ที่ขับเคลื่อนด้วย AI ซึ่งติดตั้งอยู่ใน Gmail, Docs, Sheets และอื่น ๆ อีกมากมาย วันนี้เราจะประกาศคลื่นลูกใหม่ของนวัตกรรมและการเพิ่มประสิทธิภาพของ Gemini for Google Workspace ซึ่งประกอบด้วย:
- Google Vids: แอปใหม่สำหรับการสร้างวิดีโอที่ขับเคลื่อนด้วย AI สำหรับการทำงานนี้สามารถเป็นผู้ช่วยด้านการเขียนวิดีโอ การผลิต และการตัดต่อวิดีโอของคุณทั้งหมดได้ในที่เดียว โดย Vids สามารถสร้างสตอรี่บอร์ดที่คุณแก้ไขได้อย่างง่ายดาย และหลังจากเลือกสไตล์แล้ว เครื่องมือนี้จะรวมร่างงานแรกของคุณเข้ากับฉากที่แนะนำจากวิดีโอสต็อก รูปภาพ และเพลงประกอบ นอกจากนี้ยังช่วยให้คุณส่งข้อความด้วยเสียงพากย์ที่ถูกต้อง ไม่ว่าจะเลือกเสียงพากย์ที่ตั้งไว้ล่วงหน้าหรือใช้เสียงของคุณเอง Vids จะทำงานร่วมกับแอป Workspace อื่น ๆ ของเรา เช่น Docs, Sheets และSlide ในรูปแบบอินเทอร์เฟซที่ใช้งานง่าย และมีความสามารถในการทำงานร่วมกันและแบ่งปันโครงการได้อย่างปลอดภัยจากเบราว์เซอร์ของคุณ โดย Vids กำลังจะเปิดตัวใน Workspace Labs ในเดือนมิถุนายนนี้
- ส่วนเสริมการประชุมด้วยระบบ AI และการรับส่งข้อความ: ด้วยโหมด “จดบันทึกให้ฉัน” (take notes for me) การสรุปแชท และการแปลแบบเรียลไทม์ใน 69 ภาษา (4,600 คู่ภาษา) เครื่องมือการทำงานร่วมกันนี้จะมีราคาเพียง 10 ดอลลาร์สหรัฐ ต่อหนึ่งผู้ใช้ ต่อเดือน
- ส่วนเสริมการรักษาความปลอดภัยด้วย AI: ขณะนี้ แอดมิน Workspace สามารถจัดประเภทและปกป้องไฟล์และข้อมูลที่ละเอียดอ่อนได้โดยอัตโนมัติโดยใช้โมเดล AI ที่รักษาความเป็นส่วนตัวและการควบคุมการป้องกันข้อมูลสูญหายที่ได้รับการฝึกอบรมสำหรับองค์กรของตน ส่วนเสริมการรักษาความปลอดภัยด้วย AI มีให้บริการในราคา 10 ดอลลาร์สหรัฐ ต่อหนึ่งผู้ใช้ ต่อเดือน และสามารถเพิ่มลงในแผน Workspace ส่วนใหญ่ได้
เมื่อมองย้อนกลับไปในปีที่ผ่านมา เป็นเรื่องที่น่าทึ่งอย่างยิ่งที่เห็นว่าลูกค้าของเราเปลี่ยนจากความกระตือรือร้นและการทดลอง ไปสู่การใช้เครื่องมือ AI และการเปิดตัวผลิตภัณฑ์ในระยะเริ่มต้นได้รวดเร็วเพียงใด และเราตั้งตารอสิ่งที่พวกเขาจะทำต่อไปในอนาคตอันใกล้นี้