Biarkan container Anda dalam mode autopilot dan jalankan workload perusahaan Anda dengan aman dalam skala besar—tanpa memerlukan keahlian Kubernetes.
Dapatkan satu cluster Zonal atau Autopilot gratis per bulan. Pelanggan baru mendapatkan kredit gratis senilai $300 untuk mencoba GKE dan produk Google Cloud lainnya.
Fitur
Untuk mengantisipasi model yang lebih besar, kami memperkenalkan dukungan untuk cluster 65.000 node. Untuk mengembangkan model AI yang canggih, tim harus dapat mengalokasikan resource komputasi di berbagai workload. Hal ini tidak hanya mencakup pelatihan model, tetapi juga penyajian, inferensi, melakukan riset ad hoc, dan mengelola tugas tambahan. Dengan memusatkan daya komputasi dalam jumlah cluster terkecil, Anda dapat dengan cepat beradaptasi terhadap perubahan permintaan dari workload inferensi, penyajian, riset, dan pelatihan.
Kemampuan inferensi GKE dengan teknik penskalaan dan load balancing yang dioptimalkan untuk AI generatif memberikan performa yang berbeda untuk aplikasi AI generatif. Kemampuan ini membantu mengurangi biaya penayangan lebih dari 30%, mengurangi latensi tail sebesar 60%, dan meningkatkan throughput hingga 40% dibandingkan dengan penawaran Kubernetes terkelola dan open source lainnya.
Dengan edisi GKE Enterprise premium yang baru, tim platform mendapatkan manfaat dari peningkatan kecepatan dengan mengonfigurasi dan mengamati beberapa cluster dari satu tempat, menentukan konfigurasi untuk tim, bukan cluster, serta menyediakan opsi layanan mandiri bagi developer untuk deployment dan pengelolaan aplikasi. Anda dapat mengurangi risiko menggunakan keamanan lanjutan dan manajemen konfigurasi berbasis GitOps. Menurunkan total biaya kepemilikan (TCO) dengan solusi yang terintegrasi dan terkelola sepenuhnya, sehingga menghasilkan ROI hingga 196% dalam waktu tiga tahun.
Edisi GKE Standard menyediakan pengelolaan siklus proses cluster yang sepenuhnya otomatis, penskalaan otomatis pod dan cluster, visibilitas biaya, serta pengoptimalan biaya infrastruktur otomatis. GKE mencakup semua manfaat yang ada dari GKE dan menawarkan mode operasi Autopilot dan Standard. Edisi GKE Enterprise premium yang baru menawarkan semua hal di atas, ditambah pengelolaan, tata kelola, keamanan, dan konfigurasi untuk berbagai tim dan cluster, semuanya dengan pengalaman konsol terpadu dan mesh layanan terintegrasi.
Autopilot GKE adalah mode operasi handsfree otomatis yang mengelola komputasi dasar cluster Anda (tanpa perlu mengonfigurasi atau memantau) sambil tetap memberikan pengalaman Kubernetes yang lengkap. Dan dengan adanya penagihan per-pod, mode Autopilot memastikan Anda hanya perlu membayar untuk pod yang berjalan, bukan komponen sistem, overhead sistem operasi, atau kapasitas yang belum dialokasikan, serta dapat menghemat sumber daya dan efisiensi operasional hingga 85%. Mode operasi Autopilot dan Standard tersedia sebagai bagian dari edisi GKE Enterprise.
Deteksi ancaman GKE didukung oleh Security Command Center (SCC), dan menampilkan ancaman yang memengaruhi cluster GKE Anda secara mendekati real-time dengan terus memantau log audit GKE.
Kepatuhan GKE memberikan insight real-time yang disederhanakan, laporan otomatis, dan kebebasan untuk berinovasi dengan aman di Google Cloud.
GKE mengimplementasikan Kubernetes API lengkap, penskalaan otomatis empat arah, saluran rilis, dan dukungan multi-cluster. Penskalaan otomatis pod horizontal dapat didasarkan pada pemakaian CPU atau metrik kustom. Penskalaan otomatis cluster bekerja berdasarkan per pool node dan penskalaan otomatis pod vertikal menganalisis penggunaan CPU dan memori oleh berbagai pod secara terus menerus, serta secara otomatis menyesuaikan permintaan CPU dan memori.
Manfaatkan Kubernetes dan teknologi cloud di pusat data Anda sendiri melalui Google Distributed Cloud. Dapatkan pengalaman GKE dengan penginstalan yang cepat, terkelola, dan sederhana, serta update yang divalidasi oleh Google.
Cadangkan rentang alamat IP untuk cluster Anda, sehingga IP cluster Anda dapat ada berdampingan dengan IP jaringan pribadi melalui Google Cloud VPN.
Cara Kerjanya
Cluster GKE memiliki bidang kontrol dan mesin yang disebut node. Node berfungsi menjalankan layanan yang mendukung container yang berisi workload Anda. Bidang kontrol memutuskan apa yang berjalan pada node tersebut, termasuk penjadwalan dan penskalaan. Mode autopilot yang akan mengelola kerumitan ini; Anda cukup men-deploy dan menjalankan aplikasi Anda.
Penggunaan Umum
Gunakan fleet untuk menyederhanakan cara Anda mengelola deployment multi-cluster, seperti memisahkan lingkungan produksi dan non-produksi, atau memisahkan layanan lintas tingkat, lokasi, atau tim. Fleet memungkinkan Anda mengelompokkan dan menormalisasi cluster Kubernetes, sehingga mempermudah pengelolaan infrastruktur dan adopsi praktik terbaik Google.
Gunakan fleet untuk menyederhanakan cara Anda mengelola deployment multi-cluster, seperti memisahkan lingkungan produksi dan non-produksi, atau memisahkan layanan lintas tingkat, lokasi, atau tim. Fleet memungkinkan Anda mengelompokkan dan menormalisasi cluster Kubernetes, sehingga mempermudah pengelolaan infrastruktur dan adopsi praktik terbaik Google.
Platform AI/ML yang tangguh mempertimbangkan lapisan berikut: (i) Orkestrasi infrastruktur yang mendukung GPU untuk pelatihan dan penyajian workload dalam skala besar, (ii) Integrasi fleksibel dengan komputasi terdistribusi dan framework pemrosesan data, dan (iii) Dukungan untuk beberapa tim di infrastruktur yang sama untuk memaksimalkan penggunaan resource.
Platform AI/ML yang tangguh mempertimbangkan lapisan berikut: (i) Orkestrasi infrastruktur yang mendukung GPU untuk pelatihan dan penyajian workload dalam skala besar, (ii) Integrasi fleksibel dengan komputasi terdistribusi dan framework pemrosesan data, dan (iii) Dukungan untuk beberapa tim di infrastruktur yang sama untuk memaksimalkan penggunaan resource.
Buat aplikasi web dalam container, uji aplikasi tersebut secara lokal, lalu deploy ke cluster Google Kubernetes Engine (GKE), semuanya dilakukan secara langsung di Cloud Shell Editor. Pada akhir tutorial singkat ini, Anda akan memahami cara membangun, mengedit, dan men-debug aplikasi Kubernetes.
Buat aplikasi web dalam container, uji aplikasi tersebut secara lokal, lalu deploy ke cluster Google Kubernetes Engine (GKE), semuanya dilakukan secara langsung di Cloud Shell Editor. Pada akhir tutorial singkat ini, Anda akan memahami cara membangun, mengedit, dan men-debug aplikasi Kubernetes.
Harga
Cara kerja penetapan harga GKE | Setelah kredit gratis habis digunakan, total biaya didasarkan pada edisi, mode operasi cluster, biaya pengelolaan cluster, dan biaya transfer data masuk yang berlaku. | |
---|---|---|
Layanan | Deskripsi | Harga (USD) |
Tingkatan gratis | Paket gratis GKE memberikan kredit bulanan senilai $74,40 per akun penagihan yang berlaku untuk cluster zona dan Autopilot. | Gratis |
Kubernetes | Edisi perusahaan Mencakup fitur edisi standar dan multi-tim, multi-cluster, operasi layanan mandiri, keamanan lanjutan, mesh layanan, konfigurasi, dan pengalaman konsol terpadu. | $0,0083 Per vCPU per jam |
Edisi standar Mencakup pengelolaan siklus proses cluster yang sepenuhnya otomatis, penskalaan otomatis pod dan cluster, visibilitas biaya, serta pengoptimalan biaya infrastruktur otomatis. | $0,10 Per cluster per jam | |
Komputasi | Mode autopilot: CPU, memori, dan resource komputasi yang disediakan untuk Pod Anda. Mode standar: Anda akan ditagih untuk setiap instance sesuai dengan harga Compute Engine. | Lihat harga Compute Engine |
Pelajari lebih lanjut tentang penetapan harga GKE. Lihat semua detail penetapan harga
Cara kerja penetapan harga GKE
Setelah kredit gratis habis digunakan, total biaya didasarkan pada edisi, mode operasi cluster, biaya pengelolaan cluster, dan biaya transfer data masuk yang berlaku.
Paket gratis GKE memberikan kredit bulanan senilai $74,40 per akun penagihan yang berlaku untuk cluster zona dan Autopilot.
Gratis
Edisi perusahaan
Mencakup fitur edisi standar dan multi-tim, multi-cluster, operasi layanan mandiri, keamanan lanjutan, mesh layanan, konfigurasi, dan pengalaman konsol terpadu.
$0,0083
Per vCPU per jam
Edisi standar
Mencakup pengelolaan siklus proses cluster yang sepenuhnya otomatis, penskalaan otomatis pod dan cluster, visibilitas biaya, serta pengoptimalan biaya infrastruktur otomatis.
$0,10
Per cluster per jam
Mode autopilot: CPU, memori, dan resource komputasi yang disediakan untuk Pod Anda.
Mode standar: Anda akan ditagih untuk setiap instance sesuai dengan harga Compute Engine.
Lihat harga Compute Engine
Pelajari lebih lanjut tentang penetapan harga GKE. Lihat semua detail penetapan harga
Kasus Bisnis
Moloco: Waktu pelatihan model 10x lebih cepat dengan TPU di Google Kubernetes Engine
“Menskalakan infrastruktur kami seiring dengan pertumbuhan eksponensial bisnis Iklan Moloco merupakan sebuah tantangan besar. Kemampuan penskalaan otomatis GKE memungkinkan tim engineering untuk berfokus pada pengembangan tanpa harus menghabiskan banyak upaya untuk operasi.” - Sechan Oh, Director of Machine Learning, Moloco
Dengan menggabungkan kekuatan NVIDIA NIM dengan Google Kubernetes Engine, kami berhasil meningkatkan kecepatan token rata-rata sebesar 6,1 kali lipat. Artinya, LiveX AI dapat menghadirkan pengalaman yang dipersonalisasi untuk pelanggan secara real-time, termasuk dukungan pelanggan yang lancar, rekomendasi produk instan, dan pengurangan pengembalian.
- Jia Li, Co-Founder, Chief AI Officer, LiveX AI
“Penggunaan TPU di GKE, terutama Trillium versi terbaru untuk inferensi, khususnya untuk pembuatan gambar, telah mengurangi latensi hingga 66%, sehingga menghasilkan pengalaman pengguna yang lebih baik dan peningkatan rasio konversi. Pengguna mendapatkan respons dalam waktu kurang dari 10 detik, bukan menunggu hingga 30 detik. Hal ini sangat penting untuk engagement dan retensi pengguna.”
- Cem Ortabas, Co-founder, HubX
“Mengoptimalkan rasio harga-performa untuk inferensi AI generatif sangatlah penting bagi pelanggan kami. Kami sangat senang melihat Gateway Inferensi GKE dengan load balancing dan ekstensibilitas yang dioptimalkan di open source. Kemampuan Gateway Inferensi GKE yang baru dapat membantu kami meningkatkan performa lebih lanjut untuk workload inferensi pelanggan kami.“
- Chaoyu Yang, CEO dan Founder, BentoML
GKE menawarkan inferensi hemat biaya dan berskala besar yang terdepan di industri
“Kami telah melihat bahwa streaming image container di GKE memiliki dampak signifikan dalam mempercepat waktu mulai aplikasi kami. Streaming image membantu kami mempercepat waktu mulai sebesar 20% untuk tugas pelatihan setelah pengiriman.”
- Juho Kallio, CTO dan Co-Founder, IPRally
"Dukungan baru GKE untuk cluster yang lebih besar memberikan skala yang kami butuhkan untuk mempercepat inovasi AI kami."
- James Bradbury, Head of Compute, Anthropic
“Class komputasi memainkan peranan penting dalam membantu Shopify melakukan penskalaan selama peristiwa kami yang paling menuntut berlangsung.”
- Justin Reid, Principal Engineer, Shopify