Yayınlanma tarihi: 20 Mayıs 2025
Açıklayıcı | Web | Uzantılar | Chrome Durumu | Amaç |
---|---|---|---|---|
GitHub | Görünüm | Deneme Yapma Amacı |
İstem API'si ile tarayıcıda Gemini Nano'ya doğal dil istekleri gönderebilirsiniz.
İstem API'sini birçok farklı şekilde kullanabilirsiniz. Web uygulamasında veya web sitesinde şunları oluşturabilirsiniz:
- Yapay zeka destekli arama: Web sayfasının içeriğine göre soruları yanıtlayın.
- Kişiselleştirilmiş haber feed'leri: Makaleleri kategorilere göre dinamik olarak sınıflandıran bir feed oluşturun ve kullanıcıların bu içeriği filtrelemesine olanak tanıyın.
Bunlar sadece birkaç olasılık. Üreteceğiniz içerikleri merakla bekliyoruz.
Donanım gereksinimlerini inceleyin
Geliştiriciler ve Chrome'da bu API'leri kullanarak özellikleri çalıştıran kullanıcılar için aşağıdaki şartlar geçerlidir. Diğer tarayıcıların farklı işletim gereksinimleri olabilir.
Dil Algılayıcı ve Çeviri API'leri masaüstündeki Chrome'da çalışır. Bu API'ler mobil cihazlarda çalışmaz. Prompt API, Summarizer API, Writer API ve Rewriter API, aşağıdaki koşullar karşılandığında Chrome'da çalışır:
- İşletim sistemi: Windows 10 veya 11; macOS 13 veya üzeri (Ventura ve sonraki sürümler) ya da Linux. Android, iOS ve ChromeOS için Chrome, Gemini Nano'yu kullanan API'ler tarafından henüz desteklenmemektedir.
- Depolama alanı: Chrome profilinizi içeren birimde en az 22 GB.
- GPU: Kesinlikle 4 GB'tan fazla VRAM.
- Ağ: Sınırsız veri veya ölçülmeyen bağlantı.
Gemini Nano'nun tam boyutu biraz farklılık gösterebilir. Mevcut boyutu öğrenmek için chrome://on-device-internals
adresini ziyaret edip Model durumu'na gidin.
Model boyutunu belirlemek için listelenen Dosya yolunu açın.
Prompt API'yi kullanma
Bu API'yi kullanmadan önce Google'ın Üretken Yapay Zeka Yasaklanan Kullanım Politikası'nı kabul edin.
LanguageModel
ad alanında kullanabileceğiniz iki işlev vardır:
availability()
simgesini tıklayarak modelin neler yapabileceğini ve kullanıma sunulup sunulmadığını kontrol edin.create()
simgesini tıklayarak dil modeli oturumu başlatın.
Model indirme
Prompt API, Chrome'da Gemini Nano modelini kullanır. API, Chrome'a yerleşik olsa da model, bir kaynak API'yi ilk kez kullandığında ayrı olarak indirilir.
Modelin kullanıma hazır olup olmadığını belirlemek için eşzamansız LanguageModel.availability()
işlevini çağırın. Bu işlem aşağıdaki yanıtlardan birini döndürmelidir:
"unavailable"
, uygulamanın istenen seçenekleri veya dil modeline istem göndermeyi hiç desteklemediği anlamına gelir."downloadable"
, uygulamanın istenen seçenekleri desteklediği ancak bu seçenekleri kullanarak oturum oluşturabilmesi için bir şeyler indirmesi (örneğin, dil modelinin kendisi veya ince ayar) gerektiği anlamına gelir."downloading"
, uygulamanın istenen seçenekleri desteklediği ancak bu seçenekleri kullanarak oturum oluşturabilmesi için devam eden bir indirme işlemini tamamlaması gerektiği anlamına gelir."available"
, uygulamanın istenen seçenekleri yeni indirme gerektirmeden desteklediği anlamına gelir.
Model indirme işlemini tetiklemek ve dil modeli oturumu oluşturmak için asenkron LanguageModel.create()
işlevini çağırın. availability()
sorusuna 'downloadable'
yanıtı verildiyse indirme ilerleme durumunu dinlemek en iyi uygulamadır. Bu sayede, indirme işlemi uzun sürerse kullanıcıyı bilgilendirebilirsiniz.
const session = await LanguageModel.create({
monitor(m) {
m.addEventListener('downloadprogress', (e) => {
console.log(`Downloaded ${e.loaded * 100}%`);
});
},
});
Model özellikleri
params()
işlevi, dil modelinin parametreleri hakkında bilgi verir. Nesnede aşağıdaki alanlar bulunur:
defaultTopK
: Varsayılan üst K değeri (varsayılan:3
).maxTopK
: Maksimum top-K değeri (8
).defaultTemperature
: Varsayılan sıcaklık (1.0
). Sıcaklık değeri0.0
ile2.0
arasında olmalıdır.maxTemperature
: Maksimum sıcaklık.
await LanguageModel.params();
// {defaultTopK: 3, maxTopK: 8, defaultTemperature: 1, maxTemperature: 2}
Oturum oluşturma
Prompt API çalıştırılabildiğinde create()
işleviyle bir oturum oluşturursunuz.
Modele prompt()
veya promptStreaming()
işlevleriyle istem girebilirsiniz.
Oturumunuzu özelleştirme
Her oturum, isteğe bağlı bir seçenekler nesnesi kullanılarak topK
ve temperature
ile özelleştirilebilir. Bu parametrelerin varsayılan değerleri LanguageModel.params()
tarafından döndürülür.
const params = await LanguageModel.params();
// Initializing a new session must either specify both `topK` and
// `temperature` or neither of them.
const slightlyHighTemperatureSession = await LanguageModel.create({
temperature: Math.max(params.defaultTemperature * 1.2, 2.0),
topK: params.defaultTopK,
});
create()
işlevinin isteğe bağlı seçenekler nesnesi, oturumu sonlandırmak için AbortSignal
iletmenize olanak tanıyan bir signal
alanı da alır.
const controller = new AbortController();
stopButton.onclick = () => controller.abort();
const session = await LanguageModel.create({
signal: controller.signal,
});
İlk istemler
İlk istemlerle, dil modeline önceki etkileşimlerle ilgili bağlam sağlayabilirsiniz. Örneğin, kullanıcının tarayıcı yeniden başlatıldıktan sonra depolanmış bir oturuma devam etmesine izin verebilirsiniz.
const session = await LanguageModel.create({
initialPrompts: [
{ role: 'system', content: 'You are a helpful and friendly assistant.' },
{ role: 'user', content: 'What is the capital of Italy?' },
{ role: 'assistant', content: 'The capital of Italy is Rome.' },
{ role: 'user', content: 'What language is spoken there?' },
{
role: 'assistant',
content: 'The official language of Italy is Italian. [...]',
},
],
});
Önek sağlayarak yanıtları kısıtlama
Modelin önceki yanıtlarını ayrıntılandırmak için önceki rollerin yanı sıra yeni bir "assistant"
rolü ekleyebilirsiniz. Örneğin:
const followup = await session.prompt([
{
role: "user",
content: "I'm nervous about my presentation tomorrow"
},
{
role: "assistant"
content: "Presentations are tough!"
}
]);
Bazı durumlarda yeni bir yanıt istemek yerine "assistant"
rolü yanıt mesajının bir bölümünü önceden doldurmak isteyebilirsiniz. Bu, dil modelini belirli bir yanıt biçimini kullanmaya yönlendirmek için faydalı olabilir. Bunu yapmak için sondaki "assistant"
-role mesajına prefix: true
ekleyin. Örneğin:
const characterSheet = await session.prompt([
{
role: 'user',
content: 'Create a TOML character sheet for a gnome barbarian',
},
{
role: 'assistant',
content: '```toml\n',
prefix: true,
},
]);
İstem girmeden mesaj ekleme
Çıkarım, özellikle çok formatlı girişlerle istem oluştururken biraz zaman alabilir. Oturumu doldurmak için önceden belirlenmiş istemleri önceden göndermek yararlı olabilir. Böylece model, işlemeye önceden başlayabilir.
initialPrompts
oturum oluşturma sırasında faydalı olsa da append()
yöntemi, oturum oluşturulduktan sonra ek bağlamsal istemler sağlamak için prompt()
veya promptStreaming()
yöntemlerine ek olarak kullanılabilir.
Örneğin:
const session = await LanguageModel.create({
initialPrompts: [
{
role: 'system',
content:
'You are a skilled analyst who correlates patterns across multiple images.',
},
],
expectedInputs: [{ type: 'image' }],
});
fileUpload.onchange = async () => {
await session.append([
{
role: 'user',
content: [
{
type: 'text',
value: `Here's one image. Notes: ${fileNotesInput.value}`,
},
{ type: 'image', value: fileUpload.files[0] },
],
},
]);
};
analyzeButton.onclick = async (e) => {
analysisResult.textContent = await session.prompt(userQuestionInput.value);
};
append()
tarafından döndürülen söz, istem doğrulandıktan, işlendikten ve oturuma eklendikten sonra yerine getirilir. İstem eklenemezse söz reddedilir.
Oturum sınırları
Belirli bir dil modeli oturumunun işleyebileceği maksimum jeton sayısı vardır. Oturum nesnesinde aşağıdaki özellikleri kullanarak bu sınıra yönelik kullanımı ve ilerleme durumunu kontrol edebilirsiniz:
console.log(`${session.inputUsage}/${session.inputQuota}`);
Oturum kalıcılığı
Her oturumda, sohbetin bağlamı takip edilir. Oturumun bağlam penceresi dolana kadar önceki etkileşimler gelecekteki etkileşimler için dikkate alınır.
const session = await LanguageModel.create({
initialPrompts: [
{
role: 'system',
content:
'You are a friendly, helpful assistant specialized in clothing choices.',
},
],
});
const result1 = await session.prompt(
'What should I wear today? It is sunny. I am unsure between a t-shirt and a polo.',
);
console.log(result1);
const result2 = await session.prompt(
'That sounds great, but oh no, it is actually going to rain! New advice?',
);
console.log(result2);
Oturum klonlama
Kaynakları korumak için clone()
işlevini kullanarak mevcut bir oturumu klonlayabilirsiniz. Görüşme bağlamı sıfırlanır ancak ilk istem değişmez. clone()
işlevi, signal
alanına sahip isteğe bağlı bir seçenekler nesnesi alır. Bu alan, klonlanmış oturumu yok etmek için AbortSignal
iletmenize olanak tanır.
const controller = new AbortController();
stopButton.onclick = () => controller.abort();
const clonedSession = await session.clone({
signal: controller.signal,
});
Modele istem girme
Modele prompt()
veya promptStreaming()
işlevleriyle istem girebilirsiniz.
Yayınlanmayan çıkış
Kısa bir sonuç bekliyorsanız yanıtı kullanılabilir olduğunda döndüren prompt()
işlevini kullanabilirsiniz.
// Start by checking if it's possible to create a session based on the
// availability of the model, and the characteristics of the device.
const { defaultTemperature, maxTemperature, defaultTopK, maxTopK } =
await LanguageModel.params();
const available = await LanguageModel.availability();
if (available !== 'unavailable') {
const session = await LanguageModel.create();
// Prompt the model and wait for the whole result to come back.
const result = await session.prompt('Write me a poem!');
console.log(result);
}
Yayınlanan çıkış
Daha uzun bir yanıt bekliyorsanız promptStreaming()
işlevini kullanmanız gerekir. Bu işlev, modelden gelen kısmi sonuçları göstermenize olanak tanır. promptStreaming()
işlevi ReadableStream
değerini döndürür.
const { defaultTemperature, maxTemperature, defaultTopK, maxTopK } =
await LanguageModel.params();
const available = await LanguageModel.availability();
if (available !== 'unavailable') {
const session = await LanguageModel.create();
// Prompt the model and stream the result:
const stream = session.promptStreaming('Write me an extra-long poem!');
for await (const chunk of stream) {
console.log(chunk);
}
}
İstem çalıştırmayı durdurma
Hem prompt()
hem de promptStreaming()
, signal
alanıyla isteğe bağlı ikinci bir parametreyi kabul eder. Bu parametre, istemleri çalıştırmayı durdurmanıza olanak tanır.
const controller = new AbortController();
stopButton.onclick = () => controller.abort();
const result = await session.prompt('Write me a poem!', {
signal: controller.signal,
});
Oturumu sonlandırma
Bir oturuma artık ihtiyacınız yoksa kaynakları serbest bırakmak için destroy()
numaralı telefonu arayın. Bir oturum yok edildiğinde artık kullanılamaz ve devam eden yürütmeler iptal edilir. Oturum oluşturmak biraz zaman alabileceğinden, modele sık sık istem göndermeyi planlıyorsanız oturumu açık tutmak isteyebilirsiniz.
await session.prompt(
"You are a friendly, helpful assistant specialized in clothing choices."
);
session.destroy();
// The promise is rejected with an error explaining that
// the session is destroyed.
await session.prompt(
"What should I wear today? It is sunny, and I am unsure between a
t-shirt and a polo."
);
Çok formatlı özellikler
İstem API'si, yerel deneme için Chrome 138 Canary'den ses ve resim girişlerini destekler. API, metin çıkışı döndürür.
Bu özelliklerle şunları yapabilirsiniz:
- Kullanıcıların, bir sohbet uygulamasında gönderilen sesli mesajları yazıya dökmesine izin verin.
- Altyazı veya alternatif metin olarak kullanılmak üzere web sitenize yüklenen bir resmi açıklayın.
const session = await LanguageModel.create({
// { type: "text" } is not necessary to include explicitly, unless
// you also want to include expected input languages for text.
expectedInputs: [{ type: 'audio' }, { type: 'image' }],
});
const referenceImage = await (await fetch('/reference-image.jpeg')).blob();
const userDrawnImage = document.querySelector('canvas');
const response1 = await session.prompt([
{
role: 'user',
content: [
{
type: 'text',
value:
'Give a helpful artistic critique of how well the second image matches the first:',
},
{ type: 'image', value: referenceImage },
{ type: 'image', value: userDrawnImage },
],
},
]);
console.log(response1);
const audioBlob = await captureMicrophoneInput({ seconds: 10 });
const response2 = await session.prompt([
{
role: 'user',
content: [
{ type: 'text', value: 'My response to your critique:' },
{ type: 'audio', value: audioBlob },
],
},
]);
Çok formatlı demolar
Ses girişiyle Prompt API'yi kullanmak için Mediarecorder Audio Prompt demosunu, görüntü girişiyle Prompt API'yi kullanmak için ise Canvas Image Prompt demosunu inceleyin.
Performans stratejisi
Web için Prompt API'nin geliştirme süreci devam etmektedir. Bu API'yi oluştururken en iyi performans için oturum yönetimi ile ilgili en iyi uygulamalarımıza göz atın.
Geri bildirim
Geri bildiriminiz, bu API'nin geleceği ve Gemini Nano'da yapılacak iyileştirmeler hakkında bilgi edinmemize yardımcı olur. Hatta ihtiyaçlarınızı ve kullanıcılarınızın ihtiyaçlarını karşılayabilmemiz için özel görev API'leri (ör. ses transkripsiyonu veya resim açıklaması için API'ler) bile oluşturulabilir.
Katılın ve geri bildirim paylaşın
Geri bildiriminiz, bu API'nin ve tüm yerleşik yapay zeka API'lerinin gelecekteki sürümlerinin nasıl oluşturulacağını ve uygulanacağını doğrudan etkileyebilir.
- Erken önizleme programına katılın.
- Chrome'un uygulamasıyla ilgili geri bildirim için hata raporu veya özellik isteği gönderin.
- Mevcut bir soruna yorum yaparak veya Prompt API GitHub deposunda yeni bir sorun açarak API şekliyle ilgili geri bildiriminizi paylaşın.
- Web Incubator Community Group'a katılarak standartlar çalışmasına dahil olun.