Prompt API

Thomas Steiner
Thomas Steiner
Alexandra Klepper
Alexandra Klepper

Yayınlanma tarihi: 20 Mayıs 2025

Açıklayıcı Web Uzantılar Chrome Durumu Amaç
GitHub Kaynak denemesi Origin denemesinde Chrome 138 Görünüm Deneme Yapma Amacı

İstem API'si ile tarayıcıda Gemini Nano'ya doğal dil istekleri gönderebilirsiniz.

İstem API'sini birçok farklı şekilde kullanabilirsiniz. Web uygulamasında veya web sitesinde şunları oluşturabilirsiniz:

  • Yapay zeka destekli arama: Web sayfasının içeriğine göre soruları yanıtlayın.
  • Kişiselleştirilmiş haber feed'leri: Makaleleri kategorilere göre dinamik olarak sınıflandıran bir feed oluşturun ve kullanıcıların bu içeriği filtrelemesine olanak tanıyın.

Bunlar sadece birkaç olasılık. Üreteceğiniz içerikleri merakla bekliyoruz.

Donanım gereksinimlerini inceleyin

Geliştiriciler ve Chrome'da bu API'leri kullanarak özellikleri çalıştıran kullanıcılar için aşağıdaki şartlar geçerlidir. Diğer tarayıcıların farklı işletim gereksinimleri olabilir.

Dil Algılayıcı ve Çeviri API'leri masaüstündeki Chrome'da çalışır. Bu API'ler mobil cihazlarda çalışmaz. Prompt API, Summarizer API, Writer API ve Rewriter API, aşağıdaki koşullar karşılandığında Chrome'da çalışır:

  • İşletim sistemi: Windows 10 veya 11; macOS 13 veya üzeri (Ventura ve sonraki sürümler) ya da Linux. Android, iOS ve ChromeOS için Chrome, Gemini Nano'yu kullanan API'ler tarafından henüz desteklenmemektedir.
  • Depolama alanı: Chrome profilinizi içeren birimde en az 22 GB.
  • GPU: Kesinlikle 4 GB'tan fazla VRAM.
  • : Sınırsız veri veya ölçülmeyen bağlantı.

Gemini Nano'nun tam boyutu biraz farklılık gösterebilir. Mevcut boyutu öğrenmek için chrome://on-device-internals adresini ziyaret edip Model durumu'na gidin. Model boyutunu belirlemek için listelenen Dosya yolunu açın.

Prompt API'yi kullanma

Bu API'yi kullanmadan önce Google'ın Üretken Yapay Zeka Yasaklanan Kullanım Politikası'nı kabul edin.

LanguageModel ad alanında kullanabileceğiniz iki işlev vardır:

  • availability() simgesini tıklayarak modelin neler yapabileceğini ve kullanıma sunulup sunulmadığını kontrol edin.
  • create() simgesini tıklayarak dil modeli oturumu başlatın.

Model indirme

Prompt API, Chrome'da Gemini Nano modelini kullanır. API, Chrome'a yerleşik olsa da model, bir kaynak API'yi ilk kez kullandığında ayrı olarak indirilir.

Modelin kullanıma hazır olup olmadığını belirlemek için eşzamansız LanguageModel.availability() işlevini çağırın. Bu işlem aşağıdaki yanıtlardan birini döndürmelidir:

  • "unavailable", uygulamanın istenen seçenekleri veya dil modeline istem göndermeyi hiç desteklemediği anlamına gelir.
  • "downloadable", uygulamanın istenen seçenekleri desteklediği ancak bu seçenekleri kullanarak oturum oluşturabilmesi için bir şeyler indirmesi (örneğin, dil modelinin kendisi veya ince ayar) gerektiği anlamına gelir.
  • "downloading", uygulamanın istenen seçenekleri desteklediği ancak bu seçenekleri kullanarak oturum oluşturabilmesi için devam eden bir indirme işlemini tamamlaması gerektiği anlamına gelir.
  • "available", uygulamanın istenen seçenekleri yeni indirme gerektirmeden desteklediği anlamına gelir.

Model indirme işlemini tetiklemek ve dil modeli oturumu oluşturmak için asenkron LanguageModel.create() işlevini çağırın. availability() sorusuna 'downloadable' yanıtı verildiyse indirme ilerleme durumunu dinlemek en iyi uygulamadır. Bu sayede, indirme işlemi uzun sürerse kullanıcıyı bilgilendirebilirsiniz.

const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener('downloadprogress', (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});

Model özellikleri

params() işlevi, dil modelinin parametreleri hakkında bilgi verir. Nesnede aşağıdaki alanlar bulunur:

  • defaultTopK: Varsayılan üst K değeri (varsayılan: 3).
  • maxTopK: Maksimum top-K değeri (8).
  • defaultTemperature: Varsayılan sıcaklık (1.0). Sıcaklık değeri 0.0 ile 2.0 arasında olmalıdır.
  • maxTemperature: Maksimum sıcaklık.
await LanguageModel.params();
// {defaultTopK: 3, maxTopK: 8, defaultTemperature: 1, maxTemperature: 2}

Oturum oluşturma

Prompt API çalıştırılabildiğinde create() işleviyle bir oturum oluşturursunuz. Modele prompt() veya promptStreaming() işlevleriyle istem girebilirsiniz.

Oturumunuzu özelleştirme

Her oturum, isteğe bağlı bir seçenekler nesnesi kullanılarak topK ve temperature ile özelleştirilebilir. Bu parametrelerin varsayılan değerleri LanguageModel.params() tarafından döndürülür.

const params = await LanguageModel.params();
// Initializing a new session must either specify both `topK` and
// `temperature` or neither of them.
const slightlyHighTemperatureSession = await LanguageModel.create({
  temperature: Math.max(params.defaultTemperature * 1.2, 2.0),
  topK: params.defaultTopK,
});

create() işlevinin isteğe bağlı seçenekler nesnesi, oturumu sonlandırmak için AbortSignal iletmenize olanak tanıyan bir signal alanı da alır.

const controller = new AbortController();
stopButton.onclick = () => controller.abort();

const session = await LanguageModel.create({
  signal: controller.signal,
});

İlk istemler

İlk istemlerle, dil modeline önceki etkileşimlerle ilgili bağlam sağlayabilirsiniz. Örneğin, kullanıcının tarayıcı yeniden başlatıldıktan sonra depolanmış bir oturuma devam etmesine izin verebilirsiniz.

const session = await LanguageModel.create({
  initialPrompts: [
    { role: 'system', content: 'You are a helpful and friendly assistant.' },
    { role: 'user', content: 'What is the capital of Italy?' },
    { role: 'assistant', content: 'The capital of Italy is Rome.' },
    { role: 'user', content: 'What language is spoken there?' },
    {
      role: 'assistant',
      content: 'The official language of Italy is Italian. [...]',
    },
  ],
});
Önek sağlayarak yanıtları kısıtlama

Modelin önceki yanıtlarını ayrıntılandırmak için önceki rollerin yanı sıra yeni bir "assistant" rolü ekleyebilirsiniz. Örneğin:

const followup = await session.prompt([
  {
    role: "user",
    content: "I'm nervous about my presentation tomorrow"
  },
  {
    role: "assistant"
    content: "Presentations are tough!"
  }
]);

Bazı durumlarda yeni bir yanıt istemek yerine "assistant" rolü yanıt mesajının bir bölümünü önceden doldurmak isteyebilirsiniz. Bu, dil modelini belirli bir yanıt biçimini kullanmaya yönlendirmek için faydalı olabilir. Bunu yapmak için sondaki "assistant"-role mesajına prefix: true ekleyin. Örneğin:

const characterSheet = await session.prompt([
  {
    role: 'user',
    content: 'Create a TOML character sheet for a gnome barbarian',
  },
  {
    role: 'assistant',
    content: '```toml\n',
    prefix: true,
  },
]);
İstem girmeden mesaj ekleme

Çıkarım, özellikle çok formatlı girişlerle istem oluştururken biraz zaman alabilir. Oturumu doldurmak için önceden belirlenmiş istemleri önceden göndermek yararlı olabilir. Böylece model, işlemeye önceden başlayabilir.

initialPrompts oturum oluşturma sırasında faydalı olsa da append() yöntemi, oturum oluşturulduktan sonra ek bağlamsal istemler sağlamak için prompt() veya promptStreaming() yöntemlerine ek olarak kullanılabilir.

Örneğin:

const session = await LanguageModel.create({
  initialPrompts: [
    {
      role: 'system',
      content:
        'You are a skilled analyst who correlates patterns across multiple images.',
    },
  ],
  expectedInputs: [{ type: 'image' }],
});

fileUpload.onchange = async () => {
  await session.append([
    {
      role: 'user',
      content: [
        {
          type: 'text',
          value: `Here's one image. Notes: ${fileNotesInput.value}`,
        },
        { type: 'image', value: fileUpload.files[0] },
      ],
    },
  ]);
};

analyzeButton.onclick = async (e) => {
  analysisResult.textContent = await session.prompt(userQuestionInput.value);
};

append() tarafından döndürülen söz, istem doğrulandıktan, işlendikten ve oturuma eklendikten sonra yerine getirilir. İstem eklenemezse söz reddedilir.

Oturum sınırları

Belirli bir dil modeli oturumunun işleyebileceği maksimum jeton sayısı vardır. Oturum nesnesinde aşağıdaki özellikleri kullanarak bu sınıra yönelik kullanımı ve ilerleme durumunu kontrol edebilirsiniz:

console.log(`${session.inputUsage}/${session.inputQuota}`);

Oturum kalıcılığı

Her oturumda, sohbetin bağlamı takip edilir. Oturumun bağlam penceresi dolana kadar önceki etkileşimler gelecekteki etkileşimler için dikkate alınır.

const session = await LanguageModel.create({
  initialPrompts: [
    {
      role: 'system',
      content:
        'You are a friendly, helpful assistant specialized in clothing choices.',
    },
  ],
});

const result1 = await session.prompt(
  'What should I wear today? It is sunny. I am unsure between a t-shirt and a polo.',
);
console.log(result1);

const result2 = await session.prompt(
  'That sounds great, but oh no, it is actually going to rain! New advice?',
);
console.log(result2);

Oturum klonlama

Kaynakları korumak için clone() işlevini kullanarak mevcut bir oturumu klonlayabilirsiniz. Görüşme bağlamı sıfırlanır ancak ilk istem değişmez. clone() işlevi, signal alanına sahip isteğe bağlı bir seçenekler nesnesi alır. Bu alan, klonlanmış oturumu yok etmek için AbortSignal iletmenize olanak tanır.

const controller = new AbortController();
stopButton.onclick = () => controller.abort();

const clonedSession = await session.clone({
  signal: controller.signal,
});

Modele istem girme

Modele prompt() veya promptStreaming() işlevleriyle istem girebilirsiniz.

Yayınlanmayan çıkış

Kısa bir sonuç bekliyorsanız yanıtı kullanılabilir olduğunda döndüren prompt() işlevini kullanabilirsiniz.

// Start by checking if it's possible to create a session based on the
// availability of the model, and the characteristics of the device.
const { defaultTemperature, maxTemperature, defaultTopK, maxTopK } =
  await LanguageModel.params();

const available = await LanguageModel.availability();

if (available !== 'unavailable') {
  const session = await LanguageModel.create();

  // Prompt the model and wait for the whole result to come back.
  const result = await session.prompt('Write me a poem!');
  console.log(result);
}

Yayınlanan çıkış

Daha uzun bir yanıt bekliyorsanız promptStreaming() işlevini kullanmanız gerekir. Bu işlev, modelden gelen kısmi sonuçları göstermenize olanak tanır. promptStreaming() işlevi ReadableStream değerini döndürür.

const { defaultTemperature, maxTemperature, defaultTopK, maxTopK } =
  await LanguageModel.params();

const available = await LanguageModel.availability();
if (available !== 'unavailable') {
  const session = await LanguageModel.create();

  // Prompt the model and stream the result:
  const stream = session.promptStreaming('Write me an extra-long poem!');
  for await (const chunk of stream) {
    console.log(chunk);
  }
}

İstem çalıştırmayı durdurma

Hem prompt() hem de promptStreaming(), signal alanıyla isteğe bağlı ikinci bir parametreyi kabul eder. Bu parametre, istemleri çalıştırmayı durdurmanıza olanak tanır.

const controller = new AbortController();
stopButton.onclick = () => controller.abort();

const result = await session.prompt('Write me a poem!', {
  signal: controller.signal,
});

Oturumu sonlandırma

Bir oturuma artık ihtiyacınız yoksa kaynakları serbest bırakmak için destroy() numaralı telefonu arayın. Bir oturum yok edildiğinde artık kullanılamaz ve devam eden yürütmeler iptal edilir. Oturum oluşturmak biraz zaman alabileceğinden, modele sık sık istem göndermeyi planlıyorsanız oturumu açık tutmak isteyebilirsiniz.

await session.prompt(
  "You are a friendly, helpful assistant specialized in clothing choices."
);

session.destroy();

// The promise is rejected with an error explaining that
// the session is destroyed.
await session.prompt(
  "What should I wear today? It is sunny, and I am unsure between a
  t-shirt and a polo."
);

Çok formatlı özellikler

İstem API'si, yerel deneme için Chrome 138 Canary'den ses ve resim girişlerini destekler. API, metin çıkışı döndürür.

Bu özelliklerle şunları yapabilirsiniz:

  • Kullanıcıların, bir sohbet uygulamasında gönderilen sesli mesajları yazıya dökmesine izin verin.
  • Altyazı veya alternatif metin olarak kullanılmak üzere web sitenize yüklenen bir resmi açıklayın.
const session = await LanguageModel.create({
  // { type: "text" } is not necessary to include explicitly, unless
  // you also want to include expected input languages for text.
  expectedInputs: [{ type: 'audio' }, { type: 'image' }],
});

const referenceImage = await (await fetch('/reference-image.jpeg')).blob();
const userDrawnImage = document.querySelector('canvas');

const response1 = await session.prompt([
  {
    role: 'user',
    content: [
      {
        type: 'text',
        value:
          'Give a helpful artistic critique of how well the second image matches the first:',
      },
      { type: 'image', value: referenceImage },
      { type: 'image', value: userDrawnImage },
    ],
  },
]);

console.log(response1);

const audioBlob = await captureMicrophoneInput({ seconds: 10 });

const response2 = await session.prompt([
  {
    role: 'user',
    content: [
      { type: 'text', value: 'My response to your critique:' },
      { type: 'audio', value: audioBlob },
    ],
  },
]);

Çok formatlı demolar

Ses girişiyle Prompt API'yi kullanmak için Mediarecorder Audio Prompt demosunu, görüntü girişiyle Prompt API'yi kullanmak için ise Canvas Image Prompt demosunu inceleyin.

Performans stratejisi

Web için Prompt API'nin geliştirme süreci devam etmektedir. Bu API'yi oluştururken en iyi performans için oturum yönetimi ile ilgili en iyi uygulamalarımıza göz atın.

Geri bildirim

Geri bildiriminiz, bu API'nin geleceği ve Gemini Nano'da yapılacak iyileştirmeler hakkında bilgi edinmemize yardımcı olur. Hatta ihtiyaçlarınızı ve kullanıcılarınızın ihtiyaçlarını karşılayabilmemiz için özel görev API'leri (ör. ses transkripsiyonu veya resim açıklaması için API'ler) bile oluşturulabilir.

Katılın ve geri bildirim paylaşın

Geri bildiriminiz, bu API'nin ve tüm yerleşik yapay zeka API'lerinin gelecekteki sürümlerinin nasıl oluşturulacağını ve uygulanacağını doğrudan etkileyebilir.