Détection de la langue avec l'IA intégrée

Thomas Steiner
Thomas Steiner

Publié le 24 septembre 2024, dernière mise à jour le 20 mai 2025

Explication Web Extensions État de Chrome Intent
MDN  Chrome 138  Chrome 138 Afficher Intention d'expédier

Avant de traduire un texte d'une langue à une autre, vous devez d'abord déterminer la langue utilisée dans le texte donné. Auparavant, la traduction nécessitait d'importer le texte dans un service cloud, d'effectuer la traduction sur le serveur, puis de télécharger les résultats.

L'API Language Detector fonctionne côté client, ce qui signifie que vous pouvez protéger la confidentialité des utilisateurs. Bien qu'il soit possible de fournir une bibliothèque spécifique qui effectue cette opération, cela nécessiterait des ressources supplémentaires pour le téléchargement.

Quand utiliser la détection de la langue

L'API Language Detector est principalement utile dans les scénarios suivants :

  • Déterminer la langue du texte d'entrée pour pouvoir le traduire
  • Déterminer la langue du texte d'entrée pour charger le modèle approprié pour les tâches spécifiques à la langue, comme la détection de la toxicité.
  • Déterminer la langue du texte saisi afin de pouvoir l'étiqueter correctement, par exemple sur les sites de réseaux sociaux en ligne.
  • Déterminer la langue du texte saisi pour que l'interface d'une application puisse être ajustée en conséquence. Par exemple, sur un site belge, vous pouvez choisir de n'afficher que l'interface destinée aux utilisateurs francophones.

Commencer

L'API Language Detector est disponible à partir de la version stable de Chrome 138. Exécutez la détection de fonctionnalités pour voir si le navigateur est compatible avec l'API Language Detector.

if ('LanguageDetector' in self) {
  // The Language Detector API is available.
}

Consulter la configuration matérielle requise

Les exigences suivantes s'appliquent aux développeurs et aux utilisateurs qui utilisent des fonctionnalités à l'aide de ces API dans Chrome. Il est possible que les exigences de fonctionnement soient différentes dans les autres navigateurs.

Les API Language Detector et Translator fonctionnent dans Chrome sur ordinateur. Ces API ne fonctionnent pas sur les appareils mobiles. Les API Prompt, Summarizer, Writer et Rewriter fonctionnent dans Chrome lorsque les conditions suivantes sont remplies :

  • Système d'exploitation : Windows 10 ou 11, macOS 13 ou version ultérieure (Ventura et versions ultérieures) ou Linux. Chrome pour Android, iOS et ChromeOS ne sont pas encore compatibles avec les API qui utilisent Gemini Nano.
  • Stockage : au moins 22 Go sur le volume contenant votre profil Chrome.
  • GPU : plus de 4 Go de VRAM.
  • Réseau : données illimitées ou connexion non limitée.

La taille exacte de Gemini Nano peut varier légèrement. Pour connaître la taille actuelle, accédez à chrome://on-device-internals, puis à État du modèle. Ouvrez le chemin d'accès au fichier indiqué pour déterminer la taille du modèle.

Téléchargement du modèle

La détection de la langue dépend d'un modèle optimisé pour la tâche spécifique de détection des langues. Bien que l'API soit intégrée au navigateur, le modèle est téléchargé à la demande la première fois qu'un site tente d'utiliser l'API. Dans Chrome, ce modèle est très petit par rapport aux autres modèles. Il est peut-être déjà présent, car ce modèle est utilisé par d'autres fonctionnalités Chrome.

Pour savoir si le modèle est prêt à être utilisé, appelez la fonction asynchrone LanguageDetector.availability() et inspectez la promesse résultante. Trois réponses sont possibles :

  • "unavailable" : les options demandées ne sont pas compatibles ou le modèle ne peut pas être sollicité.
  • "downloadable" : la requête est acceptée, mais des téléchargements supplémentaires sont nécessaires avant de pouvoir créer une session. Ces téléchargements peuvent inclure le modèle de langage ou l'affinage.
  • "downloading" : la requête est acceptée et un téléchargement est en cours. Il doit être terminé avant de créer une session.
  • "available" : la requête est acceptée et vous pouvez créer une session.

Pour déclencher le téléchargement et instancier le détecteur de langue, appelez la fonction asynchrone LanguageDetector.create(). Si la réponse à availability() est 'downloadable' ou 'downloading', il est recommandé d'écouter la progression du téléchargement afin d'en informer l'utilisateur si le téléchargement prend du temps.

L'exemple suivant montre comment initialiser le détecteur de langue.

const availability = await LanguageDetector.availability();

let detector;
if (availability === 'unavailable') {
  // The language detector isn't usable.
  return;
}
if (availability === 'available') {
  // The language detector can immediately be used.
  detector = await LanguageDetector.create();
} else {
  // The language detector can be used after model download.
  detector = await LanguageDetector.create({
    monitor(m) {
      m.addEventListener('downloadprogress', (e) => {
        console.log(`Downloaded ${e.loaded * 100}%`);
      });
    },
  });
  await detector.ready;
}

Exécuter le détecteur de langue

L'API Language Detector utilise un modèle de classement pour déterminer la langue la plus susceptible d'être utilisée dans un texte donné. Le classement est un type de machine learning dont l'objectif est d'ordonner une liste d'éléments. Dans ce cas, l'API Language Detector classe les langues de la probabilité la plus élevée à la plus faible.

La fonction detect() peut renvoyer le premier résultat, la réponse la plus probable ou itérer sur les candidats classés avec le niveau de confiance. Elle est renvoyée sous la forme d'une liste d'objets {detectedLanguage, confidence}. Le niveau confidence est exprimé sous la forme d'une valeur comprise entre 0.0 (confiance la plus faible) et 1.0 (confiance la plus élevée).

const someUserText = 'Hallo und herzlich willkommen!';
const results = await detector.detect(someUserText);
for (const result of results) {
  // Show the full list of potential languages with their likelihood, ranked
  // from most likely to least likely. In practice, one would pick the top
  // language(s) that cross a high enough threshold.
  console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...

Bac à sable de l'API

Testez l'API Language Detector dans notre bac à sable d'API. Saisissez du texte écrit dans différentes langues dans la zone de texte.

Effort de standardisation

L'équipe Chrome a demandé l'avis du Technical Architecture Group du W3C et a sollicité Mozilla et WebKit pour connaître leur position sur les normes.

Envoyer des commentaires

Nous voulons découvrir ce que vous créez avec l'API Language Detector. Partagez vos sites Web et applications Web avec nous sur X, YouTube et LinkedIn.

Si vous avez des commentaires sur l'implémentation de Chrome, signalez un bug Chromium.