ID de synthétiseur : Google publie un outil pour identifier les textes générés par l'IA
Crédits images : Google Deepmind

ID de synthétiseur : Google publie un outil pour identifier les textes générés par l'IA

Technologie de filigrane de texte ID de synthétiseur do Google, un outil créé par l'entreprise pour créer du texte généré par intelligence artificielle (IA) plus facile à identifier, est désormais disponible en open source via le Google Boîte à outils d'IA générative responsable, a annoncé la société le X.

PUBLICITÉ

« Désormais, d'autres développeurs d'IA [générative] pourront utiliser cette technologie pour les aider à détecter si les sorties de texte proviennent de leurs propres [grands modèles de langage], ce qui permettra à davantage de développeurs de créer plus facilement une IA de manière responsable », a-t-il déclaré. Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à MIT Technology Review.

Les filigranes sont devenus des outils de plus en plus importants, car de grands modèles linguistiques sont utilisés pour diffuser des informations erronées politiques, générer du contenu sexuel non consensuel et à d'autres fins malveillantes. La Californie envisage déjà de rendre obligatoire le filigrane de l'IA, tandis que le gouvernement chinois a commencé à l'exiger l'année dernière. Pourtant, les outils sont toujours en chantier.

SynthID, annoncé en août dernier, permet de rendre visible la sortie générée par l'IA en ajoutant un filigrane invisible aux images, à l'audio, à la vidéo et au texte au fur et à mesure de leur génération.. Google dit que la version texte de SynthID fonctionne en rendant la sortie de texte légèrement moins probable d'une manière détectable par le logiciel mais pas par les humains :

PUBLICITÉ

« Un LLM génère du texte un jeton à la fois. Ces jetons peuvent représenter un seul caractère, un mot ou une partie d'une phrase. Pour créer une chaîne de texte cohérente, le modèle prédit le prochain jeton le plus susceptible d'être généré. Ces prédictions sont basées sur les mots précédents et les scores de probabilité attribués à chaque jeton potentiel.

« Par exemple, avec la phrase « Mes fruits tropicaux préférés sont __ ». Le LLM peut commencer à compléter la phrase avec les jetons « mangue », « litchi », « papaye » ou « durian », et chaque jeton reçoit un score de probabilité. Lorsqu'il existe une variété de jetons différents parmi lesquels choisir, SynthID peut ajuster le score de probabilité de chaque jeton prédit, dans les cas où il ne peut pas le faire.promeaura la qualité, la précision et la créativité du résultat ».

« Ce processus est répété dans tout le texte généré, de sorte qu'une seule phrase peut contenir dix scores de probabilité ajustés ou plus, et une page peut en contenir des centaines. Le modèle final de scores pour les choix de mots du modèle, combiné aux scores de probabilité ajustés, est considéré comme le point culminant.

PUBLICITÉ

O Google précise que le système, déjà intégré à son chatbot Gemini, pas avecpromete la qualité, la précision, la créativité ou la rapidité du texte généré, ce qui pose depuis longtemps un problème avec les systèmes de filigrane. LE Google dit qu'il peut fonctionner sur des textes comme curtos sous forme de trois phrases, ainsi que dans des textes coupés, paraphrasés ou modifiés. Mais il a du mal avec les textes curtos, du contenu réécrit ou traduit, et même des réponses à des questions factuelles.

"SynthID n'est pas une solution miracle pour identifier le contenu généré par l'IA", a écrit le Google dans un article de blog en mai. "[Mais c'est] un élément important pour développer des outils d'identification d'IA plus fiables et peut aider des millions de personnes à prendre des décisions éclairées sur la manière d'interagir avec le contenu généré par l'IA."

Lire aussi:

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

Faire défiler vers le haut