Microsoft avaa pääsyn kielimallien tietoturvatestaustyökaluun

Olla nimeltään PyRIT (Python Risk Identification Toolkit), testaajaa voidaan käyttää arvioimaan kielimallien tuloksia hallusinaatioiden, harhojen ja kielletyn sisällön tuottamiseen.

MAINONTA

AI-chatboteissa voi myös olla "hallusinaatioita"; ymmärtää

Tämän vuoden ystävänpäivänä toimittaja Kevin Roose oli häiritsevä vuorovaikutus Googlen tekoälyllä (AI) toimivaan hakukoneeseen integroidun chatbotin kanssa. Microsoft, Bing. Tietää enemmän!

Se voi myös tunnistaa mahdollisia tapoja käyttää mallia, kuten haittaohjelmien ja jailbreakingin luominen, sekä mahdolliset yksityisyyden haitat, kuten identiteettivarkaudet.

Työkalu automatisoi "punaisen tiimin" tehtävät lähettämällä haitallisia varoituksia. Kun se saa vastauksen, se pisteyttää mallin ja lähettää uuden kehotteen lisätestausta varten.

A Microsoft käytti PyRITiä testatakseen yhtä apujärjestelmistään Copilot AI, joka tuottaa tuhansia haitallisia kehotteita arvioidaksesi kykyäsi käsitellä ilkeitä syötteitä. PyRITin avulla testausprosessi saatiin päätökseen muutamassa tunnissa. Normaalisti testaus kestää viikkoja.

MAINONTA

Microsoft keihäs Copilot Pro uusilla AI-ominaisuuksilla; tietää enemmän

A Microsoft esittelee Copilot Pro, premium-tilaus, joka parantaa pelikokemusta Copilot edistyneillä ominaisuuksilla.

A Microsoft sanoi avanneensa PyRITin toivoen, että tietoturva-ammattilaiset ja koneoppimisinsinöörit voisivat löytää riskejä generatiivisista turvajärjestelmistä. inteligência keinotekoinen.

"Tämän avulla he voivat saada empiiristä tietoa siitä, kuinka heidän mallinsa toimii tänään ja havaita suorituskyvyn heikkeneminen tulevien parannusten perusteella", sanoo PyRIT GitHub -sivu.

Lue myös:

Humane tarjoaa ilmaisia kuukausia AI Pin -koodia viivästysten korvaamiseksi

Captura-de-Tela-2024-01-11-as-14.19.57-aspect-ratio-930-440

Humane ilmoitti, että sen AI Pin:n toimittaminen alkaisi maaliskuussa, mutta siinä oli pieni viive. Varhaisille käyttäjille kerrotaan nyt, että tilaukset saapuvat aikaisintaan huhtikuun puolivälissä Humanen työntekijän Sam Shefferin videopäivityksen mukaan.

Etsitkö tekoälytyökalua helpottaaksesi elämääsi? Tässä oppaassa, selaat tekoälyllä toimivien robottien luetteloa ja opit niiden toiminnoista. Katso arvio, jonka toimittajatiimimme antoi heille!

MAINONTA

Microsoft avaa pääsyn kielimallien tietoturvatestaustyökaluun

Kirjailijasta

Isabella Caminoto

Kirjailijasta

Isabella Caminoto

luetuimmat

Liittyvät