Microsoft membuka akses kepada alat ujian keselamatannya untuk model bahasa

dipanggil PyRIT (Python Risk Identification Toolkit), penguji boleh digunakan untuk menilai keputusan model bahasa untuk halusinasi, berat sebelah dan penjanaan kandungan yang dilarang.

PUBLISITI

Chatbot AI juga boleh mempunyai 'halusinasi'; faham

Reka bentuk-tanpa nama-13-2-nisbah-aspek-930-440

Pada Hari Valentine tahun ini, wartawan Kevin Roose mengalami interaksi yang mengganggu dengan chatbot yang disepadukan ke dalam enjin carian berkuasa kecerdasan buatan (AI) Google. Microsoft, Bing. Mengetahui lebih lanjut!

Ia juga boleh mengenal pasti cara yang mungkin untuk menggunakan model, seperti menjana perisian hasad dan pemecahan jail, serta potensi bahaya privasi seperti kecurian identiti.

Alat ini mengautomasikan tugas 'pasukan merah' dengan menghantar amaran berniat jahat. Apabila ia menerima respons, ia menjaringkan model dan menghantar gesaan baharu untuk menyediakan ujian lanjut.

A Microsoft menggunakan PyRIT untuk menguji salah satu sistem pembantunya Copilot AI, menjana beribu-ribu gesaan berniat jahat untuk menilai keupayaan anda menangani input jahat. Menggunakan PyRIT, proses ujian selesai dalam masa beberapa jam. Biasanya, ujian akan mengambil masa berminggu-minggu.

PUBLISITI

Microsoft lembing Copilot Pro dengan ciri AI baharu; mengetahui lebih lanjut

A Microsoft mempersembahkan Copilot Pro, langganan premium yang meningkatkan pengalaman permainan Copilot dengan ciri-ciri canggih.

A Microsoft berkata beliau membuka PyRIT dengan harapan dapat memperkasakan profesional keselamatan dan jurutera pembelajaran mesin untuk mencari risiko dalam sistem keselamatan generatif. inteligência buatan.

"Ini membolehkan mereka mempunyai data empirikal tentang prestasi model mereka hari ini dan mengesan sebarang kemerosotan prestasi berdasarkan penambahbaikan pada masa hadapan," kata Halaman PyRIT GitHub.

Baca juga:

Humane menawarkan bulan AI Pin percuma untuk mengimbangi kelewatan

Captura-de-Tela-2024-01-11-as-14.19.57-aspect-ratio-930-440

Humane mengumumkan bahawa AI Pinnya akan mula dihantar pada bulan Mac, tetapi terdapat sedikit kelewatan. Pengguna awal kini diberitahu bahawa pesanan akan tiba paling awal pada pertengahan April, menurut kemas kini video daripada pekerja Humane Sam Sheffer.

Mencari alat Kepintaran Buatan untuk menjadikan hidup anda lebih mudah? Dalam panduan ini, anda menyemak imbas katalog robot berkuasa AI dan belajar tentang fungsinya. Lihat penilaian yang diberikan oleh pasukan wartawan kami!

PUBLISITI

Microsoft membuka akses kepada alat ujian keselamatannya untuk model bahasa

Mengenai Pengarang

Isabella Caminoto

Mengenai Pengarang

Isabella Caminoto

Kebanyakan membaca

Berkaitan