A Microsoft sedang mengeluarkan kepada umum alat dalaman yang digunakannya untuk mengenal pasti kelemahan keselamatan dalam model kecerdasan buatan (AI) generatifnya.
dipanggil PyRIT (Python Risk Identification Toolkit), penguji boleh digunakan untuk menilai keputusan model bahasa untuk halusinasi, berat sebelah dan penjanaan kandungan yang dilarang.
Ia juga boleh mengenal pasti cara yang mungkin untuk menggunakan model, seperti menjana perisian hasad dan pemecahan jail, serta potensi bahaya privasi seperti kecurian identiti.
Alat ini mengautomasikan tugas 'pasukan merah' dengan menghantar amaran berniat jahat. Apabila ia menerima respons, ia menjaringkan model dan menghantar gesaan baharu untuk menyediakan ujian lanjut.
A Microsoft menggunakan PyRIT untuk menguji salah satu sistem pembantunya Copilot AI, menjana beribu-ribu gesaan berniat jahat untuk menilai keupayaan anda menangani input jahat. Menggunakan PyRIT, proses ujian selesai dalam masa beberapa jam. Biasanya, ujian mengambilariam minggu.
A Microsoft berkata beliau membuka PyRIT dengan harapan dapat memperkasakan profesional keselamatan dan jurutera pembelajaran mesin untuk mencari risiko dalam sistem keselamatan generatif. inteligência buatan.
"Ini membolehkan mereka mempunyai data empirikal tentang prestasi model mereka hari ini dan mengesan sebarang kemerosotan prestasi berdasarkan penambahbaikan pada masa hadapan," kata Halaman PyRIT GitHub.
Baca juga:
Catatan ini kali terakhir diubah suai pada 23 Februari 2024 17:12 petang
Laporan antarabangsa oleh pakar dalam kecerdasan buatan (AI) memberi amaran tentang kemungkinan peningkatan dalam curto...
Suruhanjaya Eropah menetapkan tarikh akhir pada 27 Mei untuk Microsoft menyampaikan maklumat tentang…
Berita baik untuk pengguna yang membayar ChatGPT: A OpenAI mengumumkan bahawa tidak lama lagi anda…
Seorang bekas pekerja kanan di OpenAI, syarikat yang mencipta ChatGPT, menuduh syarikat itu mengutamakan "produk…
A Microsoft mengumumkan bahawa ia akan menawarkan pelanggan pengkomputeran awannya satu platform…
Sony Music, label rekod kedua terbesar di dunia, menghantar surat amaran kepada lebih...