Inteligência Buatan

Microsoft membuka akses kepada alat ujian keselamatannya untuk model bahasa

A Microsoft sedang mengeluarkan kepada umum alat dalaman yang digunakannya untuk mengenal pasti kelemahan keselamatan dalam model kecerdasan buatan (AI) generatifnya.

Posted by
Isabella Caminoto

dipanggil PyRIT (Python Risk Identification Toolkit), penguji boleh digunakan untuk menilai keputusan model bahasa untuk halusinasi, berat sebelah dan penjanaan kandungan yang dilarang.

Ia juga boleh mengenal pasti cara yang mungkin untuk menggunakan model, seperti menjana perisian hasad dan pemecahan jail, serta potensi bahaya privasi seperti kecurian identiti.

Alat ini mengautomasikan tugas 'pasukan merah' dengan menghantar amaran berniat jahat. Apabila ia menerima respons, ia menjaringkan model dan menghantar gesaan baharu untuk menyediakan ujian lanjut.

A Microsoft menggunakan PyRIT untuk menguji salah satu sistem pembantunya Copilot AI, menjana beribu-ribu gesaan berniat jahat untuk menilai keupayaan anda menangani input jahat. Menggunakan PyRIT, proses ujian selesai dalam masa beberapa jam. Biasanya, ujian mengambilariam minggu.

A Microsoft berkata beliau membuka PyRIT dengan harapan dapat memperkasakan profesional keselamatan dan jurutera pembelajaran mesin untuk mencari risiko dalam sistem keselamatan generatif. inteligência buatan.

"Ini membolehkan mereka mempunyai data empirikal tentang prestasi model mereka hari ini dan mengesan sebarang kemerosotan prestasi berdasarkan penambahbaikan pada masa hadapan," kata Halaman PyRIT GitHub.

Baca juga:

Catatan ini kali terakhir diubah suai pada 23 Februari 2024 17:12 petang

Isabella Caminoto

Peguam dan pelajar sarjana dalam Undang-undang Antarabangsa, saya mempunyai demokrasi dan kebebasan sebagai bendera yang tidak dapat dinafikan. Saya meminati haiwan dan percaya bahawa kesejahteraan planet kita harus menjadi sorotan harian agenda masyarakat kita.

Catatan terkini

Kecerdasan buatan boleh mempercepatkan kehilangan pekerjaan dan pelepasan karbon, dedah laporan

Laporan antarabangsa oleh pakar dalam kecerdasan buatan (AI) memberi amaran tentang kemungkinan peningkatan dalam curto...

19 Mei 2024

Kesatuan Eropah mengancam untuk didenda Microsoft atas sebab kecerdasan buatan

Suruhanjaya Eropah menetapkan tarikh akhir pada 27 Mei untuk Microsoft menyampaikan maklumat tentang…

19 Mei 2024

ChatGPT memperoleh integrasi dengan Google Drive dan OneDrive untuk analisis data

Berita baik untuk pengguna yang membayar ChatGPT: A OpenAI mengumumkan bahawa tidak lama lagi anda…

19 Mei 2024

Keselamatan AI berisiko? penyelidik di OpenAI meletak jawatan dan mengkritik keutamaan "produk cantik"

Seorang bekas pekerja kanan di OpenAI, syarikat yang mencipta ChatGPT, menuduh syarikat itu mengutamakan "produk…

18 Mei 2024

Microsoft menawarkan pemproses AMD sebagai alternatif untuk AI dalam awan

A Microsoft mengumumkan bahawa ia akan menawarkan pelanggan pengkomputeran awannya satu platform…

18 Mei 2024

Sony Music mengetatkan tindakan keras terhadap penyalahgunaan lagu dalam kecerdasan buatan

Sony Music, label rekod kedua terbesar di dunia, menghantar surat amaran kepada lebih...

18 Mei 2024