Microsoft membuka akses kepada alat ujian keselamatannya untuk model bahasa

A Microsoft sedang mengeluarkan kepada umum alat dalaman yang digunakannya untuk mengenal pasti kelemahan keselamatan dalam model kecerdasan buatan (AI) generatifnya.

Posted by

Isabella Caminoto

26 Februari 2024 09:00

dipanggil PyRIT (Python Risk Identification Toolkit), penguji boleh digunakan untuk menilai keputusan model bahasa untuk halusinasi, berat sebelah dan penjanaan kandungan yang dilarang.

Chatbot AI juga boleh mempunyai 'halusinasi'; faham

Pada Hari Valentine tahun ini, wartawan Kevin Roose mengalami interaksi yang mengganggu dengan chatbot yang disepadukan ke dalam enjin carian berkuasa kecerdasan buatan (AI) Google. Microsoft, Bing. Mengetahui lebih lanjut!

Ia juga boleh mengenal pasti cara yang mungkin untuk menggunakan model, seperti menjana perisian hasad dan pemecahan jail, serta potensi bahaya privasi seperti kecurian identiti.

Alat ini mengautomasikan tugas 'pasukan merah' dengan menghantar amaran berniat jahat. Apabila ia menerima respons, ia menjaringkan model dan menghantar gesaan baharu untuk menyediakan ujian lanjut.

A Microsoft menggunakan PyRIT untuk menguji salah satu sistem pembantunya Copilot AI, menjana beribu-ribu gesaan berniat jahat untuk menilai keupayaan anda menangani input jahat. Menggunakan PyRIT, proses ujian selesai dalam masa beberapa jam. Biasanya, ujian mengambilariam minggu.

Microsoft lembing Copilot Pro dengan ciri AI baharu; mengetahui lebih lanjut

A Microsoft mempersembahkan Copilot Pro, langganan premium yang meningkatkan pengalaman permainan Copilot dengan ciri-ciri canggih.

A Microsoft berkata beliau membuka PyRIT dengan harapan dapat memperkasakan profesional keselamatan dan jurutera pembelajaran mesin untuk mencari risiko dalam sistem keselamatan generatif. inteligência buatan.

"Ini membolehkan mereka mempunyai data empirikal tentang prestasi model mereka hari ini dan mengesan sebarang kemerosotan prestasi berdasarkan penambahbaikan pada masa hadapan," kata Halaman PyRIT GitHub.

Baca juga:

Humane menawarkan bulan AI Pin percuma untuk mengimbangi kelewatan

Humane mengumumkan bahawa AI Pin akan bermulaaria untuk dikomersialkan pada bulan Mac, tetapi terdapat sedikit kelewatan. Pengguna awal kini diberitahu bahawa pesanan akan tiba paling awal pada pertengahan April, menurut kemas kini video daripada pekerja Humane Sam Sheffer.

Catatan ini kali terakhir diubah suai pada 23 Februari 2024 17:12 petang

Isabella Caminoto

Peguam dan pelajar sarjana dalam Undang-undang Antarabangsa, saya mempunyai demokrasi dan kebebasan sebagai bendera yang tidak dapat dinafikan. Saya meminati haiwan dan percaya bahawa kesejahteraan planet kita harus menjadi sorotan harian agenda masyarakat kita.

Seterusnya Tinder dan ChatGPT: Era baharu untuk temu janji dalam talian yang dikuasakan oleh AI »

sebelum « MTN melancarkan chatbot berkuasa AI pertama di Afrika

Saham

Posted by

Isabella Caminoto

Tags: CopilotMicrosoftkeselamatan

26 Februari 2024 09:00

Catatan terkini

Inteligência Buatan

Kecerdasan buatan boleh mempercepatkan kehilangan pekerjaan dan pelepasan karbon, dedah laporan

Laporan antarabangsa oleh pakar dalam kecerdasan buatan (AI) memberi amaran tentang kemungkinan peningkatan dalam curto...

19 Mei 2024

Inteligência Buatan

Kesatuan Eropah mengancam untuk didenda Microsoft atas sebab kecerdasan buatan

Suruhanjaya Eropah menetapkan tarikh akhir pada 27 Mei untuk Microsoft menyampaikan maklumat tentang…

19 Mei 2024

Inteligência Buatan

ChatGPT memperoleh integrasi dengan Google Drive dan OneDrive untuk analisis data

Berita baik untuk pengguna yang membayar ChatGPT: A OpenAI mengumumkan bahawa tidak lama lagi anda…

19 Mei 2024

Inteligência Buatan

Keselamatan AI berisiko? penyelidik di OpenAI meletak jawatan dan mengkritik keutamaan "produk cantik"

Seorang bekas pekerja kanan di OpenAI, syarikat yang mencipta ChatGPT, menuduh syarikat itu mengutamakan "produk…

18 Mei 2024

Inteligência Buatan

Microsoft menawarkan pemproses AMD sebagai alternatif untuk AI dalam awan

A Microsoft mengumumkan bahawa ia akan menawarkan pelanggan pengkomputeran awannya satu platform…

18 Mei 2024

Inteligência Buatan

Sony Music mengetatkan tindakan keras terhadap penyalahgunaan lagu dalam kecerdasan buatan

Sony Music, label rekod kedua terbesar di dunia, menghantar surat amaran kepada lebih...

18 Mei 2024

Microsoft membuka akses kepada alat ujian keselamatannya untuk model bahasa

jawatan berkaitan

Catatan terkini

Kecerdasan buatan boleh mempercepatkan kehilangan pekerjaan dan pelepasan karbon, dedah laporan

Kesatuan Eropah mengancam untuk didenda Microsoft atas sebab kecerdasan buatan

ChatGPT memperoleh integrasi dengan Google Drive dan OneDrive untuk analisis data

Keselamatan AI berisiko? penyelidik di OpenAI meletak jawatan dan mengkritik keutamaan "produk cantik"

Microsoft menawarkan pemproses AMD sebagai alternatif untuk AI dalam awan

Sony Music mengetatkan tindakan keras terhadap penyalahgunaan lagu dalam kecerdasan buatan