SON GELİŞME
--:--:--

Icaro Labs’un Yayımladığı Şiirsel Komutlarla Yapay Zekâları Manipüle Etme Çalışması

0 Yorum Yapıldı
Bağlantı kopyalandı!
Icaro Labs’un Yayımladığı Şiirsel Komutlarla Yapay Zekâları Manipüle Etme Çalışması

Icaro Labs tarafından yayımlanan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan çalışma, araştırmacıların klasik konuşma dili yerine şiir biçiminde yazılmış talimatlar vererek güvenlik filtrelerini devre dışı bırakmayı başarabildiğini gösterdi. Araştırma, bu yöntemin sohbet botlarından yasaklı içerikler ve tehlikeli bilgiler elde edilmesini mümkün kılabildiğini ortaya koyuyor.

Yasaklı İçeriklere Erişim Sağlandı

Araştırmacılar, Wired’ın aktardığına göre, kullandıkları şiirsel komutların detaylarını kamuoyuyla paylaşmadı. Ekibe göre bu komutların açıklanması son derece tehlikeli sonuçlara yol açabilir. Laboratuvar, şiirsel komutların kullanılmasıyla sohbet botlarından nükleer bomba yapımı için adımlar ve malzemeler, çocuk istismarı içerikleri ve kendine zarar verme yöntemleri gibi kesinlikle yasak bilgiler elde edilebildiğini bildirdi.

Popüler Yapay Zeka Sistemleri Üzerinde Test

Araştırma ekibi, yöntemi OpenAI’nin ChatGPT’si, Google’ın Gemini’si, Anthropic’in Claude’u ve diğer büyük modeller üzerinde denedi. Sonuçlara göre: Google Gemini, DeepSeek ve MistralAI gibi modeller, şiirsel komutlar karşısında en kolay manipüle edilebilen sistemler arasında yer aldı. OpenAI’nin ChatGPT modeli (GPT-5) ve Anthropic’in Claude Haiku 4.5 modeli, güvenlik bariyerlerini en iyi koruyan sistemler olarak öne çıktı.

Yapay Zeka Güvenliği Yeniden Gündemde

Uzmanlar, bulguların yapay zekânın denetlenmesi ve güvenlik sistemlerinin geliştirilmesi konusunda acil ihtiyaç olduğunu gösterdiğini belirtiyor. Şirketler, modellerinin tehlikeli içerik üretmesini engellemek için giderek daha gelişmiş güvenlik filtrelerine yatırım yapıyor.

Benzer Haberler
İran’daki Gösteriler: 27 Bin Kişi Gözaltına Alındı
İran’daki Gösteriler: 27 Bin Kişi Gözaltına Alındı
Muvahhidi: İran Yönetiminin 800 Kişinin İdam Ceza Kararını İptal Ettiği İddiaları Asılsız
Muvahhidi: İran Yönetiminin 800 Kişinin İdam Ceza Kararını İptal Ettiği İddiaları Asılsız
Yeni Zelanda’da Doğal Afet: Maunganui Dağı’nda Toprak Kayması
Yeni Zelanda’da Doğal Afet: Maunganui Dağı’nda Toprak Kayması
Su Krizi: Küresel Durum ve Gelecek Stratejileri
Su Krizi: Küresel Durum ve Gelecek Stratejileri
Trump’un Son Açıklamaları
Trump’un Son Açıklamaları
İsrail Hapishanelerindeki Filistinlilerin Durumu
İsrail Hapishanelerindeki Filistinlilerin Durumu
Haberler 07 Antalya 'nın Doğru Adresi
Copyright © 2025 Tüm hakları HABERLER 07 'de saklıdır. Seobaz Haber Teması