“大規模言語モデル（LLM）がアスキーアートを正しく認識できないという脆弱性を利用して、LLMに有害なコンテンツを出力させる新しいジェイルブレーク（脱獄）攻撃を提案した研究報告”

misshiki のブックマーク 2024/03/07 15:23

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4750287128559139040/comment/misshiki" data-user-id="misshiki" data-entry-url="https://b.hatena.ne.jp/entry/s/www.itmedia.co.jp/news/articles/2403/07/news064.html" data-original-href="https://www.itmedia.co.jp/news/articles/2403/07/news064.html" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fwww.itmedia.co.jp%2Fnews%2Farticles%2F2403%2F07%2Fnews064.html" data-user-icon="/users/misshiki/profile.png">生成AIに“アスキーアート”入りプロンプト入力→有害コンテンツ出力　米研究者らが新手の脱獄法発見</a><ul class="comment-tag" style="list-style: none; margin: 0px;"><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E5%87%A6%E7%90%86">自然言語処理</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3">セキュリティ</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD">人工知能</a>]</li></ul><br><p style="clear: left">“大規模言語モデル（LLM）がアスキーアートを正しく認識できないという脆弱性を利用して、LLMに有害なコンテンツを出力させる新しいジェイルブレーク（脱獄）攻撃を提案した研究報告”</p><a class="datetime" href="https://b.hatena.ne.jp/misshiki/20240307#bookmark-4750287128559139040"><span class="datetime-body">2024/03/07 15:23</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！