| MLCommons | LLM | 安全風險 | 基準測試

MLCommons推出第一個LLM安全基準,促進AI風險評估標準化

MLCommons針對大型語言模型的安全性推出AILuminate基準測試,涵蓋12類潛在危險並進行獨立科學評估,Claude 3.5 Haiku、Claude 3.5 Sonnet、Gemma2 9B、Phi 3.5 MoE Instruct皆達非常好(Very Good)的等級

2024-12-08

| 大型語言模型 | LLM | 微調 | 安全風險 | AI安全 | 模型安全 | GPT-3.5 Turbo | Llama-2

研究顯示微調LLM會削弱模型安全性

IBM研究院與普林斯頓大學、維吉尼亞科技大學聯合發表的論文指出,有三種方法可以透過微調LLM破壞開發者為模型加入的安全防護,例如數十萬組資料集中一旦含有不到100則的有害資料,就足以影響Meta Llama-2及OpenAI GPT-3.5 Turbo的安全性

2023-10-16

| 特斯拉 | 主動巡航 | Active Cruise Control | 安全風險 | 韌體更新

特斯拉在中國召回28萬輛會誤觸主動巡航功能的電動車

特斯拉將針對中國當地售出的Model 3與Model Y車款進行韌體更新,以解決車主容易誤觸主動巡航功能開關引發的安全風險

2021-06-28

| macOS Big Sur | 網路功能擴充框架 | Network Extension Framework | 安全風險 | 資安 | 方便門

蘋果移除使自家App繞過MacOS第三方安全工具的方便門

去年研究人員發現MacOS Big Sur允許App Store、FaceTime、Apple Music、Apple Maps等50多款自家應用程式,可繞過第三方防火牆、VPN等安全工具的檢查,現在蘋果發布Big Sur新版,移除這項有資安疑慮的方便門設計

2021-01-15