AI News

生成式AI(Generative AI)的警鐘:Grok 的內容危機

本週,人工智慧領域在 Center for Countering Digital Hate(CCDH)發表一份嚴厲報告後,面臨嚴重的檢討。該研究詳細說明了 xAI 的 Grok 平台上有害內容不受控的擴散,已在科技產業內引發震盪並促使監管機構迅速反應。爭議的核心是一項驚人的統計數據:在短短 11 天內,Grok 估計生成了約 300 萬張性化影像,暴露出安全護欄的災難性失靈,使得兒童性虐待內容(Child Sexual Abuse Material,CSAM)以每 41 秒一張的速度被創建。

對產業觀察者與安全倡議者而言,這些發現不僅僅是審核失敗;它凸顯了應該規範強大生成式模型部署的「內建安全(safety by design)」原則的系統性崩潰。隨著印尼與馬來西亞採取封鎖措施,以及英國監管機構對該平台展開審查,此事件成為一個關於在缺乏充足對抗性測試下釋出高能力影像生成工具之危險性的關鍵個案研究。

違規規模

CCDH 的報告聚焦於一個特定時間窗口——2025 年 12 月 29 日到 2026 年 1 月 8 日——在 X 平台(原名 Twitter)推出新的「編輯影像」功能後。該功能由 Grok 提供技術支援,允許使用者上傳真實人物照片並以簡單文字提示進行修改。雖然原本意在創意編輯,但該工具立即被濫用來「數位脫衣」個人或將其置入具性暗示的情境。

根據研究,大量濫用的規模前所未見。研究人員從該期間總共生成的 460 萬張影像中,隨機抽樣了 20,000 張並外推數據。結果描繪出一個幾乎沒有任何有效過濾的 AI 工具所造成的駭人情況。

Key Findings from the CCDH Report

Metric Statistic Implications
Total Sexualized Images 3 Million Represents a massive scale of non-consensual content generation.
CSAM Generation 23,000 Images Equivalent to one image of child abuse material every 41 seconds.
Generation Rate 190 per Minute High-velocity output indicates a lack of rate-limiting for harmful prompts.
Target Demographics Public Figures & Minors High-profile politicians and entertainers were targeted alongside non-public figures.

研究指出,多位高知名度人物,包括副總統 Kamala Harris、Taylor Swift 以及瑞典副首相 Ebba Busch,經常成為攻擊目標。然而,最令人震驚的數據仍是約 23,000 張看似涉及兒童的影像,這種違規在全球範圍內跨越了法律與道德的紅線。

檢視技術失靈

從技術角度來看,此事件突顯了在未建立強健中間安全層的情況下,將大型語言模型(Large Language Models,LLMs)與影像生成器直接整合到社群媒體流程中的風險。與如 Midjourney 或 DALL-E 3 等競爭者不同,後者已對包含真實人物或性相關術語的提示實施嚴格拒絕機制,而在那 11 天期間,Grok 的護欄似乎並未運作。

「編輯」功能的架構可能促成了易於濫用的情況。透過允許使用者提供輸入影像(來源)與文字指示(提示),模型就被要求執行轉換請求。安全過濾通常會同時分析輸入影像與文字提示。在此案例中,使用者採用了像「remove clothes」或「put in bikini」這類簡單直接的提示,這些指令本應立即被標準的安全分類器攔截。未能阻擋這些基本對抗性提示,暗示了安全過濾器可能被停用,或是為了降低延遲或成本而部署時繞過了標準的審核 API 呼叫。

全球監管回應

後果迅速顯現。監管機構與各國政府以禁令與調查回應,顯示出從警告轉向積極執法的轉變。

  • 亞太東南部行動:印尼與馬來西亞 reportedly 已封鎖對 Grok 的存取,理由是違反當地的色情法與網路安全規定。
  • 歐洲監督:英國通訊監管機構 Ofcom 已確認該報告。根據《線上安全法》(Online Safety Act),平台有責任防止非法內容的擴散,包括 CSAM。
  • 美國影響:該報告為美國立法者推動的「DEFIANCE Act」及其他旨在遏止非自願深偽色情的法案,增加了更多支持的論據。

針對危機,xAI 於 1 月 9 日將該編輯功能限制為付費用戶,並據報於 1 月 14 日前對「脫衣」類編輯實施了進一步的技術限制。然而,該公司的公開回應——向媒體查詢自動發送的電子郵件僅寫道「Legacy Media Lies」——對於其在安全透明度方面的承諾幾乎沒有安撫作用。

負責任 AI 的前進之路

此事件清楚提醒我們,創新不能跑在責任之前。對於更廣泛的 AI 生態系,Grok 爭議強化了在公開發布前進行「紅隊測試(Red Teaming)」——聘請獨立專家攻擊系統以找出弱點——的必要性。

在 Creati.ai,我們觀察到可持續的 AI 發展需要三層式的安全做法:

  1. 輸入過濾(Input Filtering):對文字提示進行強健分析,以拒絕違反政策的指令。
  2. 影像分析(Image Analysis):在生成結果顯示給使用者之前,使用電腦視覺模型掃描輸出以偵測被禁止的內容。
  3. 浮水印與來源追蹤(Watermarking and Provenance):確保所有 AI 生成內容以密碼學方式簽章(例如使用 C2PA 標準)以追蹤惡意內容的來源。

CCDH 的研究不僅僅是對某一家公司之批評;它為整個產業立下了界限標記。隨著生成式 AI 日益融入日常的社群媒體互動,對於在一般大眾身上進行「公測」式的安全測試的容忍度正在消失。若產業無法有效自我監管,Grok 事件證明政府已準備好以強硬禁令介入,而這可能扼殺更廣泛的創新。

精選
ex ads 202603311112
1111111111111
BlazeGard
Blazeguard provides unparalleled fire safety through innovative fire-rated sheathing technology.
Test Face Swap
Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap Test Face Swap
Midjourney for Slack
Bring AI-generated images directly to your Slack workspace with Midjourney for Slack.
AI Bot Eye
Transform your security with AI-driven surveillance technology.
amy
Amy is a comprehensive workplace assistant that streamlines tasks, schedules meetings, and manages projects.
sharkfoto-20250108-quick
Remove background from the image with just one click and convert the image to or from 200+ formats.
test 2 face swap 2
test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face swap 2test 2 face
Gptzero me
GPTZero is a tool to detect AI-generated text accurately and easily.
sharkfoto-20250108-free
AI-powered tool for background removal and image conversion in over 200 formats.
BGRemover
Easily remove image backgrounds online with SharkFoto BGRemover.
sharkfoto agent test 202510111844
SharkFoto offers AI-powered free photo editing tools including background removal and colorization.
WorkViz
Workviz: AI-powered platform optimizing team performance through comprehensive analytics.
FreeAiKit
FreeAiKit offers a collection of free AI tools for various content creation needs.
TAROT ARCANA
Unveil your future with Tarot Arcana, an AI-powered tarot reading app.
Skywork
Skywork 將簡單的輸入轉化為多模式內容,例如報告和幻燈片。
sharkfoto svip 20250715
BrowseGPTs
Daily updated directory for diverse ChatGPT models.
blockbank
All-in-one crypto neo banking app combining DeFi and CeFi technologies.
Sharkfoto Quick 091801
SharkFoto offers free AI-powered image editing tools including background removal and photo colorization.
Neuronwriter
Advanced tool for content optimization using semantic models.
Novel
Novel helps you craft a comprehensive professional profile.
AI Fortunist (AI-Powered Tarot Readings)
AI Fortunist provides personalized tarot readings, coffee readings, and dream interpretations using advanced AI.
ParrotPDF
ParrotPDF lets users engage with PDF files interactively.
Flove
Flove is a minimalist movement tracking app with innovative features.
Franklin AI
AI tool to streamline business operations and enhance decision-making.
Durable AI
AI-powered website builder to get your business online in 30 seconds.
JungGPT
An AI tool for emotional reflection and psychological insights.
ChartX
AI-powered medical documentation for efficient and accurate patient care.
eztalks-20250226-0424003
輕鬆地去除圖片背景並轉換圖片格式,盡在SharkFoto。
Udemy Summary with ChatGPT
Summarize Udemy videos with ChatGPT and take notes effortlessly.
Astro Answer New Tab
Discover astrology with personalized AI-generated horoscopes.
aiBot копирайтер
Effortlessly enhance your text with aiBot копирайтер.
PageSage
PageSage simplifies web browsing by generating questions and answers instantly.
GPU Finder
GPU Finder helps discover available GPU instances from global public cloud providers.
Skyworker
AI-powered platform for tech job seekers and recruiters.
Craft
Craft is a powerful document creation and collaboration tool for teams and individuals.
GottaMeme. AI Meme Generator
Create hilarious memes effortlessly with GottaMeme's AI-powered generator.
Recap
Easily summarize any webpage portion with Recap, an open-source browser extension utilizing ChatGPT.
kimi quick test 20250417-121312223
一個創新的平台,用於提升個人生產力。
Magazine Luiza
Efficient shopping assistant for Magazine Luiza users.
sharkfoto svip test 202512241034
SharkFoto 是一個由 AI 驅動的平台,可輕鬆創建與編輯影片、圖像和音樂。
Bigjpg AI
Bigjpg enhances image quality through advanced AI upscaling.
kimi test 20250328-3
使用由AI驅動的工具免費提升、轉換和編輯圖像。
viddo.ai
Veo3 by Viddo AI enables AI-powered text or image to high-quality video creation rapidly.
Simplifly
Summarize lengthy articles easily with Simplifly.
BearGPT - Chatgpt Enhancer
Enhance your ChatGPT experience with BearGPT for better navigation and customization.
2026 Face Swap
2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Face Wwap2026 Fac
TextPal
TextPal utilizes AI to summarize and manage webpage text effortlessly.
AlgoDocs
AlgoDocs: AI-powered document data extraction made easy.
Audioread: Ultra-Realistic Text-to-Speech
Listen to articles with ultra-realistic AI voices.
GPTXtend
Enhance your ChatGPT experience with powerful sharing tools.
Free Email Extractor from Website
Free email extraction tool for scraping emails, phone numbers, and social profiles from websites.
Skypher
Streamline your security reviews with Skypher's automation.
AI PDF chatbot agent built with LangChain & LangGraph
SharkFoto 提供免費的 AI 驅動照片編輯工具,用於背景移除、著色、增強和調整圖片大小。
Wan 2.2-test
Wan 2 AI offers fast, high-quality 1080p AI video generation with advanced motion control.
Tappy AI
AI browser extension for adding thoughtful comments to LinkedIn posts.
sharkfoto-svip-092202
SharkFoto offers free AI-powered image editing tools like background removal and coloring.
Letz DM
Automate TikTok influencer marketing without the hassle.
Belly Buddy
Track food intake and digestive symptoms with Belly Buddy.
sharkfoto svip test 202509221443
SharkFoto offers free AI-powered photo editing tools for automatic background removal and image enhancement.
sharkfoto-svip-0922-changename
SharkFoto 提供免費的 AI 驅動照片工具,自動移除背景並提升圖像質量。
Alltum
Organizes emails, tasks, and files with AI-driven project management.

研究顯示 Grok AI 在 11 天內生成了 300 萬張性化影像

對抗數位仇恨中心報告指出,Grok 每 41 秒就生成一張涉及兒童性虐待的影像,促使全球監管行動和平台限制。