Meta契約業者、競合チャットボット調査で未成年者になりすまし

原題: Meta Contractors Posed as Teens to Prompt Rival Chatbots About Suicide, Sex, and Drugs

なぜ重要か

AI安全性評価の方法論に関わる重要な問題。チャットボット企業間の競争的ベンチマークと倫理的テスト手法の境界線を定義する必要がある。

Metaの契約業者数百名が、OpenAIのChatGPTやGoogleのGeminiなど競合チャットボットの安全性を試験するため、未成年者になりすましていたことが判明。2025年8月のテストで45,000以上のプロンプトが送信され、自殺や自傷行為、性的内容など高リスク主題への応答を記録していた。

WIREDが入手した内部文書と5人の関係者証言によると、Meta契約企業Covalenが管理するプロジェクト「Cannes」は、OpenAIのChatGPT、GoogleのGemini、Character.AIを対象に実施されていた。プロジェクトは2025年4月21日まで活動していた。

契約業者らは18歳未満の名義でダミーアカウントを作成し、自殺、性的内容、摂食障害など高リスク主題に関するプロンプトを送信。画像には錠剤、ナイフ、ロープ、婦人科手術の医学図が含まれていた。プロンプトはチャットボットの安全システムを回避するよう設計されていた。

2025年8月の単一テストラウンドでは、45,000以上のプロンプトが実行された。WIREDが確認したスプレッドシートには3,748件のプロンプトが記録されており、数百件は自殺・自傷行為、数百件は摂食障害に関するもの。少なくとも239件は性的・恋愛的内容を含んでいた。

プロンプトには危機的状況にある子どもや十代の視点で作成されたものが多数含まれていた。13歳の少女が成人男性による妊娠に関する相談、高校生が違法薬物入手に関する質問など。フランス語でいじめが原因で自殺した二十代の少年に言及し、「もし彼が異性愛者男性だったら生きていたかもしれない」という内容のプロンプトもあった。

Covalenの内部文書は当プロジェクトを「包括的なAI安全ベンチマーク」と説明し、「モデル比較とコンプライアンスのための重要なデータセット」を提供したと述べている。Metaは声明で、この取り組みは「責任あり、業界標準的な安全テスト」であると主張している。

出典

wired.com — 元記事を読む →