2024/09/26
防災・危機管理ニュース
人工知能(AI)の安全性を評価する際の基準を検討する政府の専門機関「AIセーフティ・インスティテュート(AISI)」は9月25日、AIセーフティに関するレッドチーミング手法ガイドを公開した。
レッドチーミングとは、攻撃者の視点でシステムなどを評価する手法で、今回、「攻撃者がどのようにAIシステムを攻撃するかの観点で、AIセーフティへの対応体制及び対策の有効性を確認する評価手法」としてまとめた。AIシステムによるイノベーションの促進や社会課題の解決が期待されている一方で、AIシステムの悪用や誤用、不正確な出力による懸念等が生じており、AIセーフティについての関心は国内外で高まりつつある。こうした中、AIセーフティ評価の一環として、特にレッドチーミング手法の検討が各国で進んできていることから、基本的な考慮事項を示した。
本ガイドの主な想定読者はAI開発者・AI提供者のうち、レッドチーミングの企画・実施に関与する人。システムは、大規模言語モデル(LLM)を構成要素とするAIシステム(LLMシステム)を対象として記載している。
ガイドの構成は、第2章で、レッドチーミングについて解説。第3章では、LLMシステムへの代表的な攻撃手法について説明している。

その上で、第4章と第5章では、実施体制と役割、実施時期及び実施工程について。多様な関係者(攻撃シナリオの実施によって影響を受けるシステムに関わる組織)が参画するのが望ましく、AIシステムのリリース/運用開始前に加え、運用開始後も、必要に応じて随時実施することが望ましいとしている。
第6章(実施計画の策定と実施準備)、第7章(攻撃計画・実施)、第8章(結果のとりまとめと改善計画の策定)では、レッドチーミングの具体的な工程について15のステップに分けて解説している。

(ニュース提供元:時事通信社)
防災・危機管理ニュースの他の記事
おすすめ記事
-
-
中澤・木村が斬る!今週のニュース解説
毎週火曜日(平日のみ)朝9時~、リスク対策.com編集長 中澤幸介と兵庫県立大学教授 木村玲欧氏(心理学・危機管理学)が今週注目のニュースを短く、わかりやすく解説します。
2025/08/26
-
-
ゲリラ雷雨の捕捉率9割 民間気象会社の実力
突発的・局地的な大雨、いわゆる「ゲリラ雷雨」は今シーズン、全国で約7万8000 回発生、8月中旬がピーク。民間気象会社のウェザーニューズが7月に発表した中期予想です。同社予報センターは今年も、専任チームを編成してゲリラ雷雨をリアルタイムに観測中。予測精度はいまどこまで来ているのかを聞きました。
2025/08/24
-
スギヨ、顧客の信頼を重視し代替生産せず
2024年1月に発生した能登半島地震により、大きな被害を受けた水産練製品メーカーの株式会社スギヨ(本社:石川県七尾市)。その再建を支えたのは、同社の商品を心から愛する消費者の存在だった。全国に複数の工場があり、多くの商品について代替生産に踏み切る一方、主力商品の1つ「ビタミンちくわ」に関しては「能登で生産している」という顧客の期待を重視し、あえて現地工場の再開を待つという異例の判断を下した。結果として、消費者からの強い支持を受け、ビタミンちくわは過去最高近い売り上げを記録している。一方、BCPでは大規模な地震などが想定されていないなどの課題も明らかになった。同社では今、BCPの立て直しを進めている。
2025/08/24
-
-
-
-
ゲリラ豪雨を30分前に捕捉 万博会場で実証実験
「ゲリラ豪雨」は不確実性の高い気象現象の代表格。これを正確に捕捉しようという試みが現在、大阪・関西万博の会場で行われています。情報通信研究機構(NICT)、理化学研究所、大阪大学、防災科学技術研究所、Preferred Networks、エムティーアイの6者連携による実証実験。予測システムの仕組みと開発の経緯、実証実験の概要を聞きました。
2025/08/20
-
※スパム投稿防止のためコメントは編集部の承認制となっておりますが、いただいたコメントは原則、すべて掲載いたします。
※個人情報は入力しないようご注意ください。
» パスワードをお忘れの方