【公共/非営利×AI】UK GOV.UK Chat 10,136名・23,838質問・回答精度90%・jailpreak508件100%遮断を中小自治体・公共機関が再現する設計

UK政府が「GOV.UK Chat」テスト、10,000人超利用・10,136名/23,838質問・回答精度76%→90%向上・jailbreak508件100%遮断・AWS Bedrock+Claude基盤と公表しました。 UK Government Digital Service公式ブログで公開されています。

「英国政府の話だから関係ない」と読み飛ばすにはもったいないです。中小自治体・公共機関で「問合せ件数膨張+人員不足+情報散在」で悩んでいる構造そのものだからです。この事例は、「Claude+RAG+ガードレール+ログ分析」の枠で整理できます。

僕が注目したのは、「jailbreak508件100%遮断」という踏み込みです。中小自治体にそのまま応用できます。

中小自治体/公共機関の問合せ対応課題
UK GOV.UK Chatの整理
何が真似できるか
中小自治体/公共機関で再現するなら
出典・参考

中小自治体/公共機関の問合せ対応課題

中小自治体/公共機関にありがちな構造はこうです。

住民問合せは電話+窓口で人員圧迫
制度情報はPDF/ホームページ散在
FAQは更新が追いつかず古い
結果、待ち時間長+職員疲弊+住民満足度低下

汎用ChatGPTには自治体制度情報は入っていません。「Claude+RAG+ガードレール+ログ分析」が必要、というのが本事例の骨子です。

UK GOV.UK Chatの整理

公表情報で示されている内容は以下です。

対象: GOV.UK利用住民
基盤: AWS Bedrock+Claude+ガードレール
成果:
利用者: 10,000人超(10,136名)
質問数: 23,838件
回答精度: 76%→90%向上
jailbreak対応: 508件100%遮断
対象範囲: 政府制度・サービス情報
設計思想: 公的情報をRAGで参照、悪用は完全遮断

考察:

公共の壁は情報散在と問合せ集中
ClaudeのRAGなら正確な制度回答と監査ログを両立
中小自治体ほど職員不足で問合せが詰まる

何が真似できるか

UK政府の話ですが、設計思想だけ抜き取るとこうなります。

制度資料をベクトルDB化
問合せはClaude APIでRAG回答
jailbreak対策のガードレール設計
全ログを月次分析で精度改善
効果は「問合せ削減数×回答精度×人員工数」で測る

特に「ガードレール」が秀逸です。中小自治体ほど「セキュリティ懸念でAI導入断念」となりがちですが、ガードレール設計で桁違いに安全運用できます。

中小自治体/公共機関で再現するなら

ここからが本題です。職員50〜500人の中小自治体・公共機関で同じ思想を取り入れるならどう削るか。

構成

項目	GOV.UK Chat像	中小自治体(50〜500人)
対象	全英国民	自市町村住民
ツール	AWS Bedrock+Claude	Claude API+ベクトルDB+ガードレール
月額費用	(大規模)	推定月5〜15万円
初期費用	(大規模)	推定 50〜150万円(資料整理+RAG+ガードレール)
体制	(専門チーム)	情報課+外部AI開発
期間	(継続)	3〜6ヶ月で運用化