2025年3月、こども家庭庁は約10億円を投じて開発を進めてきた児童虐待判定AIシステムの導入を見送ることを決定しました。このシステムは、児童相談所(児相)の業務負担軽減や虐待の早期発見を目的として開発されましたが、試験運用の結果、判定ミスが約6割に達したことから「実用化困難」と判断されました。
本記事では、このプロジェクトの概要、導入見送りに至った理由、そして今後の課題について詳しく解説します。
虐待判定AIシステムとは?
開発の背景と目的
こども家庭庁が2021年度から開発を進めてきたこのAIシステムは、以下の目的で設計されました。
- 児相職員の業務負担軽減
児童虐待相談対応件数は年々増加しており、2022年度には過去最多の21万4843件に達しました。このような状況下で、人手不足に悩む児相を支援するためにAI技術が注目されました。 - 虐待リスクの早期発見
虐待の兆候を見逃さず、一時保護が必要な子どもを迅速に保護するために、AIによる客観的な判断が期待されました。
システムの仕組み
このAIは過去約5000件の虐待事例を学習し、以下のような仕組みで動作します。
- 入力項目:傷の有無や保護者の態度など91項目を入力
- 出力結果:虐待リスクを0~100点でスコア化し、一時保護が必要かどうかを判定
導入見送りに至った理由
試験運用結果:ミス率6割
2024年夏、全国10自治体の児相で過去100件の虐待事例を用いた試験運用が行われました。しかし、その結果は以下の通りでした。
- 100件中62件で「著しく低い」判定
ベテラン職員が「即時一時保護が必要」と判断したケースでも、AIは低いリスクスコア(例:2~3点)を出すことがありました。これにより、重大な虐待事例であっても見逃す可能性が浮き彫りになりました。 - 重要情報の欠落
AIは外傷や明確な証拠に依存する傾向があり、心理的虐待やネグレクトなど目に見えない形態には対応できませんでした。
精度不足の主な原因
- 学習データ量の不足
AI学習には膨大なデータが必要ですが、今回使用された5000件では不十分だったと指摘されています。 - 入力項目の限界
91項目は該当・非該当のみを入力する形式であり、ケガの程度や状況など詳細な情報を反映できませんでした。 - 多様性への対応不足
虐待事例は非常に多様であり、AIが全てを網羅することは困難でした。特に心理的虐待やネグレクトなど非身体的要素への対応が弱点となりました。
今後の課題と改善策
1. データ量と質の向上
AIモデルを改善するには、大量かつ多様なデータが必要です。
例えば:
- より多くの事例データ(数万件以上)の収集
- 心理的虐待やネグレクトなど非身体的要素も含む詳細なデータ提供
2. 入力項目と分析精度の再設計
現場職員からフィードバックを得て、以下を検討すべきです。
- ケガや症状だけでなく、「子どもの体重減少」「家庭環境」など重要な要素を反映
- 入力項目に自由記述欄を追加し、多面的な情報収集を可能にする
3. 人間との協働モデル構築
AIはあくまで補助ツールとして活用し、人間による最終判断との併用が求められます。
例えば:
- AIによるリスクスコア提示 → 職員による詳細確認
- 職員研修でAI活用スキル向上
4. 継続的な検証と改善
プロトタイプ段階で終わらせず、実証実験と検証プロセスを繰り返し行うことで精度向上につなげます。また、新たな技術(自然言語処理や画像認識)との統合も検討すべきです。
技術活用と現場経験の融合へ
今回の失敗は、「技術だけでは解決できない現場課題」を浮き彫りにしました。しかし、それは同時に「技術と人間の協働」の重要性も示しています。
例えば:
- AI技術:膨大なデータ解析やパターン認識による効率化
- 現場経験:個別ケースごとの文脈理解や柔軟な対応
この二つを組み合わせることで、より効果的な児童虐待防止策が期待されます。
まとめ:教訓から未来へ
こども家庭庁が約10億円を投じた虐待判定AIプロジェクトは、「精度不足」という課題から導入見送りとなりました。しかし、この失敗は単なる終わりではなく、「より良いシステム構築への第一歩」として捉えるべきです。
今後は以下が求められます。
- データ拡充と精度向上への継続的取り組み
- 人間とAIによる協働モデル構築
- 技術進化と現場経験との融合
児童虐待という深刻な社会問題解決には時間と努力が必要ですが、この教訓を活かしながら、一つひとつ課題解決へ向けた歩みを進めることが重要です。こども家庭庁や関係機関には引き続き注目していく必要があります。