| Title | LinuxのLinux Kernelにおけるリソースのロックに関する脆弱性 |
|---|---|
| Summary | Linuxカーネルにおいて、次の脆弱性が修正されました。cgroupのrmdir時に発生していたcss percpu_refのキル処理を、cgroupが空になるまで延期するようにしました。v7.0以降の一連のコミットでrmdir処理を再設計し、サブシステムの-css_offline()がcgroup内でカーネル側の作業がまだ行われている間は実行されないというコントローラーの不変条件を満たすように対応しました。[1] d245698d727aではtask csetのunlink処理をdo_exit()からfinish_task_switch()に移動し、タスクのスケジューリング停止後にリンクが解除されるようにしました。これにより、exit_signals()後のタスクが最終コンテキストスイッチまでcset-tasksに残留し、ユーザ空間の期待とカーネル側の待機条件に乖離が生じました。[2]-[5]ではこの乖離を調整しています。[2]では終了中のタスクをcgroup.procsから除外し、[3]ではrmdir(2)をTASK_UNINTERRUPTIBLE状態で待機させ、[4]で待機条件を修正し、[5]でnr_dying_subsys_*を同期的に可視化しました。しかし、[3]のcgroup_drain_dying()の待機は根本的な問題解決にはならず、rmdir呼び出し元がゾンビの再逐次処理者である場合にデッドロックが発生しました。そのため、cssのキル処理側は非同期で実行されるべきであり、-css_offline()は既にpercpu_ref_kill_and_confirm()により非同期でcss_killed_work_fn()から実行されています。修正内容は、すべてのタスクがcgroupを離れるまでこの処理を開始しないようにすることです。rmdirのユーザから見える側はcgroup.procs等が空になるとすぐに戻りますが、-css_offline()はcgroupが完全に空になるまで実行されません。元の再現テスト(pidnsの解放およびゾンビ再逐次処理者の挙動確認)が成功し、コミットごとの決定論的再現テストも行われています。cgroup_apply_control_disable()に存在した既存の競合も同様の形で、kill_css()は同期的に実行され、exit_signals()後のタスクがまだcsetにリンクされたまま-css_offline()が先行することがありました。本パッチでは同期的動作を保持しつつ、後続のパッチでkill_css_finish()の遅延実行を行います。この方法は適切であり、大きな問題は見当たりません。変更はやや侵襲的ですが過度ではなく、安定版へのバックポートが可能です。問題があれば、一連のコミット[1]-[5]を元に戻して開発ブランチで再検討します。v2では遅延破棄処理の周囲に明示的なcgroup_get()/cgroup_put()を追加して参照を固定しました。v1は本質的に破綻していませんでしたが、この明示的参照により非明示の不変条件への依存が排除されています。以上のように、cgroupのrmdir処理におけるタスク終了管理とcssキル処理を改善したことで、デッドロックや不正な状態遷移を防止しました。 |
| Possible impacts | ・当該ソフトウェアが扱う情報について、外部への漏えいは発生しません。 ・当該ソフトウェアが扱う情報について、書き換えは発生しません。 ・当該ソフトウェアが完全に停止する可能性があります。 |
| Solution | リリース情報、またはパッチ情報が公開されています。参考情報を参照して適切な対策を実施してください。 |
| Publication Date | May 28, 2026, midnight |
| Registration Date | June 12, 2026, 2:48 p.m. |
| Last Update | June 12, 2026, 2:48 p.m. |
| CVSS3.0 : 警告 | |
| Score | 5.5 |
|---|---|
| Vector | CVSS:3.0/AV:L/AC:L/PR:L/UI:N/S:U/C:N/I:N/A:H |
| Linux |
| Linux Kernel 6.19.12 以上 7.0 未満 |
| Linux Kernel 7.0 |
| Linux Kernel 7.0.1 以上 7.0.9 未満 |
| Linux Kernel 7.1 |
| No | Changed Details | Date of change |
|---|---|---|
| 1 | [2026年06月12日] 掲載 |
June 12, 2026, 2:48 p.m. |
| Summary | In the Linux kernel, the following vulnerability has been resolved: cgroup: Defer css percpu_ref kill on rmdir until cgroup is depopulated A chain of commits going back to v7.0 reworked rmdir to satisfy the [1] d245698d727a ("cgroup: Defer task cgroup unlink until after the task is done switching out") [1] moved task cset unlink from do_exit() to finish_task_switch() so a The cgroup_drain_dying() wait in [3] turned out to be a dead end. When the The css killing side that drove the original reorder, however, can be made Verified by the original reproducer (pidns teardown + zombie reaper, runs cgroup_apply_control_disable() has the same shape of pre-existing race: This seems like the right approach and I don't see problems with it. The v2: Pin cgrp across the deferred destroy work with explicit |
|---|---|
| Publication Date | May 28, 2026, 7:16 p.m. |
| Registration Date | May 29, 2026, 4:14 a.m. |
| Last Update | May 28, 2026, 10:44 p.m. |