| タイトル | vLLMにおける複数の脆弱性 |
|---|---|
| 概要 | vLLMは大規模言語モデル(LLM)の推論およびサービングエンジンです。0.20.0より前のバージョンでは、vLLMのextract_hidden_states投機的デコーディング提案者が、最初のデコードステップ後に誤った形状のテンソルを返し、EngineCoreプロセスがクラッシュするRuntimeErrorを引き起こしていました。このクラッシュは、バッチ内の任意のリクエストがサンプリングペナルティパラメーター(repetition_penalty、frequency_penalty、presence_penalty)を使用した場合に発生しました。単一のリクエストにペナルティパラメーター(例: "repetition_penalty": 1.1)が設定されているだけでサーバーがクラッシュしました。この脆弱性は0.20.0で修正されています。 |
| 想定される影響 | 当該ソフトウェアが扱う情報について、外部への漏えいは発生しません。 また、当該ソフトウェアが扱う情報について、書き換えは発生しません。 さらに、当該ソフトウェアが完全に停止する可能性があります。 そして、この脆弱性を悪用した攻撃の影響は、他のソフトウェアには及びません。 |
| 対策 | 正式な対策が公開されています。ベンダ情報を参照して適切な対策を実施してください。 |
| 公表日 | 2026年5月12日0:00 |
| 登録日 | 2026年5月18日12:12 |
| 最終更新日 | 2026年5月18日12:12 |
| CVSS3.0 : 警告 | |
| スコア | 6.5 |
|---|---|
| ベクター | CVSS:3.0/AV:N/AC:L/PR:L/UI:N/S:U/C:N/I:N/A:H |
| vLLM |
| vLLM 0.18.0 以上 0.20.0 未満 |
| No | 変更内容 | 変更日 |
|---|---|---|
| 1 | [2026年05月18日] 掲載 |
2026年5月18日12:12 |
| 概要 | vLLM is an inference and serving engine for large language models (LLMs). From to before 0.20.0, the extract_hidden_states speculative decoding proposer in vLLM returns a tensor with an incorrect shape after the first decode step, causing a RuntimeError that crashes the EngineCore process. The crash is triggered when any request in the batch uses sampling penalty parameters (repetition_penalty, frequency_penalty, or presence_penalty). A single request with a penalty parameter (e.g., "repetition_penalty": 1.1) is sufficient to crash the server. This vulnerability is fixed in 0.20.0. |
|---|---|
| 公表日 | 2026年5月13日5:16 |
| 登録日 | 2026年5月15日4:18 |
| 最終更新日 | 2026年5月16日0:16 |
| 構成1 | 以上 | 以下 | より上 | 未満 | |
| cpe:2.3:a:vllm:vllm:*:*:*:*:*:*:*:* | 0.18.0 | 0.20.0 | |||