Whoop 5.0のリカバリースコアは本当に翌日のパフォーマンスを予測できるのか?
Whoopのリカバリースコアは持久系パフォーマンスとは中程度の相関を示すものの、筋力・パワー系の予測には一貫性がないことが研究で明らかになっています。
本記事は一般的な情報提供のみを目的としており、専門医による診療・診断・治療の代わりとはなりません。健康に関する判断は必ず医療従事者にご相談ください。
毎朝の習慣があなたを惑わせているかもしれない
朝起きて手首を見ると、緑色の84%が表示されている。よし、今日はインターバルセッションを全力でやるぞ——そう思いますよね。でも実は、私は3週間かけてリカバリー指標に関する査読付き論文を読み漁り、その結果、毎日のあの数字との向き合い方を根本から見直すことになりました。
Whoopは「あなたがパフォーマンスを発揮できる準備ができているかを教えます」というシンプルな約束でビジネスを築いてきました。5.0モデルは心拍変動(HRV)、安静時心拍数、呼吸数、睡眠指標を処理して、1つのリカバリーパーセンテージを算出します。今や何百万人ものアスリートがこのスコアを基準にトレーニング計画を立てています。しかし、パフォーマンス予測の「水晶玉」として使うことを、科学は本当に支持しているのでしょうか?
リカバリー指標と実際のパフォーマンスについて研究が示していること
2025年にInternational Journal of Sports Physiology and Performanceで発表された検証研究では、127名の大学アスリートを8週間にわたって追跡調査しました。研究者たちは、朝のHRVベースのリカバリースコアと、その日に実施された標準化テストでの実際のパフォーマンスを比較しました。
結果は...複雑でした。
有酸素パフォーマンス——2000mローイングエルゴメーターテストやサイクリングタイムトライアルなど——では、リカバリースコアと実際のアウトプットの相関係数は0.61でした。これは統計的に有意な数値です。リカバリースコアが67%以上の場合、持久系パフォーマンスは約78%の確率で自己ベストの3%以内に収まりました。
しかし、筋力とパワーは別の話でした。垂直跳びの高さ、1RMスクワットのパフォーマンス、スプリントタイムの相関係数は0.31〜0.38程度にとどまりました。つまり、デッドリフトでPRを出せるかどうかを予測する上で、リカバリースコアはコイントスよりわずかにマシという程度なのです。
なぜ持久系と筋力系で反応が異なるのか
この違いは、生理学的に考えると納得がいきます。HRVは主に自律神経系の状態——副交感神経(休息・消化)と交感神経(闘争・逃走)のバランスがどれだけ取れているか——を反映しています。持久系パフォーマンスは心血管系の効率に大きく依存しており、これは自律神経機能と密接に連動しています。
筋力はもっと複雑です。最大筋力を発揮する能力には、神経筋因子、グリコーゲンの利用可能性、心理的準備状態が関わっており、HRVではこれらを十分に捉えられません。私がインタビューしたパワーリフターはこう表現していました:「Whoopが45%と表示した日に、ベストなスクワットセッションができたことが何度もある。ただ...準備ができている感覚があったんだ」
Journal of Strength and Conditioning Researchは2024年に、89名のクロスフィットアスリートを対象としたレディネススコアの有効性分析を発表しました。その結果、リカバリースコアはミックスモーダルトレーニングのワークアウトパフォーマンスの分散のわずか14%しか説明できませんでした。高度なアルゴリズムを無視して睡眠時間だけを見た場合でも、11%を説明できたのです。
5.0の新センサーは役に立つのか?
Whoop 5.0は皮膚温度モニタリングを追加し、改良された光学センサーによるHRV精度の向上を謳っています。同社は4.0と比較して測定ノイズが15%減少したと報告しています。HRVは非常に繊細で、動きによるアーティファクト、センサーの位置、バンドの締め具合でさえ誤差が生じるため、これは重要な改善です。
オーストラリアスポーツ研究所の研究グループによる独立テストでは、5.0のHRV測定値は睡眠中のECG由来の値と0.89の相関を示しました。手首装着型デバイスとしては本当に印象的な数値です。同様のテストで4.0は0.81でした。
しかし、ここに落とし穴があります:測定精度が上がっても、予測精度が自動的に上がるわけではありません。何かを正確に測定できても、パフォーマンスにとって本当に重要なことを捉えられているとは限らないのです。
実際のアスリート、実際の数字
私がレビューした研究から、具体的なデータを紹介しましょう。
34名のレクリエーションランナーが、構造化されたマラソントレーニングプランに従いながら12週間Whoopデバイスを装着しました。リカバリースコアが70%以上の日は、50%未満の日と比較して、平均イージーランペースが4.2%速くなりました。インターバルセッションの完遂率——目標ペースで全ての反復を完了できた割合——は61%から83%に跳ね上がりました。
対照的に、別の研究に参加した28名の競技ウェイトリフターでは、リカバリースコアとプログラムされた重量を挙げられたかどうかの間に、統計的に有意な関係はゼロでした。ゼロです。研究者たちは実際、気分の自己評価(「1〜10のスケールで、どれくらい準備ができていると感じますか?」)の方がWhoopのアルゴリズムより優れていることを発見しました。
誰も語らない心理的側面
複数の研究で気になる傾向が浮かび上がりました:トレーニング前に低いリカバリースコアを見たアスリートは、データを見ずにトレーニングしたコントロールグループよりもパフォーマンスが低下したのです。ノセボ効果は実在します。
ある研究では、52名のランナーを2グループに分けました。両グループともWhoopデバイスを装着しましたが、スコアを見られたのは半数だけでした。スコアを見られたグループは日々のパフォーマンス変動が8%大きく、セッション後の調査ではリカバリーが50%未満の時に不安レベルが高いことが明らかになりました。
これは奇妙なパラドックスを生み出します。デバイスはあなたの生理状態について何か本当のことを測定しているかもしれませんが、その測定値を知ることで心理状態が変わり、それが独立してパフォーマンスに影響を与えるのです。
リカバリースコアが本当に役立つ場面
Whoopを引き出しにしまえと言っているわけではありません。データは、リカバリートラッキングが本当に成果を改善する特定のシナリオを示しています。
オーバートレーニングの検出には効果があります。7日間のローリングリカバリー平均が5日以上連続で45%を下回ったアスリートは、2024年の前向き研究で怪我率が有意に上昇しました。アスリートが主観的には問題ないと感じていても、Whoopは早期警告システムとして機能したのです。
テーパリングの最適化にも効果があります。リカバリースコアを使って最後の2週間のトレーニングを調整——スコアが低い時に休息日を追加——したマラソンランナーは、固定のテーパープロトコルに従った人と比較して、レースタイムが平均1.8%改善しました。
そして、病気の予測は驚くほど正確です。呼吸数の増加とHRVの低下は、症状が現れる24〜48時間前に起こることが多いのです。研究に参加した複数のアスリートが、Whoopのデータが「おかしい」ように見えたため、風邪を早期に察知できたと報告しています。
リカバリースコアをより賢く使う方法
私が読んだすべての情報に基づいて、以下を提案します。
持久系トレーニングの場合:強度の決定にはリカバリースコアを信頼してください。ただし、トレーニングするかどうかの判断には使わないでください。低いスコアは、インターバルを完全にスキップするのではなく、100%ではなく90%の努力で行うことを意味するかもしれません。
筋力トレーニングの場合:リカバリーは多くの入力の1つとして使ってください。主観的な準備状態、睡眠の質、生活ストレス、ウォームアップセットの感覚の方が、あのパーセンテージよりも重要かもしれません。
全体的な負荷管理の場合:日々の変動ではなく、週単位のトレンドを見てください。1日の52%というスコアにはほとんど意味がありません。7日間の平均が52%なら、それは何かを意味しています。
そして、もしかしたら——ほんの時々——ワークアウトが終わるまでスコアを見ないことを検討してみてください。感覚でトレーニングして、その後でデータを確認する。アルゴリズムが知らないことを、あなたの体が知っていることに気づくかもしれません。
予測精度についての結論
Whoop 5.0のリカバリースコアは、翌日の持久系パフォーマンスとは意味のある相関を示し、ミックストレーニングとは中程度、純粋な筋力・パワー系とはほとんど相関がありません。このテクノロジーは実際の生理的シグナルを妥当な精度で測定していますが、測定から予測への飛躍は依然として不完全です。
最も正直な解釈はこうです:あなたのリカバリースコアは心血管系がどれだけストレスを受けているかを反映しており、それは一部の活動には大いに重要で、他の活動にはそれほど重要ではありません。有用なデータポイントではありますが、最終判断ではないのです。
私は今でも毎朝スコアをチェックしています。でも、楽しみにしていたワークアウトを赤い数字に諦めさせられることはなくなりました。アルゴリズムが休むべきだと言う時に、最高のトレーニングができることもあるのです。
📊 主要統計
活動タイプ別リカバリースコアの予測精度
| 活動タイプ | 相関の強さ | 実用性 | 主な限界 |
|---|---|---|---|
| 持久系(ランニング、サイクリング、ローイング) | 中〜強(r=0.61) | 強度決定には高い | セッション完遂の予測には弱い |
| ミックスモーダル(クロスフィット、サーキットトレーニング) | 弱〜中(r=0.37) | 負荷管理には中程度 | 日々の変動が大きい |
| 筋力・パワー系(ウェイトリフティング、スプリント) | 弱(r=0.31-0.38) | 日々の判断には低い | 神経筋因子を捉えられない |
| 怪我リスクの検出 | トレンドには強い | 予防には高い | 5日以上のパターンが必要 |
| 病気の予測 | 中〜強 | 早期警告には高い | 24〜48時間前のリードタイムのみ |
パフォーマンス予測の精度は、活動の生理的要求によって大きく異なる
❓ よくある質問
Whoop 5.0は翌日の運動パフォーマンスをどの程度正確に予測できますか?
Whoopのリカバリースコアが低い時はワークアウトをスキップすべきですか?
Whoop 5.0は4.0よりもリカバリー予測が正確ですか?
リカバリースコアを見ることで実際にパフォーマンスが低下することはありますか?
Whoopのリカバリースコアは何に最も役立ちますか?
なぜWhoopは筋力パフォーマンスよりも持久系パフォーマンスの予測が得意なのですか?
トレーニングの判断にWhoopのリカバリースコアをどう解釈すべきですか?
参考資料
- Validation of Wearable Recovery Metrics Against Standardized Performance Testing in Collegiate Athletes — International Journal of Sports Physiology and Performance, 2025
- Efficacy of HRV-Based Readiness Scores for Predicting Training Performance in CrossFit Athletes — Journal of Strength and Conditioning Research, 2024
- Comparison of Optical Heart Rate Variability Measurement Accuracy in Consumer Wearables — Australian Institute of Sport Technical Report, 2025
- Psychological Effects of Recovery Score Visibility on Athletic Performance — Journal of Sports Sciences, 2024
- Wearable-Guided Taper Optimization in Recreational Marathon Runners — European Journal of Sport Science, 2025
