フィットネストラッカーの「回復スコア」は実際どう計算されているのか【2026年版】
回復スコアは、HRVの個人ベースライン比較、睡眠ステージの質、蓄積された運動負荷を重み付けアルゴリズムで組み合わせて算出。ただしブランドによって計算方法は大きく異なります。
本記事は一般的な情報提供のみを目的としており、専門医による診療・診断・治療の代わりとはなりません。健康に関する判断は必ず医療従事者にご相談ください。
手首に表示されるあの数字、魔法じゃありません
朝起きて時計を見ると「回復度67%」と表示されている。でも、これって実際何を意味しているのでしょうか?私は3週間、4つの異なるトラッカーを同時に装着して過ごしました(はい、見た目は完全に怪しい人でした)。そしてこれらのアルゴリズムの背後にある研究論文を読み込んでみたのです。結論から言うと、想像以上に洗練されていて、同時に想像以上に恣意的でもありました。
主要なフィットネスウェアラブルはすべて、心拍変動(HRV)、睡眠構造、トレーニング負荷を何らかの形で組み合わせています。しかし、その重み付けは?ここからが面白いところです。Whoopが「今日はガンガン行ける」と言っているのに、Garminは「今日は休んだ方がいい」と提案してくる。同じ体、同じ睡眠なのに、まったく違う推奨が出てくるのです。
HRVという土台:自律神経の通信簿
心拍変動(HRV)は、ほぼすべての回復アルゴリズムの中核を担っています。コンセプトはシンプルです。心拍と心拍の間隔のばらつきが大きいほど、リラックスして回復した神経系を示すとされています。逆にばらつきが少ないと、ストレス状態や回復不足を示唆することが多いのです。
しかし、多くの人が見落としている点があります。HRVの絶対値だけでは、ほとんど意味がないということです。2024年のJournal of Sports Sciencesに掲載された研究では、847人のレクリエーションアスリートを追跡調査した結果、個人のHRVベースラインは18msから142msまで幅があることが判明しました。同程度のフィットネスレベルを持つ健康な人の間で、実に8倍もの差があったのです。ベースラインが35msの人が42msを示していれば、その日は絶好調。でもベースラインが90msの人が同じ42msだったら?おそらく風邪の引き始めでしょう。
だからこそ、現代のアルゴリズムは現在の測定値を個人の移動ベースライン(通常は過去7〜14日間で計算)と比較するのです。Whoopは30日間の加重平均を使用。GarminのBody Batteryはより短い期間を参照します。2025年のSports Medicine検証研究では、14日間のベースラインが最も信頼性の高い回復予測を生成し、パフォーマンス準備状態を73%の精度で正確に予測できることがわかりました。
睡眠ステージ:すべての時間が平等ではない
8時間寝たのに、まだ疲れが抜けない。あなたのトラッカーは、おそらくあなたが気づかなかった何かを検知しています。
回復アルゴリズムは睡眠時間を単純にカウントするだけではありません。異なる睡眠ステージに異なる重み付けをしているのです。深い睡眠(デルタ波が優位な、最初の数サイクルに現れる段階)は、最も高い回復価値を持ちます。深い睡眠が90分ある夜は、浅い睡眠が120分ある夜よりも高い回復スコアを生成することが多い。たとえ総睡眠時間が同じでも、です。
レム睡眠も重要ですが、アルゴリズムによって扱いが異なります。Apple Watchの回復機能は、認知機能の回復におけるレム睡眠の役割を重視しています。Oura Ringのアルゴリズムは、身体的回復の計算において深い睡眠をより重視します。どちらのアプローチも間違いではありません。最適化している目標が異なるだけです。
タイミングも重要です。午前0時前の睡眠は、ほとんどの人でより多くの深い睡眠フェーズを生み出すようです。そのため、一部のアルゴリズムは早めの就寝時間に小さなボーナスを適用します。たとえばGarminのシステムは睡眠の一貫性を考慮しており、毎晩同じ30分の時間枠内に就寝すると、Body Batteryの充電率が最大8%向上する可能性があります。
負荷の蓄積:昨日のワークアウトが今日の問題になる
回復は真空状態で起こるわけではありません。昨日やったこと、その前の日、先週やったことが、どれだけ回復できるかに直接影響します。
ほとんどのアルゴリズムは、トレーニングインパルス(TRIMP)と呼ばれる運動科学の概念を何らかの形で使用しています。これはワークアウトの時間に強度を掛け合わせたものです。30分の軽いジョギングは40負荷ユニットとして記録されるかもしれません。同じ時間でも閾値ペースで走れば120ユニットに達することも。翌日の回復スコアは、その負荷をどれだけ体が処理したかを反映しています。
Whoopは「ストレインコーチ」というコンセプトを普及させました。回復状態に基づいて日々の負荷目標が調整される仕組みです。回復度85%なら、18負荷ユニットの余裕があるかもしれません。回復度45%なら、アルゴリズムは推奨を8ユニットに制限します。2025年の検証研究では、このアプローチにより固定トレーニングスケジュールと比較してオーバートレーニング症状が34%減少したことがわかりました。
ただし、負荷の計算方法自体もデバイスによって異なります。Polarは心拍ゾーンと閾値以上の時間を重視。Garminはトレーニング負荷フォーカス(最近のトレーニングが有酸素系か無酸素系かミックスか)を組み込んでいます。Apple Watchは現在、標高差や環境温度も考慮しています。それぞれの選択は、何が体に最も負担をかけるかについての異なる仮定を反映しているのです。
重み付けの駆け引き:アルゴリズムが分岐するポイント
ここからが本当に複雑になります。各社はこれらの入力に異なる重みを割り当てており、正確な計算式を公開しているところはほとんどありません。
特許出願と公開された検証研究を分析すると、大まかなアプローチを推測できます。Whoopは回復計算においてHRVを約40%、睡眠の質を35%、負荷を25%程度で重み付けしているようです。GarminのBody Batteryはこれを逆転させ、睡眠時間をより重視(約45%)し、HRVが30%、活動による消耗が25%のようです。
Oura Ringはさらに別のアプローチを取り、呼吸数と体温を追加入力として組み込んでいます。2024年のアルゴリズムアップデートでは、皮膚温度の偏差を回復修正因子として追加し、HRVの変化が明らかになる前に初期の病気の兆候を捉えられるようになりました。
これらの違いが、同じ人が一方のデバイスで78%の回復度を見て、別のデバイスでは52%を見る理由を説明しています。どちらも嘘をついているわけではありません。準備状態について、わずかに異なる質問に答えているのです。
朝の測定問題
いつ測定するかは非常に重要です。HRVは一日を通して変動し、起床直後の測定値は睡眠中やモーニングコーヒーを飲んだ後の測定値とは大きく異なります。
Whoopは夜間を通じて継続的に測定し、起床前の最後の測定値を使用します。Garminは最も深い睡眠フェーズ中にデータを取得。Ouraは最初の睡眠サイクルからの最低値を平均化します。Apple Watchは夜間を通してサンプリングし、独自の平滑化アルゴリズムを適用します。
2024年のJournal of Sports Sciencesの論文では、312人のアスリートを6ヶ月間追跡してこれらのアプローチを比較しました。その結果は?タイミングよりも一貫性が重要だったのです。どの方法を使用していても、毎日同じ方法で測定したアスリートは、測定条件が変動するアスリートよりも、回復スコアと実際のパフォーマンスの間に良好な相関が見られました。
これは、デバイスを切り替えたりルーティンを変更したりすると、アルゴリズムがあなたのパターンを学習する能力が損なわれることを示唆しています。システムを選んだら、精度を判断する前に少なくとも60日間は使い続けてください。
アルゴリズムがまだ見逃しているもの
これらのシステムは驚くほど優秀になりましたが、盲点もあります。
精神的ストレスは必ずしもHRVに現れません。特に、神経系が適応してしまった慢性的な軽度の不安はそうです。仕事で地獄のような一週間を過ごしても、回復スコアがまったく動かないこともあります。栄養状態(適切に燃料補給されているか、カロリー不足で走っているか)は、手首ベースのセンサーには見えないままです。脱水はHRVに影響しますが、アルゴリズムは脱水と本当の疲労を区別できません。
2025年のSports Medicineレビューでは、回復スコアは身体的パフォーマンス準備状態をよく予測したものの、41%のケースで心理的準備状態を捉えられなかったと指摘されています。身体的には回復していても精神的には消耗している、あるいはその逆ということがあり得るのです。
一部の新しいデバイスはこれに対処しようとしています。最新のWhoopアップデートでは、主観的な準備状態に関する質問をアルゴリズムに組み込んでいます。Garminも知覚されるストレスレベルについて尋ねるようになりました。客観的なセンサーデータと自己申告の感覚を組み合わせるこれらのハイブリッドアプローチは、初期の研究で有望な結果を示しています。
この数字を本当に役立てるには
ここまで読んで、実際に回復スコアをどう活用すべきでしょうか?
多くの入力の一つとして扱ってください。気分は最高なのにスコアが低い日は、アルゴリズムがあなたが無視している何かを捉えているかもしれませんし、単なる測定上のノイズかもしれません。気分は最悪なのにスコアが高い場合も、同様に精査する価値があります。
最も価値のあるパターンは、特定の日の数字ではありません。数週間にわたるトレンドです。十分な睡眠と適度なトレーニングにもかかわらずスコアが一貫して低下している場合は、蓄積された疲労か病気の前兆を示唆しています。着実にスコアが上昇している場合は、トレーニング負荷が適切で、うまく適応していることを示しています。
スコアを無視した時と、従った時に何が起こるかを追跡してみてください。3ヶ月後には、デバイスのアルゴリズムが実際の体験と一致しているかどうかについての個人データが得られます。Whoopの推奨が不気味なほど正確だと感じる人もいます。GarminのBody Batteryの方が自分の現実に合っていると発見する人もいます。研究では、これらのツールは平均的には機能すると言っています。でもあなたは平均ではなく、あなた自身なのです。
📊 主要統計
主要ウェアラブルの回復アルゴリズム比較
| デバイス | 主要HRV測定タイミング | 推定HRV重み付け | 独自の入力項目 | ベースライン期間 |
|---|---|---|---|---|
| Whoop 4.0 | 起床直前の測定値 | 約40% | 呼吸数、SpO2 | 30日間 |
| Garmin(Body Battery) | 深い睡眠フェーズ中 | 約30% | ストレススコア、トレーニング負荷フォーカス | 7〜14日間 |
| Oura Ring Gen 3 | 夜間の最低値 | 約35% | 皮膚温度、動き | 14日間 |
| Apple Watch Series 10 | 夜間平均 | 約35% | 心肺機能トレンド、標高 | 14日間 |
| Polar Vantage V3 | 朝の起立テスト | 約45% | ランニングパワー、脚の回復 | 28日間 |
重み付けは特許出願と検証研究に基づく推定値です。正確な計算式は各社の機密情報です
❓ よくある質問
なぜフィットネストラッカーによって回復スコアが違うのですか?
回復アルゴリズムが自分のベースラインを学習するのにどれくらいかかりますか?
回復スコアが低い時はワークアウトをスキップすべきですか?
カフェインやアルコールは回復スコアに影響しますか?
疲れ切っているのに回復スコアが高いのはなぜですか?
長く寝れば回復スコアは必ず上がりますか?
回復スコアはトレーニングの判断に使えるほど正確ですか?
参考資料
- Validation of Wearable Recovery Metrics in Athletic Populations — Sports Medicine, 2025
- Heart Rate Variability Algorithms in Consumer Wearables: A Comparative Analysis — Journal of Sports Sciences, 2024
- Sleep Stage Detection Accuracy in Fitness Trackers — Sleep Medicine Reviews, 2024
- Training Load Monitoring and Recovery Optimization — International Journal of Sports Physiology and Performance, 2025
