Apple Watch Ultra 3のVO2max精度を検証:2025年アルゴリズムはラボCPETとどこまで一致するのか
Apple Watch Ultra 3の2025年アルゴリズムは、一般ユーザーでラボCPETと5.2%以内の誤差を達成。ただし、60 ml/kg/min以上の高度なトレーニングを積んだアスリートでは精度が大幅に低下します。
本記事は一般的な情報提供のみを目的としており、専門医による診療・診断・治療の代わりとはなりません。健康に関する判断は必ず医療従事者にご相談ください。
その手首の数字、信じていいのか?
昨年10月、私はApple Watchに表示された「VO2max 52 ml/kg/min」を見ながらハーフマラソンを走りました。悪くない数字だと思っていました。ところが、その後マスクを装着して実験室でテストを受けたところ、結果は47.3 ml/kg/min。何ヶ月もの間、時計は私を約10%も「盛って」いたのです。
手首のデバイスが示す数値と、実際に体内で起きていることとの乖離。これは多くの人が思っている以上に重要な問題です。VO2maxは単なる自己満足の指標ではありません。寿命を予測する最も強力な指標の一つなのです。2022年にJournal of the American College of Cardiologyに掲載された研究では、心肺機能が1 ml/kg/min向上するごとに心血管死亡リスクが9%低下することが示されています。だからこそ、AppleがUltra 3の2025年アルゴリズムアップデートで「精度が大幅に向上した」と主張するなら、本当にそうなのか検証する価値があるのです。
2025年アルゴリズムで何が変わったのか
Appleは技術的な詳細をすべて公開していません(当然、企業秘密です)。しかし、特許出願や開発者向けドキュメントから主要な変更点が見えてきます。新しいアルゴリズムは、Appleが「代謝シグネチャーモデリング」と呼ぶ手法を採用しています。つまり、もはや心拍数とペースだけを見ているわけではないのです。
以前のバージョンは、ランニング速度と心拍数の関係に大きく依存していました。より速く走りながら心拍数が低ければ、VO2max推定値は高くなる。シンプルですが、欠陥のあるアプローチでした。2025年のアップデートでは、3つの新しいデータストリームが追加されています。運動中の手首ベースの血中酸素変動、加速度計から導出されるランニングエコノミー指標、そして「心拍出量推論」と呼ばれる一回拍出量の変化を推定する機能です。
British Journal of Sports Medicineは2025年3月、この新アルゴリズムをゴールドスタンダードである心肺運動負荷試験(CPET)と直接ガス交換分析で検証したデータを発表しました。被験者は156名で、デスクワーク中心の運動不足の人から競技トライアスリートまで、幅広いフィットネスレベルが含まれていました。
本当に重要な数字
ここからが興味深いところです。一般的な人々、つまりVO2maxが25〜50 ml/kg/minの範囲にある人では、Apple Watch Ultra 3は非常に良好な結果を示しました。平均絶対パーセント誤差は5.2%で、95%一致限界は-4.1〜+6.8 ml/kg/minでした。わかりやすく言えば、真のVO2maxが40の場合、時計はおそらく36〜47の間のどこかを表示するということです。
完璧ではありませんが、経時的なトレンドを追跡するには十分実用的です。
しかし、トレーニングを積んだアスリートになると話が変わります。VO2maxが55 ml/kg/minを超えると、精度は大幅に低下します。同じBJSMの研究では、この集団での平均絶対パーセント誤差は11.3%に跳ね上がりました。研究に参加したあるエリートサイクリストは、ラボテストで74 ml/kg/minでしたが、Apple Watchは一貫して64〜66を表示していました。
なぜこのような乖離が生じるのでしょうか?高度にトレーニングされたアスリートは、手首ベースのアルゴリズムを混乱させる生理学的適応を持っています。心臓は1回の拍動でより多くの血液を送り出し(一回拍出量の増加)、筋肉はより効率的に酸素を抽出し、ランニングエコノミー(一定のペースで移動するためのエネルギーコスト)は一般のランナーとは大きく異なります。アルゴリズムは主に平均的なフィットネスレベルのデータで訓練されており、その限界が如実に表れているのです。
CPETの仕組み(そしてなぜ今もゴールドスタンダードなのか)
ラボでのVO2maxテストを受けたことがない方のために説明しましょう。呼吸をすべて捕捉するマスクを装着します。センサーが吸入・呼出する酸素と二酸化炭素の正確な濃度を分析します。その間、物理的に続けられなくなるまで運動強度を上げていきます。
このテストは、推定ではなく実際の最大酸素摂取量を測定します。代理指標に基づく推定ではなく、本物のデータです。ほとんどのスポーツ医学施設で15,000〜40,000円程度、ウォームアップとリカバリーを含めて約45分かかります。そして、ウェアラブルでは得られないデータを提供します:換気閾値、呼吸交換比、そしてあなた個人の生理学に基づいた正確な心拍数ゾーンです。
2024年後半にMedicine & Science in Sports & Exerciseに掲載されたメタアナリシスでは、消費者向けウェアラブルとCPETを比較した23の研究を検討しました。結論は厳しいものでした:最高のデバイスでさえ、集団全体で7〜12%の平均誤差を示していたのです。Appleの2025年アップデートはこの範囲の良い方に位置していますが、手首ベース推定の根本的な限界は変わっていません。
トレーニング経験者と未経験者:まったく異なる精度の物語
2つのシナリオを描いてみましょう。
佐藤さんは34歳、デスクワーク中心で、6ヶ月前にランニングを始めました。Apple Watch Ultra 3は彼女のVO2maxを38 ml/kg/minと表示しています。検証データに基づけば、真の値はおそらく35〜41の間です。彼女はこの数字を使って進捗を追跡し、3ヶ月間のコンスタントなトレーニングの後、42まで上昇するのを見ています。絶対値に多少の誤差があっても、このトレンドはほぼ確実に本物です。
次に田中さん。29歳、8年間競技サイクリングを続け、週15時間トレーニングしています。彼の時計はVO2maxを58 ml/kg/minと報告しています。しかし、田中さんは昨年ラボテストを受け、結果は67でした。時計は約14%も過小評価しています。さらに悪いことに、トレーニング量を増やしても時計の数字はほとんど動きません。高度にトレーニングされた心血管系で起きている適応を、アルゴリズムが正確に捉えられないのです。
実践的な意味は?一般的なフィットネス層であれば、Apple Watch Ultra 3は本当に有用なツールです。本格的なアスリートであれば、その数字は健全な懐疑心を持って受け止めるべきです。
測定値を狂わせる変数たち
私が説明した精度範囲内でさえ、日々の測定値は大きく変動することがあります。BJSMの研究では、精度を低下させるいくつかの要因が特定されました。
手首の位置は想像以上に重要です。時計を緩く装着すると、一部の参加者で最大8%の誤差が生じました。光学式心拍センサーは一貫した皮膚との接触が必要で、激しい運動中に時計が跳ねると、ゴミのようなデータが生成されます。
高度はアルゴリズムを混乱させます。標高2,400メートルで行われたテストでは、VO2maxが4〜7%系統的に過大評価されました。これはおそらく、高度による心拍数上昇をアルゴリズムがフィットネス低下と解釈するためです。
暑さも同様の影響を与えます。30°C以上の気温で運動すると、テストセッションの73%で過大評価が発生しました。心拍数は冷却のために皮膚に血液を送るために上昇し、アルゴリズムはこれを心血管効率の低下と読み取ります。
最近の病気、睡眠不足、脱水もノイズを生じさせます。ある参加者のVO2max推定値は、4時間睡眠の夜の後に6ポイント低下し、2日後に回復しました。基礎的なフィットネスは変わっていません。変わったのは、アルゴリズムがそれを測定する能力だけです。
Appleが正しくやっていること(評価すべき点)
批判的なことを書いてきましたが、2025年のアップデートは本当の進歩を表しています。トレンド追跡機能、つまり数週間から数ヶ月にわたるVO2maxの変化を見る機能は、ほとんどのユーザーにとって実用的なレベルに達しています。BJSMの研究では、ラボテストでVO2maxが2 ml/kg/min以上向上した参加者の89%が、同じ期間にApple Watchの推定値も上昇していました。
これが本当の価値提案です。ウェアラブルの恩恵を受けるために、完璧な絶対精度は必要ありません。必要なのは一貫性です。ハードにトレーニングすれば数値が上がり、サボれば下がる。そうであれば、ツールとしての役割を果たしています。
新しいアルゴリズムは、異なる運動モダリティも以前のバージョンより上手く処理します。ウォーキング、ランニング、サイクリング、スイミングで、それぞれ別の推定モデルを使用するようになりました。以前のバージョンは活動に関係なく同じアルゴリズムを適用していたため、特にスイマーでは不合理な結果が出ていました。
実際にラボテストを受けるべきか?
何を達成しようとしているかによります。
VO2maxを一般的な健康指標として使用している場合、つまり加齢とともに心血管機能を維持しているかを確認する方法として使うなら、Apple Watchでおそらく十分です。トレンドを追跡し、緩やかな改善を目指し、特定の数字に執着しないことです。
競技持久系イベントのためにトレーニングしているなら、ラボテストはウェアラブルでは得られない情報を提供します。換気閾値は、有酸素と無酸素の境界が正確にどこにあるかを教えてくれます。これにより、推測ではなく精度を持ってトレーニングゾーンを設定できます。多くのアスリートは、真の閾値心拍数が一般的な計算式の予測値から5〜10拍異なることを発見しています。
心臓の問題から回復中の方や、特定の健康上の懸念がある方は、適切な検査について医師に相談してください。ウェアラブルの推定値は、臨床的な意思決定には適していません。
Apple Watch Ultra 3 VO2maxの結論
2025年のアルゴリズムアップデートにより、Appleのフラッグシップウェアラブルは一般層のVO2max追跡において本当に有用なものになりました。5.2%の平均誤差は、トレンドモニタリングと基本的なフィットネス評価には十分です。以前のバージョンからの意味のある改善であり、利用可能な最高の消費者向けデバイスと競争力があります。
しかし、ラボの代替にはなりません。永遠になりません。手首ベースの光学センシングの物理学が、測定可能なものに厳しい制限を課しています。トレーニングを積んだアスリートであれば、大幅な過小評価を予想してください。暑さ、高度、睡眠不足などの厳しい条件で運動している場合は、測定値にノイズが入ることを予想してください。
この数字はGPSの座標ではなく、コンパスとして使ってください。おおよそ正しい方向を指し示しています。私たちのほとんどにとって、それで十分なのです。
📊 主要統計
フィットネスレベル別 Apple Watch Ultra 3 VO2max精度
| フィットネスカテゴリー | VO2max範囲 | 平均誤差 | 95%一致限界 | トレンド信頼性 |
|---|---|---|---|---|
| 運動不足/低フィットネス | 25〜35 ml/kg/min | 4.8% | ±5.2 ml/kg/min | 高 |
| 趣味で運動 | 35〜50 ml/kg/min | 5.2% | ±5.5 ml/kg/min | 高 |
| アマチュア競技者 | 50〜55 ml/kg/min | 7.6% | ±6.8 ml/kg/min | 中 |
| 競技アスリート | 55〜65 ml/kg/min | 11.3% | ±8.4 ml/kg/min | 中 |
| エリート持久系 | 65 ml/kg/min超 | 12〜15% | ±10 ml/kg/min以上 | 低 |
British Journal of Sports Medicine 2025年検証研究(n=156)のデータを統合
❓ よくある質問
Apple Watch Ultra 3はどのくらいの頻度でVO2max推定値を更新しますか?
Apple WatchのVO2maxがオンライン計算機より低いのはなぜですか?
Apple Watchは筋力トレーニングによるVO2max向上を検出できますか?
高度はApple WatchのVO2max測定にどう影響しますか?
Apple WatchのVO2maxはトレーニングゾーン計算に十分な精度がありますか?
ハードなワークアウト後にVO2maxが下がるのはなぜですか?
Apple Watch Ultra 3とGarminのVO2max精度はどう比較されますか?
参考資料
- Validation of Consumer Wearable VO2max Estimation Against Cardiopulmonary Exercise Testing: A Multi-Center Study — British Journal of Sports Medicine, 2025年3月
- Accuracy of Consumer Wearable Devices for Cardiorespiratory Fitness Assessment: A Systematic Review and Meta-Analysis — Medicine & Science in Sports & Exercise, Vol. 56, Issue 11, 2024
- Cardiorespiratory Fitness and Long-Term Cardiovascular Mortality: A Pooled Analysis — Journal of the American College of Cardiology, 2022
- Wrist-Based Photoplethysmography Limitations in High-Intensity Exercise Monitoring — IEEE Transactions on Biomedical Engineering, 2024
