수면·발행 2026년 5월 22일

갤럭시워치·애플워치 수면 측정, 얼마나 믿을 수 있을까? — 연구로 본 소비자 수면 트래커의 정확도

스마트워치 수면 측정 · 갤럭시워치 수면 정확도 · 애플워치 수면 정확도 · 수면 트래커 믿을 만한지
갤럭시워치·애플워치 수면 측정, 얼마나 믿을 수 있을까? — 연구로 본 소비자 수면 트래커의 정확도

한 줄 요약

스마트워치는 전체 수면 시간은 어느 정도 추정할 수 있습니다. 하지만 깊은 잠이나 REM 수면처럼 세부 수면 단계를 구분하는 정확도는 아직 낮고, 수면 장애를 진단하는 용도로는 사용할 수 없다는 것이 현재 공식 입장입니다.

아침에 확인한 스마트워치의 ‘깊은 잠 2시간’, 정말 맞을까요?

아침에 일어나 스마트워치 앱을 확인하는 분들이 많습니다.

“어젯밤 REM 수면 1시간 12분, 깊은 잠 45분”처럼 구체적인 숫자가 나오면 꽤 정확해 보이죠.

그런데 이 숫자들은 실제로 얼마나 믿을 수 있을까요?
연구 결과를 살펴보면, 생각보다 복잡한 이야기가 나옵니다.

스마트워치는 수면을 어떻게 측정할까요?

수면 측정의 기준으로 여겨지는 검사는 수면다원검사(PSG, polysomnography) 입니다. 수면다원검사는 뇌파, 눈 움직임, 근긴장도 등을 동시에 측정해 수면 단계를 판별하는 병원 검사입니다.

반면 스마트워치에는 이런 장비가 없습니다. 대신 손목의 움직임을 감지하는 가속도계와 심박수 데이터를 조합해 사용자가 잠들었는지, 어느 수면 단계에 있는지를 알고리즘으로 추정합니다. 움직임이 적고 심박수가 낮으면 잠든 상태로 판단하는 식입니다.

하지만 이 방식은 PSG와 출발점부터 다릅니다. 뇌파 없이 수면 단계를 구분하는 것은, 표정과 걸음걸이만 보고 사람의 감정 상태를 판단하려는 것과 비슷한 어려움이 있습니다.

총 수면 시간은 어느 정도 맞지만, 길게 기록되는 경향이 있습니다

2024년 아일랜드 유니버시티 칼리지 더블린 연구팀이 24편의 체계적 문헌고찰을 종합한 리빙 엄브렐라 리뷰에 따르면, 웨어러블 기기의 수면 측정은 총 수면 시간을 실제보다 길게 기록하는 경향이 있었습니다. 오차 비율도 대체로 10%를 넘는 것으로 보고됐습니다.

2019년 텍사스 대학교 연구팀이 Fitbit 기기 관련 연구 22편을 종합한 체계적 문헌고찰 및 메타분석에서도 비슷한 결과가 나왔습니다. Fitbit은 수면다원검사와 비교했을 때 총 수면 시간을 약 7~67분 더 길게 기록했습니다. 중간에 잠깐 깼다가 다시 잠든 시간을 계속 잠든 상태로 처리하는 경우가 많기 때문입니다.

반대로 중간에 깬 시간, 즉 WASO는 약 6~44분 더 짧게 기록됐습니다.

따라서 앱에 8시간으로 기록됐다고 해서 실제로 정확히 8시간을 잤다고 보기는 어렵습니다. 전반적으로는 실제보다 “조금 더 많이 잔 것처럼” 표시되는 경향이 있습니다.

REM 수면과 깊은 잠 구분은 훨씬 더 어렵습니다

잠을 ‘잤다 / 안 잤다’로 구분하는 것과, 수면이 REM인지 깊은 잠인지까지 구분하는 것은 난이도가 전혀 다릅니다.

2023년 서울대학교 분당병원 연구팀은 11개 소비자용 수면 트래커를 수면다원검사와 비교한 대규모 검증 연구를 발표했습니다. 참가자 75명을 대상으로 총 349,114개의 수면 에포크, 즉 30초 단위의 수면 구간을 분석했습니다.

연구에 포함된 기기에는 갤럭시워치 5, 애플워치 8, Fitbit Sense 2, 구글 픽셀워치, 오우라링 3세대 등이 있었습니다.

수면 단계 분류 성능을 나타내는 macro F1 점수는 기기별로 0.26에서 0.69까지 크게 차이났습니다. 이 점수는 1에 가까울수록 분류 성능이 좋다는 뜻입니다. 가장 성능이 좋았던 기기도 0.69 수준에 머물렀습니다.

특히 깊은 잠은 기기별 편차가 컸고, REM 수면은 전반적으로 과소 또는 과대 추정되는 경향을 보였습니다.

2026년 유타 대학교 연구팀이 실제 환경에서 사용된 소비자용 수면 트래커 연구 29편을 분석한 리뷰에서도 비슷한 결론이 나왔습니다. 총 수면 시간은 중간 수준의 정확도를 보였지만, REM 수면과 깊은 잠 추정은 특히 신뢰하기 어려운 것으로 평가됐습니다.

수면 장애 진단에 사용할 수 있을까요?

공식 입장은 “아직은 아니다”에 가깝습니다.

미국수면학회(AASM)는 2018년 공식 입장문에서 소비자용 수면 트래커는 수면다원검사 기반의 충분한 검증이 부족하고, 수면 장애 진단이나 치료 목적으로 사용할 수 없다고 밝혔습니다.

수면무호흡증, 불면증, 기면증 같은 수면 장애가 의심된다면 스마트워치 데이터를 참고 자료로 볼 수는 있습니다. 하지만 이 데이터만으로 스스로 진단하거나 치료 방향을 결정해서는 안 됩니다. 이런 경우에는 수면 전문 기관에서 검사를 받는 것이 더 정확합니다.

그렇다면 스마트워치 수면 데이터는 어디에 유용할까요?

단점만 있는 것은 아닙니다. 스마트워치가 잘하는 영역도 있습니다.

첫째, 장기적인 수면 패턴을 파악하는 데 도움이 됩니다.

어젯밤 정확히 몇 시간 잤는지는 다소 오차가 있을 수 있습니다. 하지만 일주일, 한 달 단위로 수면 시간이 어떻게 변하는지 살펴보는 데는 유용합니다. 예를 들어 야근이 많았던 기간에 수면 시간이 줄었는지, 운동을 시작한 뒤 수면 시간이 늘었는지 같은 흐름은 확인할 수 있습니다.

둘째, 취침 시간과 기상 시간의 일관성을 확인할 수 있습니다.

수면 단계보다 취침 시간과 기상 시간은 상대적으로 파악하기 쉽습니다. 내가 매일 비슷한 시간에 자고 일어나는지, 주말마다 수면 리듬이 크게 흔들리는지 확인하는 데 도움이 됩니다.

셋째, 나만의 기준을 세우는 데 유용합니다.

오늘 유독 피곤하다면 수면 데이터를 보면서 평소보다 덜 잤는지, 중간에 자주 뒤척였는지 확인해볼 수 있습니다. 중요한 것은 절대적인 수치보다 “평소의 나와 비교했을 때 오늘이 어땠는지”를 보는 것입니다.

반대로 “어젯밤 깊은 잠이 평소보다 10분 적었다”는 식의 세부 수치에 지나치게 신경 쓰는 것은 오히려 역효과가 날 수 있습니다. 수면 연구자들은 이를 오소음니아(orthosomnia) 라고 부릅니다. 수면 트래커 데이터에 집착하다가 오히려 수면 불안이 커지고, 수면의 질이 낮아지는 현상을 말합니다.

정리

스마트워치의 수면 측정은 전체 수면 시간을 대략 파악하는 용도로는 어느 정도 활용할 수 있습니다. 하지만 REM 수면이나 깊은 잠 같은 세부 수면 단계는 기기마다 차이가 크고, 전반적으로 신뢰도가 낮은 편입니다.

또한 미국수면학회는 소비자용 수면 트래커를 수면 장애 진단이나 치료 목적으로 사용하기에는 근거가 부족하다고 밝힌 바 있습니다.

따라서 스마트워치 수면 데이터는 장기적인 수면 패턴과 취침·기상 리듬을 살펴보는 용도로 활용하는 것이 좋습니다. 반면 하루하루의 세부 수치에 지나치게 의존하거나, 수면 장애를 스스로 진단하는 기준으로 삼는 것은 피하는 것이 현실적입니다.

자주 묻는 질문

갤럭시워치나 애플워치의 수면 측정은 정확한가요?

총 수면 시간은 어느 정도 추정할 수 있지만, 실제보다 더 길게 기록되는 경향이 있습니다. 수면 단계, 즉 REM 수면이나 깊은 잠의 분류는 기기마다 차이가 큽니다. 갤럭시워치 5와 애플워치 8을 포함한 11개 기기를 비교한 연구에서도 가장 성능이 좋았던 기기의 macro F1 점수는 0.69 수준이었습니다.

스마트워치로 불면증이나 수면무호흡증을 진단할 수 있나요?

현재로서는 어렵습니다. 미국수면학회(AASM)의 공식 입장에 따르면, 소비자용 수면 트래커는 수면 장애 진단이나 치료 목적으로 사용할 수 없습니다. 수면무호흡증, 불면증, 기면증 등이 의심된다면 수면 전문 기관에서 검사를 받는 것이 좋습니다.

REM 수면이나 깊은 잠 수치는 믿어도 될까요?

참고 정도로 보는 것이 좋습니다. 수면 단계 구분은 총 수면 시간 측정보다 훨씬 어렵습니다. 특히 REM 수면과 깊은 잠은 여러 연구에서 신뢰하기 어려운 영역으로 지적됐습니다. 따라서 “어젯밤 깊은 잠이 정확히 몇 분이었다”는 식으로 받아들이기보다는 대략적인 참고 자료로 보는 것이 현실적입니다.

스마트워치 수면 데이터는 어떻게 활용하는 게 좋을까요?

하루하루의 세부 수치보다 장기적인 흐름을 보는 데 활용하는 것이 좋습니다. 최근 수면 시간이 줄고 있는지, 취침·기상 시간이 얼마나 일정한지, 스트레스가 많았던 기간에 수면 패턴이 어떻게 달라졌는지 확인하는 용도로 쓰면 도움이 됩니다.

기기마다 수면 측정 정확도가 다른가요?

네. 같은 손목 기반 스마트워치라도 사용하는 센서와 알고리즘이 달라 정확도 차이가 납니다. 11개 기기를 비교한 연구에서 macro F1 점수는 0.26에서 0.69까지 다양하게 나타났습니다. 어떤 수면 단계를 잘 잡아내는지도 기기마다 달랐기 때문에, 특정 기기의 수면 단계 수치를 절대적인 기준으로 보기는 어렵습니다.

참고 논문