[스포츠 인공지능 논문 리뷰] 머신러닝을 활용한 남자 청소년 운동선수의 주요 체력요인 분석 (Essential elements of physical fitness analysis in male adolescent athletes using machine learning)

안녕하세요. 오늘은 "머신러닝을 활용한 남자 청소년 운동선수의 주요 체력요인 분석"이라는 논문 리뷰를 진행하겠습니다. 이 논문은 2024년 Plos one에 게재된 저희 메디스포츠연구소에서 작성한 논문입니다. 여러분이 생각할 때 이 연구가 무엇인가?라고 생각할 수도 있겠지만, 컴퓨터가 남자 청소년 운동선수의 체력 데이터를 학습하여 각 운동선수들의 운동 종목을 분류하고, 어떤 체력 요인이 가장 중요한지 분석해 봤다는 것에 의의를 두셔도 좋을 것 같습니다.

 

[전문 링크] https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0298870

[출저] Lee, Y. H., Chang, J., Lee, J. E., Jung, Y. S., Lee, D., & Lee, H. S. (2024). Essential elements of physical fitness analysis in male adolescent athletes using machine learning. Plos one, 19(4), e0298870.


 

체력을 증가시키기 위해서는 신체조성, 근력, 근지구력, 파워, 민첩성 및 협응력 등 다양한 요인들이 중요하며, 체력을 평가하여 훈련계획을 세우는 것은 매우 중요합니다. 스포츠에는 다양한 종목의 운동이 있으며, 각각의 운동 종목에는 필수적인 체력 요소가 존재합니다. 육상 선수에게는 빨리 달리기 위한 폭발적인 파워가, 축구 선수에게는 빠른 방향전환을 위한 민첩성이, 야구 선수는 공을 빨리 던지고 치기 위한 근력이, 수영선수에게는 빠른 스트로크를 위한 강한 상체와 코어 근력이, 마지막으로 배드민턴 선수에게는 코트를 쉬지 않고 움직일 수 있는 지구력과 민첩성 등이 필수적입니다. 따라서, 스포츠 종목에 특화된(Sports sports-specific) 체력 요소를 파악하는 것은 각 운동 종목에 특화된 훈련 방법을 개발하고 운동수행력(performance) 향상에 매우 중요합니다.

 

이 연구에서는 총 1,434명의 남자 청소년 운동선수 데이터를 활용하였고, 아래 그림은 각 종목 별 대상자 수와 신체적 특성입니다.

대상자의 신체적 특성

측정한 체력으로는 신체조성(체지방률, BMI, 체중), 기초체력(악력, 배근력, 팔굽혀펴기, 윗몸일으키기, 제자리멀리뛰기, 서전트점프, 사이드스텝, 좌전굴, 체후굴, 눈-손 협응력)입니다. 

 

위와 같은 다양한 체력 요인을 분석하기위해서 사용한 알고리즘(Logistic regression, Support vector machine, ElasticNet, Artificial neural network, random forest, XGBoost)은 총 6개입니다. 머신러닝의 여러 알고리즘은 컴퓨터가 데이터를 통해 학습하고 데이터의 패턴을 찾고나 예측을 잘 수행할 수 있도록 다양한 수학적 계산과 최적화 과정을 수행한다고 생각하면 될 것 같습니다. 이 연구에서 다양한 알고리즘을 활용한 이유는 어떤 알고리즘이 남자 청소년 운동선수의 체력 데이터에 가장 적합한지, 즉 정확도가 높은 알고리즘이 무엇인지 확인하기 위한 것입니다. 

 

결과를 보겠습니다.

우선, 운동 종목 간 알고리즘의 분류 성능 비교 입니다. 결과 그림은 상관관계 분석 시 그림과 비슷한데요. 예를 들어 맨 왼쪽의 맨 위의 그림은 육상(Track & field)과 축구(Football) 선수간의 비교입니다. 전체적으로 Random forest와 XGBoost가 가장 높았으며, 두 알고리즘 간에는 유의미한 차이가 없었습니다. 즉, 두 알고리즘이 가장 높은 결과를 나타났음을 설명하고 있습니다.

분류 성능 비교

 

자 그러면, 컴퓨터는 어떻게 이 운동선수들을 분류할 수 있었을까요?

-> 이 연구에서는 다양한 체력 요인을 통해 분류를 하였습니다.

 

그러면, 컴퓨터가 운동선수를 분류하는데 어떤 체력 요인이 가장 크게 기여를 했을까요?

 

위 그림은 SHAP value라는 방식으로 컴퓨터가 어떤 요인을 가장 중요하게 판단하였는지 알 수 있습니다. 그림을 보면 빨간색과 파란색 점(dot)이 보이실 텐데요. 빨간색은 수치(value)가 높은, 파란색은 낮음을 나타냅니다. 그래프에서 0을 기준으로 왼쪽은 행으로 나열된 종목들(Track & field, football, baseball, swimming) 그리고 오른쪽은 열로 나열된 종목(football, baseball, swimming, badminton)들입니다. 조금 더 설명을 드리자면, 아까와 동일한 예로 맨 왼쪽의 맨 위에는 육상(Track & field)과 축구(Football) 선수간의 비교를 볼 때 제일 위에 있는 체력 요인은 제자리멀리뛰기(Standing long jump; SLJ)라는 결과가 나타났으며, 0을 기준으로 왼쪽(육상)에는 빨간색 점들이 오른쪽(축구) 파란색 점들이 있는 것을 확인할 수 있습니다. 즉, 컴퓨터가 남자 청소년 육상과 축구 선수를 구별하는 가장 중요한 체력 요인은 제자리멀리뛰기이며, 실제로 육상선수는 직선으로 달리기 위한 파워가 중요한 것을 알 수 있습니다. 

 

마지막으로, 남자 청소년 운동선수의 5가지 각 운동 종목의 관계와 top3의 주요 체력 요인의 결과를 파이차트(pie chart)로 활용하여 하나의 그림으로 제시하였습니다.

파란색 색이 진할 수록 정확도가 높으며, 정확도가 높다는 것은 종목 간의 유사성이 낮다고 해석할 수 있겠습니다. 이러한 연구를 통해서 청소년 운동선수의 종목 특성에 맞는 맞춤형 훈련을 계획할 수 있을 것으로 생각됩니다. 또한, 개발한 모델을 통해서 운동을 처음 시작하는 남자 청소년에게 개인에게 맞는 운동 종목을 추천할 수 있을 것이라고 생각됩니다. 여전히, 더 많은 기관의 데이터, 여성, 다양한 연령층 대상으로 연구가 더 필요할 것으로 생각됩니다.

 

질문이 있으시면, 편하게 글 남겨주시면 감사드리겠습니다.

 

더 많은 정보를 원하신다면 아래 블로그를 참고해주세요.

https://blog.naver.com/medisportslab

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유