Project_Log

[ Python Project ] EPL 데이터 분석을 통한 토트넘의 현실 - 1

Jerry_JH 2021. 4. 15. 16:47
728x90

참고로 나는 이제 막 4년 차가 된 토트넘 팬이다.

2018년 DESK의 경기력과 16-17 시즌의 준우승을 보고 그때부터 토트넘 팬이 되었다.

(특히 2018-19 챔스는 정말 잊을 수가 없다.)

 

2019년 여름에는 토트넘 - 맨시티 경기 직관으로 보고 왔을 정도로 참팬이다.

 

맨시티 홈이라서 많이 아쉽

모우라 골장면 - 하지만 맨시티 홈이라서 좋아할 수가 없다..  (19/20 2R 맨시티 vs 토트넘)

갑자기 왜 토트넘 팬이 된 이야기를 하는지 의문일 수도 있다.

 

이 게시글을 토트넘에 대해서 (데이터 수치를 보고) 비판을 할 예정이기 때문이다. 


지금 현재 학교 강의로 Python Project라는 과목을 듣고 있다. 

자유 주제로 개인 프로젝트 발표를 하는 과제가 있었는데, 무엇을 해야 되는지 고민하다가.

"20/21 PL 31R 토트넘 - 맨체스터 유나이티드" 경기를 보고, 충격을 받아서 토트넘의 우승 가능성이 있는지.. ,

우승을 하려면 어떠한 경기력을 보여줘야 되는지 궁금해서 이번 프로젝트를 데이터 분석으로 하게 되었다.

 

발표시간이 5분 이내로 몹시 짧았기 때문에 발표 때 못했던 이야기들을 블로그를 통해 풀이할 예정이다.

 

순서는 이런 식으로 진행된다.

1.  Project - introduction / 개발 방법

2. 현재 토트넘에 대해

3. 우승팀 / 강등팀의 승점

4. 우승하는 팀들의 공통점 (공격력, 수비력 측면)

5. 결론 

 

앞으로의 모든 수치들은 모두 다 직접 뽑은 결과들이다. 

어디서 가져온 데이터들은 없고 오로지 경기 기록 데이터만 가지고 분석을 한 결과이다.

얕은 데이터 분석 스킬만 가지고 코딩을 했기 때문에 부족한 점이 많을 것이다.

분석 결과에 대해 결론적인 부분은 오로지 데이터만 보고 생각한 나의 주관적인 생각이다.


[ Project - introduction ] 

프로젝트 명 : 우승하고 싶다.. 토트넘.. 

 

개발 배경 :

 

Big 6라고 잉글랜드 프리미어 리그(EPL)의 신흥 강호 3팀과 전통 강호 3팀을 합쳐서 부르는 명칭이 있다. 

(아마 축구를 좋아하시는 분들은 다 알 듯하다.)

2000년 이후 Big 6 의 트로피 수  / 출처 : https://www.fmkorea.com/3052065309 

(토트넘 경기) 경기를 패한 후 sns에서 보면 이 짤을 보곤 한다. 

볼 때마다 너무나도 답답한 현실이다.

Big6라고 불리면서 2000년 이후 획득한 트로피는 1개이다. (카라바오 컵으로 2008년에 우승했다.)

트로피 크기도 작아서 더욱더 초라해 보인다.

 

아무튼 토트넘은 강등도 안되고 우승도 못하고 많이 어중간한 팀이라고 생각한다. 

항상 보면 막강한 전력을 가지고 있는 것 같지만 제대로 활용을 못하고 있고,

Big6에서 리그 우승 경험도 가장 오래되었다. ( 1960-61 시즌이 제일 최근 리그 우승 ) 

 

개발 내용 : 

앞 내용에서도 말했듯이 데이터 분석을 통해서 토트넘이 왜 이렇게 못하는지 지금 상태가 어느 정도인지 

역대 우승팀들과 비교해볼 예정이다. 또한 우승 가능성이 있는지도 수치적으로 볼 예정

 

개발 방법 : 

데이터 분석을 하기 위해 데이터는 kaggle에서 가지고 왔다.

 https://www.kaggle.com/irkaal/english-premier-league-results

 

English Premier League Results

Premier League Results from 1993-94 to 2020-21

www.kaggle.com

이 데이터는 EPL 1993-94 시즌부터 현재 진행 중인 2020-21 시즌 4월 5일까지의 최신 데이터가 있다. 

(경기를 하면 금방 업데이트되는 것 같다.)

 

shape :  10724 x 23 

column : 시즌, 경기 날짜, 홈/어웨이 팀 , 홈/어웨이 득점, 결과, 득점 수, 슈팅 수, 유효슈팅 수 , 심판, 파울, 경고, 퇴장 등의 23개가 있다.

 

라이브러리 : Pandas , matplotlib 만 사용했다.

 

Pandas: data가 csv로 되어 있어서 불러올 때랑 데이터 프레임으로 데이터 분석을 했기에 사용되었고,

matplotlib : 정리한 데이터를 시각화할 때 사용했다. 

 

[Load Map]

캐글에서 다운 받은 데이터는 이렇게 생겼다.

1) pandas, python 코드를 이용해서 자신이 원하는 데이터로 뽑아낸다.


1994년의 순위

2) 유의미한 데이터로 만든 다음 matplotlib을 이용해 시각화와 describe() 같은 함수를 이용해 분석을 한다.


시각화한 데이터와 describe 함수를 이용한 예시이다. 안에 내용은 나중에 설명이 될 예정

3) 분석한 데이터와 시각화를 가지고 나의 생각을 적어보았다.


[ 현재 토트넘에 대해 ] 

 

 

Tottenham Hotspur Football Club

- 1882년의 창단

- 현재 감독 : Jose Mourinho

- 주요 선수 : Lloris(C), Kane, Son, Hojbjerg 등이 있다. 

 

- 현재 순위는 4/5 기준으로 7등에 위치한다.  

 

 

 

 

 

 

 

 

 

 

 

4/5 기준으로  팀당 골 득실을 모아 보았다.

 

 

파란색은 득점 , 주황색은 실점 

득점을 기준으로 내림차순을 했을 때 5위에 위치하고 있고,

무리뉴의 수비축구답게 실점이 주변의 상위권팀들의 비해 적다는 것을 알 수 있다. 

하지만 현재 순위는 7등인 것을 보아, 골득실이 순위와 상관관계가 어느 정도는 있지만 높은 상관관계 수준은 아닌 것 같다.

 

여기서 궁금증이 생긴다. 우승을 하기 위해서는 과연 어느 정도의 승점이 필요하고, 어느정도의 골과 슈팅이 필요할까?

 

다음 포스팅에서 이어질 예정...

 

728x90