Code States Section1 Project
프로젝트 목적 :
게임 회사 데이터 팀에 일하는 입장으로 가정하에 다음 분기에 어떤 게임을 설계해야할지 기존의 데이터에 기반하여 인사이트를 얻고, 의사결정을 하고자 하는 것이 목표인 프로젝트입니다.
기존 데이터 셋 Data Description
9개의 열과 16598개의 행으로 이루어진 데이터 셋입니다.
- Name : 게임의 이름입니다.
- Platform : 게임이 지원되는 플랫폼의 이름입니다.
- Year : 게임이 출시된 연도입니다.
- Genre : 게임의 장르입니다.
- Publisher : 게임을 제작한 회사입니다.
- NA_Sales : 북미지역에서의 출고량입니다.
- EU_Sales : 유럽지역에서의 출고량입니다.
- JP_Sales : 일본지역에서의 출고량입니다.
- Other_Sales : 기타지역에서의 출고량입니다.
데이터 셋을 기반으로 가설을 설정하여 분석하였습니다.
1. 게임 트랜드는 존재한다.(가설)
게임 트랜드가 존재하는지 알아보기 위해 가장 직관적으로 측정 가능한 연도 컬럼을 이용하였습니다.
기존 데이터 셋의 연도는 1980년 ~ 2020년이므로 5년마다 묶어 범위를 나눈다음 범위별 장르, 플랫폼의 개수를 파악하여 가장 높은 것이 트랜드로 가정하였습니다.
2. 게임 트랜드 가설에 대한 검정
연도, 장르, 플랫폼을 서로에 대한 관계 검정을 파악합니다.
연도-장르, 장르-플랫폼, 연도-플랫폼으로 2 sample chi_square test를 실시해 p-value 값으로 파악합니다.
# H0 : 연도-장르, 장르-플랫폼, 연도-플랫폼은 서로 관계가 없다. (독립)
# H1 : 연도-장르, 장르-플랫폼, 연도-플랫폼은 서로 관계가 있다. (종속)
으로 가설을 설정합니다.
3가지 경우 모두 p-value 값이 0.05보다 낮음으로 귀무가설(H0)을 기각합니다.
따라서 연도-장르, 장르-플랫폼, 연도-플랫폼 모두 서로간의 관계가 있으며 연도별로 인기있는 장르와 플랫폼이 변화, 유지되기 때문에 년도별 게임트랜드는 존재한다고 할 수 있습니다.
3. 각 지역의 출고량 데이터 단위가 달라서 통일화를 진행합니다.
4. 출고량 통합을 통해 시장규모의 차이를 확인하고 지역별로 출고량을 비교 검정합니다. (t-test)
지역별 시장 규모의 차이가 미미한 것을 확인할 수 있습니다.
5. 지역별 전체기간의 인기있는 장르 TOP3을 뽑습니다.
6. 지역과 장르와의 연관성을 검정합니다.(카이제곱)
모든 지역과 장르의 연관성은 p-value 값이 0.05보다 낮음으로 연관성이 존재한다는 결과가 나왔습니다.
따라서 각 지역과 장르는 모두 서로간의 관계가 있으며, 지역별로 인기있는 장르는 모두 Action장르로 동일한 것을 확인할 수 있습니다.
7. 각 지역별로 출고량이 높은 게임 TOP10을 선정합니다.
NA지역으로 시각화한 것입니다.
NA지역 출고량이 높은 게임 제작사 시각화입니다.
네 지역 모두 출고량이 높은 게임 10개를 추려봤을 때, 게임 제작사인 닌텐도가 가장 큰 점유율을 차지하는 것을 볼 수 있습니다.
하지만 닌텐도 사의 게임 장르를 시각화하였을 때,
다음과 같음을 볼 수 있고 이는 출고량은 높지만 닌테도 사가 모든 지역의 가장 인기장르인 Action장르에는 다소 약한 모습을 보이는 것을 알 수 있습니다.
또한 다음 그래프에서 보듯이 연도가 지남에 따라 Action 장르의 게임이 트랜드가 되어 Action장르에 약세를 보이던 닌텐도 사의 상승세가 하락하는 모습을 볼 수 있습니다.
반면 PS4의 경우 36.4퍼센트의 비율이 Action게임인 것을 볼 수 있습니다.
또한 다음 그래프를 통해 Sports게임과 Action게임의 그래프로 트랜드가 변화하는 것을 볼 수 있습니다.
8. 최종 결론
게임 트랜드가 존재하는 것을 확인하고 지역별 인기장르를 확인한 다음
지역별 출고량을 조사하여 인기있는 게임사와 게임사 별로 출시하는 장르를 분석하였습니다.
따라서 다음 분기의 게임은 PS사의 Action 장르 게임을 출시하여야 합니다.
다음은 프로젝트를 진행한 코드가 담긴 페이지입니다.
'프로젝트' 카테고리의 다른 글
흉부(폐렴) X-ray 이미지를 통한 이진분류 학습 (0) | 2021.11.23 |
---|---|
와인 분석 프로젝트(with machine learning) (0) | 2021.11.23 |