파크펙터 포스팅입니다. 파크펙터라는 기록에 대한 개인적인 생각은 우선 뒤로 미루고, 일단 기록을 보도록 하죠.
파크펙터는 구장 효과, 즉 특정 구장이 투수에게 유리한지 타자에게 유리한지를 따져보는 기록입니다. 투수에게 유리한 구장을 홈구장으로 사용하는 투수는 개인기록에 그만큼 어드벤티지가 있는 것이기 때문에, 개인기록에 구장의 효과가 미치는 영향을 따지는 용도로 사용됩니다.
파크펙터를 구하는 공식도 여러가지가 있습니다. 미국의 경우, 일단 팀 자체가 많기 때문에 구장별로 다양한 기록이 도출될 수 있고, 콜로라도 경기장처럼 자연적 조건이 명백히 경기에 영향을 주는 곳도 있으므로 파크펙터가 유의미한 데이터가 나오기도 하며, 따라서 조금이라도 더 신빙성 있는 결과값을 얻기 위한 다양한 계산법이 나와 있습니다.
여기서는 짐 퍼테이도가 고안한 방식의 파크펙터 계산법으로 소개하겠습니다. 계산방식을 설명하는 것만으로도 포스팅이 빼곡해지니, 계산방식이 잘 정리된 블로그를 연결해드리겠습니다.
http://kini.tistory.com/422
http://blog.naver.com/jin37416?Redirect=Log&logNo=70012126207
참고로, 저는 보조구장(청주 마산 제주)은 완전히 무시하고 데이터를 계산했습니다. 이 세 구장은 경기수가 적어 표본에 신뢰도가 떨어지기 때문입니다. 가령, 롯데는 마산에서 9경기를 치뤘는데, 이것은 완전히 무시했기 때문에 롯데의 홈경기는 사직에서의 57경기만 계산합니다. 원정팀 역시 보조구장에서의 기록은 함께 무시합니다.
또 같은 홈구장을 쓰는 두산과 LG도 따로 계산했습니다. 두산 대 LG의 경기도 홈과 원정을 구분하여 계산했습니다. 구장의 효과를 따지자는 것이기 때문에 엄밀히 말하면 두산과 LG는 하나의 팀으로 보고 계산해야 맞지만, 그렇게 하면 너무 복잡해지기 때문에 편의상 구분하였습니다.
위에 연결해드린 블로그에서 짐 퍼테이도의 계산방식으로 뽑은 홈런 파크펙터가 이렇습니다. 평균이 1이라고 했을 때, 대전구장에서는 홈런이 30% 정도 더 잘 나오고, 사직구장에서는 20% 정도 덜 나온다는 결과입니다. 즉, 1보다 작을수로고 투수에게 유리한 구장, 1보다 클수록 타자에게 유리한 구장이라는 것입니다. 계산할 때 홈런 대신 안타/2루타/3루타/득점 등 무엇을 대입하든 해당 부문의 파크펙터를 구할 수 있습니다.
만약 모든 구장의 파크펙터가 동일하다는 가정 하에 홈런 순위를 다시 쓰면 어떻게 될까요? 위 파크펙터를 응용하여, 모든 선수가 똑같은 구장에서 경기를 했다고 가정했을 때의 홈런 10걸은 이렇게 변합니다.
물론 홈런에는 소수점이 나올 수 없으나 순위를 정리하기 위해 소수점까지 계산했습니다. 보시다시피, 가장 홈런과 친하지 않은 구장을 홈구장으로 쓰는 롯데 선수들의 조정홈런값이 월등히 뜁니다. 반대로 가장 홈런과 친한 구장을 홈구장으로 쓰는 한화 선수들의 조정홈런값은 많이 떨어졌습니다.
그런데 이렇게 기록을 정리해놓으면, "역시 김태균의 홈런왕은 구장빨이네"라는 식으로 생각하시는 분들이 계실지 모르겠습니다. 파크펙터를 따질 때는 꼭 이 부분을 생각해야 합니다. 홈런타자가 많아서 홈런 친화적인 구장으로 나온 것인지, 홈런 친화적인 구장이라 홈런이 많은 것인지. 정답은 없습니다. 보시는 분들의 개인적인 판단에 맡기겠습니다.
또 이렇게 생각하실 수도 있습니다. "한화의 공격력이 무서웠던 것도 순전히 구장빨이었어"
특정 선수의 특정 부문 기록만 놓고 보면 파크펙터의 영향이 클 수도 있습니다. 그러나 한 시즌 통틀어 한 팀의 공격력 전체를 논한다면 파트펙터의 영향은 미미하다고 봅니다. 대전구장은 펜스 거리가 가장 짧기 때문에 홈런이 많다고 칩시다. 반대로 대전구장은 그만큼 페어 지역이 타구장보다 좁기 때문에 안타가 나올 확률은 떨어집니다. 홈런만 가지고 경기할 것이 아닌 이상, 이처럼 각각의 장단점이 다 있는 것이고, 따라서 한 팀의 공격력 전체를 파크펙터로 폄하하기는 무리가 있다는 것입니다.
아래는 홈런 대신 TA를 가지고 파크펙터를 계산한 것입니다. TA는 홈런뿐 아니라 안타와 장타, 도루 등 공격력 전반에 걸친 다양한 기록들이 고루 반영되었기 때문에 공격력을 비교하는 잣대로 유용하다고 보고 TA를 기준으로 정리해보았습니다.
순위가 바뀐 것은 둘째치고, 각 구장의 격차가 현저히 줄었습니다. 평균(1)을 기준으로 2~30%까지 편차가 발생하던 홈런 파크펙터와 달리, TA 파크펙터는 편차가 2~4% 정도에 불과합니다. 즉, 홈런뿐 아니라 안타와 장타 등 공격 전반에 걸친 영향력을 따지자면 파크펙터의 효과는 크지 않다는 반증이라고 봅니다.
개인별 조정 TA 순위도 마찬가지의 결과를 보여줍니다.
규정타석의 70% 이상을 채운 타자를 대상으로 TA 순위를 뽑아본 뒤, 파크펙터를 대입해 조정한 결과의 순위와 비교해보았습니다. 보시다시피 순위에 큰 차이가 발생하지 않습니다. 위에 홈런 순위가 차이가 생기는 것과 비교해보면 더욱 분명하지 않습니까.
잠실구장의 데이터도 관심있게 볼 부분입니다. 가장 규모가 큰 야구장답게 홈런은 덜 나오지만, TA로 보면 오히려 타자들에게 유리한 구장으로 나옵니다. 물론 이것은 "뛰는 야구"를 중시하는 두산과 "도루왕 보유팀" LG의 홈구장이라는 점도 감안이 되었겠지요(TA 계산 시 도루도 들어가니 말입니다). 하지만 그것만으로 이런 차이를 설명할 수는 없을 겁니다. 구장이 커서 홈런이 덜 나오는 대신, 안타나 장타가 나올 확률은 더 높다는 뜻으로 볼 수 있을 겁니다. 즉, 잠실이 투수에게 유리한 구장이라는 편견은 옳지 못하다는 것이지요.
그래서 개인적으로 아직 한국야구에서 파크펙터는 유의미한 데이터는 아니라고 생각합니다. 보다 유의미한 데이터를 만들기 위해 3~5년치 데이터의 평균을 내기도 하는데, 여기서 그렇게까지는 하지 않겠습니다. 다만 제가 이런 기록 정리를 3~5년 더 하다보면 그 때는 자연스럽게 그런 정리가 가능해지겠지요. ^^
다음 포스팅에서는 투수와 관련된 자잘한 기록을 조금 더 살펴보겠습니다. 그런데 우선 2008년 결산 타이밍을 놓치면 안될 것 같아서, 우선 그 쪽에 역량(?)을 모아야 할 것 같습니다. 세이버 매트릭스 기획 포스팅은 기회가 될 때 꾸준히 업데이트할테니, 이런 기록도 있구나, 라는 시선으로 가볍게 즐겨주시기 바랍니다.
- 인용한 기록은 아이스탯(www.istat.co.kr)을 기준으로 계산했습니다.