GPA와 IsoP에 이어 이번에는 타자들의 능력을 나타내는 지표 중 조금 더 고차원적인 RC와 XR을 살펴보겠습니다.
RC와 XR은 타율 출루율 OPS 등 다른 기록과는 조금 성격이 다릅니다. 가령, 타율 등의 기록은 그 타자가 타석에서 무언가를 해줄 것인지를 기대하는 성격의 기록입니다. 그런데 RC와 XR은 그 타자가 게임에서 얼마나 득점에 기여하는지를 따져보는 것입니다. 계산방식은 훨씬 복잡하지만 보다 실질적인 공헌도를 따질 수 있기 때문에 세이버 매트리션이 애용하곤 합니다.
아래 기록은 모두 규정타석의 70% 이상(274타석)을 채운 68명의 타자를 기준으로 뽑은 것입니다.
1. RC (Run Created; 득점생산)
RC는 빌 제임스에 의해 고안되었는데, 그는 계속해서 RC 계산방식을 보완하면서 새로운 버전을 발표했습니다. 그래서 여지껏 나온 RC 계산방식만 20가지 넘는다는 글도 본 적이 있습니다. 여기서는 세 가지 산출공식에 따라 RC를 뽑아볼 것입니다. 이하부터는 편의를 위해 각각 RC1, RC2, RC3로 표기합니다.
먼저 RC의 베이직입니다.
RC1 = { 출루율 * 루타수 }
이것이 RC의 출발이었습니다. 산출공식이 매우 간단합니다. 빌 제임스는 치밀한 분석을 통해 여기에서 다시 계산방법을 복잡하게 만들기 시작했습니다. (산출식이 복잡하므로 약자를 쓰겠습니다.)
RC2 = { ( (H+BB+HBP-CS-GDP) * (TB + (BB-IBB+HBP)*0.26 ) + (SB+SH+SF)*0.52 ) / (AB+H+BB+SH+SF) }
복잡하지만 원리를 알면 그렇게 복잡한 것은 아닙니다. 안타와 볼넷을 더하고 도루자와 병살을 뺀 것은 출루를 뜻합니다(도루자와 병살은 출루를 무용지물로 만들기 때문에 뺍니다). 루타(TB)는 안타에 자동으로 가산점이 적용된 것이고, 이후 사사구와 도루/희생타에 각각 0.26과 0.52의 가산점을 적용해 더합니다. 이것을 타석(출루율 계산 공식에서의 타석)으로 나누면 RC가 산출됩니다.
세번째 RC 계산방식도 이와 개념은 비슷하지만 계산방식은 더욱 복잡해집니다. 세번째 계산방식은 약자로 표기해도 알아보기 힘들 정도이기 때문에 먼저 A(출루), B(전진), C(기회)를 따로 구하는 공식을 소개하고, 다시 A~C를 가지고 RC 산출식을 안내해드리겠습니다.
A(출루) = H+BB+HBP-CS-GDP
B(전진) = TB + (BB-IBB+HBP)*0.26 + (SB+SH+SF)*0.52 + (SH+SF)*0.53 + SB*0.64 - SO*0.03
C(타석) = AB+H+BB+SH+SF
RC3 = { ((A + C*2.4) * (B + C*3)) / C*9 - C*0.9
이것은 두번째 공식을 좀 더 다듬은 것으로, 도루에 가중치를 더 주는 대신 삼진은 마이너스 가중치를 줍니다. 그리고 분자에서 C*2.4와 C*3이 들어가는 것은 평균적인 타자의 경우를 고려한 설계라고 하는데, 이것까지 설명하면 너무 골 아프기 때문에 그냥 공식만 확인해주시기 바랍니다.
RC1은 가장 기본적이고 쉬운 대신 덜 정교하고, RC2는 너무 복잡하지 않기 때문에 가장 보편적으로 인용되는 공식이며, RC3는 매우 복잡하지만 더 정교한 공식이라는 차이점이 있다고 보시면 됩니다. 참고로 빌 제임스가 계속 RC 계산방법을 수정하다가 현재까지의 마지막 계산방식으로 나온 것이 RC3이라고 합니다.
위의 세 가지 순위를 보시면 아시겠지만 계산방법에 따라 미세한 변동은 있습니다. 그러나 어떻게 계산하든 김현수-김태균의 순위는 변하지 않습니다. 상대적으로 장타력이 뒤져 OPS나 GPA에서는 김태균에게 밀렸던 김현수는, RC로 계산하면 김태균을 넉넉하게 이깁니다. 그만큼 개인기록 상에 반영되지 않는 득점 공헌이 많았다는 뜻입니다.
제가 자료를 인용하는 아이스탯에서는 세 번째 방식의 RC로 계산합니다. 따라서 제 블로그에서 RC를 인용할 일이 있다면 특별한 언급이 없는 이상 세 번째 방식이라고 보시면 됩니다.
2. RC/27 = { (RC*27) / (AB-H+SH+SF+CS+GIDP) }
RC/27은 RC를 응용한 것으로, 27개의 아웃카운트, 즉 한 경기에서 한 타자가 얼마의 득점을 올릴 수 있는지를 산출한 것입니다. 계산식에 RC가 들어가기 때문에 RC의 계산방식에 따라 RC/27도 변동은 있을 수 있으며, RC/27의 계산방식도 여러가지 버전이 나오고 있으나 이 계산식이 보편적으로 사용됩니다.
RC/27의 순위가 RC3과 일치하는 것은 아닙니다. 계산식을 보시면 분모에 들어가는 (AB-H+SH+SF+CD+CIDP)가 그 타자의 총 아웃카운트라는 것을 알 수 있습니다. 즉, 아웃카운트가 적은 타자일수록 RC/27은 상대적으로 높게 나오는 것입니다. 김태균이 1위, 그리고 RC 순위에서는 이름이 없었던 김재현 이택근 장성호 등의 이름이 10위권에 올라온 것이 눈에 띕니다.
그러면 RC/27은 무엇을 보는 것인가, 이렇게 이해하시면 아주 편합니다. 김태균의 RC/27이 9.48이라는 것은, 한 경기에서 1~9번타자를 모두 김태균으로 했을 때 평균적으로 9.48점을 올릴 수 있음을 의미합니다. 올 시즌 8개구단의 팀 평균자책이 4.11이므로, RC/27이 그것보다 높게 나오면 평균 이상의 득점 생산능력을 갖춘 타자라고 이해하시면 되는 것입니다.
3. XR (eXtrapolated Runs; 추정득점)
XR도 개념은 RC와 같습니다. 이것은 짐 퍼테이도가 고안한 것으로, 선형가중식을 통해 구한 타자의 득점공헌도입니다.
XR = { 1루타*0.5 + 2루타*0.72 + 3루타*1.04 + 홈런*1.44 + (사구+볼넷-고의사구)*0.34 + 고의사구*0.25 + 도루*0.18 - 도실*0.32 - (타수-안타-삼진)*0.09 - 삼진*0.098 - 병살타*0.37 + 희생플라이*0.37 + 희생번트*0.04 }
겁나게 복잡해보이지만, 이것도 간단히 이야기하면 안타나 볼넷 도루 아웃 삼진 등 각 기록에 대해 저마다의 가중치를 더하고 뺀 수치라고 보면 됩니다. 도대체 저 가중치가 산출된 근거가 무엇이냐고 하면 사실 저도 모릅니다. 그런데 전문가들이 이야기하기로는, XR이 RC보다 조금 더 정확한 결과가 산출된다고 합니다.
보시다시피 수치 자체는 XR과 RC가 큰 차이가 없습니다. XR은 게임수로 나눈 XR/G, 타석으로 나눈 XR/PA 등으로 변형되는데, 이것은 따로 정리하지는 않겠습니다.
RC와 XR로 넘어오면 이제 야구가 무슨 복잡한 통계적 지식을 요하는 스포츠가 된 것처럼 보입니다. 이런 산출식을 다 외우는 것은 무의미하겠지요. 그러나 이런 기록이 있다는 것, 그리고 무슨 의미를 가진다는 것 정도를 알고 있다면 아마 야구를 더 재미있게 볼 수 있지 않을까 생각합니다.
기존의 개인기록과 달리 "공헌도"를 따지기 시작했다는 점에서 RC와 XR은 의의가 있다고 봅니다. 그러나 여기에 들어가는 수많은 가중치들과 복잡한 수식은 미국야구의 데이터를 기준으로 연구된 것들입니다. 따라서 한국야구에 그대로 적용하는 것에서 왜곡이 발생할 가능성이 없지는 않습니다. 이러한 문제점은 한국의 세이버 매트리션이 보완해줄 것을 기대합니다.
다음 포스팅에서는 RC XR과 유사한 개념의 득점 공헌도 기록인 BsR과 RCON을 정리해볼 계획인데, 다른 방향으로 마음이 바뀔지도 모르겠습니다. 너무 어려운 것들만 줄줄이 하다보면 저부터가 머리에 쥐가 날지도 모르겠어서 말입니다. ^^
- 인용한 기록은 아이스탯(
www.istat.co.kr)을 참고했습니다.