ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 스포츠투아이, 스포츠춘추 그리고 스탯티즈
    (구)한국프로야구칼럼 2011. 7. 17. 08:38


    스탯티즈가 문닫았습니다.

    얼마전 스탯티즈를 겨냥한 듯한 기사가 뜨더니 결국엔...

    야구를 즐기는 사람들을 위한 기록을 제공해왔던 스탯티즈가 문을 닫음으로서 이제 저같은 사람들은 어디로 가야하나요...

    애초에 KBO가 다양한 자료를 공개했으면 이런일도 없었을 거라 생각하구요. 이왕 이렇게된거 스포츠투아이측의 자료를 가공했다는 기사의 뉘앙스와 스탯티즈의 해명글(문자경기중계를 기반으로 자료를 뽑아냈다)의 사실관계는 이참에 확실하게 짚어졌으면 합니다. 여기에 함정DB에 대한 문제도요.

    일요일 아침부터 날벼락 같은 소식을 접하게되었는데 우울한 일요일입니다.

    안녕하세요.

    스탯티즈 운영자입니다.


    게시판의 많은 글에 대해 게으름을 핑계 삼아 답글을 달지 못한 상태에서 이렇게 긴 글을 쓰게 된 점, 사이트 운영을 중단하게 된 점에 대해 우선 사과를 드립니다. 박동희 기자님의 글을 보고 여러 가지 이야기가 필요한 것 같아서 글을 쓰게 되었습니다.


    참고 : “[박동희의 야구탐사] 한국 야구기록의 역사 [3] 프로야구 30년 기록, 전산화 끝났다” (마지막 부분)

    기사 링크 : http://news.naver.com/sports/index.nhn?category=kbo&ctg=news&mod=read&office_id=295&article_id=0000000631&date=20110714&page=1


    스탯티즈의 기록과 포털사이트의 문자 중계


    기사 中 “요즘 국내 개인통계 사이트 가운덴 <스포츠투아이>가 인터넷 포털사이트에 서비스하는 문자중계를 마우스로 ‘무단 복사’해 엑셀작업을 거쳐 마치 자신이 기록을 하고, 통계를 낸 것처럼 사용하는 곳이 있다”


    이 대상이 스탯티즈라고 명시되지 않았으며 아니라고 생각합니다만, 오해하실 수 있기에 몇 가지를 알려드립니다.우선, 스탯티즈는 기록에 대한 출처를 명확하게 밝혔습니다. (공지사항 1번, 이용안내) “자신이 기록을 하고, 통계를 낸 것처럼”하지는 않았습니다. 그리고 이전부터 쭉 밝혀왔듯이 스탯티즈는 포털사이트의 문자중계를 이용하지만, 엑셀을 이용해서 작업을 하지 않고 자체 개발한 프로그램으로 DB화 작업을 합니다.


    다양한 통계를 너무나도 쉽게 접근할 수 있는 MLB에 비해 그런 정보도 부족하고 일부 가능한 곳이라도 많은 제약이 있는 기록 접근에 아쉬움을 가지고 있었습니다. 한국의 야구 팬이 한국 프로야구 기록보다 미국 프로야구 기록을 더 쉽게 이용할 수 있는 이상한 상황을 바꾸어보고자 사이트 작업을 시작했고, 비슷한 분들이 많을 것이라는 생각에 항상 사이트 이용에 제한이 없어야 한다는 원칙으로 운영을 해 왔습니다. 블로그와 여러 커뮤니티에 기록 관련글이 활성화 되는 것을 보고 나름의 보람을 느꼈습니다. 스탯티즈는 이러한 명분과 함께 최소한의 정직함을 유지하려고 노력을 했습니다.


    KBO 공식 업체인 Sports2i에 사과 드립니다.


    스탯티즈는 Sports2i의 작업과 그 동안의 노력을 존중해 왔습니다. 통계회사의 큰 비용과 노력을 빼앗아오려는 생각은 전혀 가지고 있지 않습니다. 사이트를 시작할 때도 Sports2i에 전화를 한차례 했었고, 여러 통로를 통해 작업 방식의 적절성에 대해 조사해보았습니다. 일정 부분에서 문제점이 있을 수 있다는 의견도 있었지만, 전반적으로 사이트에 대해서는 긍정적으로 평가해 주셨고, Sports2i가 B2B 중심의 운영이라서 좋지 않은 영향을 주지는 않을 것이라는 판단에 진행을 하여 여기까지 오게 되었습니다.


    물론, 상업적인 활동을 전혀 하지 않았다고는 할 수 없을 것입니다. 몇 군데서 제안이 왔었고, 호스팅과 프로그램 및 사이트개발에 대한 든 노력과 비용을 생각하지 않을 수 없었습니다. 최근에 스카우팅 리포트에도 데이터를 제공했었습니다. 이런 경우에도 기본 데이터의 출처에 대해서 명확하게 알렸고 연결 고리가 있는 경우라고 판단하여 진행했습니다. 몇몇 출판사에서 더 제안이 왔지만, 더 진행을 하지 않은 것도 최소한의 예의를 지키고자 하는 마음이 있었기 때문입니다.


    기사 中 “전문 통계회사가 큰 비용과 노력을 쏟아 만들고 운영하는 문자중계를 무단으로 수집해 사용하는 건 문제가 있다. 이런 구조가 묵인될수록 <스포츠투아이>는 물론이려니와 영세 통계업체가 설 땅은 사라진다. 앞으론 ‘무단 기록 수집’에 대해 적절하고도 강력하게 대응할 방침이다.”


    ‘정식 절차’를 밟지 않은 ‘무단 기록 수집’에 대해서 sports2i에 사과를 드립니다. 하지만, 그 사이트를 만든 배경과 큰 틀에서 이해를 바라는 부분도 있습니다. 저는 아직 학생신분인 야구팬의 한 사람에 불과합니다. 모든 경기를 직접 보면서 기록하는 것은 불가능에 가깝습니다. 그렇다고, 야구 통계 분석을 하기 위해 문자 중계 데이터에 비용을 지불할 만큼의 금전도 가지고 있지 않습니다. 이 사이트의 첫째 목적은 금전적 수익이 아니라, 비슷한 정보를 원하는 더 많은 팬들에게 통계 분석을 위한 툴을 제공하는 것입니다. 적절하고 강력한 대응이 어느 수준까지 이야기 하는지 모르겠지만, 문자중계 수집에 대해 불편해 한다면 사이트 작업을 중단하는 것이 맞는 것 같습니다.


    전산화된 30년 기록의 PBP 데이터 공개는 어떨까요?


    기사 中 “1982년부터 지난해까지 프로야구 전체 기록지를 전산화하는데도 성공했다. 비시즌 기간에 기록원들이 과거의 기록지를 하나하나 전산화했기에 가능한 일이었다. … (생략) … 만약 프로야구 기록지의 검증 작업이 끝나 야구팬들에게 서비스된다면 메이저리그를 역사별, 선수별로 체계적으로 데이터 베이스화한 한국판 ‘베이스볼 레퍼런스(Baseball Reference)’가 탄생할 것으로 보인다.”


    한국판 베이스볼 레퍼런스가 나온다는 것은 환영할 부분입니다. 그렇게 된다면 저 역시 매일 3,000명 정도 접속해왔던 작은 사이트 운영에 대한 부담을 덜어 내고 야구를 좀 더 즐길 수 있을 것 같습니다. 야구 팬들도 좀 더 신뢰도가 높고 오랜 기간의 기록을 참고 할 수 있을 것입니다.


    야구 기록 자체와 별도로 야구 통계 분석에 대해 관심을 가지는 야구 팬들이 점점 늘어나고 있습니다. 야구 통계 분석을 하는 데는 PBP(play-by-play) 데이터가 필요합니다. 현재 널리 알려진 세이버 기록들은 MLB의 가중치를 그대로 가져와서 사용하고 있습니다. 만약 원년부터 PBP 데이터가 공개 된다면 KBO에 맞는 스탯들이 탄생하게 될 것입니다. 사이트를 운영하면서 항상 생각해왔던 것들입니다.


    그래서, 전산화가 완료된다면 문자 중계 형식과 같은 PBP 형태를 야구팬들이 이용할 수 있는 형태로 공개하는 것은 어떨까요?


    30년전 빌 제임스는 메이저리그 기록을 책임지는 엘리아스 스포츠가 공개하지 않는 자료에 대해 비판적인 생각을 가졌고, 데이터를 공개하기 위한 Project Scoresheet을 1984년에 조직했습니다. 이와 비슷한 목적으로 데이비드 스미스가 레트로시트(Retrosheet.org)를 만들었습니다. 이 사이트에는 전산화 할 수 있는 형태로 메이저리그 경기 Play-by-Play 기록이 모두에게 공개되어 있으며 쉽게 다운로드 받아서 통계 분석을 하는 데 이용할 수 있습니다. 데이터 사용 안내에는 다음과 같은 문구도 포함되어 있습니다. “Recipients of Retrosheet data are free to make any desired use of the information, including (but not limited to) selling it, giving it away, or producing a commercial product based upon the data.”


    물론 레트로시트는 비영리 사이트로 많은 자원봉사자들이 기록지를 옮겨서 만든 것으로 알고 있습니다. 따라서, KBO나 Sports2i와는 경우가 다를 것 입니다. 하지만, PBP 데이터를 공개하지 않으면 일반 팬들의 통계 분석이 제한이 됩니다. 한국판 레트로시트를 만들려면 수많은 시간과 노력이 팬들의 부담으로 돌아가게 될 것이고, 아마 그 작업은 불가능할지도 모릅니다. 또한, 원천 기록지에 대한 접근을 제한한다면 구축 자체가 불가능합니다.


    한국에서 SABR(Society for American Baseball Research) 같은 단체나 통계 분석 활동이 거의 사라졌던 것도 팬들이 이용할 수 있는 PBP 데이터의 부재와도 무관하지 않을 것입니다. Sports2i나 KBO 기록원의 몇몇 분들은 SKBR(Society of korea baseball research)으로 알고 있습니다. 야구 기록/통계 분야의 발전을 생각한다면 좋은 방향을 제시해 줄 수 있을 것으로 생각됩니다.


    여러 가지 측면에서 PBP 데이터 공개가 부담스러울 수 있을 것입니다. 하지만, 데이터 이용에 대한 가이드라인 및 정책(예: ‘통계 분석 결과가 아닌 기본 기록에 대한 상업적 이용 제한’, ‘PBP 데이터를 시즌 후 공개’ 등)을 명확히 제시한다면 PBP 데이터 공개가 궁극적으로는 원저작자의 수익을 확대할 뿐만 아니라 야구 발전에도 기여할 수 있을 것입니다.


    여러 가지 바람과 함께 사이트 운영을 중단합니다. 관계자 분들의 양해와 함께 빠른 기간 안에 사이트 운영을 재개할 수 있기를 바라며, 궁극적으로는 사이트가 폐쇄 되더라도 KBO나 Sports2i에서 팬들에게 더 나은 기록과 통계를 쉽게 접근할 수 있도록 해주었으면 합니다.


    스탯티즈 운영자 드림.

Designed by Tistory.