파이썬과 R을 대하는 광고인의 자세

파이썬과 R을 대하는 광고인의 자세

  • 김영연
  • 승인 2022.04.28 00:00
  • 댓글 0
이 기사를 공유합니다

출처 파이썬 브로셔
출처 파이썬 브로슈어

파이썬: 빅데이터 처리에 압도적 범용성, R: 통계와 시각화에 특화

최근 광고계에서 파이썬(Python)과 R 등 다양한 프로그래밍 언어에 대한 관심이 높아지는 것을 볼 수 있다. 이제 프로그래밍까지 배워야 한다는 현실(?)에 순순히 고개를 끄덕이고 달려들기엔 제대로 된 정보를 얻거나 활용 방향을 예측하기가 어려운 게 사실이다. 때론 당장 실무에 어떤 활용이 가능할지도 미지수이고, ‘코딩은 센스와 재능의 영역’이라는 일부의 말을 듣게 되면 활용의 불확실성과 배우는 과정의 어려움이 도전을 주저하게 만들기도 한다.

파이썬과 R은 빅데이터 처리에 활용하는 프로그래밍 언어들 중 하나이다. 주로 사용하는 분야는 비슷하지만, 각 언어가 갖고 있는 특징은 사뭇 다르다고 할 수 있다. 

파이썬의 경우 타 언어를 압도할 만큼 넓은 범용성을 지닌다. 데이터 분석·인공지능·개발까지 하나의 언어로 가능하며, 프로그램을 다양하게 사용할 수 있다는 특징이 있다. R의 경우 통계와 시각화에 특화된 언어이며, 이를 위한 다양한 라이브러리를 제공한다. 통계·머신러닝에 특화돼 있지만 그 이상의 활용에는 어려움이 있다. 그럼 일부에서 왜 파이썬을 마치 만능인 것처럼 말하는지, 실제 어떤 방식으로 활용해 볼 수 있을지 간략히 이야기해보자.

이건 다 데이터 때문이야

한정된 예산을 유효한 타깃에게 활용해 높은 전환율을 이끌고 매출을 만들어 내는 것. 모두가 가장 이상적으로 생각하는 디지털 매체 활용 방식일 것이다. 

이 같은 이상적 모델을 만들기 위해 소재나 타깃군 등에 대한 다양한 테스트를 하면서 시행착오를 겪기도 한다. 당연한 말이지만, 그 과정에서 확보되는 수많은 데이터는 더 나은 방향을 위한 의사결정에 도움을 줄 것이다.

그런데 다양한 매체에 대한 실험으로 발생한 데이터를 전처리하고 분석하고 리포팅하는 일련의 과정은 매일 또는 주기적으로 시간을 소비해야 하는 업무가 된다. 주기적이며 단순 반복적인 업무의 처리다. 

파이썬과 R의 필요성은 바로 여기에서 출발한다. 예를 들어 매일 30분∼1시간을 데이터 처리와 시각화를 위해 소모하는 것과, 그 과정을 한 번의 코딩으로 자동화해 시간 소요를 없애는 것, 둘 중에 후자가 더 효율적인 것은 분명하다. 

따라서 파이썬과 R은 우리가 접근하기 용이한 일반적 수준에서는 반복적인 업무를 자동화하거나, 데이터를 기반으로 도출된 결과 분석의 시각화 등에 활용해 업무 효율을 개선함으로써 인사이트를 얻기 위한 고민의 시간에 더욱 힘을 쏟을 수 있도록 하는 보조적 수단으로 작동할 수 있을 것이다.

‘엑셀로 데이터 분석을 할 수 있는가’의 시사점

이처럼 파이썬과 R의 역할과 활용법에 대해 기본적인 이해를 했다면 이런 생각이 들 수 있다. ‘아, 결국 이것도 배워야 하나?” 

그런데 그 생각 속의 ‘이것도’가 단순히 파이썬과 R을 의미하는 것이라면, 필자는 당장이라도 멈추라는 대답을 할 것이다. 어떤 일을 할 것인지에 대한 고민이 이루어지지 않은 채 사용할 도구만 보고 결정을 내리는 것은 순서가 뒤바뀐 행동이기 때문이다.

즉 프로그래밍을 통한 데이터 분석 과정의 효율화에 매력을 느끼고 학습의 필요성에 공감했다 해도 한 번 더 고민해볼 필요가 있다. 우선 많은 이가 가장 보편적으로 활용하는 엑셀에 대해 생각해보자. ‘엑셀로 데이터 분석을 할 수 있는가’ 하는 점이다. ‘나는 엑셀을 쓸 수 있다’는 것과 ‘나는 엑셀로 데이터 분석을 할 수 있다’는 것은 엄연히 다르다. 

마찬가지로 파이썬과 R을 포함해 SAS 같은 별도 통계 프로그램의 ‘사용법을 안다’는 것과 ‘분석을 할 수 있다’는 것은 별개의 문제이다. 즉 엑셀로 데이터 분석을 할 수 없는 사람은 어떤 프로그래밍 언어나 통계 프로그램을 써도 데이터 분석을 할 수 없다. 오히려 최소한의 GUI조차 없는 스크립트 방식의 프로그래밍 언어를 배우는 과정이 더욱 어려워질 뿐이다. 

좋은 공구가 있다고 해서 훌륭한 작업자가 되지는 않는 것과 같고, 전문가용 도구를 초보자가 다루기엔 더욱 어려운 것과 같은 이치이다.

그렇기 때문에 ‘남들이 하니까 나도 해야지’ 식의 접근이 아니라, 실질적인 데이터 분석에 대한 필요성과 문제의식을 갖고 해결할 수 있는 역량을 키우는 것이 먼저일 것이다. 

코딩이 하나의 트렌드 키워드처럼 인식되는 지금, 가장 필요한 자세는 데이터 분석이라는 큰 그림을 보고 나에게 적합한 툴을 학습하고 활용하는 것이다. 

그래서 데이터 리터러시

그럼 데이터 분석에 필요한 가장 기본적 역량은 무엇인가? 크게 두 가지로 나눌 수 있다.

하나는 통계적 지식을 활용하는 능력인 ‘통계적 사고(Statistical Thinking)’이며, 또 다른 하나는 데이터를 해석할 수 있는 능력을 의미하는 ‘데이터 리터러시(Data Literacy)’이다.

이 가운데 데이터 리터러시는 데이터를 통해 해결하고자 하는 문제를 정의하는 ‘문제 정의 능력’과 정의된 문제 해결을 위해 데이터를 추출하는 ‘데이터 가공 및 분석력’, 분석된 결과를 공유할 수 있는 ‘커뮤니케이션 스킬’을 포괄적으로 의미한다.

데이터 분석을 위해 어떤 툴을 사용할 것인가는 결국 데이터 리터러시 속 하나의 갈래라 할 수 있다. 따라서 단순히 툴을 활용하는 능력보다, 데이터를 통해 문제를 발견하고 이를 해결하기 위해 데이터를 분석하고 집단과 나누는 과정이 더욱 중요하다.

‘닭 잡는 데 어찌 소 잡는 칼을 쓰느냐’는 격언이 있다. 도구의 목적성을 이해해야 한다는 의미로 주로 활용된다. 그렇듯이 우리가 지금 어떤 목적으로 파이썬과 R이라는 도구를 얻으려고 하는 것인지를 명확히 하는 것이 좋을 것이다.

 


김영연 도브투래빗 마케팅2본부 대리

※ 본 아티클은 한국광고산업협회 발간 <디애드> 칼럼을 전재했음


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.