지표없이 트렌드 시장을 식별하는 방법

마지막 업데이트: 2022년 7월 25일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
2021년 12월 비트 폭락기에도 계속 줄어든 거래소 비트코인 보유량. 출처=크립토퀀트

서비스 상담신청

서비스 상담신청
입력하신 정보로 담당자가 연락 드리겠습니다.

1. 개인정보 수집 항목 : 이름, 전화번호, 전자메일
2. 수집목적 : 고객식별, 광고성 정보 제공 및 참여기회제공, 이용기록 분석 및 통계분석, 딥러닝을 위한 지표
3. 보유기간 : 상담이 완료되면 지체없이 모든 개인정보를 파기합니다.
단, 관계법령에서 일정 기간 정보의 보관을 규정한 경우에 한해 분리 보관 후 파기하며, 별도의 동의서를 통해 해당 기업의 재무와 비재무 지표를 AI학습을 위해 사용할 수 있습니다.
* 제출 버튼을 클릭하시면 개인정보 수집 및 이용에 동의한 것으로 간주됩니다.

2영업일 이내에
담당자가 연락드리겠습니다.

1. 개인정보 수집 항목 : 이름, 전화번호, 전자메일
2. 수집목적 : 고객식별, 광고성 정보 제공 및 참여기회제공, 이용기록 분석 및 통계분석, 딥러닝을 위한 지표
3. 보유기간 : 상담이 완료되면 지체없이 모든 개인정보를 파기합니다.
단, 관계법령에서 일정 기간 정보의 보관을 규정한 경우에 한해 분리 보관 후 파기하며, 별도의 동의서를 통해 해당 기업의 재무와 비재무 지표를 AI학습을 위해 사용할 수 있습니다.
* 제출 버튼을 클릭하시면 개인정보 수집 및 이용에 동의한 것으로 간주됩니다.

정보입력하기

특허정보 조회를 위한 대표자 주민등록번호를 입력해주세요. 입력하신 정보는 조회용으로만사용하며,
따로 정보를 저장하지 않습니다.

1. 개인정보 수집 항목 : 주민등록번호
2. 수집목적 : 특허정보 조회
3. 보유기간 : 특허정보조회 완료 후 즉시 파기
단, 관계법령에서 일정기간의 보관을 규정한 경우에 한해 분리 보관 후 파기할 수 있습니다.
* 입력하기 버튼을 클릭하시면 개인정보 수집 및 이용에 동의한 것으로 간주됩니다.

객체에 대응하는 콘텐트를 출력하기 위한 방법 및 그 전자 장치 (METHOD FOR OUTPUTTING CONTENT CORRESPONDING TO OBJECT AND ELECTRONIC DEVICE THEREOF)

출원인 출원번호(출원일) 1234567890123(2020.12.31) 출원공고번호(출원공고일) 1234567890123(2020.12.31) 등록번호(등록일) 1234567890123(2020.12.31) 등록권자(RG) 1234567890123(2020.12.31) 등록참조번호 1234567890123(2020.12.31) 등록공고번호(등록공고일) 1234567890123(2020.12.31) 국제등록번호(등록일) 1234567890123(2020.12.31) 우선권주장번호(주장일) 1234567890123(2020.12.31) 도형코드(비엔나코드) 1234567890123(2020.12.31) 전문존재유무 1234567890123(2020.12.31)

출원인 창작자명 디자인분류(일련번호) 출원번호(출원일) 1234567890123(2020.12.31) 공개번호(공개일) 1234567890123(2020.12.31) 등록번호(등록일) 1234567890123(2020.12.31) 공고번호(공고일) 1234567890123(2020.12.31) 우선권주장번호(주장일) 1234567890123(2020.12.31) 국제등록번호(등록일) 1234567890123(2020.12.31) 전문존재유무 1234567890123(2020.12.31)

출원인 한양대학교 산학협력단, 삼성전자 주식회사 출원번호(출원일) 1234567890123(2020.12.31) 공개번호(공개일) 1234567890123(2020.12.31) 등록번호(등록일) 1234567890123(2020.12.31) 공고번호(공고일) 1234567890123(2020.12.31) IPC번호 1234567890123(2020.12.31) 요약 1234567890123(2020.12.31)

지표없이 트렌드 시장을 식별하는 방법

스존

출처=픽사베이

출처=픽사베이

크립토퀀트가 지난 8일 스페이스에서 해시 리본 지표 제작자로 잘 알려진 찰스 에드워드(Charles Edwards)와 질의응답을 진행했다.

직접 패널로 참여해 찰스에게 질문할 기회를 얻은 드문 기회였다.

찰스는 디지털 자산 투자 기업인 캐프리올 인베스트먼트(Capriole Investments)의 창립자이자 알고리듬 트레이딩 전략으로 수익을 추구하는 펀드 운영을 맡고 있다. 해시 리본으로 유명한만큼 채굴과 관련해 상당한 식견과 인사이트를 가지고 있다.

결과적으로 비트코인 가격과 관련된 지표에 관심이 많은 사람이라면 최근 해시 리본 지표를 매수·매도 신호로 사용했을 때 활용도가 떨어진 것이 아닌지 의심할 만하다. 하지만 우리가 채굴자에게서 얻어낼 수 있는 인사이트는 여전히 남아 있다는 점을 기억해주길 바란다.

찰스의 답변을 바탕으로 우리가 매매할 때 지표를 어떻게 쓸지와 채굴의 미래에 대해 생각해 보기로 했다.

뉴스레터와 함께 보면 더 도움이 된다.

해시레이트 기반 지표인 해시 리본은 아직 쓸모있다

해시 리본 지표. 출처=글래스노드

해시 리본 지표. 출처=글래스노드

해시 리본 지표는 비트코인 해시레이트(전세계 전체 채굴기의 연산량에 비례하는 값)의 일 차트에 단순 이동평균선(SMA)을 적용해 교차 지점에서 매수·매도 기회를 포착하는 데 사용한다.

30일 이동평균선(이하 이평선)이 60일 이평선을 상향 돌파(골든크로스)하는 시점을 일반적으로 매수 신호로 판별한다.

마지막 골든크로스는 2021년 8월7일에 발생했고, 그 이후 데드크로스는 나오지 않았다.

당시 비트코인 가격은 4만2000~4만4000달러 구간이었으나 올해 비트코인은 무려 3만2000달러 구간까지 다녀왔다.

현재도 매수 시점 대비 수익 구간이라기 어려운 가격대에 있다.

채굴자들은 비트코인이 하락하든 말든 여전히 열혈 채굴 중인 셈이다.

그래서 찰스에게 ‘여전히 골든크로스를 유지하는 해시 리본이 현재의 장 상황에서도 유의미한 지표’인지 질문을 던지게 됐다.

해시 리본은 매도에도 유의미하지만 매수 지표없이 트렌드 시장을 식별하는 방법 신호로써 더 가치가 있다는 것이다.

즉 해시 리본은 비트코인이 채굴자의 활동 대비 매우 저평가된 영역을 식별하게 해 주는 효과를 가진 지표라는 것이다.

내 질문에 답변하던 중 찰스는 '매수 신호로 해시 리본을 사용하는 경우 좋은 수익 구간 후 하락 구간이 있을 수 있다는 점을 명심해야 한다'고 말했다.

그렇다. 해시 리본으로 매매하면 매수시에는 좋은 참고가 될 수 있고, 매도는 알아서 해야한다.

특히 매도는 다른 지표와 복합해도 쉽지 않으니 ‘알아서 예술적으로’ 하는 것이 수익 보전의 지름길인 셈이다.

(찰스 본인은 여전히 해시 리본 지표를 쓰고 있다고 한다.)

영원불변하게 쓸모있는 지표는 없다

현재 찰스는 알고리듬 트레이딩 전략으로 수익을 내는 회사를 운영하기에 많은 전략의 수익률을 평가해야 한다.

과거 매우 높은 적중률을 가진 고수익 전략들을 사용해 보면, 1~2년 정도 잘 작동하다가 성공률이 크게 떨어진다고 한다.

이 경우 여러 지표를 섞고 재구축하는 과정을 거쳐 시대 변화에 따라가야 한다.

그래서 찰스는 장기적으로 성공한 전통 금융 분야의 펀드와 기업들이 어떻게 해왔는지를 살펴보라고 조언했다.

남들이 보지 않는 데이터에서 그들이 얻는 인사이트가 분명히 있다는 것이다.

늘 같은 지표를 뚝심있게 박제된 공식처럼만 해석해서 바라보는 온체인 분석가들이 쇄신해야 되는 부분이다.

찰스가 뉴스레터에 언급한 거래소 보유량 지표가 대표적이다.

보통 거래소 물량이 계속 줄어들면 긍정적이라고 보는데 2021년 말부터 비트코인 가격은 그와 상관없이 크게 내렸다.

해당 지표로 시장 방향성을 단순 예측했을 때 입게 될 손실은 꽤 크다.

이런 특징들 때문에 ‘온체인데이터는 긍정적입니다’ 같은 밈까지 돈 셈이다.

2021년 12월 비트 폭락기에도 계속 줄어든 거래소 비트코인 보유량. 출처=크립토퀀트

2021년 12월 비트 폭락기에도 계속 줄어든 거래소 비트코인 보유량. 출처=크립토퀀트

찰스도 스페이스 대화 중 본인이 주의깊게 보는 몇 가지 지표없이 트렌드 시장을 식별하는 방법 지표의 수치 변화 체크 방식을 알려줬다.

거래소 보유량, 미결제약정, 펀딩비, 거래소 고래 비율 등 4가지 지표의 조합을 선호한다고 했는데 시장 분위기가 바뀌어도 상황을 비교적 일관적으로 반영하기 때문이다.

시장 상황을 뚝심있게 반영해주는 클래식이 될 수 있는 지표(현재 NVT가 대표적)와 그때 그때 상황을 잘 반영해 주는 지표없이 트렌드 시장을 식별하는 방법 지표를 분별해 내고 신호가 잡음이 되지 않게 해석해 내는 능력이 분석가에게 필요하다.

점점 교과서적 해석으로는 온체인 분석으로 생존이 힘들 듯 하다.

앞서 찰스는 해시 리본을 현재 쓰고 있다고 했으나 이 지표 또한 몇 년 내로 가치가 없어질 것으로 보고 있었다.

찰스에 따르면, 채굴자들이 패권을 다시 잡는 날은 ‘오지 않을 것이다’.

현재 상장지수펀드(ETF)나 은행같은 다양한 이해관계자들이 공급량을 좌지우지하며 채굴자에게서 나오는 비트코인 공급량의 파이 자체가 줄어든 상태다.

심지어 반감기를 거칠 때마다 블록당 채굴 물량이 반감하니 앞으로 그 현상은 더 심해질것이다.

결국 채굴자 항복기의 영향력도 감소할 것이다. 또 반대매매 전략에 의해 향후 쓸모없어질 수도 있다.

해시 리본에 의존하는 개인 트레이더가 다수인 것을 고래가 확인할 수 있다면, 자신의 유동성 관리를 위해 그 지표를 역이용해버릴 가능성은 항상 존재하기 때문이다.

아직은 그 단계가 온 것은 아니라고 한다. 결국 우리는 시장 상황과 지표의 유효성을 실시간으로 잘 파악하는 수밖에 없다.

현재 비트코인 채굴 원가는 개당 3만5000달러 부근

찰스는 몇년 전 비트코인 채굴 원가를 도출한 적이 있고, 이를 통해 우리가 저점 매수 기회를 얻을 수 있을 만한 영역을 도출하려 했다.

비트코인 해시레이트, 블록당 고정된 인플레이션율, 들어가는 에너지 비용을 알고 있다면 채굴 원가를 구할 수 있다. 거기에 채굴장 운영 비용을 합해서 값을 얻으면 현재는 개당 3만5000달러 선이다.

전기 요금만으로는 2만2000달러 정도다. 역사적으로 비트코인 가격이 전기료를 위협하는 지점을 찍은 적이 서너 번 정도 있었다.

이 구간이 오지 않을 가능성도 고려해야 한다. 온다면 역사적으로는 매우 좋은 매수 신호 구간이었기에 참고할 만하다.

찰스에 따르면, 전기료는 고정값이 아닌 상황에 따라 바뀌므로 지속적인 상황 확인이 필요하며 도출에 들어간 추정치 값을 가지고 있어야 된다.

지금은 전기료 뿐 아니라 지정학적, 통화량적 관점에서도 변수가 나올 수 있는 복잡한 시대다.

갑자기 나올 수 있는 비트코인 금지 규제, 미국 소비자물가지수(CPI) 변화, 전쟁 상황 등 생산 비용을 변화시킬 수 있는 여러 상황들이 도사리고 있어 이런 요소들도 명심해야 한다.

채굴 마진은 건재하나, 채굴 영향력은 감소

23일 기준 비트코인의 가격은 3만5000달러를 한참 웃돌기에 채굴 마진은 건강하다고 볼 수 있다.

1월 반등한 비트코인의 저점을 고려해 봐도 여전히 비트코인 채굴 원가는 시장에 영향을 미치는 요소 중 하나로 보는 것이 타당하다.

현재는 비트코인 채굴자가 위협받을 정도로 위험한 시장이 아니다.

다만 나는 채굴 산업의 흥망과 별개로 가산자산 시장에서 채굴자의 시장 점유율은 점점 줄어들 것으로 본다.

앞서 언급한 공급량의 반감 뿐 아니라 산업의 다양화도 중요한 트렌드의 한 축이기 때문이다.

찰스는 디파이(Defi, 탈중앙화금융), 대체불가능토큰(NFT), 게임 등의 분야가 성장하면서 채굴자들은 비트코인과 다른 레이어1 체인 중 선택이 필요할 수도 있고 다른 비즈니스 가치를 포착할 수도 있음을 언급했다.

찰스가 언급하진 않았지만, ESG(환경, 사회, 지배구조) 관점에서 작업증명(PoW) 채굴 방식이 지속가능성이 있느냐는 이슈는 해외에서 지속적으로 제기되는 도전 과제이기도 하다.

채굴 외에도 크립토 시장에 돈 되는 일이 많아져서 그런것이니 마켓 쉐어가 줄어든다고 슬퍼할 일도 아니다.

이날 스페이스에서 주기영 크립토퀀트 최고경영자(CEO)는 “채굴자 대다수를 포함해 7년 이상 된 비트코인 보유자와 작년에 들어온 기관투자자들은 비트코인을 팔지 않고 버티는 중”이라고 했다.

채굴자들은 시장 상황에 안 맞게 버티며 매매 지표에 혼란을 주는 트롤이 아니라, 아직까지는 그들이 있기에 바닥이 지켜지는 ‘바닥가 수호자’에 더 가까워 보인다.

데이터 과학이란 무엇인가?

데이터 과학은 통계, 과학적 방법, 인공지능(AI), 데이터 분석 등 다양한 분야를 결합해 데이터로부터 가치를 추출합니다. 데이터 과학을 수행하는 사람들을 데이터 과학자라고 부르며, 이들은 다양한 기술을 결합하여 웹, 스마트폰, 고객, 센서 및 기타 소스로부터 수집한 데이터를 분석해 실행 가능한 인사이트를 도출합니다.

데이터 과학은 분석을 위해 데이터를 정제, 집계, 조작하는 데이터 준비 과정에서부터 고급 데이터 분석을 수행하는 작업까지 모든 과정을 총칭하는 용어입니다. 분석 애플리케이션 및 데이터 과학자들은 분석 결과를 검토해 패턴을 발견하고, 비즈니스 리더들이 정보를 기반으로 통찰력을 얻을 수 있도록 지원합니다.

데이터 과학: 머신러닝을 위한 무한한 가능성의 보고

데이터 과학은 오늘날 가장 주목받는 분야 중 하나입니다. 데이터 과학이 이토록 중요한 이유는 무엇일까요?

그건 지금 기업들이 데이터라는 보물 창고를 깔고 앉아있기 때문이죠. 모던 기술로 점점 더 많은 양의 정보를 생성 및 저장할 수 있게 되자 데이터의 양도 폭발적으로 증가했습니다. 전 세계에 존재하는 데이터의 90%가 지난 2년간 생성된 것으로 추정됩니다. Facebook의 경우만 해도 사용자들이 매시간마다 1,000만 장의 사진을 업로드하니까요.

하지만 이와 같은 데이터는 데이터베이스 및 데이터 레이크에 저장된 후, 대부분 방치되어 버립니다.

모던 기술을 통해 수집 및 저장된 풍부한 데이터는 전 세계 조직 및 사회에 혁신적인 이점을 가져다줄 수 있습니다. 하지만 지표없이 트렌드 시장을 식별하는 방법 그건 우리가 그 데이터를 해석할 수 있을 때 얘기죠. 바로 이 시점에 데이터 과학이 중요한 역할을 수행할 수 있습니다.

데이터 과학은 트렌드를 볼 수 있게 해줍니다. 기업이 더 나은 의사결정을 내리고, 보다 혁신적인 제품과 서비스를 만드는 데 사용할 수 있는 인사이트도 제공하죠. 무엇보다 중요한 건, 비즈니스 분석가가 데이터에서 무언가를 발견하길 막연히 기다려야 했던 과거와 달리, 데이터 과학은 머신러닝(ML) 모델이 방대한 양의 데이터를 학습할 수 있게 한다는 점입니다.

데이터는 혁신의 기반입니다. 하지만 데이터 과학자가 데이터로부터 정보를 얻어내고, 이를 기반으로 조치가 이행될 때야 비로소 데이터의 가치가 빛을 발합니다.

데이터 과학, 인공지능, 머신러닝은 각각 어떻게 다른가요?

데이터 과학의 정의와 사용법을 제대로 이해하려면, 인공지능(AI), 머신러닝 등 이 영역과 관련된 용어들을 알아야 합니다. 이 용어들이 동일한 의미로 사용될 때도 있지만, 각 용어 사이에는 미묘한 차이가 있습니다.

세부 내용을 아래와 같이 간단히 정리했습니다:

  • AI는 컴퓨터가 어떤 식으로든 인간의 행동을 모방하게 지표없이 트렌드 시장을 식별하는 방법 만드는 것을 의미합니다.
  • 데이터 과학은 AI의 하위 개념으로 통계, 과학적 방법, 데이터 분석과 겹치는 면이 많은 영역입니다. 모두 데이터로부터 의미와 인사이트를 추출하는 데 활용되는 기술들이죠.
  • 머신러닝은 AI의 또 다른 하위 개념이며, 컴퓨터가 데이터로부터 무언가를 파악할 수 있게 하고, AI 애플리케이션을 제공할 수 있게 만드는 지표없이 트렌드 시장을 식별하는 방법 다양한 기술로 구성됩니다.
    추가로 한 가지 용어를 더 살펴보도록 하겠습니다.
  • 딥 러닝은 머신러닝의 하위 개념으로, 컴퓨터가 보다 복잡한 문제를 해결할 수 있게 해줍니다.

데이터 과학이 비즈니스를 변화시키는 방법

조직은 데이터 과학을 활용해 제품과 서비스를 개선함으로써 데이터를 경쟁우위로 전환해 나가고 있습니다. 데이터 과학 및 머신러닝의 사용 사례는 다음과 같습니다:

  • 콜 센터에서 수집한 데이터를 분석해 고객 이탈률을 파악하여 마케팅 팀이 고객 유지를 위한 조치를 취할 수 있게 합니다
  • 물류 회사가 배송 속도를 개선하고 비용을 절감할 수 있도록 교통 패턴, 기상 조건 등 다양한 요인을 분석하여 업무 효율성을 높입니다
  • 의사가 질병을 조기에 진단하고 환자를 보다 효과적으로 치료할 수 있도록 의료 검사 데이터 및 보고된 증상을 분석하여 환자 진단을 개선합니다
  • 장비 고장 시기를 예측하여 공급망을 최적화합니다
  • 의심스러운 행동과 비정상적인 활동을 인지하여 금융 서비스 사기를 감지합니다
  • 이전 구매 내역을 기반으로 고객에게 상품을 추천하여 매출 향상에 기여합니다

많은 기업들이 데이터 과학의 중요성을 인지하고, 엄청난 지표없이 트렌드 시장을 식별하는 방법 투자를 하고 있습니다. 3,000명 이상의 CIO가 참여한 Gartner의 최근 설문조사 결과, 응답자들은 분석 및 비즈니스 인텔리전스를 조직을 남들과 차별화해 줄 가장 중요한 기술로 꼽았습니다. 설문조사에 참여한 CIO들은 이 기술들을 자사 전략에 가장 중요한 요소로 보고 해당 기술에 투자하고 있습니다.

데이터 과학의 수행 방식

데이터를 분석하고, 분석 내용에 따라 조치를 취하는 과정은 선형적이라기 보다 반복에 가깝습니다. 그리고 이와 같은 과정은 데이터 모델링 프로젝트에서 데이터 과학 수명 주기가 진행되는 전형적인 방식이기도 합니다:

계획 수립: 프로젝트와 해당 프로젝트의 잠재적 결과를 정의합니다.

데이터 모델 구축: 데이터 과학자들은 종종 다양한 오픈 소스 라이브러리 또는 인데이터베이스 도구를 사용해 머신러닝 모델을 구축합니다. 많은 사용자들이 데이터 수집, 데이터 프로파일링 및 시각화 또는 기능 엔지니어링에 도움이 되는 API를 원합니다. 이들에게는 적절한 도구와, 적절한 데이터 그리고 컴퓨트 파워와 같은 기타 리소스도 필요합니다.

모델 평가: 데이터 과학자들은 반드시 높은 확률의 정확도를 달성한 이후에 구축 모델에 대한 배포 결정을 내려야 합니다. 일반적인 모델 평가 과정에서는 포괄적인 평가 측정 지표 및 시각화 모음이 생성되며, 이를 활용해 신규 데이터에 대한 모델의 성능을 평가합니다. 또한 시간 경과에 따른 평가를 진행해 생성된 모델이 최적의 행동을 수행할 수 있게 합니다. 모델 평가는 단순한 원시 성능 평가를 넘어 예상되는 기본 동작을 고려하는 단계까지 진행합니다.

모델 설명: 머신러닝 모델의 내부 매커니즘을 인간의 언어로 설명하는 게 늘 가능했던 건 아닙니다. 하지만 설명 가능성의 중요성은 점점 더 커지고 있습니다. 데이터 과학자들은 예측 생성에 투입된 요소들의 상대적 가중치 및 중요성에 대한 자동 설명과 각 모델 예측에 대한 모델별 상세 설명을 원하고 있습니다.

모델 배포: 훈련된 머신러닝 모델을 선택해 이를 적합한 시스템에 적용하는 일은 종종 어렵고 힘든 과정을 수반합니다. 이 과정은 모델을 확장 가능하고 보안성 뛰어난 API로 조작할 수 있게 하거나, 인데이터베이스 머신러닝 모델을 사용하면 한결 단순해질 수 있습니다.

모델 모니터링: 모델을 배포했다고 끝난 것은 아닙니다. 모델이 제대로 작동하는지 확인하기 위해 배포 후에는 항상 모델을 모니터링해야 합니다. 모델이 학습했던 데이터는 일정 기간이 지난 후에는 더 이상 미래 예측에 도움이 되지 않을 수도 있습니다. 사기 탐지를 예로 들자면, 범죄자들은 늘 계정 해킹을 위한 새로운 방법을 시도하니까요.

데이터 과학용 도구

머신러닝 모델을 구축, 평가, 배포, 모니터링하는 과정은 복잡한 일일 수 있습니다. 데이터 과학 도구의 수가 증가한 이유가 바로 여기에 있죠. 데이터 과학자들은 여러 유형의 도구를 사용하지만, 가장 흔히 사용하는 도구는 오픈 소스 노트북입니다. 동일한 환경에서 코드를 작성 및 실행하고, 데이터를 시각화하고, 결과를 확인하는 데 사용되는 웹 애플리케이션이죠.

가장 널리 쓰이는 노트북은 Jupyter, RStudio, Zeppelin입니다. 노트북은 분석을 수행하는 데 매우 유용하지만 여러 데이터 과학자가 팀으로 작업해야 하는 경우 한계가 있습니다. 이 문제를 해결하기 위해 데이터 과학 플랫폼이 구축되었습니다.

어떤 데이터 과학 도구가 적절한지 선택하려면 다음과 같은 질문들을 던져볼 필요가 있습니다: 귀사의 데이터 과학자가 사용하는 언어는 무엇인가? 그들은 어떤 종류의 작업 방법을 선호하는가? 그들은 어떤 종류의 데이터 소스를 사용하는가?

예를 들어 오픈 소스 라이브러리를 사용하는, 데이터 소스에 구애받지 않는 서비스를 선호하는 사람들이 있습니다. 인데이터베이스 머신러닝 알고리즘의 속도를 선호하는 사람들도 있죠.

데이터 과학 프로세스는 누가 감독하나요?

대부분의 조직에서 데이터 과학 프로젝트는 일반적으로 세 가지 유형의 관리자가 감독합니다:

비즈니스 관리자: 이 유형의 관리자는 데이터 과학 팀과 협력하여 문제를 규정하고 분석 전략을 세웁니다. 마케팅, 재무, 영업 등 LOB 책임자가 여기에 해당되며 데이터 과학 팀이 이들에게 보고하는 체계로 구성됩니다. 이 유형의 관리자는 데이터 과학 및 IT 관리자들과 긴밀히 협력하여 프로젝트가 제대로 수행되도록 지표없이 트렌드 시장을 식별하는 방법 합니다.

IT 관리자: 선임 IT 관리자들은 데이터 과학 운영을 지원할 인프라 및 아키텍처를 책임집니다. 이들은 데이터 과학 팀이 효율적이고 안전하게 운영될 수 있도록 운영 및 리소스 사용을 지속적으로 모니터링합니다. 이들은 또한 데이터 과학 팀을 위한 IT 환경 구축 및 업데이트를 담당하기도 합니다.

데이터 과학 관리자: 이 유형의 관리자들은 데이터 과학 팀과 그들의 일과를 감독합니다. 이들은 프로젝트 계획 및 모니터링을 통해 팀의 균형적인 발전을 유지하는 팀 빌더입니다.

그러나 전체 프로세스에서 가장 중요한 역할은 데이터 과학자들이 맡습니다.

데이터 과학자는 누구인가요?

전문 분야로서 데이터 과학은 아직 젊은 분야라고 할 수 있습니다. 통계 분석 및 데이터 마이닝 분야에 그 뿌리를 두고 있죠. 2002년에 창간된 The Data Science Journal은 국제 과학 위원회: CODATA(Committee on Data for Science and Technology)에서 발간했습니다. 2008년에 이르러 데이터 과학자라는 직함이 생겨났고 이후 데이터 과학 분야는 빠르게 성장했습니다. 점점 더 많은 대학에서 데이터 과학 학위를 제공하기 시작했지만, 아직까지도 데이터 과학자가 부족한 상황입니다.

데이터 과학자의 임무에는 데이터 분석 전략 개발, 분석용 데이터 준비, 데이터 탐색, 분석 및 시각화, Python 및 R과 같은 프로그래밍 언어를 사용하여 데이터로 모델 구축하기, 애플리케이션에 모델 배포하기 등이 포함될 수 있습니다.

데이터 과학자는 혼자 일하지 않습니다. 실제로 가장 효과적인 데이터 과학은 팀웍을 통해 이루어지죠. 데이터 과학자 외에도 데이터 과학 팀에는 문제를 정의하는 비즈니스 분석가, 데이터를 준비하고 데이터 액세스 방법을 설정하는 데이터 엔지니어, 기본 프로세스 및 인프라를 감독하는 IT 아키텍트, 분석 모델 또는 출력을 애플리케이션 및 제품에 배포하는 애플리케이션 개발자가 포함될 수 있습니다.

데이터 과학 프로젝트 구현의 과제

데이터 과학이 주는 약속과 데이터 과학 팀에 대한 막대한 투자에도 불구하고 많은 기업이 데이터의 가치를 온전히 실현하지 못하고 있습니다. 일부 기업들은 인재 유치전 및 데이터 과학 프로그램 생성 경쟁에서 팀 워크플로의 비효율성을 경험했습니다. 다양한 팀원이 서로 다른 도구 및 프로세스를 사용해 공동 작업이 제대로 이루어지지 않았기 때문이죠. 보다 체계적이고 중앙화된 관리가 이루어지지 않는다면 경영진은 투자에 대한 최대의 수익을 얻지 못할 수 있습니다.

이 혼란스러운 환경은 다양한 문제를 시사합니다.

데이터 과학자가 효율적으로 일할 수 없습니다. 데이터에 대한 접근 권한은 IT 관리자가 부여해야 하기 때문에 데이터 과학자가 데이터 및 데이터 분석에 필요한 리소스를 얻게 되기까지 오래 기다려야 하는 경우가 많습니다. 접근 권한을 얻게 되었더라도 데이터 과학 팀원들은 다양한 도구(높은 확률로 서로 호환되지 않는 도구)를 사용해 데이터를 분석할 가능성이 높습니다. 예를 들어 한 과학자가 R 언어를 사용해 모델을 개발했는데, 해당 모델이 사용될 애플리케이션은 다른 언어로 작성된 경우가 있죠. 모델을 유용한 애플리케이션에 배포하는 데 몇주, 심지어 몇 개월이 걸리기도 하는 이유가 바로 여기에 있습니다.

애플리케이션 개발자가 가용한 머신러닝에 액세스할 수 없습니다. 개발자가 애플리케이션에 배포될 준비가 되지 않은 머신러닝 모델을 받게되는 경우가 종종 발생합니다. 게다가 액세스 지점이 유연하지 않을 수 있기 때문에, 해당 모델을 모든 시나리오에 배포하는 게 불가능하고, 확장성 자체도 애플리케이션 개발자의 손에 맡겨지는 경우가 있습니다.

IT 관리자가 지원에 너무 많은 시간을 할애합니다. 오픈 소스 도구가 확장되면서 IT 팀은 그 어느 때보다 긴 '지원해야 할 도구 목록'을 손에 쥐기도 합니다. 예를 들어 마케팅 분야의 데이터 과학자는 재무 분야의 데이터 과학자가 쓰는 것과는 다른 도구를 사용할 수 있습니다. 각 팀의 워크플로가 다를 수도 있습니다. 즉 IT 팀이 계속해서 새로 환경을 구축하고 업데이트해야 한다는 뜻이죠.

비즈니스 관리자가 데이터 과학 업무에서 지나치게 배제되어 있습니다. 데이터 과학 워크플로가 비즈니스 의사결정 프로세스 및 시스템에 늘 통합되는 지표없이 트렌드 시장을 식별하는 방법 지표없이 트렌드 시장을 식별하는 방법 건 아닙니다. 그 결과 비즈니스 관리자가 데이터 과학자들과 협업하는 데 필요한 충분한 지식을 얻지 못하는 경우가 발생하죠. 통합 환경이 개선되지 않으면, 비즈니스 관리자는 시제품이 제품이 되기까지 이토록 오랜 시간이 걸리는 이유가 무엇인지 이해하지 못하고, 자신이 판단하기에 '프로세스가 지나치게 느린' 프로젝트에 대한 투자를 지원하지 않을 가능성이 있습니다.

새로운 역량을 선사하는 데이터 과학 플랫폼

많은 기업이 통합 플랫폼 없이 진행되는 데이터 과학 작업이 비효율적이고, 불안정하며, 확장이 어렵다는 사실을 깨달았습니다. 이와 같은 깨달음은 데이터 과학 플랫폼을 탄생시켰죠. 이 플랫폼들은 모든 종류의 데이터 과학 작업이 이루어지는 소프트웨어 허브입니다. 좋은 플랫폼은 데이터 과학 구현 과정의 문제를 대부분 완화하고, 기업이 보다 빠르고 효율적으로 데이터를 인사이트로 전환할 수 있도록 지원합니다.

중앙형 머신러닝 플랫폼을 활용하면, 데이터 과학자는 자신이 즐겨 쓰는 오픈 소스 도구를 사용해 협업 환경에서 작업할 수 있으며, 이들의 모든 작업은 버전 제어 시스템에 의해 동기화됩니다.

데이터 과학 플랫폼의 이점

데이터 과학 플랫폼은 팀이 코드, 결과 및 보고서를 공유할 수 있게 하여 중복을 줄이고 혁신을 유도합니다. 또한 관리를 단순화하고 모범 사례를 통합하여 작업 흐름상의 병목 현상을 제거합니다.

일반적으로 최고의 데이터 과학 플랫폼은 다음을 목표로 합니다:

  • 데이터 과학자가 모델 개발 속도를 높이고 오류를 줄일 수 있도록 지원하여 생산성을 높입니다
  • 데이터 과학자가 다양한 종류의 대용량 데이터를 보다 쉽게 다룰 수 있게 지원합니다
  • 편견으로부터 자유롭고 감사 및 재현 가능한, 신뢰할 수 있는 엔터프라이즈급 인공지능(AI)을 제공합니다

데이터 과학 플랫폼은 전문 데이터 과학자, 일반인 데이터 과학자, 데이터 엔지니어, 머신러닝 엔지니어 또는 전문가를 포함한 다양한 사용자 간의 협업을 위해 구축되었습니다. 예를 들어 데이터 과학 플랫폼을 사용하면 데이터 과학자가 모델을 API로 배포하여 해당 모델이 다른 애플리케이션에 쉽게 통합되도록 할 수 있습니다. 데이터 과학자는 IT 팀의 지원 없이도 각종 도구, 데이터 및 인프라에 액세스할 수 있습니다.

데이터 과학 플랫폼에 대한 시장의 수요가 폭발적인 증가 추세를 보이고 있습니다. 실제로 플랫폼 시장의 연평균 성장률이 향후 몇 년간 39% 이상을 달성할 것으로 예상되며, 시장 규모가 2025년까지 3,850억 달러에 이를 것으로 예상됩니다.

데이터 과학자에게 필요한 플랫폼

데이터 과학 플랫폼의 기능을 살펴볼 준비가 되었다면, 다음의 주요 기능들을 고려해야 합니다:

협업을 권장하는 프로젝트 기반 UI를 선택하는 게 좋습니다. 플랫폼은 개념이었던 것이 최종 제품이 되는 모든 과정에서 해당 모델에 대한 팀원 간의 협업을 지원해야 합니다. 이 플랫폼은 팀의 각 구성원에게 데이터 및 리소스에 대한 셀프 서비스 액세스 권한을 부여해야 합니다.

통합 및 유연성에 중점을 두어야 합니다. 플랫폼이 최신 오픈 소스 도구 사용, GitHub, GitLab, Bitbucket 등 공통 버전 제어 공급자 및 기타 리소스와의 긴밀한 통합을 지원하는지 확인하세요.

엔터프라이즈급 기능이 포함되어 있어야 합니다. 팀의 성장 속도에 따라 비즈니스에 필요한 확장을 플랫폼이 지원할 수 있는지 확인하세요. 플랫폼은 고가용성과 강력한 액세스 제어 기능을 보유해야 하며 다수의 동시 사용자를 지원할 수 있어야 합니다.

데이터 과학을 셀프 서비스로 이용할 수 있어야 합니다 . IT 및 엔지니어링 팀의 부담을 덜어주고, 데이터 과학자가 환경을 즉시 생성하고, 모든 작업을 추적하고, 모델을 운영 환경에 손쉽게 배포할 수 있게 해주는 플랫폼을 선택해야 합니다.

손쉬운 모델 배포를 보장해야 합니다. 모델 배포 및 연산화는 머신러닝 수명 주기에서 가장 중요한 단계 중 하나이지만, 이 과정이 종종 간과되곤 합니다. 선택한 서비스가 보다 손쉬운 모델 연산화를 지원하는지 확인해 보세요. API를 제공하는 방식일 수도, 사용자가 손쉬운 통합 과정을 거쳐 모델을 구축하게 하는 방식일 수도 있습니다.

데이터 과학 플랫폼의 도입 시기

다음과 같은 상황이라면, 귀사에 데이터 과학 플랫폼이 필요한 것일 수 있습니다:

  • 생산성 및 협업 과정이 압력을 받고 있습니다
  • 머신러닝 모델을 감사하거나 재현할 수 없습니다
  • 모델을 단 한 번도 제품화하지 못했습니다

데이터 과학 플랫폼은 비즈니스에 진정한 가치를 제공할 수 있습니다. Oracle의 데이터 과학 플랫폼에는 모델 배포 속도를 높이고 데이터 과학의 결과를 개선하기 위해 설계된 포괄적인 E2E 경험을 제공하는 광범위한 서비스가 포함됩니다.

브랜드 경험, 온오프라인의 경계를 허물다 제3화

모바일은 고객 유입 경로, 사용 패턴, 데이터 분석 방법 등에 있어 오프라인 및 PC와 완전히 다른 플랫폼이기 때문에 의사결정이 중요하다.

Posted on 2017년 12월 14일 @ 08:00 Editor 디지털 인사이트

온라인과 오프라인, 그 사이를 헤매고 있을 마케터들에게

실질적으로 온오프라인의 경계가 허물어지며 마케터들은 고객 행동이나 패턴을 분석하기 점점 어려워지고 있다. 온오프라인을 넘나들며 다양한 소비패턴을 보이고 있기 때문. 특히나 오프라인 매장을 기반으로 하는 기존 브랜드들은 온라인에서의 측정이 더욱 어려워질 수밖에 없다. 그렇다면, 온라인과 오프라인 그 사이에서 마케터들은 어떻게 일관되게 브랜드를 전달할 수 있을까. 현재 마케터들은 그 경계에서 어떤 전략을 취하고 있는지 크리테오 Insights Seoul 2017 패널토론을 통해 살펴보자.

Q. LFmall에서 마케터로 일하면서 가장 고민되는 게 무엇인가?

김보람 LFmall 과장 저성장 저소비 시대인만큼 패션업은 품질은 유지하되 가격은 낮은 ‘가성비가 좋은’ 상품을 갖춰야 하는데 그런 상황이 일단 어렵다. 두 번째는 고객 행동과 패턴 지표없이 트렌드 시장을 식별하는 방법 분석하기가 점점 어려워진다는 점이다. LFmall는 오프라인에서 시작한 패션 기업이기 때문에 오프라인 대비 PC 그리고 PC 대비 모바일에서 고객 행동과 성과를 측정하기가 어렵다. 앞서 말씀드렸던, 저성장 저소비 시대에 고객층이 얇아지고 고령화되는 경향이 있기 때문에 이러한 점이 가장 어렵다.

Q. 그런 어려움을 해결하는 데 모바일 플랫폼이 돌파구가 돼 줄 수 있는 건가?

김보람 LFmall 과장 모바일은 앞서 말씀드린 두 가지 측면에서 돌파구가 될 수 있다. 첫 번째 저성장 저소비에 따른 수익 악화와 두 번째 소비행태 변화에 대응하는 솔루션으로 매우 유용하다. 첫 번째 측면을 살펴보자면 많은 패션 브랜드들은 오프라인 매장을 기반으로 한다. 이런 구조는 원가율이 높은 원인이기도 하다. 하지만 모바일은 오프라인 매장 운영에 비해 상대적으로 낮은 원가율로 시작할 수 있다. 회사도 소비자도 이익인 구조인 거다. 두 번째 측면인 고객 행동 패턴을 살펴보자면 패션업은 모바일에 최적화돼 있는 산업이다. 온라인 매출의 상당 부분이 모바일에서 발생하고 있기 때문. 그런 사업에서 고객이 고령화되더라도 오히려 고령화된 고객은 전환율이 높다는 점과 객단가가 높다는 점으로 상쇄된다.

모바일 시장이 주목하는 한국 앱 시장

Q. TUNE은 모바일 앱 내에서의 성과 측정방식을 MMP(Mobile Measurement Partner)라 언급하더라. PC가 온라인의 중심이었던 때는 ‘PC 메저먼트 파트너’라는 용어는 없었는데 왜 모바일 메저먼트라는 새로운 업종이 생겨나게 된 건가?

윤거성 지표없이 트렌드 시장을 식별하는 방법 TUNE Korea 이사 웹과 앱에서 사용자를 식별하는 방법이 완전히 달라졌다. 웹에서는 써드파티 쿠키로 유저를 트래킹하기 위해서 각 매체사가 광고주 사이트에 자신의 스크립트와 픽셀을 심어 유저를 트래킹하고 성과를 측정하는 방식이다. 그런데 모바일 앱에서는 쿠키를 사용할 수 없어 웹의 방식을 적용하긴 어렵다. 모바일 앱의 경우는 구글 플레이와 앱스토어에서 정한 광고용 아이디를 사용하는데 이 광고용 아이디로 분석하기 위해서는 반드시 SDK(Software Development Kit)를 설치해야 한다. 이 SDK를 통해 마케팅, 특히 유저를 인식하는 점이 달라졌다.

Q. 전 세계적으로 많이 알려진 MMP가 대부분 한국에서 사업을 하고 있는데 그만큼 한국의 앱 시장이 크다는 방증인 건가?

윤거성 TUNE Korea 이사 실제로 앱 시장이 크고 한국의 기술력을 많이 인정해주고 있다. TUNE과 같은 경우는 APAC 회사임에도 본사를 싱가포르나 일본이 아닌 서울에 둔 이유는 모바일 앱만큼은 APAC 전체에서 한국이 가장 다이나믹하기 때문이다.

Q. MMP는 용어 그대로 ‘measurement’까지만 하는지 궁금하다. 이러한 메저먼트를 가지고 차후에 마케터들이 활용할 수 있는 부분이 있을까?

윤거성 TUNE Korea 이사 저희는 메저먼트 즉, 성과를 측정하는 어트리뷰션과 트래킹을 발전시켜 이를 TUNE의 매체들에 제공한다. 세분화된 정보를 가지고 있다 보니 마케터 분들에게도 여러 특성을 가진 유저들을 나눠 서로 다른 반응을 볼 수 있는 A/B Test를 제공한다. 더 나아가, 인앱 마케팅 메시지, 푸시 메시지와 같은 마케팅 영역으로까지 확장하고 있다. 여행 업종에서 MMP를 사용한다고 가정해보면, 위치 정보까지 활용해 원하는 상황과 때에 (예를 들어 유저가 공항에 도착하는 순간) 푸시 메시지를 보낼 수 있는 거다.

모바일 캠페인의 KPI 설정 방식

Q. 모바일 캠페인을 진행할 때 KPI 설정이 PC와 다른 점은 무엇이며 어떤 지표없이 트렌드 시장을 식별하는 방법 지표가 가장 중요한가?

김보람 LFmall 과장 PC와 모바일의 KPI 설정은 그리 다르지 않다. 모바일 캠페인을 진행할 때 KPI 설정은 회사가 현재 처해있는 상황(매출과 디바이스 구분 그리고 디바이스별 거래 및 매출량)에 따라 채널 자체를 매출과 유입으로 구분해 진행하고 있다. 매출의 경우는 기본적인 상거래 지표인 지표없이 트렌드 시장을 식별하는 방법 매출액, 전환율, 구매단가를 보고 있고 유입과 노출은 써드 지표로 관리하고 있다.

Q. 윤거성 이사님은 패션, 여행 등 다양한 브랜드와 함께 일하고 계시다. 업종별로 KPI 설정 방식 등의 차이점이 있는가?

윤거성 TUNE Korea 이사 웹 브라우저 환경에서는 유저를 트래킹하고 타깃팅하기 위해 매체사가 각자의 써드파티 쿠키를 사용한다. 그런데 앱에서는 특정한 하나의 OS가 정한 광고 식별 값(ADID/IDFA, 모바일 기기의 비식별 개인정보)이 있다. ADID/IDFA를 기준으로 그 모든 트래킹과 데이터를 제공하고 있다. 이전에는 a매체를 클릭하고 b매체를 클릭하고 c매체를 클릭 후 구매했을 때 클라이언트 입장에서는 a,b,c, 중 어떤 곳이 구매에 기여했는지 알기 어렵다. 그래서 대부분 세션 visit(1인의 사용자에 의해 연속적으로 서버에 대한 요청이 이루어지는 것)을 30분으로 두고 구매전환에 대한 기여 룰을 설정한다.

그러나 모바일 앱은 스마트폰을 바꾸거나 OS를 초기화하지 않으면 아이디가 따라 다니게 된다. 그러다 보니 유저의 최초 인지부터 앱 설치와 같은 행동을 시기적으로 계속해서 파악할 수 있다. 이러한 특성 때문에 산업별로 설정하는 방식이 다르다. 예를 들어, 커머스 쇼핑에서 빠른 텀 안에 의사 결정이 일어나는 제품은 ‘어트리뷰션 윈도우(클릭 후 액션이 일어날 때까지의 기간)’를 짧게 보고 여행처럼 구매 객단가가 높은 상품은 검색하는 단계가 길기 때문에 어트리뷰션 윈도우를 길게 본다.

또한, 앱에서는 유저를 명확히 구분할 수 있다. 이 사람이 상세 페이지까지 보고 이탈한 사람인지, 장바구니까지 도달한 사람인지, 한 번 구매한 사람인지, 재구매한 사람인지를 말이다. 이렇듯, 유저의 로열티를 기준으로 티어를 구분할 수 있다. 이 티어별로 서로 다른 KPI를 적용한다. 전체 유저에게 일괄적으로 1000% KPI를 주는 것이 아니라 로열티가 높은 유저에게는 700%, 다른 유저들은 300%를 부여하는 거다. 이렇게 합산해 1000%가 나오는 방식으로 KPI를 운영하는 분들을 많이 봤다.

내부적으로 모바일에 대한 방향 설정이 우선

Q. 모바일이 중요한 건 알지만 실질적으로 마케팅할 때 어려운 점은 온라인과 오프라인 그 사이에서 어떻게 다른 전략을 취해야 할지가 아닐까. 이렇게 다른 환경에 대해 마케팅적으로 지표없이 트렌드 시장을 식별하는 방법 어떻게 대처해나가고 있을지 궁금하다.

김보람 LFmall 과장 고민이 많은 건 사실이지만 모바일은 오프라인과 이렇게 달라, PC 대비 이렇게 복잡해라고 접근하면 안 된다고 생각한다. 모바일은 고객 유입 경로, 사용 패턴, 데이터 분석 방법 등에 있어 오프라인 및 PC와 완전히 다른 플랫폼이기 때문에 의사결정이 중요하다. 모바일에 대한 어느 정도의 이해를 기반으로 의사결정이 이뤄지고 전략적 방향이 협의 되어야만 ‘모바일을 위한 개발자’, ‘모바일을 이해하는 마케터’와 함께 모바일 분석 시스템을 기반으로 현재 잘하는지 못하는지를 판단할 수 있다. 많은 회사가 이러한 점을 간과하기도 한다. 모바일 마케팅 담당자만 생기면 뭔가 될 거라 생각하는 거다. 마케터 입장에서는 숙제가 많아지겠지만

모바일 지표없이 트렌드 시장을 식별하는 방법 광고는 이런 것이고, 모바일 트렌드는 이런 것이니 ‘이렇게 바꿔야 한다’고 의사 결정권자에게 끊임없이 자극을 줘야 한다.

참석자. 김보람 LFmall 과장, 윤거성 TUNE Korea 이사

(기사 원문은 디아이 매거진 12월호를 통해 보실 수 있습니다.)

digitla-insight-202102-offline-ads-inpix

뉴스콘텐츠는 저작권법 제7조 규정된 단서조항을 제외한 저작물로서 저작권법의 보호대상입니다. 본 기사를 개인블로그 및 홈페이지, 카페 등에 게재(링크)를 원하시는 분은 반드시 기사의 출처(로고)를 붙여주시기 바랍니다. 영리를 목적으로 하지 않더라도 출처 없이 본 기사를 재편집해 올린 해당 미디어에 대해서는 합법적인 절차(지적재산권법)에 따라 그 책임을 묻게 되며, 이에 따른 불이익은 책임지지 않습니다.

개인정보 외부 유출 없는 가명처리 DB 익명성/ 다양성/ 근접성으로 최적의 비식별화 처리


데이터 유출 사고, 개인정보 유출 경로의 다양화 및 데이터 유출 규제 강화 또한 우려되고 있습니다.


스파이스웨어 가명화 솔루션은

고유의 기술력 (부분 암호화를 이용한 비식별화 특허 출원) 및

국제 표준 (ISO/IEC 20889) 의 비식별 기술과

“익명성, 다양성, 근접성” 을 기반하여

최적의 비실별화 처리 수준을 측정 합니다.

스파이스웨어 비식별화 가명화 솔루션 방식

데이터 3법 맞춤 최적화 솔루션

개인정보 가명화에서 요구하는 17개 항목을 모두 충족하는 최적화 솔루션 입니다.

외부 유출 없는 가명처리 DB 생성

양방향 암호 처리된 개인정보를 SQL을 이용하여 로드하고, 평문 변환 없이 암호화된 상태로 외부 유출 없이 가명 처리 DB를 생성 합니다. (일회성이 아닌 설정 저장 후 온라인 상태로 IF 운영 가능)

재식별 위험도 평가를 통한 관리 편의성

가명 처리 DB는 재식별 위험도 평가를 통해 데이터의 가치와 익명성 보장을 관리자가 조정할 수 있도록 제공 하고, 모든 가명 처리 작업의 기록 보존과 처리 권한을 관리 할 수 있습니다.


0 개 댓글

답장을 남겨주세요