고로치의 자음 ㄱㄹㅊ를 정사각형 모양으로 만들었습니다.

데이터 분석의 의미와 목적

온체인 데이터에 대한 이야기를 하기에 앞서 데이터 분석의 의미와 목적에 대해서 이야기 합니다.

0/

데이터 분석의 의미와 목적을 알려줘야 하겠다. 생각하게 된 계기

어제, ‘데이터를 다루어 투자에 접목하고 싶은데.. 어떻게 하면 좋을까요..’ 라는 질문을 받았는데.. 블록체인 이라는 영역도 태어난지 얼마 안되었는데다가.. 그걸 분석하는 온체인 데이터 분석은 더더욱 새로 개척해가는 지대이다 보니 뭔가 딱히 정해진게 없다보니, ‘정답은 없다.’, ‘직접 뛰어들면서 배워야 한다.’ 라고 답변을 하긴 했지만.. 내가 도와줄 수 있는 부분은 없을까.. 라는 생각이 같이 들었습니다.
Yesterday, I was asked, “I want to work with data and apply it to investing… how do I do that? I was asked, “How can I work with data and incorporate it into investing?” Blockchain is a new field, and on-chain data analysis is a new field, so there is no set answer, so I answered, “There is no right answer,” and “You need to jump in and learn.” But is there anything I can help you with? Is there anything I can do to help? I was like, “Is there anything I can do to help?

사실, 그 동안 수십 분들에게 이런 질문을 받았는데.. 제 안에 어떤 답이 없어서 그런지 ‘정답은 없습니다. 직접 해보셔야 합니다.’ 라고 답을 했었는지 모르겠네요.
그런데, 생각해보니..
어떤 완벽한 커리큘럼이 아니라, 최소한 마중물 정도만 되어도 될 정도의 자료만 만들어도 좋을것 같고,
가치 있는 정보는 사람들이 원하는 정보라고 하는데 어떤 글보다 가치가 있을 것 같다는 생각으로
몇 달 전에 네이버 블로그에서 작성하다가만, 온체인 데이터 시리즈 글을 새로 리뉴얼 할 겸,
그 과정에서 나도 분명히 배우는게 많을 것 같아… 하나 둘 씩 제 생각을 글로 작성해보려 합니다.

In fact, I’ve been asked this question by dozens of people over the years, and I’ve always said, “There’s no right answer, you have to do it yourself,” because I don’t have any answers.
But I don’t think you need to create a complete curriculum, I think you need to create something that’s at least a stepping stone,
Valuable information is information that people want, and I think it would be more valuable than any article.
A few months ago, while writing on the Naver blog, I renewed the on-chain data series article,
I think I will definitely learn a lot in the process… I will try to write my thoughts one by one.

이번 기회에 개념도 새로 정리하고, 훗날 똑같은 질문을 할 그 누군가에게도 도움이 되었으면 합니다.
Hopefully, this will refresh your concepts and help someone else who might ask the same question in the future.

다만, 조심스러운 것은 위에서 말했듯, 여기 온체인 데이터 분석 지대는 정답이 없는.. 이제 시작하는 영역이라 제 생각이 정답이 아닐 가능성이 높아요. 지금도 같은 온체인 데이터 분석이지만, 다른 플랫폼, 다른 철학, 다른 활용법으로 접근 하는 사람들이 충분히 많거든요. 그래도 이 노력이 헛되지 않는 이유는 분명히 누군가는 제 개념을 수정/보완 할 수도 있고, 훨씬 더 높은 단계로 승화시킬 수도 있을거라 생각합니다. 오픈소스 시장이 그러하듯 이요.
However, the caveat is that, as I said above, this is an area of on-chain data analytics where there is no right answer… it’s just starting out, so there’s a high probability that my idea is not the right answer. It’s still on-chain data analytics, but there are enough people approaching it with different platforms, different philosophies, and different use cases. That’s why this effort is not in vain, because I’m sure someone can modify/complement my concept and take it to a much higher level, just like the open source market.

1/

먼저, 아래 글은 ‘하워드 막스 투자와 마켓 사이클의 법칙’ 내용에 제 생각을 담아 살짝 편집한 내용으로… 데이터를 다루는 사람들이 필수적으로 가져야 할, 데이터를 바라보는 관점입니다.
First, the following is a slightly edited version of Howard Marks’ Investing and the Laws of Market Cycles with my own thoughts… It’s a perspective on data that people who work with data should have.

미래는 일어나도록 정해진, 예측할 수 있는 하나의 고정된 결과가 아니라, 다양한 가능성과 확률적으로 일어난다고 생각해야 한다. 그래서 데이터를 기반으로 투자하는 사람이라면 더더욱 구체적으로든 약식으로든 확률분포적으로 생각해야 한다.

병에 검은색 공과 흰색 공이 100개 들어있다고 해보자. 그 병에서 임의로 공을 꺼낸다면, 어떤 색 공이 나온다는데에 베팅 하겠는가?

병 속에 든 내용물에 대해 아무것도 모른다면 베팅은 그저 추측의 문제다. 즉, 아무 정보없이 행하는 투기다. 검은 공 50개와 흰 공 50개가 들어 있다는 사실을 안다고 해도 상황은 마찬가지다. 어느 쪽이나 맞출 수 있는 확률은 50:50 이상이 될 수 없다. 따라서 최소한 50%이상의 확률을 제시받지 못하는 상황에서 베팅은 바보 같은 짓이다. 행운이 따르지 않는 한 반반의 승산으로 검은 공이나 흰공에 베팅해봤자 별 이득이 없다.

자, 이제는 병 속의 내용물에 대한 특별한 통찰력이 있어서 병 속에 검은 공 70개와 흰 공 30개가 있다는 사실을 안다고 해보자. 이 경우 당신은 틀릴 경우보다 맞출 경우가 더 많을 것이다. 검은공에 10달러를 걸 수 있다면, 10달러를 벌 확률은 70퍼센트, 10달러를 잃을 확률은 30퍼센트이다. 즉, 10번 고르면 40달러의 수익을 기대할 수 있는 것이다. 베팅 횟수가 많아지면 질수록 당신은 30퍼센트에 가까운 수익율을 낼 것이고 말이다.

물론 당신의 베팅 상대는
a 병속에 검은공이 70퍼센트, 흰 공이 30퍼센트 들어 있다는 사실을 모르거나
b 당신이 그 정보를 안다는 사실을 모를 때
에만 베팅할 것이다.

만약, 베팅 상대가 병 속의 공이 7:3의 비율로 있다는 것을 알거나, 그는 모르지만 당신이 뭔가 알고 있다는 사실을 안다면… 이 게임은 이루어지지 않거나, 모두 검은색으로 베팅하여 이익은 사라질 것이다.

다시 말해, 이 게임에서 지는 경우보다 이기는 경우를 더 많게 하려면 첫째, 확률적으로 생각해야 하고 둘째, 지식의 우위를 가져야만 한다는 것이다.

그리고 유의 해야 할 점은.. 확률을 알고 있다고 해서 당장 다음번에 무슨 공이 나올지 아는 것은 아니라는 점이다.

The future is not one fixed, predictable outcome, but rather a range of possibilities and probabilities. So, if you’re a data-driven investor, you need to think in terms of probability distributions, both concrete and abstract.

Imagine a jar with 100 black and white balls in it. If you were to randomly pull a ball out of the jar, what color would you bet it would be?

If you don’t know anything about the contents of the jar, then betting is just a matter of guesswork – an uninformed speculation. The situation is the same even if you know that there are 50 black balls and 50 white balls inside. The odds of hitting either one can’t be more than 50:50, so betting is foolish unless you’re presented with odds of at least 50%. Unless you get lucky, there’s nothing to be gained by betting on black or white balls with 50/50 odds.

Now, suppose you have special insight into the contents of the jar and know that there are 70 black balls and 30 white balls in the jar. In this case, you will get it right more often than you will get it wrong. If you bet $10 on the black ball, you have a 70 percent chance of winning $10 and a 30 percent chance of losing $10, meaning you can expect to make a profit of $40 after 10 picks. The more bets you make, the closer you are to a 30% return..

Of course, your betting partner doesn’t know that the jar contains 70 percent black balls and 30 percent white balls. doesn’t know that you know that information when they don’t know that information.

If your betting partner knows that the ball in the bottle has a ratio of 7:3, or if he doesn’t know but you know something… the game will not be played, or you will bet all black and your profit will be wiped out.

In other words, to win this game more often than you lose, you must first think probabilistically and second, you must have a knowledge advantage.

And remember. just because you know the odds doesn’t mean you know what the next ball will be.

2/

그래요. 온체인 데이터 분석가가 되었건 차티스트가 되었건.. 어떤 데이터를 다루고 또, 그 데이터를 바탕으로 베팅을 하는 플레이어들이 할 수 있는
최선의 첫걸음은.. 병 안에 검은색 공과 흰색 공이 얼만큼 있다는 사실을 알아 채는 것입니다.

이를 달리 말하면, 시장의 현 상태를 잘 안다는 말과 같고, 그 시장 혹은 종목의 현재 상태를 확인 하는 방법은 여러가지가 있지만, 우리는 시장 참여자들의 흔적 덩어리, 데이터 분석을 통해 그 상태를 파악 하고자 하는겁니다.

Yeah, I think the best first step for anybody, whether you’re an on-chain data analyst or a chartist, dealing with data and making bets based on that data, is to recognize that there’s a certain amount of black balls and white balls in the jar.

In other words, it’s like knowing the current state of the market, and there are many ways to determine the current state of a market or an instrument, but we’re trying to figure that out by analyzing the trace mass of market participants, the data.

그리고 두번째 걸음은 그 확률을 바탕으로 베팅할 때.. 가령 70% 승리의 확률로 검은색 공에 베팅하더라도 30%의 확률로 손실이 날 수 도 있다는 것을 이해 하는 것입니다. 그래서 지금 당장 게임에서 이길 가능성이 70%라고 생각하기보다, 이와 같은 조건의 게임을 많이 반복할수록 이기는 횟수가 70%라고 생각하는게 좋습니다. 단 한번의 게임에 목숨 걸면 안된다는 거죠. 승률 70%를 챙길 수 있는 엄청난 무기를 갖고 퇴학당하면.. 이보다 억울한 일은 없는거 같습니다.

And the second step is when you bet based on those odds. For example, if you’re betting on the black ball with a 70% chance of winning, you understand that there’s a 30% chance that you’re going to lose. So instead of thinking that you have a 70% chance of winning the game right now, it’s better to think that the more times you play a game with these conditions, the more times you’re going to win. In other words, you shouldn’t gamble your life away on a single game. There’s nothing more unfair than being expelled from school with this amazing weapon that can give you a 70% chance of winning.

그래서 정리하자면, 이기는 게임을 하려면 시장의 현 상태를 잘 알아야 하고, 현 상태 이해를 바탕으로 확률적으로 생각하여 베팅하고, 또 그에 따른 리스크도 같이 알아야 한다는 말입니다.
So, to summarize, in order to play a winning game, you need to know the current state of the market, make probabilistic bets based on your understanding of the current state, and understand the risks involved.

그리고 시장 속에 데이터를 이해해야 앞으로도 변화된 시장속에서의 데이터도 제대로 이해할 수 있을것입니다.
We need to understand the data in the marketplace so that we can understand the data in the marketplace in the future.

3/

그리고 잊지 말아야 하는 것은 우리는 내일 당장 데이터 분석의 완성체가 되는게 목표가 아니라.. 이제 시작하는, 이 시장의 데이터와 승률 높은 패턴의 데이터를 쌓고 쌓고 쌓아서 확률 높은 베팅을 찾고 그 베팅을 반복하는 데에 목표가 있어야 합니다. 너무 조급하게 마음 먹지 말고, 조금 길게 보고 쌓아가는 여정이 되도록 해야 할 것입니다.

And let’s not forget, our goal shouldn’t be to be a master of data analytics tomorrow… it should be to start now, to stack and stack and stack the data of this market and the patterns of winning bets and to find the winning bets and to repeat those bets. So let’s not get too hung up on it, let’s take the long view and let it be a journey.

4/

크립토 시장에는 중앙거래소 내에서 발생하는 마켓 데이터와 블록체인 위에서 발생하는 온체인 데이터가 있습니다.
다음 글에선 크립토 시장에서 데이터를 다루려고 한다면 온체인 데이터를 알아야 하는 이유와 온체인 데이터에 대한 이야기를 해보겠습니다.

In crypto markets, there is market data, which occurs within centralized exchanges, and on-chain data, which occurs on the blockchain.
In the next post, we’ll talk about on-chain data and why you need to know about it if you want to work with data in crypto markets.

5/

그럼.. 천영록님 글을 끝으로 이번 글은 마치겠습니다.

So… That’s it for today’s article by Youngrok Chun.

변하지 않는 수익의 근원에 대한 전략을 잘 정의해야 한다고 생각하는데요. 삼국지에서는 제갈공명의 북벌과 사마의의 수성이 부딪히는 장면이 떠오릅니다. 제갈공명의 전략은 ‘빠르고 강력하게 부딪혀서 모든 전투를 승리한 다음에 북방으로의 교두보를 확보한다’ 였어요. 모든 전투를 이겨야만 했고, 스스로 이길 자신도 있었겠지요.

한편 사마의의 전략은 ‘위나라는 자원이 넉넉함으로 시간을 끌고 버티기만 하면 이긴다’ 였어요.

여러분은 어떻게 생각하시나요? 저는 싸움이 시작되기 전부터 이미 사마의의 전략이 승부를 갈랐다고 생각합니다. 제갈공명이 가장 원치 않는 카운터 카드를 가지고 나온 것이죠.

트레이딩과 투자란 제갈공명과 사마의의 싸움과 비슷합니다. 모든 전투를 다 이겨야 하는 제갈공명. 모든 전투를 다 지더라도 결정적인 패배 없이 시간을 끌면 이기는 사마의. 주식의 역사란 수많은 제갈공명들이 두들겨댄 시장에서 결국 사마의가 모든 것을 가져가는 역사가 아니었나 합니다.

I think you have to define a strategy for the constant source of revenue. In the Three Kingdoms, there’s a scene where the Northern Beetle of Zhuge Liang and the Mercury of Samaritan collide. His strategy was “strike fast and hard, win all the battles, and then secure a bridgehead to the north.” He had to win all the battles, and he was confident that he could win.

On the other hand, Sama’s strategy was, “Wei has plenty of resources, so we can bide our time and win.

What do you think? I think Sama’s strategy won the game before the fight even started, because he played the most unwanted counter-card.

Trading and investing is a lot like the fight between Zebra Resonance and Samaritan. Zebra has to win all the battles. Sama, who can lose all the battles and still win if he bides his time without suffering a decisive defeat. The history of stocks is a story of a market that has been pummeled by a number of Zebras, but in the end, the Samas take it all.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다