본문 바로가기

Research/Investment Strategy

[Two-Sigma] 머신러닝으로 Inflation-Themed Equity Portfolio 구축

1번 섹션에선 역사적으로 Inflation 국면에서의 주식시장 성과를(Style, Sector) 살펴본다 .2번 섹션에선 머신러닝을 통해 Inflation 대응하는 Equity Portfolio 구축 방법과 성과를 다룬다. 이 글은 세계적인 퀀트헤지펀드 Two-Sigma에서 발간한 아티클이다. 1번섹션은 일반적으로 금융시장에 익숙한 사람은 넘겨도 되는 부분이며, 2번섹션에서 전통적인 통계적 방식과의 차이, 배분결과,성과에 집중해서 보면 좋을듯 하다. 글의 말미엔 나의 결론도 작성해보았다.


Inflation-Themed Equity 포트폴리오의 의의는?

세계적인 헤지펀드 Two-Sigma에서 High-Inflation기간에서 Outperform & Low-Inflation 기간에선 Underperform 하는 Equity Portfolio를 구성하는 법을 소개했다. 참고로 Two-sigma는 이전에 Data Scientist처럼 Inflation을 예측하기라는 리서치를 발표하기도 했다. Inflation 예측모델-> Inflation Outperform 모델로 연결한 것이다

일반적으로 Inflation에 대비할 수 있는 자산으론 TIPS(Treasury Inflation-Protected Securities)와 Gold가 있다. TIPS는 구조적으로 인플레이션 상황에서 좋은수익률을 거둔다. 나 또한 Covid-19 대응책으로부터 유발된 인플레 우려 & 침체 우려상황에서 Gold로부터 좋은 결과를 거둔 적이 있다

나는 Gold와 TIPS는 분명 수익률이 좋은 구간이 있으나, 아래와 같은 문제가 있다고 본다

  • 자체적으로 현금흐름이 창출되지 않는 문제
  • 아래 그래프와 같이 투자 기간이 길어질수록 수익의 기회를 놓치는 문제
  • 대부분 투자자의 포트폴리오는 Equity위주이고 Multi-Asset Portfolio가 아닌 펀드들은 대응하기 어렵다

Inflation-Themed Equity 모델포트폴리오는 이에 대한 해결책을 줄 수 있다는 의의가 있다고 보며, 시의성이 있어 리서치 주제라고 생각한다.

(필자가 파이썬으로 생성한 반응형 그래프)


1. 서로 다른 Inflation 국면별 주식시장 반응

1번 섹션에선 서로 다른 Inflation 국면에서의 주식시장 성과를 확인하고, 섹터 및 스타일별로 성과를 분석한다.


1.1. 현재 Inflation 상태는?

현재를 진단하기 위해선, Inflation의 역사와 함께 비교해야한다. 그래프로 보건데, 현재는 High Inflation 상태는 맞으나, 1970년대와 1980년대 수준만큼은 아님을 알 수 있다.

 Bloomberg. Period: January 1970 – December 2021, using monthly data

Exhibit1 : 연도별 YoY CPI와 Core CPI (에너지 및 식료품 제외)
"High Inflation"은 3% 이상, "Medium Inflation"은 1%이상 3%미만, "Low Inflation"은 1% 미만


1.2. Inflation의 Equity Maket에 대한 영향은?

아래의 그래프에선 Inflation과 US Market Return 간의 음의 상관 관계가 관찰된다

Bloomberg. Period: January 1970 - December 2021, using monthly data.

Exhibit2 : 월별 YoY CPI 값(X축)과 같은 달의 US Equity Market Return(Y축) 
빨강선은 회귀선(Best-fit Line)

그러나, 위 두 변수간의 관계는 단순하지 않다. Inflation과 US Equity Market Return의 관계에 영향을 줄 수 있는 팩터들은 많이있으나, 그래프를 보건데 높은 수준의 Inflation은 전반적으로 주식시장에 부정적인 영향을 끼친다고 예측할 수 있다. 부정적인 영향(기업가치 하락)을 끼치는 양상은 아래와 같다

  • 미국 연방준비이사회, 금리 상승 (High Inflation을 잡기위해) -> 차입비용 상승 -> 할인율 상승 -> 현금흐름의 현재가치 하락 -> 기업가치 하락

그러나, 아래와 같이 긍정적인 영향(기업가치 상승)을 미치는 경우도 있다.

  • 유형자산 가치 상승 ->기업가치 상승 ( ∵ Equity는 유형 자산 가치를 포함)
  • High Inflation이 양의 경제 성장과 함께하는 경우

위와 같은 이유로 High Inflation 상황에서 Equity Market이 Underperform한다는 것이 일반적인 시장참여자의 기대일지라도, 확정적으로 결론 지을 순 없다. 대신에, 시나리오와 Inflation의 driver에 따라 달려있다고 봐야한다

1.3. 주식시장의 다양한 Sector와 Style은 Inflation 국면별로 어떻게 작용하는가?

Sector: High Inflation 기간엔 대부분의 Sector의 Return은 Underperform(위 그래프). IT섹터는 섹터 중 High Inflation 기간과 Low Inflation 기간의 Return 격차가 가장 큼.(아래 그래프) 그 다음은 경기소비재, 소재. 반대로, 유틸리티 섹터는 거의 차이가 없다

이는 유틸리티는 생존에 필수적이기 때문에 수요가 덜 탄력적이기 때문

Bloomberg and Barra. Period: August 1997 - December 2021, using monthly data


Style: High Inflation 기간엔 Beta, Growth, Prospect 스타일의 Return이 저조. 반대로 Quality, Dividend Yield, Management Quality, Earnings Yield 스타일이 Outperform한다

이는 DCF 모델을 활용해 기업의 내재 가치를 평가시 Growth 주식은 상대적으로 먼 미래에 내재가치가 도래하고(Duration이 긺), 반면 Value주(높은 Earning Yields, Dividend Yields 등)은 상대적으로 가까운 기간에 더 큰 비중의 내재가치가 도래(Duration이 짧음)하기 때문. Inflation으로 인해 할인요인이 증가함에 따라 Growth주의 현금흐름은 현재가치로 계산시 더 크게 할인된다. Value주는 반대로 현금흐름이 상대적으로 더 낮은 강도로 할인됨


2. 머신러닝으로 인플레이션  Equity 포트폴리오를 구성하는법

지난 섹션에서의 이해를 토대로 인플레이션에 대응하는 포트폴리오를 구성할 수 있다. 구성방법은 아래와 같다.

  1. High Inflation 국면에서 좋은 성적을 보이는 섹터에 OW하고 반대의 경우엔 UW하는 방법
  2. ML 또는 다른 통계 모델을 활용하는 방법

Two-Sigma는 2번의 방법을 조명하는데, 이에 LightGBM이라는 ML 모델을 활용했다. Two-Sigma는 이 모델이 효율성이 높고(학습속도가 빠르고, 메모리 사용량이 적음), 분산학습을 지원하고, 손실함수(모델 예측값과 실제값과의 차이 계산함수)를 쉽게 정의할수 있기 때문이라고 밝히고 있다. 이는 실제 포트폴리오 구성에 ML사용하는 법을 보여주기 위한 예시이다. 이 모델은 High Inflation 기간엔 Outperform을, Low Inflation 기간엔 Underperform 하는 Beta 중립 주식 포트폴리오를 구성하는 데에 도움을 줄것이다.

3. 모델 셋업

모델에 사용된 데이터 셋은 아래와 같다. 2005년 1월 ~ 2021년 9월까지의 데이터를 활용한 것이다. (1970~80년대 High Inflation 기간 제외)

  • High Inflation 기간, Low Inflation 기간 데이터
  • 위 기간동안의 Stock Return
  • Stock의 섹터 및 스타일 팩터
  • Stock에 대응되는 Fundamental Data(임직원 수, 영업이익률 등)
  • 예측 데이터(애널리스트 추정 데이터)

실무적으론 다음과 같은 점에 유의한 것으로 보인다. Look-ahead Bias 제외, 과최적화 감소, 학습. 모델의 결과물은 Features, 변수, 상대적 중요도(Stock Return 예측력)이다. 특정변수(섹터, 영업이익률, 애널리스트 이익추정치 등)에 대한 민감도, 베타와 예측 Stock Return 간의 등식을 모델의 결과물로 될 수도 있다. 

일반적인 회귀분석과 Two-Sigma의 모델 간의 차이와, 의의는 아래와 같다.

  일반적인 최소제곱 회귀분석 Two-Sigma가 적용시킨 LightGBM 모델
손실함수 모델의 Error를 최소화 하는 것을 추구 Tail에 있는 Return을 정확하게 예측하는 것에 가중치 부여

Inflation이 높을 때(낮을 때) Best(Worst) 성과를 보여주는 Stock 예측에 가중치를 준 것
모델의 결과 모델 예측값과 실제값 간의 차이의 합을 최소화
적용대상  모델에 제공된 모든 데이터
데이터 처리 모든 데이터를 동일한 가치로 처리

4. 모델 결과

아래 그래프는 모델에서 밝혀낸 상대적 중요도가 높은 Feature 또는 변수이다. Two-Sigma는 그 중 아래와 같은 몇가지를 조명한다. 

Relative employment size 임금 Inflation에 대한 종목의 민감성을 대신하는 것
Industry Inflation에 타 섹터(혹은 산업) 대비 더 민감한 것이 있음
(1.3에서도 이런 결과는 예상됐음)
Dividend payout ratio 가까운 미래에 현금흐름을 창출하는 Value 주식은 Inflation이 오르는 것에 덜 영향받음
(1.3에서 예측된값)
Profit margin 높은 영업이익률을 가진 회사는 High Inflation 기간에서 살아남을 확률이 높아짐

Bloomberg, CIQ, Compustat, Worldscope, IBES, and Barra. Period: January 2005 – December 2021, using monthly data.

5. 모델 적용

모델포트폴리오는 Inflation에 민감하도록 설계됐다. 모델포트폴리오엔 전체 Universe는 800개 기업, 그 중 예측수익률 상위 10%를 보유했다.(약 80개) 이 포트폴리오는 개별주식 리스크를 감소시키는 동시에 Inflation을 강하게 표현할 수 있는 정도의 분산을 가져갔다.

모델이 성공적인지 평가하기 위해, 모델포트폴리오의 High Inflation, Low Inflation 기간동안의 Active Return을 평가했다(BM S&P 500) 데이터는 2005년에서 2021년까지 사용됐다. Alpha를 추구하는 포트폴리오가 아닌 High Inflation엔 좋은 수익률을, Low Inflation 기간엔 나쁜 수익률을 가져오는 모델포트폴리오이다. 이 모델은 Inflation 자체를 예측하는것은 아니고, High Inflation에 좋은 성과를 거두는 포트폴리오를 찾는 것이다.

5.1 Active Return 분해

아래는 모델포트폴리오의 월별 수익률이며, 맨 왼쪽의 빨간 막대를 보면, High Inflation 기간동안 모델포트폴리오가 좋은 Active Return을 거뒀음을 알 수 있다. 그 우측에 있는 그래프는 Active Return 값에 대한 수익률 요인을 분해한 것으로, Barra 모델을 활용하고 있다. 세 개의 축을 보면 대부분의 수익률은 Residual(잔차)에서 나왔음을 알 수 있다. 반면, 섹터 익스포져는 High Inflation기간에 초과 수익분을 감축시켰다는 점이 흥미롭다.

Bloomberg, CIQ, Compustat, Worldscope, IBES, and Barra. Period: January 2005 – December 2021, using monthly data. We used the Barra USFASTD risk model. The initial model training period is five years.

5.2 Inflation 헷지 수단과 비교

High Inflation 기간의 초과수익률에서 Low Inflation 기간 초과수익률을 빼면 약 0.8%가 나온다. 아래의 Exhibit 7을 보면 모델포트폴리오의 초과수익은 금의 수익률보단 크고 TIPS(인플레이션 연동 채권)의 수익률과 비슷한 수준이다.

Sources: Bloomberg, CIQ, Compustat, Worldscope, IBES, and Barra. Period: January 2005 – December 2021, using monthly data. The initial model training period is five years

5.3 Sector, Style 익스포져는?

모델의 성공을 확인하는 다른 방법은 모델포트폴리오의 평균적인 섹터와 스타일팩터 노출도를 분석하여 앞 1번섹션의 분석과 어느정도 일치하는지 확인하는 것이다.(Exhibit 3, 4) 포트폴리오가 High Inflation 기간에 좋은 수익률을 보이는 섹터와 스타일의 익스포져를 늘리고 그 반대엔 익스포져를 줄였는지이다.

Exhibit 8에서, 모델포트폴리오가 Consumer Staples, Healthcare, Utilities 익스포져를 증가시키고, IT, Financials, Energy에서 익스포져를 줄인 것을 확인할 수 있다. 스타일에선, High Dividend yildes, Profiability, Earnings, Quality에서 익스포져를 증가시키고, High-Beta, Value, Growth에선 익스포져를 줄인 것이 보인다. 

모델의 예측결과는 우리들의 Exhibit 3,4에서의 예측과 정확히 일치하지는 않는다. 이는 장점과 단점이 있다. 단점은 모델포트폴리오의 결과를 직관적으로 이해하기 힘들다는 점이고, 장점은 우리가 머신러닝같은 기술을 몰랐더라면 알 수 없었던 것을 말해준다는 점이다.

Bloomberg, CIQ, Compustat, Worldscope, IBES, and Barra. Period: January 2010 – December 2021, using monthly data. The portfolio was trained with monthly data starting from January 2005.

5. 결론

시장참여자들은 Inflation이 오르는 상황과 포트폴리오에의 영향을 염려하고 있다. Equity 리스크는 대부분 기관투자자의 Multi-Asset 포트폴리오의 가장 중요한 Driver인데, Equity 포트폴리오에선 투자자들이 잠재적으로 더 높은 Inflation을 견뎌내기 위해 어떻게 배분해야하는가?

나는 더 좋은 수익률을 얻기 위해서, 분석방법을 다각화하는 것이 우리의 사명이라고 생각한다. 일반적인 분석방법에서 멈춰있으면, 알파는 잠식된다. 머신러닝이 모든 해결책을 제시해준다거나, 우리 애널리스트들을 대체한다고 보지 않는다. 2번섹션과 3번섹션에서 본 것과 같이, 어떤 머신러닝 툴에 어떤 것을 어떻게 돌릴지도 우리 애널리스트들이 결정하는 것이며 그 결과를 해석하는 것 또한 온전히 우리의 몫이다.

금융시장을 완벽하게 예측할 수 있는 모델은 알려져있지 않다. 시장참여자들이 동일하게 이해하고 있는 큰틀에서 크게 벗어나지 않게, 부분부분 설명가능한 것들이 존재할 뿐이다. 우리가 알지 못하는 것들이 더 많다. 우리의 지평을 넓히기 위해서 머신러닝은 필수불가결한 기술로 보인다.

다만 포트폴리오에 머신러닝을 적용시키는 것은 투자자들과 신뢰관계 구축이 선행되어야한다. 투자자들의 신뢰를 얻기 위해선 적용방식에 대한 이해와 결과에 대한 분석, 모델에 대한 예측이 필요하다. 머신러닝을 통해 지금 당장 좋은 수익률을 낼수 있을진 모르더라도 이번 인플레이션 기간에도 같은 모델을 만들어서 운용해보면 좋지 않을까? 라는 생각이 든다. 모델포트폴리오를 운용하면서, 트랙레코드를 쌓고 결과를 해석해 나가는 것이다.

우리가 준비되어있지 않다면, 누가 받아들일 준비가 될 수 있는것인가?