컨퍼런스 후기

[2024년 10월 18일] 2024 제8회 한국 퀀트투자 컨퍼런스 후기

#자유의날개 2024. 10. 24. 10:50
반응형

2024년 10월 18일에 진행된 제8회 한국 퀀트투자 컨퍼런스를 다녀왔습니다. 금융 데이터를 분석하거나 정보를 제공하기 위해 현업에서 AI를 어떻게 사용하고 있는지 들을 수 있었고, 여러 인사이트를 얻을 수 있는 귀중한 시간이었습니다. 향후 금융 AI를 연구할 때 아이디어를 내는 데 참고할 수 있도록 각 세션별로 어떤 내용이 있었는지와 개인적인 생각을 짧게나마 정리해 두었습니다.

1. 엔터프라이즈 및 Vertical 시장에서의 생성AI의 기회 - 허진호, General Partner, HRZ

  • VC 관점에서 AI가 시장에 미치는 영향에 대한 포괄적이고 개론적인 설명.
  • AI는 웹/모바일보다 더 큰 경제적 가치를 창출할 가능성이 크며, 특히 B2B 시장에서 초기 기회가 클 것으로 보임.
  • 각 산업에 특화된 Vertical AI 도입은 기존의 워크플로 개선을 넘어, AI와 워크플로가 서로 영향을 주고받는 방향으로 나아가고 있음.
  • 데이터 생성 및 시뮬레이션을 통해 퀀트 트레이딩에 큰 도움을 줄 수 있을 것으로 보임. 특히 AI를 활용한 시장 예측과 포트폴리오 최적화가 유망한 분야로 보임.

2. 시장에 대한 생각을 계량화하는 실험 디자인 - 최한철 대표, 뉴로퓨전, Valley AI

  • 종목 탐색, 재무 분석, 가치 평가 등 다양한 기능을 제공하는 AI 분석 플랫폼을 서비스하고 있음.
  • 전통적 금융 데이터 기반 방법론은 레드오션화되어, 새로운 데이터와 분석 기법이 필수적이라는 점을 실감했음. 특히 금융시장에서 대안 데이터(통신, 카드, 날씨 등)는 새로운 알파를 찾는 중요한 수단이 될 수 있음.
  • 사람의 생각은 노이즈가 많으므로, 분석 질문에 따라 편향과 분산이 달라짐. LLM 기반 서비스를 만들 때 고려해야 하는 큰 문제라고 생각됨.
    예) "Google에 대해 어떻게 생각하십니까?" -> 낮은 편향, 높은 분산.
          "삼성 갤럭시의 디자인 선호도는?" -> 높은 편향, 낮은 분산.
  • 금융 데이터는 과거 패턴에 의존한 귀납적 추론 방식을 사용하지만, 시장의 데이터가 항상 동일한 분포를 따르지 않으며 변화하는 시장 상황에서는 인간의 연역적 사고가 더 유리함.
  • Valley AI 서비스 내의 사용자 인사이트와 매크로 분석 대회를 통한 데이터 수집을 통해 연역적 추론을 위한 지식 그래프 DB를 구축하려고 시도하고 있음.

3. AI와 마켓 인텔리전스의 만남 : 워크플로 적용 사례 알아보기 - Andreas Darmawan, Director, Quantitative Specialist, S&P Global Market Intelligence

  • 기업 분석을 위한 다양한 질문에 대해 각각 프롬프트를 따로 작성해 사용하고 있었음.
  • 수많은 기업 분석이나 금융 데이터에서 빠르게 인사이트를 도출하는 것이 매우 중요하며, 이 과정이 비용 측면에서도 훨씬 경제적임.

4. 언어모델LLM(GPT)을 활용한 투자 AI 애널리스트 개발기 : RAG의 적용과 한계 - 한태경 CDO, 모트에이아이

  • 사용자 질의에 실시간으로 응답 가능한 GPT 서비스와 개발한 서비스를 직접 시연함.
  • RAG와 의미를 고려한 시멘틱 청킹을 통한 데이터 처리 방식은, 특히 비정형 데이터 분석에서 큰 강점을 보여주었으며, 공시 데이터 처리와 같은 복잡한 작업에도 매우 적합해 보였음.
  • 주식 스크리닝과 백테스팅을 언어로 수행하여 분석 및 평가. 공시 데이터 실시간 분석 및 요약 제공. 기업 어닝콜 데이터를 수집해 AI 기반 보고서를 작성.
  • 투자 대가들의 전략을 통계적으로 분석해 결과를 보여주는 기능. LLM이 백테스팅 및 정형 데이터 모듈 등을 통제하여 투자자의 실시간 요청에 응답.
    예) "기대수익률 6%, 6년 투자 시 적합한 ETF 포트폴리오 추천해줘."
  • 모듈 통합의 강력함과 신뢰도 향상. 백테스팅 및 정형 데이터 모듈과 통합된 LLM은 투자자에게 더 정교하고 유의미한 정보를 제공할 수 있음을 확인했음. 이는 투자 의사결정을 크게 향상시킬 수 있는 강력한 도구가 될 수 있음.
  • 향후 부동산 데이터도 적용할 예정.

5. ChatGPT를 활용한 포트폴리오 구성: 학술 연구 사례 분석 - 김장호 부교수, 고려대학교 기술경영전문대학원

  • ChatGPT를 활용해 포트폴리오를 구성하고 투자 결정을 돕는 연구 사례 분석.
  • "Asset Selection from ChatGPT" 연구에서는 종목을 추천받거나 종목에 대한 비중을 알려달라고 요청한 후 백테스팅을 진행했음. ChatGPT의 자산 선택이 랜덤 선택보다 다양성과 성과 측면에서 더 우수함을 확인함.
  • 포트폴리오 최적화 연구
    • 관계를 파악하는 태스크에 GPT를 사용. 텍스트를 통해 자산들 간의 새로운 정보를 추출하는 데 활용.
    • 먼저 GPT에게 두 자산의 상관관계를 알려주고, High positive부터 High negative까지 중에 선택하도록 함.
    • 각 경제 상황에 따라 투자하기 좋은 자산들에 대한 지표로 올웨더 포트폴리오를 구축하는 GPT를 만들어 봄.
    • Gerber 통계 분석을 통해 결과 해석.
    • 실증 분석이 짧아서 rigorous 하지 않음.
  • GPT가 만들어질 때 학습된 기간을 고려해 룩어헤드 바이어스를 피해야 함. 예를 들어 gpt-4o-2024-05-13 버전의 경우 2024년 5월 13일 이후 데이터로 백테스팅해야 함.

6. 체계적인 퀀트 분석: 체스에서 금융 시장으로 - Chris Xie, Founder & CIO, Tianyan Capital Limited

  • 체스, 바둑에서 발전한 AI 기술을 금융 시장에 적용할 수 있다는 내용. 기본적이고 개론적인 설명.

7. 금융 의사 결정을 위한 오픈소스LLM 모델 활용의 기술적 한계와 해결책 - 전인수 팀장, AI Tech Lab 팀장, 크래프트 테크놀로지

  • LLM에 대한 자세한 설명을 진행과 LLM의 추론 능력 향상을 위한 연구들을 소개함.
  • 금융 서비스 회사의 91%가 AI를 사용하고 있으며, 블룸버그도 자연어 기반 쿼리 서비스를 제공하고 있음.
  • 오픈소스 Fin-LLM은 특정 도메인에 파인튜닝된 모델이 많음. 그러나 상용 LLM에 비해 성능이 떨어짐.
  • MMLU라는 벤치마크를 통해 LLM의 성능을 평가할 수 있음.
    • "Are We Done with MMLU?"라는 논문은 추론 능력에 대한 다양한 한계점을 분석함.
  • LLM의 기본 구조인 트랜스포머는 구조적인 특성상 추론을 잘하지 못함. AI가 인간의 추론 구조를 완전히 모방하려면 연역적, 귀납적 추론 시스템이 함께 작동해야 함.
    • 뉴로퓨전에서 언급된 것처럼 LLM은 비교 추론에는 뛰어나지만, 합성 추론에 어려움을 겪고 있으며, 연역 추론은 트랜스포머의 구조상 아직 달성되지 못한 상태임.
    • 기존 LLM의 연역적 추론 문제를 해결하기 위해 환형 트랜스포머 아키텍처에 대한 연구가 진행되고 있다고 소개함.

8. AI를 투자에 활용할 때 주의할 점 & 국부펀드 및 연기금 AI 투자 적용 사례 및 동향 - 김영규 대리, 한국투자공사

(1) 다중 테스트에서 발생하는 Selection Bias

  • 여러 테스트를 진행하다 보면 Selection Bias가 발생할 수 있음.
  • 적절한 Loss Function 사용, Information Coefficient 계산, 상대적인 주식 매력도를 예측하는 것이 중요함.

(2) 부적절한 입력 데이터 및 Loss 설정 피하기

  • 금융 데이터는 비정상성을 가진 시계열 데이터임.
  • Overfit을 방지하는 것이 가장 중요하며, Deflated 샤프 비율과 XAI(설명 가능한 AI), 불확실성 추정을 사용.

(3) 적절하지 않은 데이터 전처리 방지

  • 데이터의 topology 변화에 대응하는 것이 어려울 수 있음.
  • 해당 데이터에 공간적 특성이 있는지 확인 필요. 일반적으로 1D 데이터가 더 적합.

(4) Distribution Shift로 인한 I.I.D 가정 위반 주의

  • 독립적이고 동일한 분포(Independent Identically Distributed)의 가정이 깨질 수 있음.
  • 텍스트, 소비자 데이터, 날씨, 위성 데이터, 특허, 신규 건축 허가 등 대체 데이터를 사용해 I.I.D 가정을 만족시키는 것이 중요.

(5) AI 모델의 특성 고려

  • LLM의 토크나이저 방식으로 인해 숫자 비교에 문제가 발생할 수 있음.
  • LLM에 Look-ahead Bias가 포함될 수 있음. 학습 데이터의 날짜를 고려하고, 숫자 처리를 잘할 수 있는 토크나이저를 선택.

(6) 실제 투자 전략으로 사용 가능한지 점검

  • 거래 비용과 현실적인 투자 가정을 점검해야 함.
  • 알파 디케이가 너무 빠르면 투자할 수 없는 데이터일 수 있으며, 정보 업데이트 빈도가 낮으면 더 높은 빈도의 데이터로 대체하는 것이 필요.

9. 디지털 자산 시장에서의 퀀트 헤지펀드 전략 - 이규열 대표, 에스큐알

  • 컴플라이언스 문제로 구체적인 전략은 공개할 수 없다고 하여 개략적인 내용만 발표.
  • 롱 포지션과 숏 포지션 고래들이 청산가를 가지고 게임을 함.
  • 거래소 자체가 고레버리지를 지원하고, 투기적 성향의 투자자들이 많기 때문에 calm & crazy 상태를 찾아내고 각각에서 수익을 얻을 수 있는 전략을 개발함.

 

반응형