Polymarket 차익 거래 성경: 진정한 격차는 수학적 인프라에 있다

3월 11, 2026 13:34:42

공유하십시오

원문 제목: Polymarket에서 거래를 위한 수학 (완전 로드맵)

원문 저자: Roan, 암호 분석가

원문 편집: MrRyanChi

@insidersdotbot를 설립하는 과정에서, 저는 많은 고빈도 시장 조성 팀과 차익 거래 팀과 깊은 대화를 나누었습니다. 그 중 가장 큰 요구는 차익 거래 전략을 어떻게 세울 것인가입니다.

우리의 사용자, 친구, 파트너들은 모두 Polymarket 차익 거래라는 복잡하고 다차원적인 거래 경로를 탐색하고 있습니다. 만약 당신이 트위터의 활발한 사용자라면, "나는 XX 차익 거래 전략을 통해 예측 시장에서 얼마를 벌었다"는 트윗을 본 적이 있을 것입니다.

하지만 대부분의 글들은 차익 거래의 기본 논리를 지나치게 단순화하여, 차익 거래를 "나도 할 수 있다", "Clawdbot을 사용하면 해결된다"는 거래 모델로 만들고, 어떻게 체계적으로 이해하고 자신만의 차익 거래 시스템을 개발할 수 있는지에 대한 자세한 설명이 없습니다.

만약 당신이 Polymarket에서의 차익 거래 도구가 어떻게 돈을 버는지 이해하고 싶다면, 이 글은 제가 지금까지 본 가장 완전한 해석입니다.

영어 원문에는 너무 기술적인 부분이 많아 추가 연구가 필요하므로, 저는 여러분이 이 글 하나만으로 모든 핵심 내용을 이해할 수 있도록 재구성하고 보충했습니다.

Polymarket 차익 거래는 단순한 수학 문제가 아니다

당신은 Polymarket에서 하나의 시장을 봅니다:

YES 가격 $0.62, NO 가격 $0.33.

당신은 생각합니다: 0.62 + 0.33 = 0.95, 1달러가 안 되니 차익 거래의 여지가 있다! YES와 NO를 동시에 사고 $0.95를 쓰면, 결과에 관계없이 $1.00를 돌려받아 순이익 $0.05를 얻을 수 있습니다.

당신은 맞습니다.

하지만 문제는------당신이 이 덧셈 문제를 수동으로 계산하고 있을 때, 양적 시스템은 완전히 다른 일을 하고 있다는 것입니다.

그들은 동시에 17,218개의 조건을 스캔하고, 2\^63개의 가능한 결과 조합을 넘나들며, 밀리초 단위로 모든 가격 모순을 찾아냅니다. 당신이 두 개의 주문을 마치면, 가격 차이는 이미 사라졌습니다. 시스템은 이미 수십 개의 관련 시장에서 동일한 허점을 찾아내고, 주문서 깊이와 수수료를 고려한 최적의 포지션 크기를 계산한 후 모든 거래를 병렬로 실행하고, 자금을 다음 기회로 전환했습니다.[1]

차이는 속도만이 아닙니다. 수학적 인프라입니다.

제1장: 왜 "덧셈"만으로는 부족한가------한계 다면체 문제

단일 시장 오류

간단한 예를 봅시다.

시장 A: "트럼프가 펜실베이니아에서 선거에서 이길까요?"
YES 가격 $0.48, NO 가격 $0.52. 합쳐서 정확히 $1.00입니다.
완벽해 보이고, 차익 거래의 여지가 없죠?

틀렸습니다.

하나의 시장을 추가하면 문제가 생긴다

시장 B를 봅시다: "공화당이 펜실베이니아에서 상대를 5% 이상 초과할까요?"

YES 가격 $0.32, NO 가격 $0.68. 이것도 합쳐서 $1.00입니다.

두 시장은 각각 "정상적"입니다. 하지만 여기에는 논리적 의존 관계가 있습니다:

미국 대통령 선거는 전국적으로 투표를 세는 것이 아니라 주별로 세어집니다. 각 주는 독립적인 "전장"이며, 이 주에서 더 많은 투표를 얻는 사람이 그 주의 모든 선거인단 투표를 가져갑니다(승자 독식). 트럼프는 공화당 후보입니다. 따라서 "공화당이 펜실베이니아에서 이긴다"와 "트럼프가 펜실베이니아에서 이긴다"는 동일한 사건입니다. 만약 공화당이 상대를 5% 이상 이긴다면, 이는 트럼프가 펜실베이니아에서 이겼다는 것을 의미하며, 큰 차이로 이겼다는 것입니다.

다시 말해, 시장 B의 YES(공화당의 대승)는 시장 A의 YES(트럼프의 승리)의 하위 집합입니다------대승은 반드시 승리를 의미하지만, 승리는 반드시 대승을 의미하지는 않습니다.

이러한 논리적 의존 관계는 차익 거래 기회를 창출합니다.

이는 마치 당신이 두 가지를 내기하는 것과 같습니다------"내일 비가 올까요"와 "내일 천둥번개가 칠까요".

만약 천둥번개가 친다면, 반드시 비가 온다는 것입니다(천둥번개는 비의 하위 집합입니다). 따라서 "천둥번개 YES"의 가격이 "비 YES"의 가격보다 높을 수는 없습니다. 만약 시장 가격이 이 논리를 위반한다면, 당신은 동시에 낮은 가격에 사고 높은 가격에 팔아 "무위험 이익"을 얻을 수 있으며, 이것이 차익 거래입니다.

지수 폭발: 왜 폭력적 검색이 통하지 않는가

n개의 조건이 있는 시장에 대해, 이론적으로 2\^n개의 가능한 가격 조합이 있습니다.

괜찮아 보이나요? 실제 사례를 봅시다.

2010년 NCAA 챔피언십 시장 [2]: 63경기, 각 경기에는 승/패 두 가지 결과가 있습니다. 가능한 결과 조합 수는 2\^{63} = 9,223,372,036,854,775,808------90억억 가지가 넘습니다. 시장에는 5000개 이상의 배당이 있습니다.

2\^{63}라는 숫자가 얼마나 큰가요? 만약 당신이 매초 10억 가지 조합을 검사한다면, 모든 조합을 검사하는 데 약 292년이 걸립니다. 이것이 바로 "폭력적 검색"이 여기서 완전히 통하지 않는 이유입니다. 각 조합을 하나하나 검사하는 것은 계산적으로 불가능합니다.

2024년 미국 대선으로 다시 돌아가 보겠습니다. 연구팀은 1,576쌍의 의존 관계가 있을 수 있는 시장 쌍을 발견했습니다. 만약 각 쌍의 시장이 각각 10개의 조건을 가지고 있다면, 각 쌍은 2\^{20} = 1,048,576개의 조합을 검사해야 합니다. 1,576쌍을 곱하면, 당신의 노트북이 계산을 마칠 때쯤에는 선거 결과가 이미 나와 있을 것입니다.

정수 계획: 열거 대신 제약 조건 사용

양적 시스템의 해결책은 "더 빠르게 열거하는 것"이 아니라, 아예 열거하지 않는 것입니다.

그들은 정수 계획(정수 프로그래밍)을 사용하여 "어떤 결과가 합법적인지"를 설명합니다.

실제 사례를 봅시다. 듀크 대 코넬의 경기 시장: 각 팀은 7개의 배당(0에서 6승까지)을 가지고 있으며, 총 14개의 조건이 있습니다. 2\^{14} = 16,384개의 가능한 조합이 있습니다.

하지만 하나의 제약 조건이 있습니다: 그들은 모두 5승 이상을 할 수 없습니다. 왜냐하면 그렇게 되면 그들은 준결승에서 만나게 되기 때문입니다(오직 한 팀만 진출할 수 있습니다).

정수 계획은 어떻게 처리할까요? 세 가지 제약 조건이면 충분합니다:

제약 조건 1: 듀크의 7개 배당 중 정확히 하나가 참이어야 합니다(듀크는 최종 승리 수가 하나만 있을 수 있습니다).
제약 조건 2: 코넬의 7개 배당 중 정확히 하나가 참이어야 합니다.
제약 조건 3: 듀크가 5승 + 듀크가 6승 + 코넬이 5승 + 코넬이 6승은 1 이하이어야 합니다(그들은 동시에 그렇게 많이 이길 수 없습니다).

세 가지 선형 제약 조건이 16,384회의 폭력적 검사를 대체합니다.

폭력적 검색 vs 정수 계획

다시 말해, 폭력적 검색은 사전의 모든 단어를 읽어보는 것과 같습니다. 정수 계획은 그 글자가 시작되는 페이지로 바로 가는 것과 같습니다. 당신은 모든 가능성을 검사할 필요가 없으며, "합법적인 답이 어떤 모습인지"를 설명한 다음, 알고리즘이 규칙을 위반하는 가격을 찾도록 하면 됩니다.

실제 데이터: 41%의 시장에서 차익 거래 존재 [2]

원문에서는 연구팀이 2024년 4월부터 2025년 4월까지의 데이터를 분석했다고 언급했습니다:

17,218개의 조건을 검사했습니다.
그 중 7,051개의 조건에서 단일 시장 차익 거래가 존재했습니다(41% 차지).
중위수 가격 편차: $0.60(실제는 $1.00이어야 함).
13쌍의 확인된 교차 시장에서 이용 가능한 차익 거래.

중위수 편차 $0.60은 시장이 자주 40% 이상 편차가 있음을 의미합니다. 이는 "거의 효율적"이 아니라 "대규모로 이용 가능"하다는 것입니다.

제2장: Bregman 투영------최적 차익 거래를 계산하는 방법

차익 거래를 발견하는 것은 문제입니다. 최적의 차익 거래를 계산하는 것은 또 다른 문제입니다.

당신은 단순히 "평균을 취하거나" "가격을 조정하는 것"으로 해결할 수 없습니다. 현재 시장 상태를 무차익의 합법적 공간으로 투영하면서 가격의 정보 구조를 유지해야 합니다.

왜 "직선 거리"는 안 되는가

가장 직관적인 생각은: 현재 가격에 가장 가까운 "합법적 가격"을 찾아서 거래 차익을 얻는 것입니다.

수학적으로 말하면, 유클리드 거리를 최소화하는 것입니다: $||\mu - \theta||\^2$

하지만 치명적인 문제가 있습니다: 모든 가격 변동을 동일하게 취급합니다.

$0.50에서 $0.60으로 상승하는 것과 $0.05에서 $0.15로 상승하는 것은 모두 10센트 상승한 것입니다. 하지만 그들의 정보량은 완전히 다릅니다.

왜 그럴까요? 가격은 암묵적인 확률을 나타내기 때문입니다. 50%에서 60%로 변하는 것은 온건한 관점 조정입니다. 5%에서 15%로 변하는 것은 엄청난 신념의 전환입니다------거의 불가능한 사건이 갑자기 "조금 가능성 있는" 사건으로 바뀌는 것입니다.

당신이 체중을 재고 있다고 상상해 보세요. 70킬로그램에서 80킬로그램으로 변하면 "조금 뚱뚱해졌다"고 말할 것입니다. 하지만 30킬로그램에서 40킬로그램으로 변하면(당신이 성인이라면) "임사 상태에서 심각한 영양실조로 변했다"고 말할 것입니다. 같은 10킬로그램의 변화지만, 의미는 완전히 다릅니다. 가격도 마찬가지입니다------0 또는 1에 가까운 가격 변동일수록 정보량이 더 큽니다.

Bregman 발산: 올바른 "거리"

Polymarket의 시장 조성자는 LMSR(로그 시장 점수 규칙)[4]을 사용하며, 가격은 본질적으로 확률 분포를 나타냅니다.

이 구조에서 올바른 거리 측정은 유클리드 거리가 아니라 Bregman 발산입니다.[5]

LMSR에 대해 Bregman 발산은 KL 발산(쿨백-라이블러 발산)[6]으로 변하며, 이는 두 확률 분포 간의 "정보 이론적 거리"를 측정하는 지표입니다.

공식은 기억할 필요가 없습니다. 당신이 이해해야 할 것은 단 하나입니다:

KL 발산은 자동으로 "극단적인 가격 근처의 변동"에 더 높은 가중치를 부여합니다. $0.05에서 $0.15로의 변동은 KL 발산 하에서 $0.50에서 $0.60으로의 변동보다 "더 멀리" 있습니다. 이는 우리의 직관과 정확히 일치합니다------극단적인 가격의 변동은 더 큰 정보 충격을 의미합니다.

좋은 예로는, 지난번 @zachxbt의 예측 시장에서 Axiom이 마지막 순간에 Meteora를 역전한 것도 극단적인 가격 변동으로 모든 변화가 일어났습니다.

Bregman 투영 vs 유클리드 투영

차익 거래 이익 = Bregman 투영의 거리

이것은 원문 저자가 전체 논문에서 가장 핵심적인 결론 중 하나를 참조한 것입니다:

어떤 거래가 얻을 수 있는 최대 보장 이익은 현재 시장 상태에서 무차익 공간으로의 Bregman 투영 거리와 같습니다.

다시 말해, 시장 가격이 "합법적 공간"에서 멀어질수록, 당신이 벌 수 있는 돈은 더 많아집니다. 그리고 Bregman 투영은 당신에게 다음을 알려줍니다:

무엇을 사고 팔아야 하는지(투영 방향이 거래 방향을 알려줍니다)
얼마나 사고 팔아야 하는지(주문서 깊이를 고려합니다)
얼마나 벌 수 있는지(투영 거리가 최대 이익입니다)

1위 차익 거래자는 1년 동안 $2,009,631.76을 벌었습니다.[2] 그의 전략은 모든 사람보다 더 빠르고 정확하게 이 최적화 문제를 푸는 것이었습니다.

한계 다면체와 차익 거래

비유하자면, 당신이 한 산 위에 서 있고, 산 아래에 강이 있습니다(무차익 공간). 당신의 현재 위치(현재 시장 가격)는 강과 일정 거리가 있습니다.

Bregman 투영은 "당신의 위치에서 강가까지의 최단 경로"를 찾는 것입니다------하지만 직선 거리가 아니라 지형(시장 구조)을 고려한 최단 경로입니다. 이 경로의 길이가 당신이 벌 수 있는 최대 이익입니다.

제3장: Frank-Wolfe 알고리즘------이론을 실행 가능한 코드로 변환하기

좋습니다, 이제 당신은 최적의 차익 거래를 계산하기 위해 Bregman 투영을 해야 한다는 것을 알게 되었습니다.

하지만 문제는------Bregman 투영을 직접 계산하는 것은 불가능하다는 것입니다.

왜냐하면 무차익 공간(한계 다면체 M)은 지수적으로 많은 정점을 가지고 있기 때문입니다. 표준의 볼록 최적화 방법은 전체 제약 집합에 접근해야 하며, 즉 모든 합법적 결과를 열거해야 합니다. 우리가 방금 언급한 것처럼, 이는 대규모 환경에서는 불가능합니다.

Frank-Wolfe의 핵심 아이디어

Frank-Wolfe 알고리즘 [7]의 천재적인 점은: 한 번에 전체 문제를 해결하려고 하지 않고, 한 걸음씩 답에 접근한다는 것입니다.

그의 작업 방식은 다음과 같습니다:

첫 번째 단계: 작은 합법적 결과 집합에서 시작합니다.
두 번째 단계: 이 작은 집합에서 최적화를 수행하여 현재 최적 해를 찾습니다.
세 번째 단계: 정수 계획을 사용하여 새로운 합법적 결과를 찾아 집합에 추가합니다.
네 번째 단계: 최적 해에 충분히 가까운지 확인합니다. 충분하지 않으면 두 번째 단계로 돌아갑니다.

각 반복에서 집합은 하나의 정점만 증가합니다. 100번을 실행하더라도, 당신은 100개의 정점만 추적하면 됩니다------2\^{63}개가 아닙니다.

Frank-Wolfe 반복 과정

당신이 거대한 미로에서 출구를 찾고 있다고 상상해 보세요.

폭력적 방법은 모든 길을 다 가보는 것입니다. Frank-Wolfe의 방법은: 먼저 아무 길이나 가고, 각 갈림길에서 "가이드"(정수 계획 해결기)에게 "여기서 시작하면 어떤 방향이 출구로 가장 가능성이 높은가?"라고 묻는 것입니다. 그런 다음 그 방향으로 한 걸음 나아갑니다. 당신은 전체 미로를 탐색할 필요가 없으며, 각 주요 노드에서 올바른 선택만 하면 됩니다.

정수 계획 해결기: 각 단계의 "가이드"

Frank-Wolfe의 각 반복은 정수 선형 계획 문제를 해결해야 합니다. 이론적으로 이는 NP 어려운 문제입니다(즉, "빠른 일반 알고리즘이 알려져 있지 않음").

하지만 현대의 해결기, 예를 들어 Gurobi[8]는 구조가 잘 잡힌 문제에 대해 효율적으로 해결할 수 있습니다.

연구팀은 Gurobi 5.5를 사용했습니다. 실제 해결 시간은 다음과 같습니다:

초기 반복(소수의 경기 종료): 1초 미만
중기(30-40경기 종료): 10-30초
후기(50개 이상의 경기 종료): 5초 미만

왜 후기가 더 빠를까요? 경기 결과가 확정됨에 따라, 가능한 해 공간이 줄어들기 때문입니다. 변수는 더 적고, 제약은 더 엄격해져서 해결이 더 빨라집니다.

기울기 폭발 문제와 Barrier Frank-Wolfe

표준 Frank-Wolfe에는 기술적인 문제가 있습니다: 가격이 0에 가까워질 때, LMSR의 기울기가 음의 무한대로 향하게 됩니다. 이는 알고리즘의 불안정성을 초래합니다.

해결책은 Barrier Frank-Wolfe입니다: 전체 다면체 M에서 최적화하지 않고, 약간 "수축된" 버전 M에서 최적화합니다. 수축 매개변수 ε는 반복에 따라 적응적으로 줄어듭니다------시작할 때는 경계에서 멀리 떨어져 있다가(안정적), 나중에는 실제 경계에 점점 가까워집니다(정확).

연구에 따르면, 실제 작업에서는 50에서 150회의 반복이 수렴하기에 충분합니다.

실제 성과

논문에서 중요한 발견이 있습니다 [2]:

NCAA 챔피언십의 첫 16경기에서, Frank-Wolfe 시장 조성자(FWMM)와 간단한 선형 제약 시장 조성자(LCMM)의 성과는 비슷했습니다------정수 계획 해결기가 아직 너무 느렸기 때문입니다.

하지만 45경기가 종료된 후, 첫 번째 성공적인 30분 투영이 완료되었습니다.

그 이후로 FWMM은 배당 가격에서 LCMM보다 38% 더 나은 성과를 보였습니다.

전환점은 결과 공간이 정수 계획이 거래 시간 창 내에서 해결할 수 있을 만큼 줄어들었을 때입니다.

FWMM은 마치 학생처럼, 시험 전반부에는 아직 몸을 풀고 있지만, 일단 상태에 들어가면 압도적으로 잘하는 것입니다. LCMM은 항상 안정적으로 수행하지만 한계가 있는 학생입니다. 주요 차이는 FWMM이 더 강력한 "무기"(Bregman 투영)를 가지고 있지만, "장전하는 데" 시간이 필요하다는 것입니다.

제4장: 실행------왜 계산했더라도 여전히 손해를 볼 수 있는가

당신은 차익 거래를 감지했습니다. 당신은 Bregman 투영을 사용하여 최적 거래를 계산했습니다.

이제 당신은 실행해야 합니다.

대부분의 전략이 실패하는 지점입니다.

비원자 실행 문제

Polymarket은 CLOB(중앙 제한 가격 주문서)[9]를 사용합니다. 분산 거래소와는 달리, CLOB에서의 거래는 순차적으로 실행되며------모든 주문이 동시에 체결된다는 보장이 없습니다.

당신의 차익 거래 계획:

YES를 $0.30에 구매합니다. NO를 $0.30에 구매합니다. 총 비용 $0.60. 결과에 관계없이 $1.00를 회수합니다. 이익 $0.40.

현실:

YES 주문 제출, 체결 가격 $0.30 ✓
당신의 주문이 시장 가격을 변경했습니다.
NO 주문 제출, 체결 가격 $0.78 ✗
총 비용: $1.08. 회수: $1.00. 실제 결과: 손실 $0.08.

한 쪽은 체결되었고, 다른 쪽은 체결되지 않았습니다. 당신은 노출되었습니다.

이것이 바로 논문이 이익 공간이 $0.05를 초과하는 기회만 통계로 집계한 이유입니다. 더 작은 가격 차이는 실행 위험에 의해 소멸됩니다.

비원자 실행 위험

VWAP: 실제 체결 가격

당신이 제시한 가격으로 체결될 수 있다고 가정하지 마십시오. 거래량 가중 평균 가격(VWAP)[10]을 계산해야 합니다.

연구팀의 방법은: Polygon 체인에서 각 블록(약 2초)마다 해당 블록 내의 모든 YES 거래의 VWAP와 모든 NO 거래의 VWAP를 계산하는 것입니다. 만약 |VWAP_yes + VWAP_no - 1.0| > 0.02라면, 이는 차익 거래 기회로 기록됩니다 [2].

VWAP는 "당신이 실제로 지불한 평균 가격"입니다. 만약 당신이 10,000개의 토큰을 구매하고 싶지만, 주문서에서 $0.30에 2,000개만 있고, $0.32에 3,000개, $0.35에 5,000개가 있다면------당신의 VWAP는 $(2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = 0.326입니다. 당신이 본 "최적 가격" $0.30보다 훨씬 비쌉니다.

유동성 제약: 얼마나 벌 수 있는지는 주문서 깊이에 따라 달라진다

가격이 실제로 편차가 있더라도, 당신이 벌 수 있는 이익은 가용 유동성에 의해 제한됩니다.

실제 사례 [2]:

시장에서 차익 거래가 표시됩니다: YES 가격의 합 = $0.85. 잠재적 이익: 매달러 $0.15. 하지만 이 가격의 주문서 깊이는 단지 $234입니다. 최대 인출 이익: $234 × 0.15 = $35.10.

교차 시장 차익 거래의 경우, 모든 포지션에서 동시에 유동성이 필요합니다. 가장 작은 것이 당신의 한계를 결정합니다.

이것이 바로 기존 양적 플랫폼에서 주문 가격이 체결 가격에 미치는 영향을 보여주는 것이 매우 중요합니다.

제5장: 완전한 시스템------실제 배포된 것

이론은 깔끔합니다. 생산 환경은 혼란스럽습니다.

실제로 작동하는 차익 거래 시스템은 다음과 같습니다 [2].

데이터 파이프라인

실시간 데이터: Polymarket의 API [9]에 WebSocket 연결하여 주문서 업데이트(가격/수량 변화), 체결 푸시, 시장 생성/정산 이벤트를 수신합니다.
역사 데이터: Alchemy Polygon 노드 API를 통해 계약 이벤트를 조회합니다------OrderFilled(거래 실행), PositionSplit(새 토큰 발행), PositionsMerge(토큰 소각).

연구팀은 8600만 건의 거래를 분석했습니다 [2]. 이 정도 규모는 인프라가 필요하며, 스크립트로 해결할 수 있는 것이 아닙니다.

현재 고속 거래 API를 오픈 소스할 계획도 있으며, 비슷한 거래 모델을 사용할 계획이 있다면, API를 즉시 경험할 수 있도록 DM을 주시면 됩니다.

의존 관계 탐지 레이어

305개의 미국 대선 시장에 대해, 46,360쌍의 가능한 조합을 검사해야 합니다. 수동 분석은 불가능합니다.

연구팀은 스마트한 방법을 사용했습니다: DeepSeek-R1-Distill-Qwen-32B 대형 언어 모델을 사용하여 초기 스크리닝을 수행했습니다.

입력: 두 시장의 조건 설명.
출력: 합법적 결과 조합의 JSON.

그런 다음 세 가지 검증을 수행합니다: 각 시장에 정확히 하나의 조건이 참인가? 합법적 조합 수가 $n \times m$보다 적은가(의존 관계가 존재하는가)? 의존 하위 집합이 차익 거래 조건을 충족하는가?

결과: 40,057쌍이 독립적(무차익)이고, 1,576쌍이 의존적(잠재적 차익 거래)이며, 374쌍이 엄격한 조건을 충족하고, 13쌍이 인위적으로 검증된 차익 거래 가능성 [2]입니다.

LLM은 복잡한 다조건 시장에서 81.45%의 정확도를 보였습니다. 초기 스크리닝을 수행하기에 충분하지만, 실행 전에 수동 검증이 필요합니다.

세 가지 최적화 엔진

첫 번째 레이어: 간단한 선형 제약(LCMM). 기본 규칙을 빠르게 검사합니다------"확률의 합은 1이다", "A가 B를 포함하면, P(A)는 P(B)를 초과할 수 없다". 밀리초 단위로 완료되어 명백한 가격 오류를 제거합니다.
두 번째 레이어: 정수 계획 투영(Frank-Wolfe + Gurobi). 이것이 핵심입니다. 매개변수: Alpha = 0.9(사용 가능한 차익 거래의 최소 90%를 추출), 초기 $\epsilon$ = 0.1(10% 수축), 수렴 임계값 = 1e-6, 시간 제한 = 30분. 전형적인 반복 횟수: 50-150회. 각 반복의 해결 시간: 1-30초.
세 번째 레이어: 실행 검증. 주문을 제출하기 전에 현재 주문서에서 체결을 시뮬레이션합니다. 확인: 유동성이 충분한가? 예상 슬리피지는 얼마인가? 슬리피지를 제외한 보장 이익은 얼마인가? 이익이 최소 문턱($0.05)을 초과하는가? 모든 조건을 통과해야만 실행합니다.

포지션 관리: 개량된 Kelly 공식

표준 Kelly 공식 [11]은 거래에 얼마의 자금을 투자해야 하는지를 알려줍니다. 하지만 차익 거래 시나리오에서는 실행 위험 조정을 추가해야 합니다:
f = (b×p - q) / b × √p

여기서 b는 차익 거래 이익 비율, p는 완전 실행 확률(주문서 깊이에 따라 추정), q = 1 - p입니다.

상한: 주문서 깊이의 50%. 이 비율을 초과하면, 당신의 주문 자체가 시장을 크게 이동시킬 것입니다.

최종 결과

2024년 4월부터 2025년 4월까지, 총 인출 이익:

단일 조건 차익 거래: 양쪽을 낮게 사서 $5,899,287 + 양쪽을 높게 팔아서 $4,682,075 = $10,581,362
시장 재조정: 모든 YES를 낮게 사서 $11,092,286 + 모든 YES를 높게 팔아서 $612,189 + 모든 NO를 사서 $17,307,114 = $29,011,589
교차 시장 조합 차익 거래: $95,634

총계: $39,688,585

상위 10명의 차익 거래자는 $8,127,849를 가져갔습니다(총액의 20.5%). 1위 차익 거래자는: $2,009,632, 4,049건의 거래에서 발생하며, 평균 거래당 $496[2]입니다.

복권이 아닙니다. 운이 아닙니다. 수학적 정확성의 시스템화된 실행입니다.

마지막 현실

거래자가 "예측 시장 10가지 팁"을 읽고 있을 때, 양적 시스템은 무엇을 하고 있을까요?

그들은 정수 계획을 사용하여 17,218개의 조건 간의 의존 관계를 감지하고 있습니다. Bregman 투영을 사용하여 최적의 차익 거래를 계산하고 있습니다. Frank-Wolfe 알고리즘을 실행하여 기울기 폭발을 처리하고 있습니다. VWAP를 사용하여 슬리피지를 추정하고 주문을 병렬로 실행하고 있습니다. 체계적으로 4천만 달러의 보장 이익을 추출하고 있습니다.

차이는 운이 아닙니다. 수학적 인프라입니다.

논문은 공개되어 있습니다 [1]. 알고리즘은 알려져 있습니다. 이익은 실제입니다.

문제는: 다음 4천만 달러가 인출되기 전에, 당신은 그것을 구축할 수 있을까요?

개념 속성

한계 다면체(Marginal Polytope) 모든 "합법적 가격"으로 구성된 공간. 가격은 이 공간 내에 있어야 무차익입니다. "가격의 합법적 영역"으로 이해할 수 있습니다.
정수 계획(Integer Programming) 선형 제약으로 합법적 결과를 설명하여 폭력적 열거를 피합니다. $2\^{63}$회의 검사를 몇 가지 제약으로 압축합니다 [3].
Bregman 발산 / KL 발산 두 확률 분포 간의 "거리"를 측정하는 방법으로, 가격/확률 장면에 더 적합합니다. 극단적인 가격 근처의 변동에 더 높은 가중치를 부여합니다 [5][6].
LMSR(로그 시장 점수 규칙) Polymarket 시장 조성자가 사용하는 가격 책정 메커니즘으로, 가격은 암묵적 확률을 나타냅니다 [4].
Frank-Wolfe 알고리즘 반복 최적화 알고리즘으로, 매 반복마다 하나의 새로운 정점을 추가하여 지수적으로 많은 합법적 결과를 열거하는 것을 피합니다 [7].
Gurobi 업계 최고의 정수 계획 해결기로, Frank-Wolfe의 각 반복의 "가이드"입니다 [8].
CLOB(중앙 제한 가격 주문서) Polymarket의 거래 매칭 메커니즘으로, 주문이 순차적으로 실행되어 원자성을 보장할 수 없습니다 [9].
VWAP(거래량 가중 평균 가격) 당신이 실제로 지불한 평균 가격으로, 주문서 깊이를 고려합니다. "최적 제안"보다 더 현실적입니다 [10].
Kelly 공식 얼마나 많은 비율의 자금을 거래에 투자해야 하는지를 알려주며, 수익과 위험의 균형을 맞춥니다 [11].
비원자 실행 여러 주문이 동시에 체결되지 않는 문제. 한 쪽은 체결되고 다른 쪽은 체결되지 않으면 = 노출 위험.
DeepSeek 시장 의존 관계 초기 스크리닝을 위한 대형 언어 모델로, 정확도는 81.45%입니다.

참고 자료

[1] 원문: https://x.com/RohOnChain/status/2017314080395296995

[2] 연구 논문 "Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets": https://arxiv.org/abs/2508.03474

[3] 이론 기초 논문 "Arbitrage-Free Combinatorial Market Making via Integer Programming": https://arxiv.org/abs/1606.02825

[4] LMSR 로그 시장 점수 규칙 설명: https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work

[5] Bregman 발산 입문: https://mark.reid.name/blog/meet-the-bregman-divergences.html

[6] KL 발산 - Wikipedia: https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence

[7] Frank-Wolfe 알고리즘 - Wikipedia: https://en.wikipedia.org/wiki/Frank%E2%80%93Wolfe_algorithm

[8] Gurobi 최적화기: https://www.gurobi.com/

[9] Polymarket CLOB API 문서: https://docs.polymarket.com/

[10] VWAP 설명 - Investopedia: https://www.investopedia.com/terms/v/vwap.asp

[11] Kelly 공식 - Investopedia: https://www.investopedia.com/articles/trading/04/091504.asp

[12] Decrypt 보도 "The $40 Million Free Money Glitch": https://decrypt.co/339958/40-million-free-money-glitch-crypto-prediction-markets

(출처 링크)