Kronos-利用大语言模型预测股价
Transformer应用-1, 杜新宇,首都科技发展集团, 2025
Kronos: A Foundation Model for the Language of Financial Markets
1. 符号
D维向量表示K线指标,取D=6 (open, high, low, close volume, amount)。那么在时刻t的k线可以用一个6维向量表示: \(\vec{x_t}=[open, high, low, close, volume, amount]_t\) 我们的目标是: \(基于历史数据\vec{x}_{1:T}来预测接下来的H个时间点的K线\hat{x}_{T+1:T+H}=(\hat{x}_{T+1}, \hat{x}_{T+2},..., \hat{x}_{T+H})\) 首先需要把连续的K线向量映射到离散的token空间: \(\vec{x}_{1:T}=(\vec{x}_1, \vec{x}_2,..., \vec{x}_T) \Longrightarrow \vec{b}_{1:T}=(\vec{b}_1, \vec{b}_2,..., \vec{b}_T)\) 那么预测任务可以表述为一个自回归的token生成任务: \(p(\vec{b}_{T+1:T+H}|\vec{b}_{1:T})=\prod\limits_{h=1}^{H}p(\vec{b}_{T+h}|\vec{b}_{1:T+h-1})\)
