三大“气象仪器”:马尔可夫模型家族
基础气象站:马尔可夫链
马尔可夫链是最基础的“气象观测设备”。它假设市场的状态是直接可见的,并且状态间的转移概率是固定的。
实际应用:
量化开发者会定义几个简单的市场状态,比如“上涨”、“下跌”、“盘整”,然后基于历史数据计算状态间的转移概率。例如,他们可能发现:
从“上涨”转移到“下跌”的概率是20%
从“上涨”继续保持“上涨”的概率是60%
从“上涨”转移到“盘整”的概率是20%
局限性:
这种简单模型的缺点很明显——市场状态并非直接可见,我们只能看到价格、成交量等“表象”,而无法直接观测到市场的“真实状态”。
高级气象雷达:隐马尔可夫模型
HMM是马尔可夫链的扩展,也是应用最广泛、最强大的模型。它认为我们无法直接观察到市场的真实状态(隐藏状态),但我们可以观察到由这些状态所“发射”出来的市场价格/数据(观测值)。
核心组件:
隐藏状态:市场的真实运作机制,如“主力吸筹”、“散户追涨”、“机构派发”
观测值:我们能够看到的价格走势、成交量变化、技术指标
状态转移概率:不同隐藏状态之间切换的规律
发射概率:在特定隐藏状态下,产生某种观测值的可能性
这就像医生通过观察病人的症状(发烧、咳嗽、乏力)来推断患了什么疾病。症状是观测值,疾病是隐藏状态。不同的疾病会产生不同的症状组合,而疾病之间也有一定的转化规律。
量化应用:
HMM最强大的应用是市场状态检测。通过分析历史价格数据,HMM能够自动识别出市场所处的不同状态,并给出当前处于某种状态的概率。例如,当HMM检测到市场以90%的概率进入“高波动下跌状态”时,交易系统可以自动切换到风控模式,减少仓位,增加对冲。
智能气象AI:马尔可夫决策过程
MDP将马尔可夫模型推向了一个新的高度——它不仅预测状态,还告诉我们在特定状态下应该采取什么行动。
框架要素:
状态:当前的市场环境
行动:买入、卖出、持有、调整仓位
奖励:执行行动后获得的收益
策略:什么状态下应该采取什么行动
类似于学习骑自行车的过程就是一个MDP。你根据当前的状态(车身倾斜角度、速度、方向)来决定如何调整车把和身体重心。每次调整后,你会获得反馈——保持平衡获得“正奖励”,摔倒获得“负奖励”。通过不断尝试,你最终学会了最优的“骑行策略”。
量化应用:
MDP是强化学习的理论基础。在量化交易中,我们可以构建一个交易智能体,让它通过与市场环境交互来自主学习最优交易策略。
这个智能体开始时随机交易,但随着经验的积累,它会逐渐学习到:在“低波动启动状态”应该逐步建仓,在“高波动顶部状态”应该减仓离场。
Copyright © 2024-2025 成都宁时科技有限公司 版权所有