量化交易中的“识天气”哲学：马尔可夫模型（二）

时间：2025-12-05 14:08|来源：369期货网|作者：369期货网|点击：次

三大“气象仪器”：马尔可夫模型家族

基础气象站：马尔可夫链

马尔可夫链是最基础的“气象观测设备”。它假设市场的状态是直接可见的，并且状态间的转移概率是固定的。

实际应用：
量化开发者会定义几个简单的市场状态，比如“上涨”、“下跌”、“盘整”，然后基于历史数据计算状态间的转移概率。例如，他们可能发现：

从“上涨”转移到“下跌”的概率是20%
从“上涨”继续保持“上涨”的概率是60%
从“上涨”转移到“盘整”的概率是20%

局限性：
这种简单模型的缺点很明显——市场状态并非直接可见，我们只能看到价格、成交量等“表象”，而无法直接观测到市场的“真实状态”。

高级气象雷达：隐马尔可夫模型

HMM是马尔可夫链的扩展，也是应用最广泛、最强大的模型。它认为我们无法直接观察到市场的真实状态（隐藏状态），但我们可以观察到由这些状态所“发射”出来的市场价格/数据（观测值）。

核心组件：

隐藏状态：市场的真实运作机制，如“主力吸筹”、“散户追涨”、“机构派发”
观测值：我们能够看到的价格走势、成交量变化、技术指标
状态转移概率：不同隐藏状态之间切换的规律
发射概率：在特定隐藏状态下，产生某种观测值的可能性

这就像医生通过观察病人的症状（发烧、咳嗽、乏力）来推断患了什么疾病。症状是观测值，疾病是隐藏状态。不同的疾病会产生不同的症状组合，而疾病之间也有一定的转化规律。

量化应用：
HMM最强大的应用是市场状态检测。通过分析历史价格数据，HMM能够自动识别出市场所处的不同状态，并给出当前处于某种状态的概率。例如，当HMM检测到市场以90%的概率进入“高波动下跌状态”时，交易系统可以自动切换到风控模式，减少仓位，增加对冲。

智能气象AI：马尔可夫决策过程

MDP将马尔可夫模型推向了一个新的高度——它不仅预测状态，还告诉我们在特定状态下应该采取什么行动。

框架要素：

状态：当前的市场环境
行动：买入、卖出、持有、调整仓位
奖励：执行行动后获得的收益
策略：什么状态下应该采取什么行动

类似于学习骑自行车的过程就是一个MDP。你根据当前的状态（车身倾斜角度、速度、方向）来决定如何调整车把和身体重心。每次调整后，你会获得反馈——保持平衡获得“正奖励”，摔倒获得“负奖励”。通过不断尝试，你最终学会了最优的“骑行策略”。

量化应用：
MDP是强化学习的理论基础。在量化交易中，我们可以构建一个交易智能体，让它通过与市场环境交互来自主学习最优交易策略。

这个智能体开始时随机交易，但随着经验的积累，它会逐渐学习到：在“低波动启动状态”应该逐步建仓，在“高波动顶部状态”应该减仓离场。

上一篇：量化交易中的“识天气”哲学：马尔可夫模型（三）下一篇：量化交易中的“识天气”哲学：马尔可夫模型（一）

热门导读

编辑推荐