AI 量化的基石是数据。数据来源包括:
市场行情数据:股票、期货、加密货币等历史 OHLC、成交量、盘口深度
链上数据:如比特币、以太坊的交易数量、地址活跃度、矿工流入流出
新闻/舆情:财经新闻、社交媒体、论坛数据
宏观数据:利率、汇率、GDP、CPI 等经济指标
数据延迟与实时性
异常值清洗(如错单、缺失数据)
时间对齐(不同交易所/市场时区差异)
在量化交易中,特征工程是将原始数据转化为可用于模型训练的“因子”或“特征矩阵”。
常见特征类型:
技术指标:MA、MACD、RSI、Bollinger
波动率:ATR、历史波动率
订单簿特征:Bid/Ask imbalance、深度变化
资金流:大单/散户成交占比
情绪因子:新闻情感分数、推特情绪指数
Python 示例:计算简单移动平均特征
AI 量化模型可分为:
监督学习(Supervised Learning):预测价格涨跌或收益率
非监督学习(Unsupervised Learning):聚类因子、降维
强化学习(Reinforcement Learning):优化仓位、资金分配和执行策略
常见模型:
机器学习:Random Forest、XGBoost、LightGBM
深度学习:LSTM、CNN、Transformer
强化学习:DQN、PPO、A2C
Python 示例:训练随机森林预测涨跌
模型输出为预测概率或因子得分,需要转化为交易信号:
买入(Long)
卖出(Short)
空仓(Flat)
示例:
策略信号通常需要结合风控规则(止损、止盈、仓位限制)。
回测阶段目的是验证策略稳定性:
计算净值曲线
最大回撤
Sharpe/Sortino比率
胜率、盈利因子
实盘阶段需考虑:
滑点、交易手续费
数据延迟
异常行情应对
数据来源:Binance 历史 1 小时 K 线
特征:MA、RSI、Orderbook imbalance、新闻情绪
模型:XGBoost 分类器
回测结果:Sharpe 1.8,最大回撤 12%,胜率 56%
过拟合:模型在历史数据表现好,但实盘不稳定
数据质量差:异常、缺失、错单都会导致策略失效
黑箱风险:深度学习模型不易解释,需监控异常信号
市场流动性风险:高频策略在低流动性市场可能滑点巨大
数据驱动:把海量信息转化为可执行策略
非线性捕捉:传统统计难以发现的模式 AI 可以识别
策略自动化:实现全自动交易、风险控制和优化
可扩展性:可应用于股票、期货、加密、外汇等多市场
AI 量化不是“魔法赚钱”,而是把交易科学化、系统化、自动化的最强工具。
免费获取专属报价方案