|
以下是论文的完整讲解文本整理: 一、为什么需要专门的股票AI?股票市场如同一个“超级复杂迷宫”:价格波动剧烈(高波动性,像“比兔子还快”的跳跃)、历史规律易变(非平稳性,“今天的经验明天不管用”)、个股间关联交织(复杂关联,“比蜘蛛网还复杂”)。普通AI模型若用“通用地图”(通用数据预训练)走这个迷宫,常因无法适应股市的特殊性而“迷路”。现有AI预训练方法效果有限,亟需为股票定制专属AI。
二、SSPT模型的核心思想:给AI上“股市专业课”SSPT(Stock Specialized Pre-training)模型通过三阶段流程,让AI系统学习股市“密码”,成为“股市老司机”: - 数据处理:整合多维度股票数据(时间序列、行业信息等);
- 股票专项预训练:通过三大“定制课程”(股票代码分类、行业分类、移动平均预测),让AI掌握股市底层规律;
- 股票选择微调:针对具体投资目标优化模型,提升选股能力
三、三大“定制课程”:让AI深度理解股市SSPT的预训练阶段设计了三个针对性任务,模拟AI“从基础到进阶”的学习过程:
1. 第一堂课:股票代码分类(SCC)——识别个股“价格指纹”
每只股票的价格走势如同人类指纹般独特。SCC任务通过“切分股价曲线小段→让AI猜测来源”的方式训练:- 目标:让AI学会识别不同股票的独特波动模式(如某只科技股的急涨急跌特征);
- 公式:(猜对奖励、猜错惩罚,强化个股特征记忆)。
2. 第二堂课:股票行业分类(SSC)——捕捉行业共性规律
同行业公司对市场事件的反应高度相似(如科技股常“同涨同跌”,石油股紧随油价波动)。SSC任务通过价格曲线训练AI识别行业特征: - 目标:让AI从价格中判断“这是科技股的味道,还是银行股的节拍”;
- 公式:(聚焦行业属性学习)。
3. 第三堂课:移动平均预测(MAP)——预测更稳定的“平均趋势”
股价如“心电图”般波动剧烈,直接预测具体价格易“心律不齐”。MAP任务转换思路,让AI预测一段时间的平均价格: - 优势:平均价格更稳定(类比“月平均成绩比每日小测验更可靠”);
- 公式:(最小化预测均值与实际均值的误差)。
四、模型架构:简单而强大的TransformerSSPT采用标准两层Transformer架构,核心模块包括: - 嵌入层:将原始价格数据转化为AI可理解的“股市语言”;
- 注意力层:让AI聚焦关键信息(如某段时间的政策变动对特定行业的影响);
- 预测头:根据预训练结果输出选股或预测结论。
关键设计:预训练任务的巧妙性比架构复杂度更重要(“内功深厚>招式华丽”)。
五、多任务预训练:一箭三雕的高效学习三个预训练任务(SCC、SSC、MAP)被组合为一个训练目标: - 公式:(为课程权重,分别控制个股/行业/平均趋势学习的重要性);
- 学习率适配:分类任务(SCC/SSC)偏好高学习率(),预测任务(MAP)偏好低学习率(),模拟“不同课程用不同教学节奏”。
六、微调策略:解冻的艺术——从通用到专精预训练后需针对具体任务微调模型参数,实验验证四种策略效果(基于夏普比率): - 全解冻:所有参数可调(SCC和MAP任务最优);
- 冻结嵌入层:保留基础理解(SSC任务最优);
- 其他策略(冻结嵌入+注意力/特征提取器)效果次之。
七、实验结果:碾压式胜利在5大市场(NASDAQ、NYSE、TOPIX-100、FTSE-100、NASDAQ-recent)的测试中,SSPT模型表现优异: - 评估指标:IRR(投资回报率,衡量赚钱能力)、SR(夏普比率,衡量风险调整后收益);
- 结论:相比无预训练基线模型,SSPT在多市场、多场景下均实现“碾压式”超额收益,证明其对股市的深度理解能力。
总结:SSPT通过“定制化课程+高效架构+科学微调”,让AI真正“懂”股市,为智能选股提供了更精准的技术支撑。 |