week2交作业

叠个甲,因为最近太忙了本篇差不多一半由AI帮我讲话,但是我发的内容都是与gemini多轮探讨后总结的,算我有点偷懒吧,不过我觉得传达到意思就好
还有一些参数调整其实是我边写边调的,所以图中其实只是过程,不是结果,仅供参考

**1.1 **平台初始化与模型框架生成
本阶段旨在通过AI助手快速搭建基于深度学习的量化因子分析基础框架。

访问系统并创建空白的“AI工作流”，在画布右下角唤醒AI助手准备交互；

通过自然语言向AI描述研究目标：“帮我生成一个基于沪深全A股票池的机器学习因子分析框架，结合当前前沿的LSTM与Transformer模型特性，时间范围设定为2024年至2025年”；

确认AI自动生成的节点拓扑图。系统成功构建了从“特征工程构建”分流至“Transformer模型”与“LSTM模型”，再汇聚于“因子构建（机器学习）”及后续评估模块的完整策略流。
*
1.2* 节点逻辑解析与深度学习参数调试
本阶段重点在于理解双模型融合的机制，并根据实际数据特性进行参数的优化与排错。

借助代码AI助手理解策略核心逻辑：明确LSTM负责捕捉时间序列的短期记忆与局部时序依赖（Time Steps），而Transformer则利用其多头注意力机制（Multi-Head Attention）提取全局长序列特征；

针对节点进行精细化参数调试：在Transformer节点中，设定Embedding维度为64，多头数为4，最大序列长度5000，并启用cuda硬件加速（训练轮数1000）；

同步调整LSTM模型参数：设定时间步长为10，LSTM单元数50，为了防止过拟合，向AI提出修改需求，将Dropout比例设定为0.200，学习率调至0.001；

运用AI助手进行错误排查：在调试过程中若遇到张量维度拼接等报错，直接将日志反馈给AI，由其自动生成修复代码并“应用”覆盖，最后保存工作流。
*
1.3* 策略运行与因子绩效评估
本阶段执行回测并解读最终的因子分组收益表现。

在画布右上角启动工作流，设置调仓周期为1天，分为5组进行测试，等待云端完成模型的训练与推理；

点击“全屏查看”进入因子分析结果可视化页面，重点观察多头与空头组的收益曲线；

结合最终输出的走势图表分析：基于LSTM+Transformer融合构建的因子展现出了极强的收益区分度。头部组别累计收益率最高突破了200%，且各分组曲线呈现出完美的单调性。尽管在回测中期遭遇了系统性的急剧回撤，但由于双模型对时序特征的强健提取能力，净值迅速收复失地并创出新高，验证了该因子策略的有效性。
1.4在常规的量化社区或网上的开源方案中，大家提到 LSTM+Transformer，通常是用**“串联”**的笨办法：先把数据喂给 LSTM 过一遍，再把结果扔给 Transformer（或者反过来）。

这就好比让一个短线交易员看完盘，再口述给一个宏观分析师。**这种“一锅炖”的缺点很明显：**特征容易被互相磨灭。Transformer 的全局注意力机制，很容易把 LSTM 好不容易提取出来的短期量价波动给“平均”掉。一旦遇到类似收益图表中间那段“极端暴跌”的行情，这种串联模型容易因为参数混乱而死机，导致回撤后趴在水下起不来。

而我们自己搭建的“拆分并联”模型（如工作流画布所示），走的是“专业分工、各自为战、最后汇总”的路线：
屏幕截图 20260301 184551.png
LSTM 专注“盯短线”：，它的唯一任务就是死盯着短期的量价变化、微观的动量反转。它对暴跌后的“超跌反弹”极其敏感。

Transformer 专注“看长线”：给它开放了 5000 的序列长度，它的任务是站在上帝视角，寻找几十天甚至几个月里的全局特征和资产间的隐蔽关联。

最终仿照出来的效果差异（结合收益曲线图）：
屏幕截图 20260301 185530.png
这是跑出来虽然不是最好的一次,但是是最能展现这两个模型合力的

抗击打能力与 V 型反转：仔细看图表正中间那次断崖式的全市场回撤，我们的策略虽然也受了伤，但随后打出了一个极其漂亮的“V型反转”并创出新高。这正是拆分结构的功劳：Transformer 稳住了大趋势的判断（没被震出局），而 LSTM 敏锐地抓住了暴跌后的第一波反弹节点。如果是网上的传统模型，大概率在那波暴跌中就已经因为特征混乱而止损平仓了。

叠个甲,因为最近太忙了本篇差不多一半由AI帮我讲话,但是我发的内容都是与gemini多轮探讨后总结的,算我有点偷懒吧,不过我觉得传达到意思就好