
许多量化新手会遇到一个“神奇”现象:在回测中策略表现完美,年化收益50%以上,最大回撤不到5%;但一上实盘就连续亏损。罪魁祸首几乎都是“过拟合”。过拟合是指策略过度适应历史数据的噪声,导致失去泛化能力。使用QMT做策略开发时,如何有效避免过拟合?下面分享几个实操技巧。
技巧一:使用足够长的回测周期。不要只回测最近一年或两年。一个完整的市场周期应该包含牛市、熊市、震荡市。例如,回测时间段最好覆盖2015年股灾、2018年单边下跌、2020年疫情波动、2024年反弹等。如果你的策略只在单边上涨中赚钱,那它很可能只是碰巧。
技巧二:划分训练集和验证集。这是机器学习中的标准做法。比如,你用2016-2022年的数据来优化策略参数,然后用2023-2025年的数据(从未在优化中使用过)来测试。如果验证集表现显著差于训练集,说明过拟合了。QMT本身没有自动划分功能,但你可以手动设定两个回测区间分别测试。
技巧三:限制参数个数。双均线策略只有两个参数(短周期和长周期),这很安全。但有些人喜欢在策略里加入七八个参数:均线周期、RSI阈值、成交量因子、止盈止损比例等等。参数越多,过拟合的可能性呈指数上升。经验法则:参数数量不要超过3个,除非你有非常充足的理论依据。
技巧四:进行参数敏感性分析。假设最优参数是(5,20),那么检查一下(4,19)或(6,21)的表现是否大幅变差。如果稍微偏离一点就从盈利变亏损,说明参数过于敏感,很容易在实盘中失效。稳健的策略应该在参数邻域内表现平滑。
技巧五:避免数据偷窥。不要根据全市场某个明显的事件去写策略,比如“在2024年9月24日买入某板块”。这种针对性策略无法在未来复制。同样,不要反复优化直至回测曲线完美,那只是你在拟合噪音。
技巧六:使用蒙特卡洛模拟。随机打乱交易顺序,重新计算收益率曲线。如果多次模拟的结果很不稳定,说明策略依赖于特定的交易顺序,不够鲁棒。
最后,实盘前务必进行样本外模拟交易至少3个月。只有通过了这一关,策略才值得投入真金白银。在策略开发和测试过程中,一个能够提供专业社群答疑的平台会很有帮助。国金证券的QMT权限10万资金即可开通,并且提供量化交流群,很多有经验的用户会分享避免过拟合的实用技巧。此外,两融业务支持全线上办理,方便策略需要杠杆时进行资金管理。记住:回测漂亮不是终点,实盘稳健才是。