华泰金工 | 华泰人工智能研究6周年回顾

近几年，人工智慧在定量股权投资应用领域已获得可喜的战绩，与此同时也充斥众多争论，发展机遇与考验共存。2023年3月，ChatGPT的火热出圈再一场将创业者的注意力招揽到AI这一应用领域，大数学模型“不断涌现”所增添的精采更让人充满期盼。做为人工智慧定量科学研究的先驱者，安信木工项目组2017年6月1日年来相继正式发布广度调查报告68篇，囊括数学模型试验、胺基酸发掘、非主流统计数据、对付过插值、聚合对付网络、综合五大主轴。正逢第一篇研究调查报告正式发布6十周年之时，我们对系列产品科学研究展开简述，述追忆，思Conques。目录

01 安信人工智慧科学研究6十周年简述

系列产品科学研究编者按

数学模型试验主轴

胺基酸发掘主轴

非主流统计数据主轴

对付过插值主轴

聚合对付网络主轴

综合主轴

核心观点安信人工智慧科学研究6十周年回顾近几年，人工智慧在定量股权投资应用领域已获得可喜的战绩，与此同时也充斥众多争论，发展机遇与考验共存。2023年3月，ChatGPT的火热出圈再一场将创业者的注意力招揽到AI这一应用领域，大数学模型“不断涌现”所增添的精采更让人充满著期盼。做为人工智慧定量科学研究的先驱者，安信木工项目组2017年6月1日年来相继正式发布广度调查报告68篇，囊括数学模型试验、胺基酸发掘、非主流统计数据、对付过插值、聚合对付网络、综合五大主轴。正逢第一篇研究调查报告正式发布6十周年之时，他们对系列产品科学研究展开简述，述追忆，思Conques。数学模型试验主轴数学模型试验是系列产品早期侧重的主轴。2017年他们试验广义线性数学模型、支持向量机、决策树、神经网络等数学模型的选股效果，发现随机森林、XGBoost这两类决策树。胺基酸发掘、非主流统计数据主轴持续迭代的胺基酸库是多胺基酸数学模型长期运作的基石。2019年6月，他们展示遗传规划在量价选股胺基酸发掘中的详细流程，并且持续探索改进方案，近期将算法拓展至一致预期胺基酸发掘。2020年6在不同的股票池中都展现出优秀的选股能力。2020年起，他们借助NLP中的技术对新闻舆情、分析师研究调查报告等非主流统计数据，发掘增量Alpha。对付过插值、聚合对付网络、综合主轴

股权投资者对人工智慧的质疑集中于过插值和黑箱，他们提供丰富的工具加以应对。金融市场统计数据量有限，过插值难以避免，聚合对付网络（GAN）可以聚合以假乱真的“伪造”统计数据，有助于他们训练数学模型和理解市场。他们还探索特征选择、非主流标签、因果推断、无监督学习在股权投资中的应用。近期他们学习九坤在Kaggle举办的定量股权投资大赛中的成功经验，总结定量AI“炼丹”中的技巧，提升数学模型收益。跟进GPT大语言数学模型对定量股权投资可能增添的影响，通过四则实例分析GPT对投研工作增添的效率提升。

安信人工智慧系列产品的初心

人工智慧并不神秘。其本质是以数理数学模型为核心工具，结合控制论、认知心理学等学科的科学研究成果，最终由计算机模拟人类的感知、推理、学习、决策过程。人工智慧并非万能。现实世界高度复杂，任何数学模型相对于整个世界都太过简单。世界时刻处于演化中，没有任何数学模型能长期有效，必须同步保持更新。安信人工智慧系列产品的愿景，是通过切实的科学研究与实践，澄清人们对人工智慧的误解和偏见，帮助人们更清晰地认识人工智慧的长处和局限，从而更合理、高效地将人工智慧运用于股权投资。简述过往68篇科学研究，他们秉持了这一份初心，也希望为读者增添了启发。

正文

01安信人工智慧科学研究6十周年简述

近几年，人工智慧在定量股权投资应用领域已获得可喜的战绩，与此同时也充斥众多争论，发展机遇与考验共存。2023年3月，ChatGPT的火热出圈再一场将创业者的注意力招揽到AI这一应用领域，大数学模型“不断涌现”所增添的精采更让人充满著期盼。毫无疑问，AI科学研究已经展开了新的篇章。

做为人工智慧定量科学研究的先驱者，安信金融工程项目组自2017年6月1日年来相继正式发布广度调查报告68篇，囊括数学模型试验、胺基酸发掘、非主流统计数据、对付过插值、聚合对付网络、综合五大主轴。正逢第一篇研究调查报告正式发布6十周年之时，对系列产品科学研究展开简述，述追忆，思Conques。

系列产品科学研究编者按

2017年6月1日，《人工智慧1：人工智慧选股框架及经典算法简介》正式发布，开启数学模型试验主轴。2017年10月10日，首场人工智慧Python培训在北京举办。2018年1月2日，第一篇人工智慧周报正式发布，每周跟踪人工智慧选股策略表现。2018年11月28日，《人工智慧14：对付过插值：从时序交叉验证谈起》正式发布，开启对付过插值主轴。2019年6月10日，《人工智慧21：基于遗传规划的选股胺基酸发掘》正式发布，开启胺基酸发掘主轴。2020年5月8日，《人工智慧31：聚合对付网络GAN初探》正式发布，开启聚合对付网络主轴。2020年5月26日，《AI开辟定量新航线》专题路演上线安信机构服务平台行知。2020年6月14日，《人工智慧32：AlphaNet：胺基酸发掘神经网络》正式发布。2020年10月22日，《人工智慧37：舆情胺基酸和BERT情感分类数学模型》正式发布，开启非主流统计数据主轴。2020年12月15日，交易机会评分统计数据上线安信金融统计数据服务平台INSIGHT。2021年4月13日，AlphaNet胺基酸统计数据上线INSIGHT。2021年9月27日，人工智能选股策略统计数据库上线行知。2021年10月22日，AI炼金术第一期《左右互搏的“GAN”》上线行知。2022年4月29日，科学研究所和宽邦科技、亚马逊云科技、朝阳永续、金融阶联合撰写的《2021年中国定量股权投资白皮书》正式正式发布，在呈现定量金融应用领域当前发展现状与此同时，从人工智慧、非主流统计数据、高频交易等方面展望定量股权投资未来前景。2023年4月，《2022年中国定量股权投资白皮书》正式正式发布，首场正式发布会行知线上观看人数累计超过8000人次。

华泰金工 | 华泰人工智能研究6周年回顾

数学模型试验主轴

数学模型试验是系列产品早期侧重的主轴。多胺基酸选股和机器学习在形式上匹配，是机器学习应用于定量股权投资的较好切入点。2017年，他们试验广义线性数学模型、支持向量机、决策树、神经网络等数学模型的选股效果，发现随机森林、XGBoost这两类决策树集成数学模型较为适合多胺基酸选股场景，兼具插值能力强、稳定性好、训练效率高等优点。损失函数的不同融合方式对超额收益的影响，发掘不同预测目标下的增量信息。

华泰金工 | 华泰人工智能研究6周年回顾

胺基酸发掘主轴

持续迭代的胺基酸库是多胺基酸数学模型长期运作的基石。2019年6月，他们展示遗传规划在量价选股胺基酸发掘中的详细流程，并持续探索改进方案，与此同时还将算法拓展至一致预期胺基酸发掘。2020年6月，他们构建全新的胺基酸发掘神经网络AlphaNet，实现端到端的胺基酸自动发掘和合成，随后从网络结构、特征、损失函数等方向加以改进，样本外跟踪表强组合回测期内（2017-01-03~2023-04-28）年化超额收益率18.18%，信息比率3.29；周频中证1000指数增强组合回测期内（2017-01-03~2023-04-28）年化超额收益率28.93%，信息比率4.45。

华泰金工 | 华泰人工智能研究6周年回顾

非主流统计数据主轴

基于基本面、行情等结构化统计数据构建的常规胺基酸面临拥挤困境，非主流统计数据或成为破局关键。2020年起，他们借助自然语言处理、注意力机制等广度学习技术，尝试从海量分析师研究调查报告、新闻舆情文本中发掘微言大义，构建分析师研究调查报告情感、FADT_BERT等选股胺基酸及策略。

华泰金工 | 华泰人工智能研究6周年回顾

对付过插值主轴

股权投资者对人工智慧的质疑集中于过插值和黑箱，他们提供丰富的工具加以应对：时序交叉验证相比传统交叉验证方法更适用于金融时序统计数据；重采样技术基于真实统计数据构建“平行世界”，检验策略参数过插值概率；组合对称交叉验证（CSCV）是更为简单易行的过插值检验流程；SHAP、ICE、SDT等数学模型可解释性工具能够揭示机器学习的“思考”过程。

华泰金工 | 华泰人工智能研究6周年回顾

聚合对付网络主轴

金融市场统计数据量有限，过插值难以避免，聚合对付网络（GAN）可以聚合假统计数据，有助于他们训练数学模型和理解市场。GAN通过判别器和聚合器的“左右互搏”，实现海量数据模拟。从最初的GAN单资产聚合出发，他们试验WGAN、RGAN、DCGAN、SinGAN等变式，并将功能拓展至多资产聚合和宏观指标聚合，最终应用于资产配置、策略调参等实践场景。

华泰金工 | 华泰人工智能研究6周年回顾

综合主轴

他们还探索特征选择、非主流标签、因果推断、无监督学习在股权投资中的应用。《人工智慧52：神经网络组合优化初探》（2022-01-09）中，他们将组合优化融入神经网络，打通胺基酸聚合、多胺基酸合成、组合优化这三个定量股权投资的重要步骤，实现端到端的定量股权投资全流程。《人工智慧53：揭秘微软AI定量科学研究》（2022-01-12）中，他们透过微软亚洲科学研究院AI定量科学研究，展望行业发展五大趋势。《人工智慧64：九坤Kaggle定量大赛有哪些启示》（2023-01-20）中，他们学习九坤在Kaggle举办的定量股权投资大赛中的成功经验，总结定量AI“炼丹”中的技巧，提升数学模型收益。2023年3月ChatGPT火热出圈后，他们也思考GPT与量化股权投资结合的方式。虽然定量股权投资行业短期内可能难以直接受益于GPT数学模型；但长期看，如同人脑各区域分工明确但相互联系，现有定量股权投资预测数学模型可与各类大数学模型耦合扩展功能；算法升级和规模扩大后，定量数学模型可能不断涌现出预期之外的能力，值得定量从业者期盼。此外GPT能大幅提升投研效率，他们通过定量分析、网页抓取、文字摘要及行情复盘四个案例展示了GPT在投研工作中的可能应用场景，GPT均有不俗的表现。

华泰金工 | 华泰人工智能研究6周年回顾

结语

人工智慧并不神秘。其本质是以数理数学模型为核心工具，结合控制论、认知心理学等学科的科学研究成果，最终由计算机模拟人类的感知、推理、学习、决策过程。人工智慧并非万能。现实世界高度复杂，任何数学模型相对于整个世界都太过简单。世界时刻处于演化中，没有任何数学模型能长期有效，需要同步保持更新。人工智慧发展机遇与考验共存。AI技术在定量行业的使用已是如火如荼，GPU、平台、算法枕戈待旦，但究竟是“人工智慧”还是“人肉智能”争论不断，一遇回撤便喜提热搜。正如他们在系列产品开篇研究调查报告里所写，安信人工智慧系列产品的愿景，是通过切实的科学研究与实践，澄清人们对人工智慧的误解和偏见，帮助人们更清晰地认识人工智慧的长处和局限，从而更合理、高效地将人工智慧运用于股权投资。简述过往68篇科学研究，他们秉持了这一份初心，也希望为读者增添了启发。6年白驹过隙，AI技术发展如奔腾大河时不我待，希望他们能与读者共同见证AI的未来，未来已来。

风险提示：

人工智慧发掘市场规律是对历史的总结，市场规律在未来可能失效。人工智慧技术存在过插值风险。

相关文章

微信