其他分享
首页 > 其他分享> > 2021.1.5-开题报告

2021.1.5-开题报告

作者:互联网

目录

(一) 选题依据

选题的目的及意义  大量研究结果表明,股票行情数据蕴含着预测未来股票价格的信息,因此基于这些数据设计出能够稳定盈利的量化投资模型成为了量化投资的主要研究思路。传统的量化投资模型主要是根据金融研究人员对市场的理解与经验总结出的技术指标和交易策略所构建的[1][2]。但是股票市场是一个复杂的非线性系统[3],股票价格涉及许多不确定因素且各因素之间关系复杂,显然,传统的量化投资模型已逐渐无法满足市场需求,而机器学习在许多非线性复杂问题上取得了突破性进展,如搜索引擎、个性化推荐、语音识别等。因此,利用机器学习方法构建量化投资策略具有一定的天然优势。基于此,本文聚焦于量化选股策略研究,旨在使用机器学习算法构建出能够指导投资者获得长期稳定的投资收益的量化投资模型。
国外文献综述  Markowizt[4](1952)提出“均值-方差模型”理论,这表明量化投资理论基础的诞生和量化投资时代的到来,该理论阐述了收益与风险之间的数量关系,并且首次用指标衡量了风险的大小,这预示着投资分析从定性分析时代进入了定量分析时代。Alethea Rea和Libin Yang[5](2016)采用主成分分析法提取并利用最主要的因素,极大程度上提高了组合的收益率。R Akita等[6](2016)通过深度学习方法将事件报道的文本信息与股市时间序列信息进行融合,并进行量化交易,结果表明运用这种方法得到的收益能够超越其它对比方法。Y Deng等[7](2016)运用深度增强学习产生的交易信号来指导交易,并在股票和期货市场进行测试,结果表明该方法能得到较为稳定的收益。
国内文献综述  楼迎军等[8](2005)将股票投资组合作为研究对象,采用遗传规划、遗传算法及多目标决策做投资组合与换股的可行性分析,结果表明这种方式可以帮助投资者选择出比较好的获利组合。彭丽芳等[9](2006)提出了一种基于时间序列的支持向量机预测股票方法,构建股票收盘回归预测模型,结果发现这种方法相较于传统的时间序列预测模型具有更高的预测精度。苏治等[10](2013)采用SVR模型对股票收益率作回归分析,构建了基于核主成分遗传算法改进的支持向量机人工智能选股模型,以沪深股市的交易数据为研究对象,从短期和中长期对模型的选股性能和预测精度进行实证研究,结果表明该模型的中长期预测结果较好。曹正凤等[11](2014)以价值成长投资策略理念为准则,对样本数据进行离散化预处理之后,运用随机森林算法对股票进行了较高准确率的分类,解决了股票投资中的优质股票选择的问题。魏妹金[12](2015)通过逐步回归法筛选因子,运用支持向量机构建多因子选股模型,对2005年至2014年的A股市场进行回测,取得了显著超越市场的收益。周渐[13](2017)以沪深300成分股为研究对象构建了时间推进的在线学习SVM模型,结果得出后者能更好地根据市场做出动态的自我调整。潘磊、王琦、王丹华等[14](2018)在Dual-Thrust策略基础上构建了多版本的策略,在国内股市上进行回测,结果表明该策略具有很好的盈利性能。贾秀娟[15](2019)提出的基于随机森林的SVM模型相较于基于主成分分析的SVM模型的分类性能得到了很好的提升。

(二) 主要研究内容及预期目标

主要研究内容  本文首先综述量化投资理论的国内外现状以及发展趋势,然后介绍K近邻与XGBoost两个算法的理论知识、常用的模型参数调整方法以及 Flask Web体系结构,再做实证研究,主要包括三方面:数据预处理及特征降维、模型预测及评价、量化策略构建及回测分析,最后以可视化平台展示股票预测涨跌情况及量化策略回测结果。
预期目标  搭建一个展示预测未来股票涨跌情况和量化策略回测结果的可视化平台,将两大机器学习算法应用于股票未来涨跌方向的预测中,使用多指标对比分析各模型的预测性能,同时将机器学习模型应用于量化选股策略的构建中,对比各策略的表现以及不同持仓数下构建的选股策略模型的效果,旨在使用机器学习算法构建出能够指导投资者获得长期稳定的投资收益的量化投资模型。
  本文拟包括6大章节,第1章是绪论,主要内容是研究背景及意义、国内外文献综述以及行文的内容框架;第2章主要阐述机器学习算法理论和Flash Web相关技术;第3、4章为实证章节:第3章主要实证内容为数据预处理、特征降维、模型训练及评价;第4章主要实证内容为量化策略的构建、不同机器学习模型构建的量化策略在不同持仓数下的回测效果对比分析;第5章的主要内容是平台设计与实现,主要是将3、4章的实证结果以可视化的形式展现出来;第6章为总结与展望,总结全文的同时反思研究过程中存在的不足并在此基础上展望未来。

(三) 主要研究方案

拟采用的研究方法1.文献研究法
  通过图书馆、互联网、电子资料数据库等途径查阅大量文献,学习K近邻和XGBoost两个算法以及Flash Web体系结构的相关理论知识,理清构建量化策略的思路,为后期的实证研究和实现可视化打好理论基础。

2.案例分析法
  从WIND数据库中获取所需股票数据,为后期做实证研究提供数据支撑。

3.实践研究法
  在构建模型的过程中不断调整参数以优化模型,搭建平台的过程中发现并解决问题,不断完善自己设计的平台。
准备工作情况1.通过搜集近三年金融和信息领域的热门话题,确定论文的主要研究方向
2.利用图书馆、互联网等不同途径,收集机器学习和量化选股的相关资料和文献,并确定选题
3.查阅与选题相关的论文和著作,并研读其中大部分文献,理清论文的基本思路,搭建论文的主体框架
主要措施通过阅读期刊和学位论文,利用网络查找相关资料和数据,与指导老师和同学进行讨论交流,并结合自己所学专业课程的理论知识进行研究分析。

(四) 主要参考文献

[1] Ali, A. and Trombley, M. A. 2006. Short sales constraints and momentum in stock returans.Journal of Business Finance and Accounting,33(3-4):587-615.
[2] Agyei-Ampomah, S. 2007. The post-cost profitability of momentum trading strategies:Further evidence from the UK. European Financial Management, 13(4): 776-802
[3] Bischi G I, Valori V. Nonlinear effects in a discrete-time dynamic model of a stock market[J]. Chaos Solitons & Fractals, 2000, 11(13): 2013-2121.
[4] Harry Makowitz. Portfolio selection Journal of Finance[J], March 1952, 7(1): 77-91
[5] Alethea R, Libin Y. Stock Selection with Principal Component Analysis[J].Journal of Economic Theory 20(2); 121-168
[6] Akita R, Yoshihara A, Matsubara T, et al. Deep Learning for Stock prediction using numerical and textual information[C]//Computer and Information Science(ICIS), 2016 IEEE/ACIS 15th International Conference on. IEEE, 2016: 1-6
[7] Deng Y, Bao F, Kong Y,et al. Deep direct reinforcement learning for financial signal representation and trading[J]. IEEE transactions on neural networks and learning systems, 2016.
[8] 楼迎军,杨义群.进化计算在选股决策中的应用研究[J].技术经济,2005(03):35-37.
[9] 彭丽芳,孟志青,姜华,田密.基于时间序列的支持向量机在股票预测中的应用[J].计算技术与自动化,2006(03):88-91.
[10] 苏治,傅晓媛.核主成分遗传算法与SVR选股模型改进[J].统计研究,2013,30(05):54-62.
[11] 曹正凤,纪宏,谢邦昌.使用随机森林算法实现优质股票的选择[J].首都经济贸易大学学报,2014,16(02):21-27.
[12] 魏妹金.支持向量机多因子选股模型[D].福建:华侨大学,2015.
[13] 周渐.基于SVM算法的多因子选股模型实证研究[D].浙江:浙江工商大学,2017.
[14] 潘磊,王琦,王丹华, 等.Dual-Thrust策略在股票量化交易中的实现与应用[J].科技资讯,2018,16(27):17-21,23. DOI:10.16661/j.cnki.1672-3791.2018.27.017.
[15] 贾秀娟.基于随机森林的支持向量机量化选股[J].区域金融研究,2019(01):27-30.

(五) 时间安排

论文从2020年12月至2021年6月初结束,共历时6个月:

2020年12月28日前阅读相关资料,确定写作思路
2021年1月4日前提交写作提纲和开题报告
2021年1月12日前完成开题答辩
2021年3月27日前完成量化选股模型的实证研究,提交文献综述和外文翻译,撰写论文并进行中期检查
2021年5月11日前完成可视化平台的设计与实现,提交毕业论文草稿
2021年5月18日前提交毕业设计定稿
2021年6月初毕业答辩

标签:2021.1,策略,报告,研究,模型,构建,选股,量化,开题
来源: https://blog.csdn.net/myy12456789/article/details/112219583