投资者情绪是影响证券市场价格波动的主要因素之一。投资者情绪度量的关键在于数据获取和计算方法设计。传统的投资者情绪度量的方法主要采取两种不同的方法:1)采用直接情绪数据进行度量,这种方法需要通过问卷方式采集大量的投资者的信息,其优点是数据直接来源于投资者,数据相对可信,但是其成本很高;2)采用间接的市场指标进行度量,如成交量、换手率等,这种方法的优点在于数据获取相对比较容易,其缺点也很明显,这些代理变量并非情绪本身的度量,而是市场变化的指标。
不同于传统的投资者情绪度量方法,我们提出一种基于金融社交媒体大数据的投资者情绪度量方法,利用Web爬虫技术及时快速的获取投资者对市场看法的最直接的言论数据,并采用文本大数据的分析挖掘方法对这些情感丰富的文本数据进行智能的精准处理,从而及时计算出针对证券市场上每一只个股的当期市场情绪指数。这种方法既克服了传统的情绪度量方法中的数据获取的难题,又采用最前沿的大数据技术,结合基于深度学习的人工智能方法设计先进的情绪度量算法。在本研究中,我们数据采集的主要来源是国内影响力最大的股票论坛--股吧。股吧是目前我国个人投资者进行意见交流的主要渠道之一。在本研究中,我们通过挖掘其中大量情感丰富的股帖对个人投资者情绪进行度量。首先,在充分考虑股吧文本数据的特点的基础上,我们花费大量精力专门构建一个针对金融社交媒体文本分析的词典。基于该词典,我们对采集到的股吧文本大数据进行分析挖掘,针对个股计算其当期的投资者情绪指数。利用最近15年的数据,我们进行相关的回测。初步的实验结果显示:基于金融社交媒体的投资者情绪和市场走势存在正相关;金融社交媒体中的有效意见数量越多,情绪一致度越高,个人情绪指数就越有效;个人投资者情绪能有效揭示证券市场牛熊市的转换。
科学有效的个人投资者情绪度量不仅能对金融领域的投资行为的学术研究产生深远的影响,也能对市场上的投资机构和个人投资者起到有价值的参考。更重要的是,及时把握个人投资者的情绪动向,对于政府和监管机构制定相应的政策会起到积极有效的作用。鉴于此,我们计划从现在开始,通过微信公众号“IFIND-金融大数据研究中心”,每周发布“个人投资者情绪指数周报”。周报的主要内容包括个人投资者情绪指数与市场关系、当期情绪指数最高的前三十只个股、当期情绪指数最低迷的三十只个股、以及当期各行业情绪指数。
欢迎各位同仁各位朋友批评指正!
北京师范大学经济与工商管理学院
金融大数据研究中心
2018年7月