做了一个精选股票评论的网站
#AI的神奇用法 好几年前实习的时候做过一个项目,用神经网络判断推特上的股票评论是看涨还是看空,根据结果统计股票的情绪指数,用来指导交易。当时的效果不是特别理想,今年看到了chatgpt以后就想着如果用LLM做会怎么样,可惜如今对量化交易没什么热情,暂且作罢。
某天突然意识到,其实没必要执着于量化的思路,把这些评论都提取成指数喂给交易算法。如果LLM能够实现对这些评论的过滤总结,将高信噪比的文本提供给人类投资者,提升人的信息获取效率,那么同样能带来价值。而且这样一来项目的受众会非常广泛,比如很多常刷雪球的用户都会有这种需求。
我做了一些简单统计,雪球上一支比较热门的股票每天的讨论贴约两三百条,排除掉乱七八糟的内容后,其中真正有效的信息可能不到50条,即便一名用户只关注10只股票,想要了解网络上的全部动态,则每天大约要看完至少2000条帖子,按每条耗时3s算,则总耗时约3*2000/60/60=1.67小时,其中浪费的时间则达到1.25小时,这还仅仅只统计了雪球一个平台。
而且即便用户看完了两三百条帖子,可能也说不出个所以然:今天到底是看涨的人多还是看空的人多?看涨的里面因为基本面的有多少,因为技术指标的有多少?除非当天发生了什么重大事件,否则凭借脑海里的模糊印象,还是不足以指导投资决策,时间大部分都浪费了。
总而言之,我希望有一个工具能够自动收集相关的股票评论,并进行总结归纳和简单的数据统计,让用户在十几分钟内就能了解到关注股票近期的所有动态。所以就做了这个网站:
--后湖 houhu.info
当前主要有三块功能:
1.雷达图
把收集到的观点都用算法做了分类,除了分利好和利空以外,还有话题种类的区分,这样更容易体现真正的关注点。统计结果(不同话题下观点的数量)用雷达图做可视化对比,以这张图为例,可以看出网上普遍认为比亚迪的产品有优势,而利润营收(财务状况)不容乐观。
2.观点总结
如果想看具体的观点,这里会提供每个观点的摘要和原文链接,同时上面的那排按钮还提供了7种话题的分类筛选。
3.情绪指数
最后是近段时间的情绪指数统计,同时在最下方提供了股价走势K线的对比,中间一排是计算情绪指数用到的样本量,样本量越高指数越可信,如果样本量不足10条,则当天的情绪指数可能参考价值不大。
当前状态:
后湖目前还只是一个业余项目,而且我对网页开发了解很有限,靠着chatgpt帮忙勉强完成了第一版。即便如此,后湖已经是一个可用的工具,已经帮我节省了不少浏览无效帖子的时间。
TOP待优化点:
1.当前网页排版对手机不太友好,建议先用电脑浏览器看
2.股票只支持了雪球上最热门的50只A股
3.当前只支持雪球一个平台,某些股票的有效样本量还是太少,后续会继续扩充
4.算法的总结还不够精准,一直在做优化的尝试,当前算是能看吧
5.图表功能(缩放拉伸对齐等)需要升级