400-998-1200
让数据创造价值
用专业成就未来
某大型公募基金公司
随着信息技术的迅速发展,人们可以从更多维度获取更加充分的数据。从资产管理和投资的角度来看,大数据也为传统的投资理财提供了新的思路。越来越多的资产管理公司或券商尝试着与互联网公司合作,分析互联网上的用户数据或用户行为,用大数据的方法捕捉市场变化的信号,从而为投资策略提供新的指导。但从目前已经发行的大数据指数来看,大都表现出较大的波动性和非常高的相关性。那么,能否基于互联网信息开发出一款兼具收益性和稳定性的大数据基金产品呢?
解决方案
金融风控
产品与服务
未央数据云服务
客户简介

该大型公募基金公司是中国首批获准成立的老十家基金管理公司之一。
经过十多年的稳健发展,大成形成了强大稳固的综合实力,管理规模一直稳居行业前列,目前,其管理公募基金规模已超过1000亿元。
客户需求

自2014年7月以来大数据指数方兴未艾,但中国市场上已经发行的大数据指数表现出较大的波动性和非常高的相关性。同时,证监会逐步放开QDII业务准入条件,需要有一个指数可以比较客观系统地反映全球经济对于国内经济及国内资本市场的影响,可以捕捉到海外资本市场与国内资本市场相互影响相互传导的关系。
基于这样的背景,为真正改变投资端及投顾端的投资体验,品见智能与该基金管理有限公司合作开发了一款全球产业链大数据指数,构建一支量化选股模型,要在保证收益性的同时兼顾稳定性。
如何解决

通过未央数据云服务 模块内的云爬虫技术对国内外互联网数据的广泛爬取,从主流媒体、财经论坛、社交媒体等,收集针对产业链的报告解读与评论文章,并汇聚整合在未央数据云服务 平台内作为辅助第三方数据源;通过自然语言处理与机器学习模型,输出针对产业链的媒体热度、评论方向、政策支持、风险预警等量化指标;从而对产业投资、企业风控、量化选股等应用场景形成决策辅助。
(1)明确细分产业链和选股范围:确定了与智能产业相关的共19个细分产业链。国内 19 个智能产业相关的细分产业链总共 883 支股票作为选股样本池,美股中选择了与其中17个细分产业链相关的共367支股票作为选股样本池。从股票的选取上充分考虑分布于各细分产业链上中下游的相关上市公司,选取了并剔除“ST”等不宜投资的股票、上市不足22个交易日的股票;
(2)确定细分产业链的关键词库; 品见完成数据爬虫开发,通过关键词搜索,爬取互联网信息,每天实时更新;
(3)数据质量审查、数据清洗、数据整合、筛检增删错误信息、遗漏信息和噪音数据,克服自然语言处理中不平衡等技术难题;
(4)通过挖掘关键词在各个数据源中出现的频次和所属文章的情绪方向得到该细分产业链在不同数据源上的热度指数和方向指数;
(5)产业链综合指数模型建立:综合每个产业链的六个热度指数和六个方向指数,依据每个产业链的特点并结合历史股价信息,分析国内/国外数据源对所有产业链的综合影响,对19个细分产业链分别生成境内和境外的产业链搜索指数;
(6)该基金量化部门的量化选股模型将品见的搜索指数和传统的量化选股因子以及产业链的股价趋势因子相结合进行量化选股,从而生成国内的产业链量化选股组合以及美股的产业链量化选股组合.
实施效果

在2013年7月至2015年10月的回测期内,按照每周大数据模型评分最高的六个产业链的平均指数构造大数据选股指数,其累积收益率持续高于所有产业链平均累计收益率、创业板指数以及沪深300指数的累计收益率的情况。大数据选股指数的信息比率为1.82,分别高于创业板指数和沪深300指数44.97%和107.22%。
模型在2013年到2015年的数据上测试,收益率超过大盘500%,且成功预警了两次股灾。
大数据选股模型在美股的表现,大数据产业链指数收益率超过股票池平均收益率150%。
大数据风险预警指数成功预警了数次股灾。
准备好开始大数据升级了吗?

© 2017 Pintechs.com 版权所有 ICP证:沪ICP备17033318号-1