投资团队  
投资理念  
用户类别:
证件号:

密码:        忘记密码

验证码:




扫描二维码关注涌峰微信号

简析下一代的数据分析工具--PYTHON

2018/10/29 23:13:00 作者:中国龙团队
        《不懂编程就是文盲》,一篇关于新加入摩根大通的全部资产管理分析师必须强制学习编程语言Python的报道刷爆了朋友圈,引发了业内各分析师甚至销售学习Python的热潮。高盛曾经对全球2500名暑期实习生做了关于哪种语言在未来会更重要的调查,72%选择了Python, 计算机语言,尤其是Python在金融行业的重要性越来越大。
        为什么Python会流行呢?尽管早在1992年诞生,Python几年前还并非最主流的语言,但短短数年,从金融科技到人工智能,Python应用瞬间无处不在。AI的兴起正是Python崛起的最大推动力,而Python也是一种和AI特别般配的语言。正如我们评价Python为胶水语言一样,Python是一种简单易用,但能专业严谨地把各基本程序元件组合拼装并协调运作的语言。由于良好的包装能力、可组合性和可嵌入性,Python能直接调用各种底层程序库,比如一个C/C++写的程序库,如果用C/C++直接去调用该程序库,从环境配置到接口调用的步骤非常繁琐,而Python仅用数行代码就可以调用,非常清爽和整洁。因此在AI的环境中,这种始终把开发者效率放到CPU效率前面的特点就成了强大的优势,借助AI和数据科学,Python爬到了编程语言生态链的顶级位置。同时建立在大量前人的基础工作上,Python有着无比丰富的扩展包,例如数据科学的Numpy、Pandas、SciPy, 机器学习的Scikit-learm, 深度学习框架的Pytorch和Tensorflow等, 基于这种庞大而丰富的生态圈,Python使用者能迅速掌握并进行相应的开发。
        量化分析、金融科技和人工智能方面的研究人员,对于Python的在AI和数据科学方面的强大已经有了非常深刻的认识。那么为什么大摩会要求资管研究人员都学习Python呢?学习Python对于基本面研究的行业分析师有什么好处呢?我想还是在于Python处理数据的高效率。首先,Python能够迅速的处理大数据文件。例如,一个约5万条汽车行业各汽车种类销量的数据,如果用EXCEL保存的话大概100MB左右,打开EXCEL查看的用时可能要达到几分钟,而在Python中导入打开查看只需要几秒钟左右。同时对于大数据文件,Python借助于第三方扩展包,能够非常方便的在大数据间进行有序的分析,能图形化这些数据并且基于此做分组统计运算,而这相对于传统的工具EXCEL要更具有效率。其次,Python可以方便的处理文本文件,例如上市公司的年报公告中像数据软件万得等无法提供的非标准格式的表格数据,不再需要分析师一个个文件的摘抄整理,利用Python的文档提取能够在数分钟内完成。当然受限于数据提供方式的不同和扩展包中文分词能力的局限,并非所有的表格数据都可以被正确的识别和摘抄。但随着未来财务报告数据格式的进一步规范和中文分词库能力的提升,Python将能更方便的用来提取这些非标准信息。最后,利用Python可以做一些简单的策略回测,当行业的分析师需要对自己的想法进行数据验证以佐证观点的时候,借助于Python,他们可以定义好这些想法的条件,并且通过回测得到关于相应的历史数据支撑。
        在可预见的未来,Python作为一种非常易于学习掌握的语言,将会是金融分析师重要的数据分析帮手,但我们也不要过度神话Python的重要性。正如Python的计算效率不及C,矩阵运算比不过Matlab一样,Python有相对于其他语言易于学习操作的优势,也同样具有运算效率的劣势。Python对于分析师而言是一件非常合适的分析工具,但如果其他的数据工具足以满足手上工作的需求,那么不一定始终需要Python来执行。例如,国内用电量以及火电、风电等不同来源的发电量的月度数据,EXCEL足以满足分析过去历史趋势的需求;而且相对于Python这类编程语言而言,EXCEL的可视化和图形化操作要来的更加方便。Python能让金融分析师更高效的整理数据,这样精力可以更多放在数据研究


全国客户服务专线: 400-668-8801   www.topfund.com.cn  联系我们
沪ICP备 14007645号-1 沪公网安备 31011502017994号
Topfund © Copyright 2006-2024.