摘要:随着社会的发展,我国的大数据发展也有了很大的进步。当今,计算机参与到了经济交易中,能捕捉到和这些交易相关的数据并加以操作和分析——大数据已成为经济学中不可避免的话题。本文以预测为重点简单介绍一些经济学中处理和分析大数据的工具和方法。
关键词:大数据;计量经济学;应用与简析
引言
当前,经过长时间的以及工业经济的发展以及经济的高速发展,我国经济发展的新常态化程度不断发展,经济发展过程中不断出现各种新型的产业形态以及经济发展新形势,这就导致了我国经济发展中潜在的经济规律发生了改变,计量经济学作为分析经济发展客观规律的有效手段是经济新常态下促进经济新格局构建以及推动经济稳步发展的关键。[1]计量经济学与经济学进行深入融合对宏观经济市场进行研究和分析不仅可以有效地创新经济发展路径,而且对发现和解决宏观经济中存在的风险具有重要意义。
一、处理大数据的工具
历史上,经济学家一直处理电子表格中显示的数据,如果电子表格中有超过100万行数据,那就需要将其存储在诸如MySQL之类的关系数据库中。由于计算机中介交易的兴起,许多公司发现有必要开发每天处理数十亿笔交易的系统。例如,谷歌已经完成过30万亿次网址抓取,平均每天超过200亿次,每个月响应1000亿个搜索查询。公司可以通过租赁来数据存储和处理的能力,将以前处理大数据的固定成本转变为可变成本,降低了处理大数据的门槛。
二、宏观经济发展新形势
(一)经济发展中的能源消耗较大的工业以及附加值较小的产业在经济新常态下逐步丧失优势
经济新常态下传统工业以及技术含量较低,不利于经济发展质量的提升,随着供给侧结构性改革的推进这类产业在经济发展中的优势已经逐步丧失了,这就要求经济发展必须重视创新的运用以及技术含量的提升,提高经济发展的整体附加值。因此,我国逐步开始实体经济结构的转型以及经济形式的创新,在提升经济新常态下经济发展速度的同时注重质量和效益的提高。在这种情况下更应该注重统计分析在经济发展中的运用和研究。
(二)金融资本市场在经济新常态下发展速度越来越快
金融资本运作在经济新常态下促进经济发展所起到的作用越来越大。[2]但是金融资本市场的迅速发展在促进经济发展转型的同时也带来了潜在的金融不稳定因素,由于金融市场对实体经济发展的巨大作用,金融市场的不稳定将对实体经济的发展产生巨大的不利影响,因此需要将金融工程运用在金融产品的研发与组合,通过将计量经济学与金融学深入融合预防系统性金融风险的发生。
(三)经济新常态下经济发展中出现的问题越来越多,新型产业越来越多
随着经济发展以及技术发展,经济发展中的产业形势呈现出多元化的发展趋势,由于传统的市场监管所解决和面对的都是传统经济问题,对新问题不能做到及时的解决。[3]经济新形势下例如共享经济,区域链等新兴产业的出现,一方面对经济新格局的构建以及经济发展质量的提升起到了重要的推动力量,另一方面,由于新产业发展的不成熟也为经济发展整体格局的稳定性产生了威胁,需要利用计量经济学对宏观经济发展中波动的异常情况进行统计分析研究。
三、计量经济学在提升宏观经济发展质量的有效运用
(一)预测的一般考虑事项
预测的目的通常是获得良好的样本外预测。大多数人从经验中可以知道,构建一个在样本内工作良好但在样本外失败的预测非常容易。机器学习专家将这种现象称为“过度拟合”现象,并提出了几种解决方法。首先,选择较为简单的模型。由于简单的模型更适合样本外预测,机器学习专家提出了各种方法来否认过于复杂的模型,在机器学习世界中,这被称为“正则化”。同样的,经济学家也倾向于选择简单的模型。其次,测试-训练循环和交叉验证。为了训练、测试和验证,将数据划为不同的集合。使用训练数据来评价模型,使用验证数据来选择模型,使用测试数据来评估所选模型的性能。最后,利用调优参数。如果我们对模型的复杂性有一个直观的数值,我们可以将它看作一个参数,可以“优化”它以产生最佳的样本预测。即使没有合适的调优参数,也应当谨慎的报告已有参数所反映出拟合程度的好坏,因为这个参数反映的是样本外性能,更具有参考意义。
(二)处理大数据的方法
一般而言,如果提取的数据量非常大,可以选择一个子样本进行统计分析。一旦数据集被提取出来,通常需要进行一些附带着数据统一和数据清理任务的探索性数据分析。统计学和计量经济学中的数据分析可以分为四大类:预测、总结、估算、假设检验。在大数据处理中,与预测相关联的技术一般是机器学习;而和总结相关的技术一般为数据挖掘,比如挖掘其中有趣的模型。计量经济学家、统计学家和数据挖掘专家一般都在寻找可以从数据中提取的深刻见解。机器学习专家通常主要关注开发高性能计算机系统,这些系统能够在具有挑战性的计算约束条件下提供有用的预测。应用计量经济学的大部分内容是检测和总结数据中的关系,最常用的总结工具是(线性)回归分析。机器学习提供了一套可以有效地总结数据中的各种非线性关系的工具。这些工具是现在最为常见也是最为普遍的,因为它们是与实际经济情况最符合的。
(三)计量经济学与机器学习
计量经济学和机器学习之间在许多领域都存在着有效的结合。其中最为重要的领域是因果关系预测。当我们想要评估某些处理方式的因果影响时,需要将有干预的结果与不加干预可能发生的情况进行比较,但大多数情况下不加干预所产生的反事实是无法观测到的,因此必须通过某种模型来预测。你对反事实的预测模型越好,就越能估计出因果关系。比如经济学家经常在外界干预发生时利用它预测接下来的经济类数据走势,再根据预测做出相关应对。
四、结语
由于计算机已经渗透了经济交易系统,大数据只会越来越大。为小型数据集开发的数据处理工具和方法将越来越不足以应付新的问题。机器学习的研究人员已经开发出了处理大数据集的工具、研究出了处理大数据时特有的方法,未来也会有越来越多的相关技术出现。——本文来源于《大众投资指南》2019年第14期,论文作者:丁超群。
参考文献:
[1]洪永淼.经济统计学与计量经济学等相关学科的关系及发展前景[J].统计研究,2016,33(5):3-12.
[2]杨锐.以统计学为核心知识体系的我国宏观经济统计分析发展研究[J].中国集体经济,2015(21):25-26.
[3]陈龙,王建冬,窦悦.基于互联网大数据的宏观经济监测预测研究:理论与方法[J].电子政务,2016(1):18-25.
转载请注明来自:http://www.lunwencheng.com/lunwen/jgu/22342.html