您的位置: >> 首页 >> 数据仓库 >> Data Model >> 查看资讯

推荐给好友 上一篇 我要投稿 下一篇

构建模型用于分析和预测

  最近以来,参加了一些建模的培训,自己也读了一些关于统计建模的书,加深了对统计建模的进一步的认识和理解,其中读到一本Econometric Models and Economic Forecasts的书,书中引言部分对为什么要构造和使用模型来进行分析和预测作了很好的回答,我个人觉得对刚刚接触建模的朋友来说会有帮助,所以摘了其中的一部分与大家共亨一下:   “假装预测未来的人按照刑事法的3条第901款应被认为是妨碍治安的人,应判250美元罚款及6个月的监禁。” ——纽约州刑事法第 889 款   本书向读者展示了如何科学地和艺术地构造和使用模型。纽约州刑事法针对的是那些假装用巫师的水晶球预言未来的人,而我们相信我们的模型是非常有用的预测工具。构造模型的科学包括一些用来构造和检验真实世界的数学代表的数量工具,这些工具的发展和使用全都包括在计量经济学的范畴内。不幸的是,建造模型的艺术很难用文字表述,因为它主要依赖于建模过程中的直觉判断。因为关于这些判断没有清楚的准则,建模的艺术很难掌握。然而,本书的目的之一是向读者传达这种艺术的本质,我们将通过例题和建模技术的讨论,以及鼓励读者建造他们自己的模型来达到此目的。  本书主要讨论关于商业、经济学以及一般社会科学活动过程的模型,包括总体经济活动、 某个企业的销售,或政治活动。正如我们一般所认为的那样,许多模型能够也常常既用来做政策分析也用来预测。本书并不打算囊括所有的模型类型和建模方法,它注重于方程形式表达的、通过数量方式联系变量的模型。用数据来估计方程或方程组的参数,然后用统计方法检验理论关系。即使这样仍然有太多的模型可以选择。我们可以通过建造一个较大的多方程计量经济学经济模型来确定不同货币政策对美国经济的影响,然后用不同的货币政策对它进行模拟,这样的模型会相当复杂,应当能够解释现实世界中比较复杂的结构。如果我们认为某企业的销售额具有很强的周期规律,我们也可以通过其过去的销售额行为规律用时间序列模型进行外推,对该企业的销售额进行预测。  这个模型的范围是本书的主要议题。我们的目的是使读者对建立什么类型的模型、如何建立最适当的模型、对模型进行统计检验并将模型用于分析和预测的科学和艺术有所了解。 一、为什么要用模型?   许多人都常常不是用到就是制造某种形式的预测,然而,很少人意识到在每一个预测里,都隐含着某种逻辑结构和模型。例如,某股票经纪人告诉你道琼斯工业指数明年会上升,该股票经纪人之所以做出这样的预测或许是因为道琼斯指数在过去的若干年里一直在上升,而且他认为使指数一直上升的因素会使指数在未来继续上升。认为道琼斯指数明年会上升的观点也可能是因为相信该指数通过一组复杂的关系与许多经济和政治变量相联系。例如,该股票经纪人可能认为,道琼斯指数以某种形式与国民经济总产值以及利率相关,因此如果相信这些变量未来会有某种行为的话,道琼斯指数明年就很可能会上升。  如果一定要用一个词来形容该股票经纪人预测的方法的话,我们可能会说是直觉,虽然上述两种方法中的推理过程有很大的不同。但是,它们都隐含着某种模型构造。以过去道琼斯指数的增长为根据作出乐观预测的股票经纪人实际上用的是时间序列模型,把过去的趋势外推到将来。如果预测是以经济知识为基础的话,也隐含着一个模型;它是由于经纪人过去的经验而不十分明确地存在于他头脑中的一些关系。  因此,即便是直观的预测也是某种模型,只是人们没有意识到而已。当然,我们有理由弄清楚为什么我们希望用一个明确的模型来进行预测。例如,值得不值得让我们的经纪人学习这本书,以便使他能够建立明确的模型、对它进行估计并进行统计检验? 我们的回答是,建立明确的模型有若干好处。建模能够使我们认真思考问题所涉及的所有重要的相互关系。过分地依赖直觉有时会很危险,因为可能会忽略或错误地使用重要的关系。另外,每一个关系都应当得到一定的证实,这一点很重要。不幸的是,在直观预测时,这一点往往被忽略。但是在建造模型的过程中,人们不仅必须验证模型作为一个整体的合理性,也要验证组成模型的每一个关系的合理性。  预测时同时提供预测精度的度量也是很重要的。直观方法的使用通常会阻碍任何预测结果置信度的数量度量。对构成模型的每一个关系以及对整个模型的统计分析使我们有可能给模型的预测附以置信度的度量。  模型一旦构造完毕,并对数据进行了拟合,灵敏度分析可以用来对模型的许多性质进行研究,特别是可以对模型中的每一个变量的微小变化的影响进行评价。例如,对于描述和预测利率的模型,可以度量通货膨胀率的变量对某一利率的影响。只有在有明确的模型情况下才能做这样的灵敏度分析。 二、模型的类型   在本书中,我们将研究三类用于预测或政策分析目的的模型,每一类模型的复杂程度都不同,要求对建模过程也会有不同程度的理解。  时间序列模型 在这类模型中,我们假设自己对是什么引起我们所研究的变量发生变化一无所知,所以我们研究时间序列的过去行为,以期对它的未来行为作出某种推测。用来生成预测的方法可能是诸如线性外推法的简单确定性模型,或是用于适应性预测的复杂随机模型。  使用时间序列分析的一个例子是用过去趋势的简单外推法预测人口增长,另一个例子是为某航线预测乘客人数构造复杂的线性随机模型。时间序列模型已经被用来预测飞机容量需求、季节性电话需求量、短期利率变化,以及其他经济变量等。在对我们所预测的过程本身知之甚少时,时间序列模型特别有用。时间序列模型结构的局限性使得它们只在短期内是可靠的,但是无论如何,它们还是十分有用的。  单方程回归模型 在这类模型中,被研究的变量由有若干解释变量的单个(线性或非线性)函数所解释。这个方程常常依赖于时间(即时间指标以显式形式出现在模型当中), 因此我们能够对我们所研究的变量在不同时间关于一个或多个解释变量的变化的反应进行预测。单方程回归模型的一个例子是联系某利率--如3个月国债利率--与诸如货币供给量、 通货膨胀率,以及国民生产总值变化率的单个方程。  多方程模型 在这类模型中,被研究的变量可能是若干解释变量的一个函数,这些变量彼此相关,同时也通过一组方程与被研究的变量相关。多方程模型的建造自一组单个关系的确认开始,每一个关系都要对已有的数据进行拟合。模拟就是在一定的时间范围内对这些方程进行联立求解的过程。  多方程模型的一个例子是美国纺织品行业的一个完整的模型,这一模型包含着解释诸如纺织品需求量、纺织品产量、纺织品行业产业工人就业情况、该行业的投资情况以及纺织品价格等变量的方程。这些变量相互依赖,同时也通过一组线性或非线性方程依赖于其他变量(如国民总收入、消费者价格指数、利率等)。在给定关于国民总收入、利率等假设的情况下,我们可以用模型模拟未来,从而获得对模型中每一个变量的预测。这样的模型就可以用来分析外部经济变量对一个行业的影响。  多方程模型假定能够在很大程度上解释被研究的实际过程。模型不仅要确认每一个关系,还要考虑所有相互关系的相互作用。因此,一个五方程模型实际上包含着比5个单个方程的总和更多的信息。五方程模型不仅解释5个单个的关系,也描述这5个关系同时作用所隐含的动态结构。  模型类型的选择涉及时间、费用以及所需要的精度之间的权衡。建造一个多方程联立模型可能需要花费大量的时间和财力,这种努力的回报包括对各关系的更深刻的理解。但是,在有些情况下,这种回报与大量的投入相比可能会太小。因为构造多方程模型必须对所研究的过程有相当深入的了解,所以构造这样的模型是十分困难的。  在对所研究的变量的影响因素知足甚少或一无所知,并能够获得大量的数据,同时模型主要用于短期预测时,通常会选择建立时间序列模型。然而,在已知一些信息的情况下,预测者也有理由构造两种模型,并将它们的结果进行对比。 ...

TAG: 构建 模型 预测
10秒注册会员 结交数据仓库朋友 分享你的精彩

我来说两句

seccode