《合作经济与科技》No.9x2015
网络搜索数据与消费者信心指数自回归模型研究□文/贾培佩1张
泰2张文良1
(1.河北金融学院;2.河北软件职业技术学院河北·保定)
[提要]本文建立网络搜索数据与消费者信心指数自回归时间序列模型,对消费者信心指数进行分析,发现网络搜索数据和消费者信心指数之间存在显著相关性。
关键词:网络搜索数据;消费者信心指数;相关性基金项目:河北省统计科学研究计划项目(2014HY39)中图分类号:F713.55
文献标识码:A
收录日期:2015年8月19日
DOI:10.13665/j.cnki.hzjjykj.2015.18.066随着互联网科技的发展,以及我国固定网络和移动网络的迅速普及,人们获取信息的方式正在由传统渠道向信息化渠道发展。本文主要对网络搜索数据和消费者信心指数之间的相关性进行了探讨。关键词初选是整个研究的第一歩,搜索引擎的推荐、Googlecorrelate关键词挖掘工具、SEO关键字挖掘和ICTCLAS汉语分词系统是确定初选网络搜索词的四个重要方法,然后基于关键词搜索量的相对值与消费者信心指数的实际变化的相关性强弱,来确定最终用于研究的关键词,同时还可以在运用时差相关分析法确定相关性大小的过程中,发现其不同关键词的领先或滞后阶数。最后,将关键词搜索指数与消费者信心指数进行相关性分析。
一、建立自回归模型
(一)关键词初选。网络搜索数据反映的是在某段时期,该关键词的被关注度和搜索热度。消费者信心指数同比数据来自于我国国家统计局官方网站数据库的统计数据。两种数据选取
的时段是从2009年11月到2013年6月。
本文根据消费者信心指数的编制结构,选定了经济发展形势、家庭收入和就业、物价水平、消费或购买意愿等构成和影响因素,选择了“GDP”、“就业率”、“货币供应量”、“黄金”和“二手房”等比较原始的网络搜索关键词。除了百度搜索风云榜等比较简单的关键词挖掘方法对与消费者信心比较相关的领域进行了初步的关键词搜集外,还运用了数据挖掘工具Correlate、SEO关键字挖掘工具及ICTCLAS(汉语词法分析系统),使得关键词的选取工作更加的有章可循。通过上述的操作,得到1,500多个与初始关键词相关的词,之后对关键词做了进一步的搜集和整理工作。剔除重复的关键词后,在谷歌趋势搜索字词栏中逐一进行输入,如“公积金买房”、“柴油价格”、“上证指数”、“理财产品”、“居民消费价格指数”等,最终得到有搜索量并且各个月份数字相对比较完整的关键词约600个。为了使最终的结果更具科学性和客观性,需要把从谷歌趋势中下载下来的网络搜索关键词数据进行如下数据预处理:
1、由于关键词数据是以周为单位的,而消费者信心指数国家统计局是按月公布的,因此为了更好地确定两者之间存在的相关关系就有必要把网络搜索关键词的周数据合并转换成以月度量化的月度数据。
2、为了解决季节变动要素和不规则要素往往掩盖经济发展中客观变化给研究所带来的问题,消除其短期波动,需要对关键词进行平滑处理,对网络搜索关键词,数据进行三期的移
(一)加强政府主导作用,在行业政策法规和市场秩序方面进行改革与发展。政府在市场调节资源中应发挥其主导作用,对市场进行监管和维护,尤其在政策法规建设和市场秩序的监管维护方面,为珠海旅游业的发展提供顶层设计的保障。
(二)将城市形象建设与旅游形象建设融为一体。旅游形象与城市形象在一定层面来说是一体的,但在内在本质层面上有本质区别,属于宏观与微观。因此,将旅游形象的建设融入城市形象建设之中,有利于旅游地位的提高,同时也对城市的经济发展大有裨益。通过对旅游形象的普及与提高,促使民众认识旅游和宣传旅游的一体化发展。
(三)加大城市文化和旅游文化宣传,营造良好的氛围。将城市文化与旅游文化合二为一来进行宣传,因为两者一脉相承,在元文化上是一体的。在大学生群体中定期举行旅游文化宣讲会、大学生旅游节等,向大学生群体营造良好的旅游氛围,建设文化软环境,循序渐进的影响学生的旅游意识。-126-
(四)对大学生进行旅游景点政策和门票优惠,拉近与大学生的距离。通过特殊优惠政策来吸引大学生旅游,获得学生群体的支持,基于参与者理论使得大学生从参与者转变成旅游践行者、宣传者和支持者。
(五)提升旅游景点的人文关怀和原生态自然资源保护。提升景点的人文服务质量,对服务人员和景点管理人员进行专业培训,提高从业者的综合素质,为旅游事业的发展提供人才支撑;在全球环境恶化及PM2.5的威胁下,人们对原生态自然资源的渴求欲望尤为突出,因此对保护自然资源是提高旅游竞争力和吸引力的最有效措施。主要参考文献:
[1]珠海市政府门户网站.http://www.zhuhai.gov.cn/.[2]《珠海市城市总体规划(2001-2020年)(2015年修订)》珠府函〔2015〕110号.珠海市人民政府,2015.4.
动平均,从而达到突出各网络搜索数据长期变化规律的效果。
3、由于消费者信心指数的数据是同比数据,而网络搜索关键词数据并不是同比数据,因此为了更准确地去发现两者之间的相关关系,需要与消费者信心指数的数据保持一致,有必要将平滑之后的网络搜索关键词数据转换成同比数据。
(二)关键词评价。根据消费者信心指数的构成和影响因素,利用百度等搜索引擎的关键词推荐工具,以及SEO长尾关键词挖掘工具,对网络搜索的原始关键字词进行了挖掘和筛选过滤,保留下来大约600个与消费者信心指数相关的网络搜索初始关键词。为了比较系统的评价网络搜索关键词搜索量的变化情况与消费者信心指数之间的关系,对网络搜索关键词的评价主要从网络搜索关键词的领先性和相关性角度为衡量指标。
文章中采用了时差相关分析法分别计算各个初选网络搜索关键词的领先阶数和相关性。时差相关分析具体表达式为:
(xΣ
p=1N
(四)消费者信心指数自回归模型。本文选择消费者信心指数(Y)为被解释变量,消费者预期搜索指数(X1)和消费者满意搜索指数(X2)为解释变量,建立时间序列模型,为了确定各个研究变量是否平稳,采用ADF检验法,检验结果为所有变量在5%的置信水平都已平稳。接下来建立自回归模型:
)Yt=c2+β1X1t-2+β2X2t-1+β3Yt-1+ε2(1
采用Engle和Granger的两步协整关系检验法来检验其长期趋势。结果显示,残差项具有稳定性,因此网络搜索指数与消费者信心指数之间具有长期稳定的协整关系。并且自回归方程(1)拟合效果是最优的,拟合方程见(2)、(3)式。该模型量化了网络搜索数据与消费者信心指数之间的关系,表明消费者信心指数的变化是由消费者未来生活预期的变化和消费者对现有生活满意情况的变化以及历史的消费者信心水平来共同决定。
)Yt=-10.079-1.081X1t-2+1.062X2t-1+0.077Yt-1(2
)Yt=-396.50-106.865LogX1t-2+2.1043LogX2t-1+0.0748Yt-1(3模型当中,解释变量X1t-2和X2t-1代表的是消费者通过网络搜索相关内容对消费者信心指数刻画的贡献,从宏观和微观两个层面,以消费者预期和消费者满意为代表,反映了在网络生活中,消费者预期和消费者满意网络关注度和热度的变化。两个搜索指数变量的系数不同,这说明消费者预期和消费者满意两个影响因素的变化对消费者信心的影响程度是不同的。消费者预期搜索指数和消费者预期搜索指数两个指数各变化1%,对应的消费者信心指数变化的幅度分别为106.87%和2.10%。
我们把消费者信心指数的真实值和模型得到的消费者信心指数的拟合曲线图绘制在一起。(图1)可以看出本模型对于消费者信心指数的拟合效果基本上令人满意,两者的走势基本上是同步的。即:网络搜索数据可以在一定程度上对消费者信心指数进行预测,但是在某些时段,消费者信心指数的模型拟合值和消费者信心指数的真实值之间还是存在较大的偏差。
二、结论
通过建立网络搜索数据与消费者信心指数之间的自回归模型,我们发现:1、网络搜索数据与消费者信心指数之间是协整的。消费者预期搜索指数的提高会引起消费者信心指数的下降;消费者满意搜索指数的提高会引起消费者信心指数的上升。这表明消费者预期也就是消费者对宏观层面的评估和预判对消费者信心的影响要远远大于消费者满意即微观层面的影响;2、网络搜索数据中的部分数据和消费者信心之间具有显著的相关性;3、利用网络搜索数据合成的消费者预期搜索指数和消费者满意搜索指数与消费者信心指数之间存在不同时间的时差。消费者预期搜索指数领先消费者信心指数两个月,消费者满意搜索指数领先消费者信心指数一个月;4、引入网络搜索指数后的自回归模型对消费者信心指数的拟合和预测都比较好,可以比官方公布的消费者信心指数提前1个月左右,基本实现了对消费者信心指数的实时监测。
軃)軃)(yt-yt-p-x
Nrp=
式中,p为某一网络搜索关键词相对与消费者信心指数的x表领先阶数,rp表示当时差为p的两个变量之间的相关系数,示网络搜索关键词搜索热度的月度变化率,y表示消费者信心指数,而这个最大值即为关键词与消费者信心指数两者之间的相关系数。
本文在关键词评价过程中,符合要求的关键词其p值必须大于0。同时为网络搜索数据与消费者信心指数的相关系数设定一个临界值标准(本文中的临界值为0.5),对于小于这一标准的网络搜索关键词,不予考虑,进行剔除处理。
(三)搜索指数合成与检验。表1从消费者预期和消费者满意两方面列出部分网络搜索关键词的皮尔森相关指数。(表1)表112345678消费者预期方面国内生产总值收入物价指数货币供应投资利息就业情况平均工资相关系数0.6630.5460.6300.5990.5330.6600.7500.612消费者满意方面衣食住行男装品牌品牌西服娃哈哈醋房价二手房节能汽车坐车相关系数0.5650.595-0.674-0.5980.6470.563-0.661-0.701姨22軃)軃)(xt-p-x(yt-yΣΣp=1
p=1
N(p=0,±1,±2,…,±n)
拟合效果图
110
CCI实际值
CCI拟合值
105
100
主要参考文献:
952009m7
2010m7
2011m7time
2012m7
2013m7
[1]国敏.基于网络搜索技术的游客量预测方法研究[D].北京:首都师范大学,2012.
[2]郭洪伟.我国消费者信心指数的编制及存在的问题[J].商业时代,2010.
-127-
图1拟合效果图
因篇幅问题不能全部显示,请点此查看更多更全内容