注册

大数据:双十一前后在涨价 售假多在国际大牌代工处


来源:澎湃新闻

中国家庭金融调查与研究中心主任甘犁长年为中国画像,试图解决“中国不知道中国人有多穷,也不知道中国人有多富”的问题。甘犁认为,在大数据不能提供完全信息的问题上,比如中国家庭的资产与行为,需要抽样调查的数据来刻画清楚。

原标题:大数据揭示:双十一前后其实是涨价,售假多在国际大牌代工处 

中国家庭金融调查与研究中心主任甘犁长年为中国画像,试图解决“中国不知道中国人有多穷,也不知道中国人有多富”的问题。中国家庭金融调查与研究中心是西南财经大学于2010年成立的集数据采集与数据研究于一身的公益性学术调研机构,包含中国家庭、小微企业和基层治理三大数据库。

从2009年起,甘犁对中国家庭进行金融抽样调查,发现中国家庭收入严重不均,收入最高的一成家庭拥有近六成的人群总收入。这首次填补了中国家庭资产调查领域的空白。

但当大数据时代崛起后,“很多人来问我,甘教授,这样的做法是不是没有必要了”。

这是数据收集最便利的时代:人们刷一张信用卡,用手机下一单外卖,就向平台提交自己的所在地、年龄、性别、消费行为等信息。大数据的挖掘者写一个爬虫程序,通过网络抓取,数据就滚滚涌来。

这也是传统调查受质疑的时代:相比之下,甘犁在做的事情太过昂贵——调查一家小微企业需投入1000多元,调查一个家庭600多元,他4万户家庭的数据库,意味着几千万元调查成本的投入。在大数据的浪潮中,“他们觉得我有些老派”。

大数据带来了前所未有的机遇,清华大学通过网络抓取物价数据,已经可以每天发布物价变动情况,而国家统计局的传统方法,只能在次月延迟发布上月的CPI。阿里巴巴也在改写自己电商公司的形象,致力于把自己定义为一家数据公司。

2016年,甘犁与阿里研究院合作,从阿里巴巴的大数据入手,去实地调查电子商务对农村经济的影响。他认为直到现在,中国也尚未勾勒出清晰的自画像。大数据能够提供农村电商的信息,却不能说明电商正在怎样改变村庄的生态,这正是传统抽样调查应该去寻找“厚数据”的地方。

互联网CPI显示:双十一前后都涨价

大数据已经对传统的物价统计发起了挑战。

天猫双十一证明了低价对消费的吸引力,一秒之间,有12万笔交易近乎同时发生。在阿里巴巴安全部总监连斌看来,双十一前几分钟的交易量,足以构成一波对计算机系统的攻击。

这场降价在2016年双十一的24小时内,促成了1207亿元的交易额,却难以在国家统计局的物价指数中有清晰刻画。根据国家统计局的传统统计和发布方法,每月的物价指数变动,需要延迟到下一个月才能够发布,更不可能看到每天各项物价的涨落情况。

但大数据则可以细化到食品、服装、每项统计商品的每日价格波动。3月12日,在浙江大学大数据与厚数据研讨会上,清华大学经济学研究所所长刘涛雄,用基于互联网的消费者物价指数(清数-iCPI),证明了双十一前后的涨价现象。

清数-iCPI的价格曲线,在2016年双十一的前一天,环比上升了0.58个百分点,而在双十一过后的第二天,物价则大幅反弹了近1.62个百分点。而在变动的物价中,服装的价格变动最大,而食品和日用品的价格变动则相对较小。

大数据显示的物价变动证明,虽然商家在双十一提供了大幅折扣,但在节前,商家的确上调了商品价格,在双十一之后,商品价格也经历了大幅度的反弹。

清数-iCPI显示2016年双十一前后物价上涨

清华大学经济学研究所依照国家统计局的统计方法,对相同的一篮子商品进行价格追踪,通过爬虫程序,抓取互联网商务平台上和价格信息平台上的商品价格信息,实现了在每天凌晨发布前一天的物价变动指数。

刘涛雄认为从网络上抓取的每日物价“打开微观世界,能够看到细胞”,清数-iCPI的周数据显示,春节一周的价格指数最高,涨价最明显。每日数据显示,在雾霾严重的日子里,口罩和医疗器械等价格指数也灵敏随之变动。而这些都是传统物价指数不可能刻画的现象。

大数据不能显示:电子商务缓解留守之痛

甘犁认为,大数据终究有无法提供的信息。

“大数据对一个人的画像,如果是手机的话,一般能够做到性别、你在哪里工作、你在哪里生活、大概的教育水准,像阿里巴巴这样,会有你的网购行为,像腾讯这样的,则会有你的朋友圈信息。”

甘犁告诉澎湃新闻(www.thepaper.cn),在这些可以通过大数据获得的信息之外,很难获取家庭结构、工作情况、收入情况、资产情况,其他消费情况、金融状况等信息。而如果需要获得这些关键的信息,就需要以抽样调查去获得更深入的数据,而抽样数据的代表性,也是大数据所难以替代的。

2016年,甘犁与阿里研究院合作,对农村的电商发展进行调查。他首先通过阿里巴巴的数据,找到了有活跃电子商务活动的村庄与村民。

他也在寻找大数据中缺失的信息:“你有网上的数据,你只知道这个正在做电商家庭的情况,你却不会知道,这个家庭在淘宝上卖产品,会带动周围的产业链。”

甘犁通过抽样调查和线下数据的收集,发现电子商务带动了当地的基础设施建设和物流发展。最终报告显示,网商排名前5%的地区,村民的交通满意度、义务教育满意度和医疗满意度,分别达到56.58%、69.10%和56.21%,均高于城市居民。

资料来源:《农村网商发展研究报告2016》

此外,甘犁也在实地调查中发现,电子商务能够让村民减少外出务工,平均来看,有网商外出务工的人数,比无网商的村庄要少133人。而在全国,农村电子商务的发展,减少了约1200万外出务工的人口。这让这些村庄的留守老人和儿童问题,得到了很好的缓解。

资料来源:《农村网商发展研究报告2016》

抽样调查与大数据也能够互相验证,甘犁曾对北京地区的房屋空置率做过调查,通过抽样调查了解了每个家庭的住房拥有量和空置情况,又通过抽取北京地区水、电的使用率大数据,发现北京确实有大量房屋,用电率为零。

雨伞与降雨术

连斌所在的阿里巴巴安全部门对全国假货中心做了画像。他在浙江大学大数据研讨会上表示,阿里巴巴通过挖掘大数据,在1.1平方公里的区域内,找出了售假卖家的高度集中区域,比如北京秀水街、深圳华强北。

然后阿里巴巴派出了线下的调查队伍,去确认这些地方是否确是售假中心。

一个规律从数据中浮现出来:售假的中心正是国际大牌产品的代工中心。

连斌推测造假的根源:当国际品牌向劳动力更为低廉的东南亚转移,在中国留下了代工工厂,成熟的产线,技术经受考验的工人,还有失去订单之后,日益严重的生存问题。

他也在质疑假货的根源:如果中国有良好的国产品牌,如果这些技术熟练的工人,不需要冒着风险造假就能生存下去,那他们是否还会铤而走险,去生产假货?

甘犁认为,大数据能够看到现象之间的关联,还需要通过田野调查和实验,去确认因果关系。他在四川乐山做扶贫实验,不再直接给贫困人口发放补助,而是去奖励生产率更高的村民,找到因果关联,去改变贫困人口甘于贫穷和懒惰,以免失去补助的情况。

甘犁认为,在大数据不能提供完全信息的问题上,比如中国家庭的资产与行为,需要抽样调查的数据来刻画清楚。其他一些大数据所无法确定的因果关系,机理和机制,也需要抽样调查的数据去验证。

刘涛雄认为,在政策研究的时候,经常会提到两个问题,一个是降雨术的问题,一个是雨伞的问题。从非结构化的大数据中,可以挖掘现象,做出预测,在下雨前备一把伞。而在结构化的抽样数据中,则可以验证因果,就像在干旱缺水的时候,需要掌握打干冰降雨的技术。

“打多少干冰降多少雨,依靠大数据是说不清楚的,而在预测风向的时候,大数据却是非常有用的。”

[责任编辑:洪烨]

  • 好文
  • 钦佩
  • 笑抽
  • 泪奔
  • 无聊
  • 气炸
凤凰新闻 天天有料
分享到: