马蜂窝平台数据造假事件持续发酵。本该备受谴责的行为,众多互联网从业人士竟无一人对此表示讶异。似乎,造假已是行业共识?
文| 金融八卦女作者:伟华
···
马蜂窝被捅成“马蜂窝”,不过数日间。
10月20日,自媒体“小声比比”创始人梓泉联合乎睿数据团队在其公众号上发布了一篇文章,质疑估值175亿人民币的马蜂窝旅游网平台涉嫌数据造假,平台7454个作弊账号从携程、艺龙、美团、Agoda、Yelp抄袭、搬运点评近1800万条,占到官方声称总点评数的85%。
22日,马蜂窝发表了一则官方声明,称平台已对全网数据进行核查,查处了涉嫌虚假的信息。
另外,马蜂窝还避重就轻地指责文章“歪曲事实,存在明显的误导倾向”,并打出一张感情牌,称平台为“千万旅行者的精神家园”,文章伤害了用户的感情,平台将采取法律手段维护自身权益。
当日下午,马蜂窝起诉梓泉、乎睿数据团队名誉侵权获北京市朝阳区人民法院立案。另一方,梓泉、乎睿数据团队表示将发起反诉,还互联网世界以真实。
23日,马蜂窝联合创始人兼CEO陈罡公开回应,马蜂窝在餐饮等点评数据方面存在部分问题。但是,对于“小声比比”文章中的表述,陈罡一口咬定其“明显抹黑”。
/ 数据造假?这有啥大惊小怪的/
这几天,不少互联网从业人士也表达了各自对整个事件的看法。总结起来,观点无非以下几种:
2、马蜂窝数据刷得太明显,这次被扒纯属作死;
3、马蜂窝和投资人联合做假,毕竟马上又要融资了;
4、刚好在融资节点上出事,马蜂窝遭遇黑公关了?
而对马蜂窝平台上存在失实数据,竟无一人表示讶异。似乎,造假已是行业共识。
正如事件发生后,《新京报》记者向多位业内人士所求证的,“互联网企业发展早期都通过爬虫或机器采集信息来充实评论等内容,这是公开的潜规则,很多平台都存在。”
例如,QQ音乐上存在与网易云音乐相似的评论、大众点评曾在未授权情况下对小红书内容进行违规转载、脉脉曾非法抓取使用微博用户信息、微头条通过数据抓取同步微博内容被屏蔽等。
据极光大数据统计显示,中国移动网民平均每日花费4.2小时在手机app上,其中,花费在旅游出行类app的时长仅3.4分钟。
然而在梓泉看来,影响范围小不应成为马蜂窝数据造假的托辞。
有趣的是,马蜂窝一例中,数据造假似乎与企业的融资行为密切相关。
据了解,马蜂窝成立于2007年。彼时,与马蜂窝同处在线旅游平台赛道的,还有携程、去哪儿、艺龙、同程旅游等众多项目。
创投圈永远不乏投机者。没有用户?那就烧钱拉新,或者从其他平台挖一些来。没有数据?那就造假,或者采用技术手段从其他平台搬一些来。
对许多互联网企业来说,流量、用户、数据即价值,至于规则,在利益面前都是可以无视的。
同理,极其重视回报率的投资机构,又怎会置身于参投企业的对立一面?数据造假没关系,能套现就行。
这样一来,所谓“马蜂窝与投资机构联合做假”的传闻,兴许还真不是空穴来风。
不过,事件发生后,陈罡表示,马蜂窝决心要成为公开呼吁告别数据造假的第一家企业。另外,副总裁于卓23日公开表示,此次事件不会影响公司正常运营,IPO也在正常推进。
马蜂窝似乎在说,既然数据造假被摆上台面了,以前我们造假,以后我们就不造假了,只要最终能上市,这一切都不是事儿。
/ 互联网造假地图——
不变的造假,万变的方式/
早些时候,澎湃新闻一篇《一名网络水军的日常》深度揭示了互联网灰色产业中的造假规则。
文章提到,网络水军分为不同的圈子,有的面向企业,有的面向媒体,有的专门为明星推广,稍大些的水军团队还需要设计、策划等职位,专做业务公关。
十年前,互联网还处于BBS时代,当时,水军的任务是在各个论坛发广告贴,按条计费。后来,机刷逐渐取代了人工操作,水军的阵地也转移至微博等社交网站。
对于淘宝平台,水军的任务则是“刷单”,也有写评论、做评测的,普通稿费约为千字100-200元或一篇200-300元,专业评测稿费相对贵两到三倍。
从需求来看,水军主要负责帮助企业、媒体等完成营销任务。而在营销领域,特别是媒体、广告公关行业,数据造假由来已久。从广告主、品牌方、各层代理商中间商、从事数据造假的团队到媒体投放平台,早已形成完整的产业链条。
当所有人将对价值的评判标准量化(评分、阅读量、转发量等),没有人会在意内容的好坏,而是将注意力集中到表面数据上。
今年7月,某自媒体账号与公关公司蓝色光标(300058,股吧)就“拿刷数据的假网红骗钱”一事争执不下,事件背后,正是媒体、公关公司、品牌方、甚至数据造假团队因利益捆绑在整个行业链条上的身不由己。
在知乎有关水军、数据造假等话题的讨论中,不少答主指出,互联网平台在一定程度上默许了部分账号的刷量行为。于是,账号买粉刷量、平台默许,便成为整个行业的现状。
例如,在直播领域,大量人气是刷出来的。
/ 数据造假,有无法可依?/
事实上,一切造假都应属于违法行为,互联网企业通过爬虫或机器采集信息来充实内容,可能构成侵权、虚假宣传或不正当竞争。
例如,在微博诉脉脉非法抓取使用用户信息一案中,脉脉的行为构成不正当竞争。当时,北京知识产权法院在判决中指出,经用户同意,网络平台可以基于自身经营活动收集并使用用户信息。反之,非法抓取、使用其他平台用户信息等行为构成不正当竞争。
但是,作为大数据不正当竞争纠纷案首案,这一案件的终审日期为2016年12月30日。在此之前,不是无法可依,而是没有明确的行业规则。
同样的,规定“电子商务经营者不得以虚构交易、编造用户评价等方式进行虚假或者引人误解的商业宣传,欺骗、误导消费者”的《中华人民共和国电子商务法》,今年8月31日才获通过。
企业、公众对于法律法规的淡漠以及几近为空白的行业规则,导致近20年来,互联网数据造假成为“行业共识”,揭露真相反倒变成“故意抹黑”。
数字时代,有数据的地方就有造假。实际上,小到日常的游戏作弊器、微博僵尸粉,大到一个平台伪造UGC内容、一个企业利用黑公关诋毁竞争对手,数据造假几乎已经成为人们生活中的一部分。在互联网法律法规并不完善的今天,灰色产业一点点蚕食着原本公平的竞争空间,也扭曲着人们以往的价值判断。
然而嘲讽的是,就这次质疑本身,也被质疑水军的存在:
从10月22日至今,事件中互动量最高的三条微博分别来自@中国新闻周刊 (互动量16w+)@财经网(博客,微博)(互动量13w+) @新浪科技(互动量5w+) ,对转发列表进行分析,可以发现非常明显的水军参与特征。
以转发量最高的@财经网 微博为例,10月21日12:47分,@财经网 发布微博“#马蜂窝抄袭#【马蜂窝被指数据造假:85%的点评不真实 充斥僵尸和水军】”,截至目前,该微博转发量4.7W+,而传播最大深度仅6层,带来最多二次转发的为@财经网 本身的再度转发,但也仅仅只带来85个二次转发。
几乎没有引爆点,微博却获得了大量传播,本身就十分不正常,多出现在水军转发的情况下,转发趋势更是诡异:
首个转发高峰出现在22日0点整,凌晨也一直持续着不低的转发量;而从清晨5点起,转发趋势更是一路飙升,最高峰出现在7点半;12点40分还有400+转发,随后就瞬间断崖式下跌。
当大多数人对泛滥的数据造假怪现象免疫之时,梓泉说,这是错的。
而若想纠正这些错误,最重要的,则是建立更为明晰的行业规则。
本文首发于微信公众号:金融八卦女频道。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。