新闻 | 娱乐 | 女性 | 文化 | 教育 | 卫生 | 政务 | 廉政 | 体育 | 悦读 | 艺术 | 法制 | 专题 | 财经 | 银行 | 产业 | 

首页 | 冀州 | 国内 | 国际 | 社会 | 财经 | 娱乐 | 体育 | 看图不说话 | 微言大义 | 滚动
> 专题 > 正文

刷量、买粉、伪创作… 数据造假最终受伤的是谁? 驾驶证模拟考试题 小武基市场 嘻嘻色导肮 苹果承诺更换问题电池 女孩下河捡包溺水 完美释放板车哥 吉林省司法警官学院 惟我独仙简介 标贴印刷 刘乔安12分钟 两名法国军人在马里执行任务时触雷身亡

2019-12-11

  “刷量”“买粉”“伪创作”

  数据造假成“法则” 最终受伤的是谁

  一篇自媒体文章不仅引起了公众对旅游社区平台马蜂窝点评内容抄袭的质疑也捅开了互联网行业数据造假的“马蜂窝”。

  在对“是否存在内容抄袭或数据造假”的质疑讳莫如深数天后马蜂窝联合创始人兼CEO陈罡承认其“在餐饮等点评数据方面存在部分问题但远没有外界所表述的那么夸大”。然而业内人士指出互联网领域的数据造假远比想象的更严重而且造假法则也呈现“道高一尺魔高一丈”的趋势。

  从最早的电商刷单、刷好评到之后的微信公众号买粉、刷阅读量再到网络直播平台买流量、App机器人用户充数据各类数据造假的手段不断翻新而真实数据成为难以获知的“高度机密”。

  难道没有机制可以识别、约束这些“法则”吗?事实上一些平台企业与投资机构早已尝试通过反爬虫、第三方数据检查等技术手段预防与应对数据造假但是效果并不好。另外部分投资机构出于种种考虑默认一些互联网企业的数据造假行为甚至与之合谋。技术难题也随之成为更加复杂的人性谜题。

  进步最快的是造假的方式

  在“马蜂窝事件”中备受质疑的一个数据造假“法则”是不少用户在其他平台的旅行攻略、点评内容被搬运到马蜂窝上。实际上此类做法并不新鲜。

  今年7月生活社区小红书通过官方微博指责大家点评大量抄袭其用户的内容。具体做法是批量建立虚假账号抄袭及搬运用户在小红书发布的原创内容。据小红书估计抄袭的数量在百万条量级。

  一些用户专门为小红书平台创作的内容被“copy”后依然留着原本内容的影子。小红书用户“詹小猪Coco”曾于6月6日发视频庆祝小红书创立纪念日“copy”后文案竟变成了“祝点评生日快乐”但视频中用户说的仍然是“小红书”而且6月6日也不是大家点评的“生日”。

  当时大家点评方面对此回应称这是因为新上线试运营的推荐栏目在未经授权的情况下对相关内容进行了违规转载已第一时间完成所有内容排查与全部清理下线并通过技术手段确保该类问题不再出现。

  段民(化名)从2002年开始从事数据挖掘工作是国内最早一批大数据行业应用的开拓者。他告诉中国青年报·中青在线记者这类搬运其他平台内容为己所用的行为属于常见的“伪创作”造假法则即通过网络爬虫软件将其他平台的数据与内容复制过来稍加修改后变成自我的内容。与其他造假手法相比这类做法更隐蔽需要专业人士持续跟踪、分析 、比对才能发现。

  段民表示除“伪创作”以外互联网内容平台常见的数据造假“法则”还包括虚报数据、“僵尸用户”、虚假行为等。前两种“法则”因用户了解有限平台与用户之间存在一定门槛往往难以得知;而通过机器人冒充真实用户访问网站或App从而增加流量或点击量的虚假行为是离普通用户最近的一种造假“法则”。

  微博、微信等平台的“刷量”“买粉”是其中的典型代表。2016年9月末因微信官方的后台调整行为屏蔽了公众号刷量工具的操作许多自媒体大V的真实用户与阅读数量显现出来。此前一周平均阅读量上万的公众号在当天最少的阅读量只有200;此前阅读量在10万以上的公众号当天的阅读量只有2万左右。

  此外一些音视频节目的播放量也出现造假。此前在国内首起因视频网站“刷量”而引发的不正当竞争案件中被告杭州飞益信息科技有限公司针对爱奇艺、优酷土豆、腾讯视频等主流视频网站上的视频内容“刷量”对某个视频节目“刷量”1万次仅收费15元。

  上海市徐汇区人民法院发布的信息显示飞益公司多名员工通过多个域名、不断更换访问IP地址等方式连续访问爱奇艺网站视频在短时间内迅速提高视频访问量仅2017年2月1日至6月1日飞益公司在爱奇艺网站制造了不少于9.5亿余次的虚假访问按照该公司每万次15元的刷量收费标准共非法获利上百万元。

  技术的发展让造假成本更低

  与“刷量”“买粉”“伪创作”等内容平台的造假手法相比夸大用户与产品买卖数据则是互联网平台上更直接也更难被发现的数据造假方式。

  2015年有业内技术人员在知名社区“知乎”上爆料通过反向编译蜻蜓FM安卓版本软件他发现蜻蜓FM软件中隐藏有名为“普罗米修斯”与“宙斯”的强行自启代码。前者可以在用户不知情的情况下在手机后台启动无窗口透明界面;后者则可以自主触发广告商的广告并回传给第三方数据公司从而完成“用户自主点击广告”的操作。

  因为普通用户很难发现这种技术方法而且可以提高日活跃用户数(DAU)等数据指标所以该爆料甫一出现便立即引发注意。对此蜻蜓FM曾回应称相关代码是用于新功能上线时进行AB对照测试、统计相关用户指标。

  不过这类说法未能解释该平台的日活用户数量与广告点击量为何突然增加。此前蜻蜓FM在宣布用户数量达到1.5亿的两个月之后就宣布用户数突破2亿许多业内人士怀疑该数据的真实性。

  除这类由专业人士爆料的案例之外也有一些平台可能因一些“长相奇怪”的数据而引起质疑。同样在2015年互联网农业公司一亩田因出现“9小时前李老板采购了1073741.8235吨洋葱”“6小时前刘老板采购了999.999吨毛桃”等数额怪异的买卖信息而陷入数据造假疑云中。

  彼时一亩田展示了其过去一年的买卖后台数据并称一亩田网站确实还有一些产品与数据不够完善仍处于数据测试阶段。

  中国首席数据官联盟专家成员鲍忠铁表示许多面向用户端的互联网企业都希望讲述一个快速增长的“独角兽”的故事而市场份额、客户数量、日活用户等数据就成了体现企业估值快速提高的重要指标。

  鲍忠铁在移动互联网界工作多年他对一些App宣称的用户数量嗤之以鼻。据他的观察很多App的下载量与用户量都可以通过技术手段造假:

  因为安卓系统的开放性破解系统权限后一台平板电脑设备上甚至可以装十多个同样的App配合不需实名制的虚拟运营商电话卡可以形成十多个看似真实、独立实则批量化虚假的用户。而且因为虚拟运营商的手机号可以包月使用这样的造假手法成本得以进一步降低。

  当数据造假变成一场合谋

  数据造假的“法则”如此大行其道甚至已经形成特定的产业链条为何会出现如此局面?

  前海梧桐合伙人王蔚分析互联网企业比较常见的是在运营数据上造假包括用户数据 、产品数据、财务数据等因为这类数据可以帮助企业获得激烈竞争中的优势地位提升业务合作报价。

  此外早期互联网企业的投融资估值一般采用流量法或市销率法夸大的运营数据一般会对应更高的估值。王蔚表示在运营数据造假以外还有不少互联网企业在融资经历、融资金额等方面也会造假。“我们都习惯了官宣融资额除以510有可能更接近真实数据。”

  王蔚认为除互联网企业自身竞争需求与融资需求驱动外投资人作为另一重要的参与方在数据造假问题上也不是没有责任的。因为财务投资者需要在投资互联网公司时“低买高卖”有时候为了推高企业估值以便实现股权退出也会成为数据造假的协同者。

  值得注意的是投资机构在企业数据造假中扮演的角色非常微妙。在成为某些企业的投资者之前也会通过一些技术手段发现或破解刷量、刷粉等数据造假的手法。

  远瞻资本合伙人秦岗表示因为许多公司数据“注水”大多数投资机构不再将企业自我发布的数据作为评判一个创业公司或产品的主要指标可能会聘请第三方数据机构来进行尽职检查以验证各项数据指标的真实性。

  不过秦岗也指出这类做法一般出现在投资项目比较成熟的中晚期或投资金额较大的情况下。对于早期创业项目或投资金额不够大的项目很多投资机构往往没有相应的预算。

  鲍忠铁表示对于网站、App的真实运营数据网络运营商一清二楚。“App什么时间打开什么时间关闭装在哪些设备上通过运营商的DPI数据是可以解析出来的。”但令人遗憾的是这类真实数据往往得不到重视一些VC投资机构、第三方数据公司也不会充分利用这些数据。“没人做这个事情因为对别人只有害、没有利。”

  鲍忠铁也注意到有些第三方监测软件或第三方数据咨询公司有时也会充当数据造假的“帮凶”。一些在业内颇有名气的第三方数据咨询公司所发布的特定App的下载量、月活用户等数据也经常被质疑。

  例如国内知名数据研究机构艾瑞咨询曾发布的数据产品就被今日头条、“大姨妈”等平台质疑可能弄虚作假。2017年年底艾瑞咨询联合美柚App发布的〖2017年中国女性生活形态研究报告〗显示美柚的月度总有效使用时长占据所有经期管理类App的95%这也意味着“大姨妈”等其他经期管理App的阅读有效使用时长加起来还不到5%这被“大姨妈”指责为“收钱说瞎话”。

  “造假是‘多赢’的”这已经成为数据产业链病态发展的一个奇怪结论。重庆大学网络与大数据法治战略研究院院长齐爱民分析企业运营数据与融资数据“好看”了既方便部分投资机构退出也能让“刷量”的水军商家从中牟利;内容方可以通过大量刷取点击量炮制市场火爆的假象进而吸引真实用户的目光;平台方也需要通过这种假象来营造优质平台的形象从而进一步吸引广告投放。

  鲍忠铁认为刷单等数据造假行为的根本原因还是“to VC”的创业模式泛滥无论创业团队还是投资机构都希望快速将企业估值做大针对这类作假行为相应的监督还缺乏执行力。

  王蔚表示数据造假属于不正当获益的商业手段最终仍需要社会埋单但很难用道德约束或行业自律的方法去治理或许还是“底线管理”原则更加适用:从立法上界定清楚“数据造假”与“商业欺诈”违法犯罪行为之间的联系抬升“数据造假”的获益成本。

  中国青年报·中青在线记者 王林 张均斌 来源:中国青年报

驾驶证模拟考试题 小武基市场 嘻嘻色导肮 苹果承诺更换问题电池 女孩下河捡包溺水 完美释放板车哥 吉林省司法警官学院 惟我独仙简介 标贴印刷 刘乔安12分钟

  中新社巴黎2月21日电 (记者龙剑武)法国军方21日证实两名法国军人在马里东北部执行任务时触雷身亡。至此在非洲撒哈拉—萨赫勒地区阵亡的法国军人已达12人。

  据法国国防部发布的消息当地时间21日上午一辆执行“新月形沙丘”(Barkhane)军事行动的法军轻型装甲车在马里东北部梅纳卡地区遭遇简易爆炸装置爆炸导致两名士兵阵亡一名士兵受伤。

  梅纳卡地区位处马里与尼日尔边境地带武装派别林立暴恐袭击频发是马里恐怖活动与武装冲突最激烈的地区之一被联合国马里多层面综合稳定特派团称为马里东战区最危险地带。

  据法国国防部透露此次伤亡的士兵隶属于法军沙漠作战装甲部队。该部队通常与马里政府军联手在梅纳卡地区以及马里、布基纳法索与尼日尔三国边境地区展开打击恐怖主义武装的行动。

  爱丽舍宫当天发表消息公报说法国总统马克龙惊悉两名法军士兵在马里阵亡的消息向家属致以诚挚慰问并向法国驻军的勇气致敬。马克龙还表示法军实施的行动对“敌人构成沉重的打击”。

  2014年8月法国军队在非洲撒哈拉—萨赫勒地区启动“新月形沙丘”行动调整兵力部署并与毛里塔尼亚、马里、尼日尔、布基纳法索与乍得5国展开军事合作以应对该地区的国际恐怖主义势力取代了先前在马里实施的“非洲山猫”行动。

  目前法国在撒哈拉—萨赫勒地区执行“新月形沙丘”行动的驻军规模为4000人左右。自从2014年以来法国军队在“新月形沙丘”行动中的阵亡人数已达到12人。

网上110警察报警中心 http://www.fujianyh.com

头条推荐/热点新闻

关于我们 |  联系方式 |  广告服务 |  业务范围 |  本网招聘 |  站点地图 |  版权声明 |  员工查询

Copyright 1997-2014 All Rights Reserved.