对于《马蜂窝数据造假》事件,趁着还没有盖棺定论,我先发表自己的看法,以示我的预测之准确。
1
梓泉及乎睿数据团队抓取马蜂窝评论数据得出结论—马蜂窝2100万评论内容1800万是造假得来。
梓泉所列数据说服力极强,可以肯定的说,他所推论的结果很正确。马蜂窝数据造假确凿无疑。
但在马蜂窝数据造假事件中,不存在利益冲突,只有马蜂窝一方利益受损,而梓泉(乎睿数据)甚至是收益方—新增粉丝超过10万。
在这种情形下,马蜂窝一定会不遗余力的寻找证据来控告梓泉(乎睿数据)方。至于结果如何,我几乎可以肯定的说,梓泉败诉的可能性极大。至于会不会出现事件反转,我不敢预测。
法官的判决会考虑舆论,但不会完全被舆论左右。
2
数据可以说是互联网上最重要的资源,随着大数据的发展这种资源的竞争愈演愈烈,而在人工智能时代,数据是机器学习的生产资料。数据是互联网上最重要的资源,没有之一!
有些公司有数据而我没有,那么我就不能做大数据,不能做人工智能了吗?
当然能。抓取别人家的数据就可以了。
有人可能会问,这样做算不算偷窃?
算……也不算!
信息是公开的,搜索引擎获取的数据就是通过抓取得来。
但有些人抓取的不是公开信息,亦或者网站协议下不允许这样的抓取。这种时候就可能涉及违法。
早在93、94年的时候就有关于数据抓取的协议—robots.txt。它无关法律,有关道德,属于行业标准,大家自觉遵守。
3
可以说,梓泉抓取马蜂窝数据的手段和马蜂窝抓取竞品网站数据的手段是一样的—都是靠着别人家的数据吃饭。
和马蜂窝不一样的是梓泉团队的所有数据都是别人家的。
然而在马蜂窝数据造假事件里,马蜂窝一定是比梓泉团队更有优势。
因为数据是马蜂窝的。
马蜂窝一定有手段和方法来证明梓泉团队获取数据的不合法,文章片面且具诱导性。这是对马蜂窝公关团队的一次历练,如果处理得当,我敢肯定,马蜂窝会获得更多资本注入。
而乎睿数据公司包括梓泉在内的四人团队,有谁能保证他们在亿级体量后又不会数据造假呢?在我看来,天下乌鸦一般黑。(狭隘就狭隘吧)
4
我不是为马蜂窝洗地,我也说过,马蜂窝数据造假无疑。
一家市值170亿的公司爆出这样的事,无疑会挤掉大量水分。但瘦死的骆驼比马大,对于一家近四人的数据公司来说,根本不是一个体量的对手。
这样的对决一定是大众喜闻乐见的,“穷小子大战富家公子”这样的话题大家乐此不疲,不自觉的会站在“穷小子”的一方。
然而,万众期待的屌丝逆袭、鲜衣怒马,并不存在于资本市场。
换个角度来说,你可以认为千万级的公司在玩最大笨蛋的游戏,但百亿级的公司绝对不会玩最大笨蛋游戏。 最大笨蛋理论:炒作原本无价值的东西,最后买入并无法安然退场的是最大笨蛋。
资本不是傻瓜。
5
除了巨头公司外,创业公司是没有大量数据的。它们的数据无一不是抓取自其他公司。
梓泉团队使用爬虫爬取马蜂窝的数据,往小了说叫数据抓取,往大了说叫服务器攻击。爬虫技术本身就存在诸多争议。
从公众号“小声比比”的两篇文章《独家 | 估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》和《马蜂窝开始毁灭证据了,但这水平真的哈哈哈哈哈哈哈哈》两篇文章来看,文中措辞并不谨慎,且使用大量诱导性聊天表情,这类文章通常符合大众的阅读习惯。 |
可以肯定这是一次成功的营销案例—阅读量数百万,粉丝增长超10万。
在事件发酵过程中,梓泉接受采访,讲述了这次事件给他带来的收获。并表示,“红芯浏览器”爆款文章也是其创作。
6
我想起一个很特别的职业—职业打假人。这是一种对互联网上的假货进行严厉打击“正义”职业。对于骗子人人得而诛之,不是吗?
那么,职业打假人以什么为生呢?
敲诈勒索骗子而已。
我不知道什么时候国内的创业环境已经恶劣到这种地步了,似乎造假骗投资,营销踩巨头已经成为行业潜规则了。
但是,打劫恶人,仍是打劫!
7
我有一问,为什么点评、携程、艺龙等竞品公司没有起诉马蜂窝,反而是一家不知名的数据创业公司“捅破”玄机?
比虚假更可怕的是以正义之名的营销。