马蜂窝风波背后是行业通病还是资本暗战?凤旅

来源:未知日期:2019-04-06 浏览:

  刚刚过去的周末,自媒体“小声比比”发文称,马蜂窝内容数据存在大规模造假。22日上午,马蜂窝发布声明称报道不实,当天下午,一张北京市朝阳区人民法院受理马蜂窝诉乎睿数据、丁子荃名誉侵权一案的文件流出。马蜂窝方面回复称,立案情况属实。

  马蜂窝方面称,站内UGC内容以旅游相关的游记、攻略为主,点评内容在马蜂窝整体数据体谅中进展2.91%,存在虚假点评的账号在整体用户中的占比更是微乎其微。马蜂窝目前已对这些账号进行处理。

  今年8月以来,网上传出马蜂窝启动新一轮融资的消息,而“小声比比”的文章开篇提出马蜂窝的新一轮估值,并直指马蜂窝的核心——社区内容造假。无论所指内容是否属实,都会给马蜂窝带来一定影响。

  有业内人士指出,流量已经成为在线旅游行业竞争的重点,为了吸引流量,提高转化,在线旅游市场对于内容的需求不断增强,旅游企业也可能在行业竞争的压力下互相抓取内容。在《电子商务法》正式实施前夕,内容市场暴露出的数据造假问题需要引起各方警惕。

  10月20日晚23点40分,微信公众号“小声比比”发布了一篇名为《估值175 亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章,文中引用乎睿数据团队的数据,直言马蜂窝抄袭搬运的点评占到官网点评总数的85%。其中,涉嫌抄袭的餐饮点评共计572万条、涉嫌抄袭的酒店点评总计1221万条。

  凤凰网旅游了解到,“小声比比”前后两篇文章中,指出马蜂窝的部分账号下的点评内容存在前后点评内容矛盾,直接用翻译软件翻译境外网站点评,用爬虫手段复制其他平台点评等问题,此外,在马蜂窝ugc内容核心的游记下,也存在水军评论。

  对于发布时间的考虑,“小声比比”相关负责人梓泉在接受媒体采访时称:“想找一个(马蜂窝)公关来不及上班的时候,(比如)周末晚上。我们周五就(把文章)组织得差不多了。”

  10月22日早上,马蜂窝发布官方声明称,点评内容在马蜂窝整体数据量中仅占比2.91%,马蜂窝已对这部分账号进行清理。针对自媒体文中歪曲事实的言论,和已被查证的有组织攻击行为,将采取法律段维护自身权益。

  对于“小声比比”提出马蜂窝主流用户撰写评论时间与其他平台不同的情况,以及一段时间评论暴增等问题,马蜂窝称2016年以前曾激励用户发表点评,点评数据出现快速增长,但随后以游记、攻略为代表的长内容和以嗡嗡(旅行故事)、问答为代表的段内容成为运营重点。同时,马蜂窝用户记录旅游体验的行为,也多发生在旅行完成之后。

  此外,马蜂窝方面表示,餐饮点评不是马蜂窝的内容核心,且部分点评来自游记、问答等内容的提取。自媒体的解读存在明显的误导倾向。

  针对“小声比比”质疑马蜂窝主导内容爬虫,甚至认为时间差异是由于马蜂窝员工“朝九晚五,周末不加班”,马蜂窝则在回应中称,马蜂窝平均每周处理26000 条违规广告信息,查封15000 个违规账号。自媒体将不法商家的违规行为归结于马蜂窝,与事实严重不符。

  10月22日下午,北京蚂蜂窝网络科技有限公司起诉深圳市乎睿数据有限公司、丁子荃名誉侵权案立案,立案法院为朝阳区法院。文章内容是否存在虚构,马蜂窝内容是否造假,将交由法律评判。

  在马蜂窝先发声明、再立诉状后,10月22日晚11点21分,“小声比比”通过微信公众号再度发声,标题直言“我承认,我们就是有组织攻击马蜂窝的”。在这篇文章中,“小声比比”回顾了文章的创作历程,并指出马蜂窝的声明是避实就虚。

  对于马蜂窝提到的数据以偏概全问题,文章作者梓泉表示,“这个数据量指的的条数、还是数据大小?如果是条数,那么从马蜂窝官网的‘2100万条真实点评’,反推马蜂窝有7亿条其它内容(游记和攻略),请问马蜂窝这点是否属实?如果是数据量,在公关稿中,把以文字为主的短点评,和以图片、视频为主这种体量是文字百倍大小的其它内容,进行数据量上的对比,是否在玩文字游戏?”

  凤凰网旅游调查发现,“小声比比”在文中指出的马蜂窝存在账号性别自相矛盾、照搬英文点评、点评中出现其他平台推广信息的问题在其他在线旅游平台中也同样存在。

  实际上,性别矛盾不止出现在马蜂窝平台一家,在携程美食林上的一家古巴餐厅——Cafe De Los Artistas 点评区,凤凰网旅游注意到,网友@飞龙在杀和@樱娆均提到了带妻子在这里吃的非常开心,但是点击头像进入两人的社区后却发现,两人的性别均为女性。

  不仅如此,网友@樱娆在另外一家餐厅留下的评论则更让人怀疑网友@樱娆点评内容的真实性。在这条评论中,@樱娆同样给出了好评,而这次的身份则换成了孕妇。

  此外,在飞猪平台同样存在用马甲号复制其他平台点评内容的问题。在飞猪“今半别馆”的点评区中,排在首位的T***美的点评内容与穷游问答“东京今半别馆值得去吗?”中排在首位的“patty351”的回答如出一辙,唯一的不同是省略了一些标点符号。值得一提的是,飞猪点评内容的发布时间为2016年5月12日,而在穷游问答下的回复时间则在2015年4月13日。

  对于携程和飞猪如何看待在线旅游平台用爬虫技术抓取其他平台用户点评信息,携程方面向凤凰网旅游表示不予置评,飞猪方面在接受媒体采访时称“不存在行业现象这么一说,飞猪也没有机器人点评,有些达人入驻了多个平台,所以会一稿多投,也就造成了展示提取的图片相似对于质疑。”

  一位互联网公司高级安全专家在接受凤凰网旅游采访时表示,用户生产的内容作为一家企业的知识产权,如果用爬虫技术窃取并用于商业目的则存在违法的嫌疑。但长期以来,企业的反制手段通常仅仅是技术的博弈,很少上升到法律层面。

  然而,发生在互联网领域的另一起因爬虫技术获刑的案例,已经为在线旅游行业爬虫工程师的敲响了警钟。2017年10月,今日头条前员工宋某和侯某,因为使用爬虫技术爬取今日头条的视频内容,被北京市海淀区人民法院判处9个月至1年不等的有期徒刑。

  此外,即将于2019年1月1日起正式施行的《电子商务法》中明确提出“禁止虚构交易、编造评价,平台不得删除评价”的要求。若违反《电子商务法》相关规定,情节严重者将被处以十万元以上五十万元以下的罚款。

  凤凰网旅游调查了解到,在爬虫刷屏成为行业通病的背后,存在一条技术门槛以及使用成本双低的产业链条。在百度搜索“酒店+爬虫”关键词,即出现大量关于酒店采集爬虫的工具和服务信息。其中,不乏以大众点评、携程作为抓取对象的服务网站。

  在以携程国内外酒店为主要抓取对象的网站中,凤凰网旅游了解到,该公司提供的爬虫技术可一键批量采集携程网国内外酒店点评评价信息爬取的数据包括评价ID、酒店ID、酒店名称、评价时间、评价内容/图片/分数等,甚至可以通过技术手段对数据进行清洗和机器学习。

  数据采集项目收费也根据时长分为三档,最低99元/月,最高950元/年。尽管价格相对低廉,但是将该网站提供的爬虫案例与携程PC端酒店版块的评论区相比,几乎很难看出差异。

  除了根据服务时长收费的模式外,一些淘宝卖家还提供按条收费的服务。据从事爬虫生意的淘宝店家介绍,他们做的就是把携程和大众点评的数据下载下来,根据下载使用量进行收费,如果要买100万条评论,那么价格为0.1分每条,也就是100万条点评信息总价1000元。

  对此,中国政法大学知识产权研究中心特约研究员李俊慧在接受凤凰网旅游采访时表示,如果是企业委托第三方爬取相应网站的数据,则委托方和受托方均构成侵权行为,如果是先下载后销售,则兜售的卖家是主要侵权主体。上述两种情况最高可按《刑法》中侵犯著作权最进行定罪,当事人不仅面临罚款,甚至要受牢狱之灾。

  据凤凰网财经独家报道,在马蜂窝此轮舆论风波爆发之前,新一轮融资就已经完成。而风波爆发的背景,是因为马蜂窝的新一轮融资引发了一些竞争对手的觊觎。

  “马蜂窝动了一些人的奶酪,我们这两天一直在监控,文章以每分钟500的阅读量增加,疑似刷量。整个策划,没有四五个月完不成。”接近马蜂窝的知情人士向凤凰网财经透露,马蜂窝新一轮融资已经完成,有巨无霸领头投资,这引发了一些竞争对手的觊觎。

  今年,8月17日,网上传言马蜂窝希望在新一轮融资中筹集3亿美元,估值或达20至25亿美金,也就是说最高可达175亿人民币。

  据接近马蜂窝的知情人士称,马蜂窝新一轮融资已经完成,还未对外披露,也未定义属于D+轮还是E轮,融资金额与网上传言相当,有巨无霸领头投资。

  对于马蜂窝发起的诉讼,《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》作者梓泉在接受凤凰网财经采访时表示,马蜂窝现在还没有和本人联系,如果马蜂窝上诉,会积极应诉,并且在公众号上进行直播。

  

  互联网专家刘兴亮表示,马蜂窝在这个关键节点被人捅了一竿子。如果乎睿数据团队的指控被坐实,马蜂窝一直以来强调的用户UGC神话将被打破,市值有可能缩水。

0

首页
电话
短信
联系