当前位置: 首页 > 科技观察

一个程序员的爬虫戳了

时间:2023-03-14 10:48:19 科技观察

一个价值175亿的马蜂窝。10月21日,一篇名为《估值175亿的马蜂窝,竟是一座僵尸和水军构成的鬼城?》的文章火了!旅游网站马蜂窝上的大量内容和评论涉嫌造假。事情是这样的:某数据团队的几个同学回国参加创业大赛,吃完外卖拉肚子了,于是在平台上写了差评,结果反而遭到诽谤。恰好团队在美国学习数据分析。一怒之下,他们决定训练一个模型来过滤食品和饮料评论。正巧,马蜂窝成了他们的训练对象。卡住!这篇文章称:“在马蜂窝网站上,发现了7454个抄袭账号。平均每人抄袭携程、艺龙、美团、Agoda、Yelp的数千条评论,共计572个抄袭账号。10000条餐饮评论,1221万条酒店点评,占官网点评总数的85%。”文章还列举了几个抄袭的石锤:还有抄袭的账号自相矛盾,性别是男是女,甚至有的直接调用了谷歌翻译界面马蜂窝22日上午回应,马蜂窝也第一时间发表声明,表示另据***消息,马蜂窝已向北京市朝阳区人民法院提起诉讼,称虎睿数据侵犯名誉权,本案已向北京市朝阳区人民法院提起诉讼。23日,马蜂窝CEO陈刚也回应了此事:马蜂窝在餐饮等点评数据上存在一些问题,但远没有外界夸大,目前工作流程已经被重组堵漏洞,网友怎么说?目前,这件事已经在各个论坛讨论:这个事件终于让我看到了程序员的力量:“WaterArmy”和“爬虫”在互联网行业一直存在,因为流量和数据对于互联网公司来说是不可或缺的,数据之争在互联网上屡见不鲜。目前此事的真相尚未明朗,我们暂时不予置评。但是这件事告诉我们,不要惹程序员!尤其是有正义感又洒脱的技术极客。