这是DanielShenfeld的经验贴,他曾在12家初创公司工作过,横跨金融科技、医疗保健、教育科技、生物技术等许多领域,处于不同的阶段,从从种子前到收购后。Daniel在不同的公司担任过各种职务,从初级员工到数据科学主管和战略咨询主管。在他的所有工作中,他一直致力于研究有趣的机器学习和数据科学问题。所有人都试图创造伟大的产品,有些甚至成功了。他从这么多的工作经历中学到了什么?这篇文章介绍了他关于产品、数据和人才的8堂课。专注于产品,而不是AI作为一名真正的数学家,我最初被机器学习科学所吸引,以创建新的算法和方法来解决挑战。但我很快意识到,即使是最准确的机器学习模型也无法自行创造价值。机器学习和AI的价值由它们支持的产品来衡量。弄清楚如何有效地做到这一点是构建ML驱动产品的真正意义所在。《爱丽丝梦游仙境》是刘易斯卡罗尔写的,他也是一位数学家。他发明了许多有吸引力的产品,尽管有些产品并没有达到预期的效果。(本文中的所有插图均由JohnTenniel绘制)。关注问题,而不是方法。如果目标是构建产品,那么机器学习和人工智能只是实现该目标的一种手段。重要的是如何解决产品问题,而不是用什么方法。在大多数情况下,快速而肮脏的解决方案会让你走得更远。如果一个问题可以用简单的回归很好地解决,就不要训练深度神经网络。当专注于问题本身时,您有时会发现机器学习并不是解决问题的工具。很多问题都是流程问题。即使在这些情况下,数据科学家也可以做出很多贡献,因为他们自然倾向于采取严格的、数据驱动的方法。但这并不意味着用AI修复不良流程是个好主意。只需修复过程。寻找数据和产品之间的协同作用将现有产品与机器学习模型的预测相结合,很少能揭示机器学习的真正价值。当然,这会给他们带来一些额外的好处,但在一个强大的人工智能产品中,机器学习不仅仅是一个附加功能。它是价值创造的引擎,产品是建立在引擎之上的:产品和数据必须协同工作。如果做得好,就会形成一个强大的良性循环,我称之为“产品/数据匹配”:产品有效地意识到数据的潜在价值,同时不断生成必要的数据以进一步改进产品。将机器学习引入产品是一种次优策略。特别是,人工智能不能仅仅停留在数据科学和工程团队中。组织的其他部门,从产品到管理,都参与进来以加速创造价值的过程。这需要大量的教育和承诺,超出了工程师用于构建软件的范围(即使是在初创公司)。首先是数据,人工智能在机器学习和人工智能之后需要大量的数据,更重要的是“高质量的数据”。如果您要从头开始构建产品,则需要从一开始就考虑收集数据。如果您打算将AI技术引入现有产品,请准备好在进入AI部分之前大量投资于数据工程和重新架构。这并不意味着您必须先完成所有工作才能交付价值。更好的数据处理意味着更好的分析,这对于任何组织学习和改进都至关重要。使用这些结果来展示价值并产生组织认同。当你的分析扎实后,你就可以真正开始考虑机器学习了。有效沟通打造出色的产品需要出色的产品经理和高管的支持。虽然人工智能和深度学习的力量让很多人着迷,但很少有非技术人员真正理解这些技术。有效地讨论机器学习和人工智能需要对统计学有扎实的理解,而沟通上的差距往往会产生不切实际的期望。关于机器学习和人工智能的讨论显然不完全基于业务指标。一个重点是在讨论业务指标的同时还要思考如何将业务指标转化为模型指标。这对产品经理和数据科学家来说都是很大的责任,他们必须对所提议的产品具有领域知识并对业务有深刻的理解才能真正有效。有缺陷但没有那么多副作用的捷径正如我之前提到的,有缺陷的捷径会让你走得更远。部分原因是今天快速而有缺陷的方法实际上是过去缓慢但准确的方法。像word2vec这样的工具已经变得和回归一样容易使用,研究人员继续创造强大的新工具。深入了解不同的构建块以及它们之间的粘合剂对于任何数据科学家来说都是必不可少的。开源工具爆炸式增长的后果之一是,在大多数情况下开发专用的ML平台并不是一个好主意。当然,您应该使用通用构建块构建专用算法,并将这些算法用于您自己的问题和领域。但是,请将深度学习研究留给谷歌的研究人员——专注于业务问题,还记得吗?当有疑问时,将数据呈现给用户是有用的,但并非所有呈现方法都同样有效在产品开发的早期阶段,最重要的活动是获取市场反馈。但是机器学习需要大量的数据,而且需要很长时间。这就提出了一个问题:一个没有多少数据的数据产品,如何获得市场反馈?一般来说,解决方案是将数据显示给用户。人类一次只能处理少量数据,所以数据不多也没关系。用户将如何处理您向他们展示的数据?他们想隐藏什么,又想深挖什么?公开以前不可用的信息是一种强大的方法,可以提供数据的潜在商业价值。建立信任信任是大多数技术成功的主要因素。归根结底,每项技术都是供人使用的,因此必须赢得人们的信任。在机器学习应用的背景下,有些人可能担心他们的工作会被自动化。其他人则根据技术提供的信息做出重要决定。如果这些顾虑混杂在一个人工智能产品中,比如一个试图做出决定而不是让人类自主决定的产品,就会导致信任的迅速丧失。信任很容易失去,很难获得。打造人们信任的产品。柴郡猫展示了获得用户信任的方法原文链接:https://towardsdatascience.com/what-ive-learned-working-with-12-machine-learning-startups-a9a3026d2419《心》原译,微信公众号《机器之心(id:almosthuman2014)》】点此查看作者更多好文
