1。人工智能的应用与价值吴恩达还是从AI这个新势力入手,并举例说明。人工智能技术的大部分经济贡献来自监督学习,即学习从A到B,从输入到输出的映射。比如输入一张照片,让机器学习判断照片是不是你,输出0或者1。***MoneyAI应用是在线广告。在此示例中,输入是广告和用户信息,输出是用户是否会点击广告(还是0或1)。监督学习也可以应用在消费金融领域,输入贷款申请信息,输出用户是否会还贷。在过去的几年里,机器学习经历了快速发展,并且越来越擅长学习这种A-to-B映射,创造了大规模的经济价值。同时,AI的进步还体现在监督学习的输出不再局限于0或1的数字。再比如:语音识别的任务也是一个端到端的学习。有了足够的数据,语音识别就可以很好地工作。亚马逊Alexa、苹果Siri、百度DuerOS等都依靠AI算法和数据取得了不错的成绩。监督学习的缺点是需要大量的标注数据,影响了它的普及。为什么神经网络已经存在了这么多年,而AI却是近几年才开始快速发展?上图中,横轴是数据量,纵轴是算法的性能。随着数据量的增加,传统机器学习算法的性能并没有明显提升,但神经网络的性能会得到显着提升。神经网络越大,性能提升越明显。为了达到最好的性能,你需要:大量的数据和一个庞大的神经网络。2.机器学习的趋势和算法如何创造价值目前,监督学习是创造价值最多的一种。除此之外,迁移学习技术正在创造更多的经济价值。例如,在医学影像诊断中,迁移学习技术利用数据创造了良好的识别效果。无监督学习在自然语言处理方面更具商业价值。强化学习也很有趣。在我看来,强化学习的普及与商业化有点不相称。强化学习对数据的需求程度甚至比监督学习还要严重,尤其是强化学习算法很难获得足够的数据。又如:在AI+游戏中,强化学习表现非常好,因为在电子游戏中,算法可以反复玩第一遍,获取最新的数据。在机器人领域,用强化学习搭建一个模拟器,相当于让强化学习智能体在里面模拟无人车和人形机器人,重复第一局。在游戏和机器人技术之外,强化学习在商业中的应用还有很长的路要走。目前,监督学习、迁移学习、无监督学习和强化学习四类算法所创造的经济价值正在下降。另一个担忧是机器学习依赖于结构化数据,创造了比非结构化数据更多的经济机制。举个结构化数据的例子,比如你的数据库记录了用户的交易,谁买了什么,什么时候,谁给谁发了信息,什么时候,这就是结构化数据。而图像、音频、自然语言等,都是非结构化数据。在上述几种学习算法中,仅监督学习就为企业和创业者创造了大量的经济价值和机会。3、如何做人工智能产品人工智能的兴起正在改变着企业的竞争格局。公司的壁垒不再是算法,而是数据。想做一个AI产品,如图:让算法用足够多的数据让产品跑起来,然后用产品去获取用户,用户在提供更多的数据……如此反复。另一个例子:搜索公司。搜索公司有大量数据显示用户在搜索该术语时倾向于点击哪些链接。我知道如何构建搜索算法,但如果没有像大型搜索公司那样的数据集,很难想象一个小团队如何构建出同样出色的搜索引擎。这些数据资产建立了平衡壁垒。工程师还需要明白,人工智能的影响比监督学习要广泛得多。DailyAI包括几种类型的工具:例如机器学习、图形模型、规划算法和知识图谱。重点一直放在机器学习和深度学习上,主要是因为其他工具开发缓慢。计算机或算法如何知道该做什么?它依赖于两个来源,数据和人类。例如,在在线广告中,我们拥有如此多的数据,以至于深度学习算法无需太多手动工作即可很好地学习。但是在医学领域,数据量很小,可能只有几百个样本,这时候需要大量的劳动,比如用图形模型来介绍人类的知识。很多工程师想进入AI,很多人都参加在线课程,但有一种学习途径被严重忽视:阅读论文并重现其中的研究。当你读了足够多的论文,练习了足够多的算法,它们都会转化为你的知识和想法。想要转型成为机器学习工程师,我推荐的是:学习deeplearning.ai等机器学习课程打好基础,然后看论文复现成果,也可以参加各种人工智能活动,巩固自己的基础。4.如何打造一家人工智能公司大约从25年前开始,我们就见证了互联网时代的兴起。我从那个时代学到:商场+网站≠互联网公司。我认识一家大型零售公司的CIO。有一次CEO跟他说:我们在网上卖东西,亚马逊也是在网上卖东西,我们是一样的。这个不对。如何定义互联网公司?不是看你有没有网站,而是看你有没有做A/B测试,能不能快速迭代,有没有工程师和产品经理做决策。这就是互联网公司的本质。在AI时代,我们也需要明确:传统科技公司+机器学习/神经网络≠AI公司。公司有多少人在用神经网络,不代表你是AI公司,你的基础一定要深。人工智能公司倾向于战略性地获取数据。我以前做过这样的事情:一个地区发布一个产品,获取另一个地区发布一个产品的数据,这个产品用于获取下一个地区发布一个产品的数据,等等。所有产品加起来获取数据以推动更大的目标。像谷歌和百度这样的大型人工智能公司的战略非常复杂,并且为几年后做好了充分的准备。第二点更具战术性,你现在就可以做到:AI公司通常有一个统一的数据库。很多公司的数据库很多,但是比较分散。如果一个工程师想把这些数据放在一起做某事,他可能需要和50个不同的人交流。所以我认为拥有一个将所有数据存储在一起的统一数据库是一个很好的策略。此外,自动化和定制化的招聘需求也是AI企业的重要特征。比如移动互联网时代,产品经理会写PRD:然后工程师去实现,整个过程很容易理解。但是假设在AI时代,我们要做一个聊天机器人。这时候,如果产品经理画个线框图说:这是头像,这是聊天气泡,这样也解决不了问题。聊天气泡是什么样子并不重要,我只需要知道聊天机器人要说什么。线框图对聊天机器人项目毫无用处。如果一个产品经理画了一个自动驾驶汽车的线框图,说“我们要做这个”,那就更没用了。在AI公司,产品经理在与工程师沟通时,需要学会根据数据迭代升级产品。
