虽然埃隆·马斯克和马克·扎克伯格一直在争论 AGI(通用人工智能,也称为强人工智能)的危险,但初创公司只是应用人工智能来解决特定领域的问题,例如提高销售团队的绩效和通过提高生产线效率,这些初创公司成长为价值数十亿美元的公司。
然而,严格定义问题只是寻找人工智能有价值的商业应用的第一步。
想要找到合适的机会打造人工智能业务,初创公司必须在不同维度应用“金发姑娘原则”,找到“最佳点”开始——注意不同维度之间的平衡,切记不要过于专注于一个维度方面。
根据我们与数千家人工智能初创公司合作的经验,有抱负的创始人可以通过以下一些方法结合自己的人工智能策略来找到最佳点。
“恰到好处”的预测时间范围 与市场上其他智能软件不同,人工智能会对其运行环境做出反应;该算法接收数据并返回结果或预测。
根据应用的不同,可以预测不久的将来(例如明天的天气)或未来许多年的结果(例如患者是否会在 20 年后患上癌症)。
算法预测的范围对于其有效性以及是否提供建立防御性的机会至关重要。
预测较长时间的算法很难评估和改进。
例如,算法可以使用承包商之前项目的时间表来预测建设项目将比计划晚六个月,并且超出预算 20%。
在一个新项目完成之前,算法设计者和最终用户除了确定预测是否方向正确之外,很难对预测进行评论——即项目是否会稍后完成或成本更高。
即使最终的项目数量非常接近预测数量,也很难完成反馈循环并积极强化算法。
许多因素都会影响复杂的项目(例如建设项目),因此很难使用 A/B 测试预测来梳理出未知混杂因素的输入变量。
系统越复杂,算法完成强化周期所需的时间就越长,准确训练算法的难度也越大。
虽然许多企业客户愿意使用人工智能解决方案,但为了完成销售,初创公司必须能够验证算法的性能。
验证算法最有说服力的方法是使用实??时客户数据,但这在试点期间可能很难实现。
如果初创公司可以访问客户数据,则预测时间范围应尽可能短,以便在试验期间验证算法。
对于大多数人工智能初创公司来说,缓慢的计算速度严重限制了人工智能的应用范围。
历史数据(如果有)可以用作训练算法并通过回溯测试临时验证算法的权宜之计。
训练算法对历史数据进行长期预测是有风险的,因为过程和环境更有可能改变您对历史记录的了解,从而使历史数据集对当前状况的描述性较差。
在其他情况下,虽然描述结果的历史数据可用于训练算法,但它可能无法捕获所考虑的输入变量。
以建筑行业为例,您发现使用蓝色安全帽的建筑工地更有可能按时完成项目,但由于帽子的颜色以前对管理项目没有贡献,因此此信息不会记录在存档文件中。
因此,必须从头开始获取这些数据,这再次延迟了公司的上市时间。
人工智能初创公司应该构建多种算法,在较短的时间范围内做出更小、更简单的预测,而不是在较长的时间范围内做出单一的“英雄”预测。
将操作环境分解为更简单的子系统或限制流程中的数据量可以更轻松地控制混杂因素。
Autodesk 的 BIM Project IQ 团队将这种小规模预测方法应用于建筑行业,消除了施工过程中的众多低效率问题,并帮助消除潜在的设计和施工风险。
其算法模型可以预测安全性并评估供应商和分包商的质量/可靠性,所有这些都可以在项目生命周期中进行测量。
较短的时间范围使算法工程师更容易监控其性能变化并采取措施快速改进,同时仅限于对历史数据进行回溯测试。
时间范围越短,算法的反馈循环越短。
每个周期做出的反馈逐渐积累,可以增强算法的性能。
较短的反馈周期更有利于建立防御。
“恰到好处”的可操作窗口 大多数算法都会对动态系统进行建模,并返回可供人类采用的预测。
由于系统变化频繁,算法的输出很难长时间保持有效:很可能在用户采取行动之前,预测结果的有效性就会显着“下降”。
为了确保预测结果对最终用户有效,算法的设计必须适应机器和人类的速度限制。
在典型的人工智能工作流程中,人类将数据输入算法;算法运行,计算输入数据,并输出预测或推荐的行动步骤;人类解释这些信息来决定行动方案,然后采取行动。
算法计算结果所需的时间和人类对输出采取行动所需的时间是此工作流程中的两个最大瓶颈。
对于大多数人工智能初创公司来说,缓慢的计算速度严重限制了人工智能的应用范围。
该算法的预测取决于输入数据,输入数据代表所记录过程的瞬时数据。
如果数据描述的环境变化速度快于算法计算输入数据的时间,那么当算法完成计算并返回预测时,预测结果仅在过去的某个时刻有效并且不会被采取行动。
例如,音乐程序Shazam背后的算法从第一次“听到”一首歌曲到识别它可能需要几个小时,并且需要Windows 95系统的计算能力。
云计算的兴起以及针对人工智能计算优化的硬件的开发极大地拓宽了人工智能应用的可行且负担得起的范围。
尽管宏观技术的进步极大地推进了应用人工智能,但算法并不完全受到当前计算的限制;算法的响应时间也可以通过训练增强来提高。
算法遇到的相同示例越多,跳过计算并得出预测的速度就越快。
得益于增强的计算能力,Shazam 现在可以在 15 秒内识别一首歌曲。
自动化决策和行动还可以帮助用户利用那些过期得太快而人类无法做出反应的预测。
Opsani 就是这样一家公司,它利用人工智能做出大量、快速变化的决策,以便人类有效采用。
与人类的 DevOps 不同(DevOps,或称开发和运营,是一组用于促进开发应用/软件工程、技术运营和质量保证部门之间的沟通、协作和集成的流程、方法和系统的统称),人类DevOps只是根据算法建议快速优化性能,而Opsani则应用人工智能来识别并自动改进应用程序和云设施的运行,以便用户享受更好的性能。
然而,并非所有人工智能应用程序都可以完全自动化,例如,如果感知到的风险太高而最终用户无法接受,或者法规要求人类批准决策,则无法实现自动化。
“恰到好处”的最低性能就像软件初创公司在开发出最小可行产品(MVP)后会选择进入市场,以便从初始客户那里收集可操作的反馈一样,人工智能初创公司也应该达到早期采用者所要求的最低限度。
算法性能(MAP)正式进入市场。
在市场环境下,算法可以接受更加多样化、新鲜的数据集的训练,也可以避免过度训练而成为数据集。
大多数应用程序不需要达到一定的准确度就具有一定的价值。
例如,欺诈检测算法可能只能在发生故障后 24 小时内立即捕获 5% 的欺诈案件,但欺诈调查人员经过一个月的分析后只能捕获 15% 的案件。
在这种情况下,MAP 为 0,因为欺诈检测算法可以用作第一过滤器,以减少调查人员必须处理的案件数量。
该初创公司可以立即进入市场,确保获得用于训练其算法的大量欺诈数据。
随着时间的推移,算法的准确性肯定会提高并减轻调查人员的负担,使他们能够专注于更复杂的案件。
为 MAP 为 0 或更低的应用程序构建算法的初创公司将能够快速进入市场,但如果这些副本在算法达到高水平性能之前出现,则可能需要对山寨公司进行持续调查。
没有一种放之四海而皆准的方法可以将算法从研究实验室转移到市场。
专注于较低 MAP 问题的初创公司还应该关注那些可以通过非常小的训练集以接近 % 的准确率解决的问题,其中建模的问题相对简单,需要跟踪的维度较少,并且可能的变化也较少。
结果。
基于人工智能的合同处理是算法性能快速提高的应用程序的一个很好的例子。
合同类型有数千种,但大多数关键组成部分都是相似的:涉及各方、交换的价值项目、时间框架等。
某些文件类型(例如抵押贷款申请或租赁协议)是高度标准化的,以符合法规。
在多家初创公司中,我们发现自动处理这些文档的算法只需要几百个示例就可以训练到可接受的精度,然后其他示例可以帮助改进它们,从而使后来者更容易集成现有业务并与早期算法性能相匹配。
专为劳动力廉价且可以轻松实现高精度的应用领域而设计的人工智能在找到早期采用者之前需要实现更高的 MAP。
例如,需要精细运动技能的任务尚未被机器人接管,而人类的表现需要非常高的 MAP 来克服。
当拾取物体时,为机械手提供动力的人工智能必须高精度地测量物体的硬度和重量,否则机械手会损坏正在搬运的物体。
人类无需任何训练就可以非常准确地测量这些尺寸。
攻克高MAP问题的初创公司必须投入更多的时间和金钱来获取足够的数据才能达到MAP并正式进入市场。
克服研究实验室的困难,狭义人工智能可以在广泛的应用中取得重大进展。
此外,围绕狭义人工智能的应用程序建立业务需要一套新的算法??。
这个过程在很大程度上取决于所有维度的具体用例,算法的性能只是一个起点。
没有一种放之四海而皆准的方法可以将算法从研究实验室转移到市场,而且需要具体情况具体分析,但希望这些想法能为您提供一个蓝图。