来源:unsplash人工智能是这个时代的座右铭。技术专家、学者、记者和风险投资家都在为人工智能唱赞歌。然而,就像一些从专业学术领域延伸到日常生活的词组一样,“人工智能”一词的使用也存在巨大争议。但这不是关于“公众无法理解科学家”的常见争议。事实上,科学家和公众一样困惑。想到一个可以与人类相媲美的数字智能时代正在出现,这一切都令人兴奋,但同时又令人恐惧,而且它会分散我们的注意力。这是当今时代的一个特殊故事,它涉及人、计算机、数据和生死决定,而不是人们幻想的硅基智能。十四年前,笔者的一位亲戚怀孕后做B超检查。房间里的遗传学家指着胎儿心脏周围的一些白点:“这些都是唐氏综合症的征兆,对胎儿的风险是二十分之一。”手术以确定胎儿是否真的出生时患有唐氏综合症的遗传变异。但羊膜穿刺术有风险,大约每300个胎儿中就有1个在手术过程中死亡。作为一名统计学家,我真的很想弄清楚这些数字的依据和来源。十年前,英国进行了一项统计研究,这些代表钙积累的白点实际上被确定为唐氏综合症的预测因子。但我还发现,我们测试的成像系统每平方英寸的像素比英国分析中使用的系统多几百个。我告诉遗传学家,我认为这些白点可能是误报——它们只是“白噪音”。“这就是为什么几年前新电脑问世时唐氏综合症诊断激增的原因,”她说。他们最终没有进行羊膜穿刺术,几个月后一个健康的女孩出生了。但这件事让我感到恐惧——粗略估计,全球有数千人在同一天得到诊断,其中许多人选择了羊膜穿刺术,许多婴儿不必要地死亡。这种情况每天都会发生,直到有一天错误被修复。这个故事揭露的问题与我个人的医疗保健无关——它是关于一个医疗系统,它评估不同地点和时间的变量和结果,进行统计分析,并使用其他地方和不同时间的研究结果。此类问题不仅与分析数据本身有关,还与研究数据库研究人员关注的“来源”有关——一般来说,数据科学家需要弄清楚数据从何而来,如何推导出来,以及数据的重要性。这些推论是对现状的质疑。虽然熟练的数据科学家可以依次进行案例研究,但当今的挑战是全球规模的医疗保健系统不需要广泛的人工监督。我也是一名计算机科学家,碰巧在我的学校找不到这样一个概念来建立一个全球范围内的推理和决策系统——将计算机科学与统计学相结合,并考虑到人类的效用。在我看来,发展不应该局限于医学领域,还应该涉及贸易、交通、教育等,至少和构建人工智能系统一样重要。无论“智能”是否很快被理解,我们都面临着如何将机器与人类结合起来以改善人类生活的巨大挑战。有人认为这项任务从属于“人工智能”的发展,但也可以看作是一个新的工科分支。与过去几十年的土木工程和化学工程一样,这门新学科的目标是汇集几个关键概念的力量,为人们提供新的工具和技能,并安全可靠地进行。土木工程和化学工程主要侧重于物理和化学,这门新的工程学科将建立在上个世纪的思想之上,例如“知识”、“算法”、“数据”、“不确定性”、“计算、推理、和优化。此外,新学科的大部分重点及其总体研究方向将集中在来自人类和关于人类的数据上。虽然构建模块已经出现,但指导如何将这些模块组合在一起的原则尚未制定,因此这些块以特别的方式组合在一起。因此,就像在结构工程之前设计建筑物和桥梁一样,人类正在构建涉及计算机、人类和环境的社会规模、推理和决策的结构。来源:unsplash建筑物和桥梁经常以意想不到的方式倒塌,造成毁灭性的后果,许多早期的社会推理和决策过程在概念上也存在严重缺陷。可悲的是,我们还没有我们很擅长预测下一个致命错误,而我们真正失去的是工程学科及其理论和设计概念。通常,人工智能在公共话语中被用作通配符,这使得人们很难思考新兴技术的性质和影响。下面,笔者就来一探“AI的前世今生”。今天所谓的“人工智能”,几十年来一直被称为“机器学习”。机器学习是算法领域,它融合了统计学、计算机科学和许多其他学科的思想,以开发处理数据、进行预测和支持决策制定的算法。机器学习对世界的影响由来已久。早在20世纪90年代初期,机器学习显然已经发展成为具有重大工业意义的产品。在世纪之交,机器学习开始被有远见的公司所利用。在亚马逊等公司中,机器学习已被应用于解决关键任务后端问题,例如欺诈检测和供应链预测,并开发突破性的面向消费者的服务,例如推荐系统。在接下来的20年里,随着数据集和计算资源的快速增长,很快机器学习将不仅控制亚马逊,而且控制几乎所有决策可以与大规模信息挂钩的组织。科学家预测,新的商业模式将继续发展。“数据科学”一词后来被用来指代这种现象,表明机器学习算法专家需要与数据库和分布式系统专家合作,以创建可扩展、稳定的机器学习系统,以代表由此产生的系统更广泛的社会和领域对环境造成的影响。回顾历史,“人工智能”一词是在20世纪50年代后期创造的,指的是在软件和硬件上实现具有人类水平智能的物体的强烈愿景。虽然有性能分析、统计学、模式识别、信息论、控制论等相关学术领域,往往受到人类智能的影响,但人工智能实际上是一个学术事业。这些领域的灵感来自于松鼠感知其所居住的森林的三维结构并从一个树枝跳到另一个树枝的能力。“人工智能”旨在专注于“推理”和“思考”或“认知”的高级人类能力。然而,60年后,更高层次的推理和思考仍然难以捉摸。今天在工程学中被称为“人工智能”的东西主要关注低层次模式的识别和运动的调节,以及统计领域——在共同识别数据和趋势后做出有根据的预测、检验假设和决策。事实上,DavidRumelhart在80年代初期重新发现的流行“反向传播”算法(现在被认为是所谓“人工智能革命”的基石)最早出现在1950-60年代的控制理论领域。它的早期用途之一是提高阿波罗飞船飞往月球时的推力。20世纪60年代以来,人类科技有了长足的进步,但人工智能的发展还没有达到顶峰。相反,就像阿波罗飞船一样,这些与研究人员独特的技术问题相关的概念一直隐藏在背景中。尽管没有向公众明确展示,但研究表明,该系统在文档检索、文本处理、垃圾邮件检测、推荐系统、自定义搜索、社交网络分析、准备、诊断和A/B测试等领域取得了巨大成功.这些创新也推动了谷歌、Netflix、Facebook和亚马逊等公司的发展。人们统称这些为人工智能,优化和统计研究人员一夜之间被贴上了“人工智能研究人员”的标签,令人惊讶。但更严重的问题是,使用这种模棱两可的特殊首字母缩略词,使人们无法更清楚地了解它所涉及的知识和商业问题。人工智能的人类模仿(也称为“信息增强”)在过去二十年中在工业和研究方面取得了重大进展。计算和数据在这里被用来构建和增强人类的智慧和创造力。搜索引擎可以看作是IA(增强人类记忆和事实意识)和自然语言翻译(增强人类交流)的例子,基于计算的声音和图像生成是艺术家创造力的调色板和增强器。虽然这些服务可能需要高级逻辑和分析,但它们目前不需要——它们只是执行各种类型的字符串匹配和数字操作以确定人类可消费的模式。希望读者能接受最后一个首字母缩略词来代替“人工智能”,设想一门“智能基础设施”(II)学科,其中存在一个计算、数据和物理实体网络,能够使人类环境更美好友好、有趣和安全。这种类型的基础设施开始出现在交通、卫生、贸易和金融等领域,对个人和社区产生深远影响。这些讨论通常被称为“物联网”,但这通常只是互联网上问题的指示,而不是更高层次的抽象,能够操纵数据流来发现相关的上下文信息并交流信息。在笔者看来,读者可以想象自己生活在一个“社会规模的医疗体系”中。该系统在医生和放置在身体内或身体周围的设备之间创建数据流和数据分析,使人工智能能够做出诊断并提供治疗。该框架将整合有关人类细胞、DNA、血液样本、气候、种群遗传学和大量科学文献的药物和治疗知识。它不仅会关注个别患者和医生,还会关注所有的人际关系,正如当前的医学研究可以针对一组人类(或动物)对照进行测试一样。它将保留重要性、来源和连续性的概念,就像现有银行系统处理此类财务和支付问题的方式一样。虽然人们可能会预料系统会出现一些问题,包括隐私、责任、保护问题等,但这些问题只是暂时的障碍。现在需要解决一个关键问题:研究经典人工智能是应对更大挑战的最佳方法还是唯一方法?事实上,机器学习的一些最新成功案例涉及模仿人类的人工智能领域,例如计算机视觉、语音识别、游戏和机器人技术。所以也许我们应该等待某些领域的进一步发展。本文在此提出两点。首先,很明显,人类在模仿人工智能方面的进步是有限的,我们离实现人类模仿人工智能的期望还很远。然而,现实情况是,在模仿人类的人工智能方面取得一些进展所带来的兴奋(和恐惧)已经引发了过高的期望和媒体报道,这是其他工程领域所没有的。其次,这些领域的进展对于解决重要的IA和II问题既不充分也没有必要。例如,无人驾驶汽车的发展需要解决各种可能与人类能力无关的工程问题。整体运输结构(A型结构)可能看起来更像目前的空中交通管制系统,而不是目前松散的、前瞻性的、漫不经心的人类司机。它将比目前的空中交通管制系统更加复杂,尤其是在使用大数据和自适应统计建模来为细粒度决策提供信息方面。这些问题至关重要,强调模仿人类的人工智能可能会分散注意力。至于必要性,一般认为AI模仿人类同时包含了IA和II的愿望,因为模仿人类的人工智能系统不仅可以解决传统的人工智能问题(比如图灵测试),还可以解决AI我最好。选择。但这种说法没有历史依据:土木工程是通过尝试建造人造木匠或瓦工而发展起来的吗?化学工程是否应该被设计来建造一个人工化学家?更有争议的是:如果我们的目标不是建化工厂,是不是可以先造一个人工化学家,然后看他想怎么开发化工厂?同样,人类智能是我们所知的唯一智能形式,第一步是尝试模仿它。但事实上,人类并不擅长任何类型的推理——因为人类容易犯错误、偏见和弱点。此外,人类根本没有进化到做出现代II系统必须面对的那种大规模决策,也没有进化到处理II环境中出现的歧义。有人可能会争辩说,人工智能系统不仅在模仿人类智能,而且通过任意放大问题也将是“正确的”。但现在在科幻小说的世界里——虽然这种推测在小说的背景下是令人兴奋的,但在面对IA和II的关键问题时,它不应该成为前进的关键策略。靠自己,我们需要解决IA和II问题,而不是完全模仿人工智能的节奏。在SystemsII中识别不是人类模拟AI研究核心主题的算法和技术并不困难。II系统需要能够处理快速发展和全球不连贯的分布式信息源。这样的系统必须在做出及时的分布式决策时应对云与边缘的交互,还必须应对长尾现象,即一些人拥有大量数据而另一些人拥有很少的数据。他们必须克服跨机构和竞争边界的数据共享问题。最重要的是,II系统必须将激励和定价等经济理念纳入统计和计算基础设施领域,从而将人与人以及有价值的商品联系起来。该II系统可能被视为制造市场,而不仅仅是提供服务。音乐、文学和新闻等行业迫切需要这样的市场出现,数据分析将生产者和消费者联系起来。所有这一切都必须在新兴的文化、道德和法律规范的框架内实现。当然,经典的人类模仿AI问题还是很有意思的。然而,如今过分强调通过数据收集、实施“深度学习”基础设施以及模拟那些松散定义的人类技能的系统来进行人工智能研究——几乎没有解释进化的概念——往往会分散人们对人工智能中主要开放问题的经典注意力.这些问题包括将意义和推理纳入处理自然语言的系统,推断、反映和解释因果关系,建立计算可追踪的不确定性表示,以及建立长期目标设定框架。这些是人类模仿人工智能的经典目标,但它们很容易被遗忘,在最近的“人工智能革命”辩论中也没有得到解决。人工智能也将继续保持其重要地位。在可预见的未来,机器在现实环境中的抽象思维能力将无法与人类匹敌。为了解决我们最紧迫的问题,人机交互值得关注。我们希望计算机能够激活人类的创造力,而不是取代它。“人工智能”一词是由约翰麦卡锡(当时是达特茅斯大学教授,不久将在麻省理工学院担任教授)创造的,显然是为了使新的研究方向与诺伯特维纳(麻省理工学院)的研究方向保持一致。来自学院一位老教授的研究方向)。维纳发明了“控制论”来指代他的智能系统概念——一个与运筹学、统计学、模式识别、知识论和控制论密切相关的概念。另一方面,麦卡锡强调了控制论与理性之间的联系。奇怪的是,在麦卡锡的术语下,维纳的情报系统主导了现代。当然,这只是暂时的,AI行业的变化比一般行业要剧烈得多。但我们需要进一步发展麦卡锡和维纳的历史观。值得注意的是,现有的公众AI对话仅集中在一小部分工业界和学术界,这可能导致普通大众忽视AI、IA和II全面覆盖所带来的威胁和机遇。这种关注不是关于实现科幻小说或超人机器的幻想,而是更多地考虑和开发技术,因为它在人们的日常生活中变得越来越普遍和强大。此外,对技术的理解和塑造需要来自各行各业的不同声音,而不仅仅是技术协调者之间的对话。如果你只关注模仿人类的人工智能,你会被蒙蔽。尽管人工智能将继续推动各个方面的进步,但学术界仍将继续发挥重要作用——不仅提供一些最具创新性的技术思想,还将带来计算和统计领域的研究人员以及其他学科和领域的研究人员的成果,观点,尤其是社会科学、人文科学和认知科学。另一方面,虽然人文和科学在历史的进程中很重要,但也必须承认这是一个规模和范围巨大的工程项目——社会寻求创造新的物体。这些工件应该以规定的方式设计。我们不想创建一个提供医疗保健、交通选择和商业机会的无用程序。在这方面,如上所述,以数据和学习为中心的领域尚未成为一门工程学科。尽管这些领域令人着迷,但它们还不能被视为工程学的一个分支。此外,令人高兴的是,我们正在见证一门新的工程学科的出现。通常,技术一词在学术界和其他领域都被狭义地使用,让人联想到机器的冷酷形象和人类被剥夺权力的负面含义。所以我们要建立一门新的工程学科,现在我们有一个很好的机会来构想一些新的、不同于传统的东西——以人为中心的工程学科。如果未来继续使用缩写词AI,人们必须意识到它的真正局限性。
