当前位置: 首页 > 科技观察

【WOT2018】AI门槛不断降低,AI工具人人可用

时间:2023-03-12 21:38:32 科技观察

【.com原稿】2018年11月30日至12月1日,WOT2018全球人工智能技术峰会在北京JW万豪酒店举行。60+海内外人工智能一线精英、千余位行业人士齐聚现场,分享人工智能平台工具、算法模型、语音、视觉等技术内容,探讨人工智能如何赋予新活力到行业。为期两天的会议涵盖通用技术、应用领域、行业赋能三大篇章,设置机器学习、数据处理、AI平台与工具、推荐搜索、商业实践、优化硬件等13个技术专场,堪称人工智能科技盛会。在分论坛中,ThoughtWorks智能服务团队技术总监白发川、百度深度学习技术平台部总监马延军、连科技AI负责人刘大伟,三位专家分享了各种深度学习框架和工具,例如TensorFlow、PaddlePaddle等。应用程序和技巧。持续智能——构建规模化AI服务ThoughtWorks智能服务团队技术总监白发川在主题演讲《持续智能——打造规模化的AI服务》中提到,持续集成、持续交付、持续部署可以让软件在快速迭代的同时保持软件的高品质。随着机器学习的普及,越来越多的服务更加个性化和定制化。“持续智能”定义了一套快速迭代和发布此类服务的方法。情报的定义大致可分为三个层次:一是为应对当前作战需要而不得不开展的一系列工作;二是将AI变成基础服务,融入业务场景。三是将AI变成一个个性化的服务,可以结合产生新的业务场景。其中,第三个层次是理想状态,通过人工智能发现新的业务和价值点,实现更好的用户体验。整体来看,人工智能在企业落地的过程中,还面临不少挑战。首先是规模问题。AI模型的边界很难衡量,也很难复用现有模型的构建过程。二是工程实践中的三大难题:跟踪难、复现难、部署难。然后是数据问题,包括数据或模拟数据不足、数据治理不足、数据安全隐患等诸多问题。很多开发者发现,对于一个机器模型来说,数据带来的挑战远大于调整神经网络参数或选择算法带来的困难。ThoughtWorks智能服务团队技术总监白发川表示,人工智能在业务系统或生态环境中的落地大致可以分为三个阶段。首先是做PoC[狄娜1](Projectionsonceconvexsets),评估和验证模型、服务或解决方案是否可行,完成单个模型的发布和上线。第二阶段开始解决规模问题,因为优化和训练好的模型可以用于生产。第三阶段是跨业务系统集成AI服务。在PoCs阶段,需要引入数据中心的概念,利用数据治理、血缘分析、可访问性和多语言数据存储来构建现代数据架构。传统的数据仓库架构只能解决一个维度的智能,即支撑运营。机器学习场景下,非结构化、半结构化数据需要大规模的ETL操作,必须使用数据中心架构。第二阶段,因为从开发到发布训练再到实施的整个过程过于手工化,需要一个产品化的机器学习架构。通过引入优秀的实践,如CI/CD、TDD、Pipeline等技术方法,从模型创建到发布[Yuwei2]的过程可以被复用、跟踪和复现。第三阶段,需要构建跨业务的机器学习架构,通过端到端的机器学习管道搭建平台,更大程度共享企业的AI服务、数据、算法,实现智能化跨业务线的服务集成。可重用的模型构建过程与数据平台相结合,利用数据平台的能力作为数据支撑,更好地发挥数据平台的价值;拆分服务构建流程,简化智能服务开发,快速响应业务需求;使用元数据管理方式,提供统一的标准格式,场景可多人开发;基础设施共享,模型的训练和发布与数据平台有效绑定,服务构建自动化;统一的元数据管理系统保证了模型的全生命周期可管理;通用AI能力平台化,降低人员需求,提升协作效率。为了在数据中心实现持续智能,让AI模型像流水线一样不断发布,首先需要解决以下问题:第一,数据中心能够整合数据集成、数据处理、数据处理的流程,和数据发布合二为一整条流水线。二是要有人工智能基础平台,可以选择需要的算法、框架和服务,以及模型发布需要的运行环境,实现精简。三是数据和AI能力的汇聚层,解决数据和AI基础平台的连接问题,比如模型数据从哪里来,模型发布到哪里,存储到哪里等等。这三层能力搭建完成后,可以实现持续发布、持续迭代、持续上线,也就是常说的AI流水线。持续智能架构构建步骤从硬编码到自适应模型;使用大规模数据训练特定模型;构建可扩展的系统;创建交互式人工智能探索和开发工具;共同设计算法、软件和产品。企业级机器学习目标大规模数据集下的模型训练;模型分析和比较工具;端到端模型工作流程;可扩展的机器学习模型生态系统;可重复使用的算法和服务;实验管理。企业级机器学习解决方案分布式训练工具;绩效报告流程;可视化施工过程;PythonJupyter、R、Sklearn、TensorFlow、PyTorch、SparkML、ONNX等可选工具白法川列举了企业级机器学习的一个模型、多个模型、跨业务线和部门,列举了机器学习的框架和工具学习。他强调,在考虑大规模落地AI的过程中,首先要考虑如何提升底层AI能力,进而构建上层AI模型和业务场景。到处撞墙。扫描下方二维码查看详细课程PaddlePaddle深度学习框架百度深度学习技术平台部总监马延军在演讲中分析了深度学习技术的发展历史和未来趋势以及深度学习框架的发展现状。结合百度对深度学习技术的应用,为参会者带来了国内开源开放的深度学习框架PaddlePaddle的进展,介绍了PaddlePaddle的技术领先优势,分享了PaddlePaddle在AI赋能各行业的经验和成果。百度对深度学习技术的使用最早可以追溯到2012年,仅仅一年时间,就应用于百度的搜索和推荐业务,并带来了业务的显着提升。2015年,百度推出了完全基于深度学习的翻译引擎。随着深度学习技术的普及,越来越多的应用场景开始工具化,也就是所谓的深度学习框架,如TensorFlow、PaddlePaddle相继开源,PaddlePaddle是百度开发的深度学习框架许久。百度深度学习技术平台部总监马延军事实上,深度学习框架的开源已经大大降低了技术门槛,但开发者仍然需要特定的知识背景和硬件资源支持。深入研究这个系统还是太复杂了,于是诞生了一系列的工具。比如针对深度学习调参问题,百度开放了网络结构自动化设计工具AutoDL,让开发者无需专门培训即可完成。此外,百度还发布了更简单的定制化AI模型应用平台——EasyDL,这是一个零算法的快速应用平台,无需代码,无需任何专业背景,即可轻松定制模型。任何担心。以深度学习框架为核心的“操作系统生态”马延军提到,在AI场景下,深度学习框架类似于操作系统。它介于用户程序和硬件资源之间,通过内核为用户程序提供资源调度。该接口方便了用户程序的开发。深度学习框架需要解决的是如何将底层硬件性能提升到更高的层次,向上提供API,让企业实现自己的算法。当然,很多算法、可视化工具、安装部署工具等都会在深度学习框架上开放。企业或个人可以直接开发和使用这些模型来构建自己的人工智能程序。PaddlePaddle与其他深度学习框架的不同之处在于,首先它更注重模型和API的兼容性,并在深度学习安装环境的适配上做了深度优化和验证,让开发者真正使用起来;二是更方便二三是性能更稳定,更注重对上层视觉、语言处理、情感分析、对话系统等场景应用的支持,而不仅仅是底层的工具应用。此外,PaddlePaddle的配套工具和组件也非常丰富,包括AutoDL、VisualDL、EasyDL等。此外,PaddlePaddle官方发布的模型丰富多样,均经过百度长期验证,效果持续稳定。对于大规模数据场景,PaddlePaddle的并行能力也是一大优势。在部署方面,百度开放了大量独特的模型,包括推荐模型、视觉模型、NLP模型等。马延军表示,百度在AI生态方面做了大量工作,包括开放数据、评价标准和平台,并举办了一系列专家课程。目的是降低深度学习的门槛,让AI技术赋能行业,提高行业生产力。让每个人都用上AI偶数科技AI负责人刘大伟从人工智能行业的发展现状出发,列举了行业发展的机遇和挑战,然后介绍了人工智能建模系统的优势和便利性.此外,还以偶数科技的反洗钱金融项目为例,对如何“让普通人轻松拥抱AI,助力行业实践”进行了深入解读。刘大伟表示,人工智能技术在语音识别、图像识别等领域取得了长足进步,人工智能技术已经渗透到多个领域。例如,人工智能模型可以通过视网膜诊断糖尿病,人工智能可以预测工业生产线上的设备状态,动态检测系统可以保护东北虎等野生动物。偶数科技人工智能负责人刘大伟偶数科技在反洗钱领域应用人工智能技术取得了成功案例。据悉,美国大型征信机构已开始使用AI模型计算FICO评分系统,锁定非法交易。在中国,每年发生2000亿笔洗钱交易,这破坏了金融稳定。我国也出台了与反洗钱相关的法律和监管政策。因此,每一家银行都有责任和义务监督在银行发生的每一笔交易,查出洗钱行为,并报告中央银行统一处理。偶数科技反洗钱解决方案底层是数据源,包括交易流水、客户信息、洗钱模式样本、训练模型等,中间两层是OushuDB和LittleBoy人工智能平台,以及分布式存储成分。上层进行数据清洗、数据转换和交叉验证,以获得与洗钱相关的有意义的数据。连科技通过AI建模,提供多种可行的模型方案,可将疑似案件发送量和人工排查工作量减少数百倍。可行模型方案现有方法:召回率100%,准确率1%左右;连模型A:召回率100%,准确率51.43%;连模型B:召回率86.11%,查准率92.08%。OushuDB数据仓库和LittleBoy人工智能平台承载在OushuLavaAICloud上,可以在公有云上管理整个集群,也可以部署在用户自己的私有云上??。反洗钱解决方案从数据、建模、发布到接入银行系统的整个过程听上去很复杂,其实很简单,甚至不需要学习专业的AI知识。比如小男孩的AI工作室,就有很多现成的组件。用户只需要经过至少半小时的培训,就能了解如何配置节点,然后就可以通过拖放操作将组件连接到不同的工作流中,甚至构建复杂的应用程序。五步训练分类模型另外,EvenTechnology找到了更简单的方法,增加了另一种建模方法。通过五步引导界面,无需太多AI知识即可构建AI模型。第一步:训练数据,将所有集群、数据库、数据表中的数据以树状结构展示;第二步:选择特征和标签,网络会自动识别哪些特征更有用,所以不需要做太多的特征工程;第三步:评估模型;第四步:配置算法,系统默认使用AutoML自动调整算法,会自动探索所需神经网络的网络结构,也会自动匹配一组超参数组合,无需配置.如果你是AI工程师,也可以自己填写参数;第五步:点击Start开始训练。在训练过程中,您可以实时监控模型收敛状态。模型训练完成后,只需点击发布,系统会自动完成模型的发布和服务。此外,偶数科技还提供了通用的RESTAPI调用工具。用户可以通过将此接口集成到自己的应用程序中来立即获得AI能力。非常适合那些不能在短时间内更新的现有系统。通过调用API,这些系统将立即成为人工智能系统。扫描下方二维码,查看详细课程。以上内容是记者根据WOT2018全球人工智能技术峰会《AI平台和工具》分论坛发言内容整理而成。更多WOT资讯请关注51cto.com。【原创稿件,合作网站转载请注明原作者和出处为.com】