当前位置: 首页 > 网络应用技术

人工智能超大培训模型浅训练

时间:2023-03-06 15:40:54 网络应用技术

  中国信息与传播研究所最近发布了“人工智能白皮书(2022)”。白皮书指出,人工智能已经进入了一个新的开发阶段,并将被定义并将其捕获到技术创新,工程实践和值得信赖的“三维坐标。在算法级别上,超大的预培训模型已成为过去两年中最受关注的热点之一,并不断刷新各种记录。其中,百度eRnie3.0模型已达到90%以上的模型全面的自然语言理解任务。世界第一。

  1941年世界第一台计算机出生十五年后,参加了“达特茅斯会议”的“ datmouth会议”,这是香农和赫伯特·西蒙的“达特茅斯会议”,这是第一次。人工智能的正式诞生。人工智能的第一波科学家是雄心勃勃的,希望写出一种伟大的算法来模拟人类的意识形态过程。但是,计算能力的问题已导致设计的精美算法。沉默,计算能力促进了第二波人工智能的浪潮。1982年,日本和美国投入了大量资金来开发第五代计算机,即“人工智能计算机”。几年后,科学家们发现,即使以摩尔法律的速度开发了芯片,它仍然无法满足计算能力的要求,但是没有将数据输入到该算法中,从而导致了第二波人工智能波。

  得益于算法的突破,例如深度学习,计算能力的持续改进以及大量数据的持续积累,人工智能可以真正从实验室转变为工业实践。在2016年,Alpha Dog击败了Go World Champion Li Shishi,代表新一代的人工智能,依靠机器学习成为大师,甚至是从未在人类经验中创造的新国际象棋道路。深度学习已经实现了人工智能。

  如果我们在高中和大学水平上使用人工智能算法模型的功能,我们需要从幼儿园到该领域的水平进行培训,直到幼儿园的水平,例如培训到大学水平。长时间,同时,这意味着成本也很高。

  预培训是将大型和低成本培训数据放在一起,并通过培训预培训方法(例如达到高中级别)学习一些共同点。如果需要在某个领域中需要一个大学生的模型,有必要根据该字段中的特殊标签数据进行罚款,以在此字段中生成特殊模型。高中级模型是大型型号。

  要训练大型模型,除了算法外,还有大型数据和大型计算能力,这意味着它需要大量的钱。通常,只有大型工厂才能制造大型型号。

  以深度学习为代表的算法已经开始了人工智能浪潮的前奏。它被广泛用于计算机视觉,智能声音和自然语言处理领域,并超过了人类的识别水平。

  在预训练出现之前,自然语言治疗领域中大规模深度学习的应用阈值相对较高,模型效应取决于个人能力。PRE培训模型可以大大降低此类的成本和阈值link.pre-培训模型使模型培训重用,这大大降低了培训的成本。例如,我们可以根据一般模型的大型模型扩展金融部门中的特殊模型。预培训模型是迁移学习的应用。句子的每个成员的上下文与句子的上下文有关,语法知识的学习以隐藏的方式完成。Pre -Training模型在几乎所有自然语言处理任务中都取得了良好的结果。同时,预训练模型通过细调具有很强的可扩展性。每次将它们扩展到新场景时,他们只需要针对此场景的特定特定特定。标记用于方向学习的数据可以在此场景中快速应用,这大大降低了机器学习人员的要求。

  如果您对大型模型在生产和研究或需求实践中的实践感兴趣,则可以前往Baidu Wenxin正式阅读更多学习材料,并开始使用大型模型旅程开始工具。官方地址:https:/ https://wenxin.baidu.com/

  总体而言,在过去的两年中,大型模型发展迅速,并且也很快应用于行业。尽管深度学习已大大提高了许多领域的准确性,但AI模型中存在许多挑战。最重要的问题是模型的模型不高。每个模型都在特定字段中进行训练。当应用于其他字段时,效果不好。

  1.模型破碎化,大型模型提供预培训程序

  大型模型提供了广义解决方案。通过“预训练大型模型+细节下游任务”,它可以有效地从大量标签和无符号数据中捕获知识,从而大大扩展了无调的概括能力,例如NLP,PRE -PRE -PRE -PROP-培训大型模型共享一些下游任务的前训练任务和参数。在一定程度上解决了普遍性问题,可以应用于自然语言任务,例如翻译,问答,文本生成。

  2.通过自学和学习功能,降低培训和研发成本

  大型模型的自学和学习方法可以减少数据标记,并在一定程度上解决高成本,长周期和低精度的问题。还可以比以前获得更好的功能,并且模型参数量表越大,优势就越明显。避免开发人员进行大规模训练。您需要大大降低开发成本和使用成本。

  3.大型模型有望进一步打破现有模型结构的准确性限制

  从深度学习的发展来看,模型的准确性得到了提高,这主要取决于网络的结构。随着神经网络结构的设计技术,它逐渐成熟并收敛。很难通过优化神经网络结构来打破准确性限制。近年来,随着数据量表和模型量表的增加,模型精度也得到了进一步提高,模型和数据量表的增加确实可以突破现有准确性的限制。

  整个培训模型也处于快速发展,整个主要发展趋势。首先是该模型越来越大,整个变压器的层数正在增加,整体能力将成为越来越强。当然,培训成本的带来越来越高。第二个趋势越来越多,包括各种自动编码和多任务培训。第三个是继续从多模式发展。将继续出现,这也是实现人工智能概括的有用探索。

  推荐阅读[技术加油站]系列:

  在测试领域自动生成测试领域的BAIDU智能测试

  小型程序自动化测试框架原理的分析

  百度程序员开发指南(GO语言)

  百度程序员开发指南(3)

  百度程序员一起开发(移动终端)

  Baidu程序员避免坑(最前沿)的开发指南

  百度工程师会教您快速提高研发效率的效率

  百度前线工程师谈论云的迅速云

  原始:https://juejin.cn/post/7096700385284489223