当前位置: 首页 > 科技观察

自然语言处理必读:理论与实践兼顾的5本书_0

时间:2023-03-21 14:03:11 科技观察

谈到学习方法,我们往往会参考教程、博文、在线课程等,而书籍总是被忽略。即使你正在寻找关于某个主题的书,你也会很快发现这样的书太多而无法快速判断哪一本最适合你。为了帮助你搞清楚,我帮你选了5本关于自然语言处理的书,与清单中的其他书不同,这些书除了第一本外没有一本是免费的,但它们已经被证明是值得投资的,希望可以对大家有帮助。1.NaturalLanguageProcessingwithPython(NaturalLanguageProcessingwithPython)本书由StevenBird、EwanKlein和EdwardLoper合着。可以从Python系统的角度学习自然语言处理的实用基础知识,更适合初学者。也称为NLTK书,NaturalLanguageProcessingwithPython自始至终都在很大程度上依赖于NLTK库。以下是该书序言的节选:“本书为NLP领域提供了通俗易懂的介绍,可用于个人学习,可作为自然语言处理或计算语言学课程的教科书,也可作为人工情报、文本挖掘或语料库语言。”本书非常实用,包含数百个示例和分级练习。这本书适合所有人,无论以前是否有编程经验,如果你想学习如何编程和分析书面语言。”如上所述,这本书绝对实用。虽然你肯定会一路上得到概念性的解释,毫无疑问,这本书真的是为那些希望在Python中实现NLP解决方案的人而设计的。2.UsingPyTorchforNaturalLanguageProcessing(NaturalLanguageProcessingwithPyTorch)本书的作者是DelipRao和BrianMcMahan。它没有介绍NLP领域的传统技术,但介绍了当今使用的神经网络。该学科的另一种实用方法是使用PyTorch进行自然语言处理,将神经网络应用于NLP。您可以直接从本书的网站上看到的一些主题包括:探索计算图和监督学习范式掌握PyTorch优化张量操作库的基础知识传统NLP概念和方法概述表示单词、句子、文档和其他特征的嵌入探索序列预测并生成Seq2seq模型学习构建生产NLP系统的设计模式从更传统的(非基于神经网络的)NLP技术到现代NLP,NLP越来越依赖于深度学习。3.NeuralNetworkMethodsforNaturalLanguageProcessing(NeuralNetworkMethodsforNaturalLanguageProcessing)这是一本关于NLP的神经网络方法的书,作者是YoavGoldberg。本书对NLP相关概念进行了深入的解释,您可以学习如何轻松地在代码中实现它们。以下内容摘自该书网站:“本书着重介绍神经网络模型在自然语言数据中的应用。本书的第1部分和第2部分涵盖了监督机器学习和前馈神经网络的基础知识,使用机器学习的基础知识,以及基于向量而不是符号表示的单词的使用。”本书的第三部分和第四部分涵盖了更专业的神经网络架构,包括一维卷积神经网络、递归神经网络、条件生成和基于注意力的模型。这些架构和技术是最先进技术背后的驱动力用于机器翻译、句法分析和许多其他应用的算法。”在理论或解释领域,自然语言处理的神经网络方法将大大增强您对基于现代神经网络的NLP方法如何工作的理解。4.自然语言处理的语言基础(LinguisticFundamentalsforNaturalLanguageProcessing)在使用NLP时,它盲目地学习语言基础知识并不是一个好主意,而且在没有任何正式语言学习经验的情况下,如果你想从纯计算开始学习NLP或计算语言学,有很多地方需要注意。本书旨在帮助您弥合这一差距。网站上是这样描述本书的:本书旨在提供有关人类语言的形态和句法结构的简明易懂的信息,可用于创建更复杂、独立的语言,因此更成功的NLP系统。本书第1章的以下内容支持这一点:关于l的知识语言结构可以为NLP中机器学习方法的特征设计提供信息。更具体地说:语言结构的知识将为机器学习带来更好的特性。本书包含100个要点,以便更好地理解词法和语法,还包括相关主题的章节。如果你没有语言学背景,可能会有点读,但它会让你变得更好5.NaturalLanguageProcessinginAction(自然语言处理实战)HobsonLane、HannesHapke和ColeHoward合着的这本书将带我们回到现实。这本书涵盖了NLP的传统方法和基于神经网络的方法,可以看作是该列表中前两本书的组合,涵盖了使用TensorFlow和Keras等现代工具的实用编码解决方案。来自本书的网站:“《自然语言处理实际应用》是帮助您构建可以阅读和解释人类语言的机器的指南。您将使用现成的Python包来捕获文本中的含义并对其做出反应。这本书扩展了传统的NLP方法,包括神经网络、现代深度学习算法和生成技术,可帮助您解决现实世界中的问题,例如提取日期和姓名、编写文本以及回答自由形式的问题。”来源:unsplash这本书是目前市面上最新的,最全面最实用的一本书。但是你也可以根据你想入手的系统和你想深入的程度来选择更适合你的书get,再考虑一些其他的因素,这5本书绝对值得一读,你要做的就是想清楚自己想学什么,然后做出相应的选择,再往下读,你一定会收获很多。