当前位置: 首页 > 科技观察

4000字长文:读博士前希望有人告诉我这个(计算机-NLP-机器学习方向)

时间:2023-03-11 23:51:56 科技观察

作者:MarkDredze,HannaM.Wallach编译:Mirra,LiuXiaoli,Sophie又是一年的申请季。“你想继续学业吗?”你可能一直在纠结和迷茫。你或许曾坚定希望推动世界进步,但你准备好度过五年或更长时间的青春了吗?这篇文章是自然语言处理/机器学习方向两位学者给出的“PhD生存指南”,关于如何做好科研、自我管理和规划工作。这些原则不仅适用于计算机领域,也适用于其他方向的学习者。花时间读一读,相信你会有所收获。不管你是不是博士生,你都需要“Dowhatmakesyouhappy”。攻读博士学位是有益的,有趣的,也很累。就像生活中的每一件事一样,前人的经验和教训可以帮助你掌握方法,少走很多弯路。我们根据自己的博士经历和指导他人(尤其是自然语言处理和机器学习博士生)的经验编写了本指南,但我们希望它具有更广泛的适用性。本文中的建议没有特定的顺序。一、成为博士生1、你为什么要读博士?我们想强调这个问题本身的重要性。获得博士学位将极大地改变你的职业生涯。博士学位不仅意味着你将在学校度过很多年(对个人和经济都有影响),它还会改变你追求的职业类型。在获得博士学位的同时。很高兴,决定攻读博士学位。并不适合所有人。需要考虑的一些事情如下:你必须真的想要它。获得博士学位需要很长时间,需要大量的奉献和努力。除非你真的想要,否则你无法完成博士学位。你可以先做点别的。许多学生从本科毕业后直接进入研究生院。那很好,当然——事实上,我们自己做。但也有一些优秀的博士生在离开学术界一段时间后开始攻读研究生。做些别的事情可以让你从学术界中解脱出来,帮助你获得新的视角。2.申请研究生院为了攻读博士学位,你必须进入研究生院。关于这个主题有很多资源,例如http://cra.org/ccc/csgs。我们想强调申请外部奖学金的重要性,例如国家科学基金会(NSF)研究生研究奖学金和国防科学与工程研究生奖学金(NDSEG奖学金)。关于申请和选择学校的一般建议:跳出学校思考。当然,您想去可以申请的最好的学校。但你也需要快乐。如果你不快乐,你就不会成功。如果你发现自己不合群、没有朋友,你就不会快乐。与聪明人为伍。你的导师很重要,但你也会花很多时间和其他学生在一起。和聪明人在一起会让你更聪明。如果你是房间里最聪明的人,是时候起身去另一个房间了。3.博士的几个阶段您可能想知道与周围的其他学生相比,您的表现如何。不要只是猜测——你可以问问你的导师。计算机科学(CS)博士学位。通常需要5-6年,但很多需要更长的时间。花7年毕业可能也不错。请记住,攻读博士学位需要多长时间。不是别人评价你的依据,而是你的产出才是。从广义上讲,博士学位。可能会经历以下几个阶段。第1阶段:上课,找导师,看其他人做研究,阅读论文,完成项目并产生一些东西(不一定是论文)。一般2-3年。第二阶段:选择一个感兴趣的领域,领导一个该领域的研究项目,发表论文,为该领域做出贡献。通常为2-4年。第3阶段:评估您的作品,编写故事并撰写论文。通常为1年。2、你和导师、导师的良好关系对你的成功至关重要。只要确保您为自己选择了合适的导师即可。您将与导师共度数百小时,因此请确保您的导师是您喜欢的人,并且您喜欢与之共事。仅仅喜欢某人的研究是不够的,这并不意味着你们会很好地合作。不同的导师有不同的指导风格。询问他们如何领导他们的研究小组。与他们现在的学生交谈,了解他们的教学风格以及他们对学生的期望。听你的导师。他们并不总是正确的,但他们做研究的时间通常比你长得多。另外,你的导师就是你的老板——你为他们工作。当你的导师告诉你做某事时,就去做吧。与你的导师保持联系。如果你的导师没有回复一封重要的邮件,请提醒他你正在等待他的回复(首先,把你的邮件写清楚。请在此处查看电子邮件写作建议:http://matt.might.net/articles/how-to-email/)。您的顾问可能很忙,可能没有阅读您的电子邮件或意识到它的重要性。定期与你的导师会面。定期与你的导师约会,以确保你的工作效率,并让你的导师给你反馈。你应该定期(比如每周一次)与你的顾问会面——尤其是当你不想见他的时候。制定议程。在每次与你的导师会面之前制定一个议程。概述您要涵盖的每个主题及其相对重要性。如果你不知道你想谈什么,你的导师也不太可能知道。带来结果。尝试每次带着结果(例如图表、数字)去找导师。从总结开始。通过总结上次会议来开始每次新会议。提醒导师上次你同意下一步做什么,总结你做了什么(和没做什么),并介绍你这次的议程。你的主管有许多研究项目。与您不同的是,他们上周所做的工作不仅仅是您的项目,因此您需要帮助导师切换工作场景。总结你之前的会议将使你的导师更快地切换并确保你们两个同步。3.管理日常工作生活/提高工作效率攻读博士学位不同于您拥有的任何其他教育经历或您曾经拥有的任何工作。成功意味着富有成效、富有创造力和独立。不是每个人都能自然而然地做到这一点,所以你最好尽快发现如何才能拥有这些成功的特质。还要记住,一个成功的人也可能会失败(很多次)。每个人的工作方式都不一样。找出您喜欢的工作方式以及什么使您的工作效率最高。(你在早上或晚上效率最高吗?你更喜欢与他人合作还是独自工作?你更擅长专注于一个项目还是同时处理多个项目?)与你的导师讨论这些偏好,以便他们能够了解更了解您并尽可能有效地与您合作。保持规律作息。即使您没有动力,这也可以帮助您取得进步。一般来说,每周至少在实验室工作20小时是个好主意:实验室是一个专注的工作环境,周围都是同事,而且很容易找到顾问。如果您觉得无法在实验室工作,请尝试找出原因并加以处理(例如,与您的主管交谈)。优先考虑。你会发现你面临很多机会,但时间不够。试着找出你的优先事项(例如,研究、课程、社区服务、社交生活等),并确保相应地分配你的时间。如果觉得要做的事情太多,可以算算每天的时间分配。学会区分紧急和重要——不要通过关注紧急截止日期(例如家庭作业)来延迟更长但更重要的截止日期(例如会议)。拥有少量高质量的文章比拥有大量低质量的文章要好。自己迈出“下一步”。如果你坐在那里等着导师告诉你下一步该怎么做,那就有问题了。找点事做,比如阅读文学作品。有社交生活。为了提高工作效率,您需要快乐。社交生活通常是保持快乐的一部分。花点时间确保你快乐和健康,否则你的工作效率就会低下。经常与实验室内外的其他同学交流,可以了解自己对自己和博士的期望是否切合实际,了解一些技术细节、有趣的问题和解决方案。从错误中吸取教训。请记住,每个人有时都会陷入困境或士气低落。即使是特别著名、成功和著名的研究人员也会陷入困境和沮丧。失败不算什么(可以说是成功的关键)。失败也很常见。问题是,当你失败时你会做什么。做笔记。想想你为什么失败了,想想下次怎么办。许多巧妙的研究想法的产生是因为有人失败并问“为什么”。4.研究你是一名博士生,PhD是一个研究学位。这意味着您的目标是学习如何进行高质量的研究。做研究就像学徒——你通过看别人做,然后自己做来学习。对于某些人来说,科学研究是自然而然的事情。对于大多数人来说,做研究并不是偶然发生的。这需要艰苦的工作和周密的计划。1.阅读文献你需要知道以前做过什么,以确保你的贡献是创新和有用的。如果您不知道其他人已经做过和正在做什么,该领域的主要挑战在哪里以及人们如何看待它们,那么您就不能指望跳入一个活跃的研究领域并做出贡献。所有这些信息都来自阅读文献。阅读,阅读,阅读!每周阅读多篇论文——如果您不确定要阅读什么,请咨询您的导师(或其他研究生)。你有很多东西要学(尤其是在头几年),阅读是第一学习方法。做笔记。对你读过的每一篇文学作品做笔记。在每个级别做笔记(例如,从对整篇文章的一句话总结,一直到句子级别的笔记)。找到你自己的笔记系统。精读重要文献。当你阅读一篇重要的文献时,试着理解每个方程式是如何产生的——换句话说,你自己推导它。如果你遇到困难,不要害怕问别人(比如其他研究生或你的导师)。区分广度和深度。并非每个文档都需要从头到尾详细阅读。有时你只需要一个鸟瞰图。每次阅读一篇文献时,弄清楚你需要什么(即你希望通过阅读这篇论文达到什么目的),并据此阅读。版本控制。对所有内容(笔记、代码、论文等)使用版本控制。这可能很耗时,但从长远来看会节省您的时间。2.选题了解科研圈子。论文不是在真空中发表的,论文是圈子内正在进行的对话的一部分。了解这个圈子,即它的参与者、现有工作、术语等。你必须知道你在和谁说话以及如何与他们交谈。思考大问题。你不应该试图解决简单的问题。专注于解决大问题,即使您最终只是朝着解决方案迈出了一小步。有许多论文的想法只是以前工作的延伸。虽然这些论文可能会发表,但它们通常并不重要。尝试专注于大问题,而不是对以前的工作进行渐进式改进。不要编造问题。很高兴提出新问题,但要确保它是真实的。如果你想不出至少三个这个问题的例子,那么它可能不是一个真正的问题。换句话说,不要拔出锤子去找钉子。了解如何根据实际钉子设计或制作锤子。从写作开始。当你有想法时,先把它写下来。在编写任何代码之前在纸上详细说明。这将有助于暴露问题并充实细节。这在处理数学问题时特别有用。在写任何文本之前写一个大纲,以便清楚你想要做什么。学习何时放弃。你可以从失败中学习,但前提是你要继续前进。如果您发现自己不断降低目标和期望,则表明您没有取得进步。学习何时放弃并相信你的导师,他比你知道的更多。问问题。不要害怕提出问题和寻求帮助——与尝试自己解决所有问题相比,您会学得更快、效率更高。3.获取并呈现结果了解您的数据。全面深入地了解您的数据。确保它显示您想要的属性。进行探索性数据分析-以多种不同方式绘制/可视化-有时您会发现数据表现出您没有预料到的有趣属性。了解你的工具。确保您了解所使用的软件包的作用。如果您发布使用其他人的软件获得的结果,您应该确保他们的软件按照您的想法进行操作。有一种“简单”的方法可以做到这一点:阅读源代码。如果您没有源代码,请谨慎。如果可以,多次实施(例如,使用两种不同的方法,或两种不同的语言),并检查它们是否一致。良好的基线模型。只有当基线模型合适时,超越基线才有意义。它只有在改进现有方法或提出更简单的方法时才有用。了解如何构建令人信服、有效且简单的模型。你应该经常问自己:“检验我的假设的最简单的实验是什么?”了解您的结果。仅知道您的方法对数据的准确率为95%是不够的。您还需要确切地知道是什么让您的方法不适用于其余5%的数据点。尝试查看您的方法正确(或错误)预测的那些实际数据点,以不同方式绘制/可视化您的结果。这些练习可以帮助展示和改进您的工作。展示你的结果。学习如何呈现结果,使它们易于理解、有用和令人信服。表格不是呈现数字信息的唯一方式——请至少阅读一本关于(定量)信息可视化的书籍。只有当你的结果易于理解时,你才能说服别人。4.出版跟踪截止日期。不要依赖你的顾问为你做这件事——他们已经跟踪了大量的其他截止日期。如果您认为您无法在最后期限前完成,请务必告诉您的顾问——他们宁愿早点知道。早点写完。至少在截止日期前一周完成论文。这不仅会给你足够的时间来润色你的论文,从别人那里得到反馈,进行别人建议的任何实验,而且更有可能从你的导师那里得到有用的反馈,导师通常手头有一些论文。还有其他论文需要在截止日期前阅读。学习如何写作。如果您认为成为一名工程师或科学家不需要出色的写作技巧,那您就大错特错了。作为一名科学家,您的工作是将您的想法传达给他人。不管你的作品多么了不起,如果没有人能理解你对你作品的解读,它也不可能产生任何影响。如果你发现自己在想“审稿人不理解我的论文”,那么可能你还没有足够清楚地解释你的想法。写作水平影响一篇论文是被拒还是被录用,也是好论文和获奖论文的区别。如果你想提高你的写作水平,你需要尽早获得草稿的反馈。重现您的结果。发表你的研究在一定程度上是为了证明你的结果的准确性。这意味着您必须能够重现它们。确保你在论文中详细记录了你是如何获得结果的,这样你就可以复制实验。至少,根据审稿人的反馈(或当您需要撰写论文时)进行额外的实验会很有帮助。提交后刷新。在提交截止日期后立即组织和归档您的代码和结果。不要对自己撒谎——如果你不这样做,它就永远不会发生。当您发现自己需要重新进行实验(例如,为了您的论文)时,您会感激您花时间去做这件事。发布代码和数据。发布对您的论文至关重要的任何代码或数据。这确保其他人可以复制或建立您的想法。另外,如果其他人使用你的代码或数据,他们会引用你,这不正是你想要的吗?注重质量而不是数量。您会找到最新的会议征文通知、书籍、期刊等。他们中的大多数不会影响你的职业生涯。没有人关心发表在随机期刊上的论文。花点时间为重要会议提交一篇高质量的论文。发表或埋葬不会在***年开始。随着发表压力的增加,一些学生觉得他们需要在第一年发表一篇论文。你不这么认为。在不到一年的时间里,你不太可能产生一个重要的、新颖的想法来为社会做出贡献。先学习一些东西会让你的第一个贡献变得有价值。5.Speech学习如何做报告很重要。进行演示可以宣传您的工作并确保人们知道您是谁。做一个好的演讲可以让你的会议论文被阅读和引用,而不是被搁置。此外,知道如何进行演讲将有助于你毕业后找到工作。作为一名博士生,你必须学习如何说话,所以要早点开始。实践。学习如何发表演讲的最好方法是练习。在镜子前,在朋友和同事面前练习。在重要演讲之前进行多次练习是很常见的。此外,您应该寻找机会进行演示。如果你的学校组织学生研讨会,你可以自愿发言。这些研讨会让您有机会在实际进行会议演示和工作面试之前很久就练习您的演示技巧。寻求反馈。如果你发表演讲(无论是演讲练习还是真实演讲),请听众就你演讲的清晰度、风格、内容、表达方式等提出建议。专注于内容。使用PowerPoint或Keynote等工具时,很容易花费大量时间来设计幻灯片的外观。然而,这远不如拥有清晰的结构和清楚地表达内容重要。在你制作精美的动画之前,你应该花时间考虑一下你要说什么以及你将如何说。控制时间。一份好的报告会在正确的时间呈现正确的内容。如果演讲者说“我的时间不多了,所以我要赶时间”,一半的听众不会有兴趣听。如果您没有时间涵盖某些主题,则可以完全跳过它(最好不要首先将主题放在演示文稿中)。最好是能够把一个话题的内容完全覆盖,而不是仓促覆盖多个话题。当你练习演讲时,你应该管理好自己的时间。记录你说话的时间将有助于你在实际演讲中调整节奏。与实际演讲相比,你在练习中说话的速度是快了还是慢了?知道了这一点,您就可以调整实际讲话的速度。6.制作海报海报展示有时是出版过程的重要组成部分。制作一张好的海报有很多不同的方法,这里我们将概述几个要点。开始对话。海报可以帮助您开始和继续对话。因此,您的海报应该宣传您的作品并说服其他人与您交谈。它还应该有助于您谈论您的工作。海报不能代替论文。省略一些细节是可以的。视觉吸引力。人们通常会访问看起来不错的海报,而不是上面一堆数学公式。你不需要成为一名艺术家,但你应该学习如何使用图形和颜色。讲一个故事。演示文稿应该有一个清晰的故事情节,你的海报也应该如此。在与访客谈论您的工作时,您将使用海报作为指南。确保它以正确的顺序呈现正确的内容。钻头。正如练习对于演示很重要一样,练习如何展示海报也很重要。练习将帮助您确定海报是否包含正确的内容、细节和顺序。5.职业发展职业发展、网络和(最终)找到工作都很重要。实践。工业(或学术)实习是学习新技能、结识新朋友、解决新问题和赚取额外收入的好方法。一种方法是在研究生院的早期进行实习,那时你还没有研究过某个主题,也没有在特定问题上积累足够的知识。另一种方法是在更接近找工作的后期进行实习,届时您将拥有一套专门的技能和兴趣。两种方式都不错,可以多实习。参与论文评审。开始审阅您研究领域的论文。主动帮助你的导师——他们几乎总是会接受你的帮助。通过让你的导师评估你的评论来提高你的判断能力。写个教程。编写教程/带注释的参考书目/技术说明。如果这些教程的质量很好,您的名字可以在您的领域内迅速传播。想想你读过的所有由知名学者撰写的教程。注意丹尼尔。了解您所在领域的知名人士(著名研究人员),并关注他们的工作。去开会。即使您不提交论文,也请尝试每年参加一次会议(请记住,您的顾问并不总是有钱资助您)。如果你对没有在会议上发言感到不安,你可以告诉人们,“哦,我今年没有在这里发表论文。”自我介绍。不要羞于在会议上向陌生人(无论头衔)介绍自己,即使您觉得这很困难。如果您不知道该说什么,请让他们向您描述他们的工作。也可以请导师帮忙介绍。行事专业。你的行为不仅反映了你自己,也反映了你的实验室和你的顾问。此外,您可能会继续与该领域的研究人员互动数十年——确保您建立良好的专业声誉是对您未来的投资。你并不孤单。不要指望自己找到工作。导师的部分职责是帮助您找到工作。你想尽早开始与你的导师谈论你的职业目标和求职。与您的导师一起制定发展计划。您还可以依靠您的其他联系人,例如您的论文委员会成员和实习主持人。有很多方法可以成功。许多学生认为获得学术研究工作才是成功的真正衡量标准:如果你没有成为教授,你就没有成功——这完全是胡说八道。你获得博士学位是因为你在做它的时候得到了培训。学术研究是需要你培养博士学位的一个领域,但还有很多其他领域需要你:教学、工业研究、政府政策、投资创业等等。在攻读博士学位期间,尝试做一些您喜欢做的事情。完成博士学位后,找一份能让你继续做这些事情的工作。有很多优秀的人选择非学术职业道路,因为这是他们想做的事,而且他们乐在其中。最终,你需要做能让你快乐的事情。原文:https://people.cs.umass.edu/~wallach/how_to_be_a_successful_phd_student.pdf【本文为栏目组织大数据文摘原文翻译,微信♂“大数据文摘(id:BigDataDigest)”】点这里,查看该作者更多好文