我是Liu Jicong。我于2020年毕业于Fudan Computer。出国,为什么AI数据库从大火中如火如荼,以及为什么我离开了大型AI,以及为什么我离开了Big。而且,您是否可以从中获得一些共鸣,希望为困惑的人们带来一些灵感。
像许多人一样,当我进入大学时,我不清楚自己对自己的兴趣。在自然科学测试班的分歧进入物理系一段时间后,我决心将其转向计算机专业的方向。
我和我在实验室设备管理系统的物理部门拥有一个项目管理系统。需要完成的是与服务器相关的功能。我在互联网上找到了一个教程,并使用世界上最好的语言PHP来编写程序的第一版-Alame Architecture CRUD System。同时,我参加了物理学系的C ++课程。第一个相对较大的C ++项目是本课程的最终项目。经典的蒙特卡洛方法用于模拟Ising模型。
一两次,我发现编写代码比修复物理实验室中的设备更有趣。此外,Fudan还提供了转移这个想法的专业机会。但是,当时我已经是大二学生。根据法规,必须减少第二个转移专业。尽管当时的价格很高,但是现在我想来,但这绝对是一个正确的选择。
话虽如此,当我第一次转入计算机系统时,它确实被伟大的神灵滥用,甚至怀疑我是否犯了一个错误。
当时,我的顶级课程中的数据结构课程每周都会播放OJ。OJ和Leetcode有点相似,但是有一个典型的区别。您只知道您的答案是错误的,但是您不知道哪些测试数据。我不知道什么数据错误,因此调试取决于代码猜测。一开始,我没有得到一个点我的测试。每周,我几乎花了几乎所有的时间来完成我的作业。为了获得更好的结果,我写了很多次,直到蒂安明(Tianming)。慢慢地,我可以在每周考试中获得完整的分数。最后,我得到了一个,不仅我得到了一个,而且还获得了整个部门的第一个。
现在我想来,我认为这应该是一步。您需要尽最大努力登机,但是只要您登上它,就会看到不同的风景。竭尽所能刷新算法问题的经验也极大地帮助我找到了实习并找到一份工作。基于此,我可以输入字节击败实习,并在没有任何准备工作的情况下获得每一个。
小费课程的优点是有很多选择的空间。除了数据库课程外,我还参加了分布式系统,数据挖掘和加密等课程。我与朋友一起做了很多有趣的项目部署Hadoop和Hive来分析不同任务中的性能瓶颈;使用火花进行分布式计算;实现数据库嵌套循环连接,并将执行从十二次的时间执行时间。
在Fudan,我赢得了各种奖励。除了第一,第二,第二,第三级奖学金外,还举办数字模特比赛,物理学学术比赛的全国第一奖,以及上海一等奖,海洋范围的学者,出色的海洋学者,卓越院士,等等。为了学习,我遇到了许多杰出的同学,著名的老师和挑战,并且也一路获得。
该奖项 - 大学证书
![图片]()
在研究领域,我从一开始就没有注意数据库,并且有曲折。
进入计算机部门后,我应该能够加入NLP(自然语言处理)实验室。上一学期结束后,我成为Byte Beating AI实验室的NLP实习生。我做了中文错字测试的工作。实习后,我进入了香港科学技术大学进行夏季交流。尝试在短期和完全不同的AI研究经验中进行更多的研究,尽管导师是行业和学术界的大母牛,但我并没有取得任何好成绩。
结果,我有一些新想法。你想做其他事情吗?也许我会发现它更有趣,可以发挥自己的优势,就像我从物理学转移到计算机一样。我与不同研究领域的朋友交换了这些想法。后来,一个制作数据库的同学导致我看到了另一个领域-Data infra.next,我成为** tidb ****的贡献者,并开始系统地学习分布式系统和数据库。这是正式进入数据库的门槛。**
但是当我加入工作时,我没有直接进入该行业。但是当时我在香港大学进行了沟通),学校没有特别合适的导师,所以我放弃了鲍伊安,赶上了Qiuzhao的最后一辆公共汽车。即使我找不到合适的工作,我仍然可以申请国外。结果,我没想到Qiuzhao无法想象。我收到了所有参加采访的公司的报价:其中,有很多工厂,例如Ali和Tencent Tencent。还有Pingcap等初创公司。
在一家大型互联网工厂结束时,我遇到了一位从富丹(Fudan)毕业并工作了十多年的资深人士。他问我选择什么优惠和趋势。您真的考虑过吗?在接下来的几年中,您可能比在互联网上更重要。在大型工厂开展业务的同学是较低的工资,同时他们必须承担更多的不确定性风险。您能否真的接受吗?”
我真的在想吗?也许最终有否。我选择去阿里巴巴云参与基础架构,希望实现一定的平衡。
该冬天的流行病爆发了,无法重返学校。当他毕业时,他不得不赶紧与一些学生聚在一起。从上海到杭州的开车只开车49分钟,就像从学生到工作场所的人们的转变一样,这几乎措手不及。下一站,阿里,杭州。
也许它从我以前丰富的实习经验中受益,或者也许我在学生时代做了很多挑战性的课程项目。我很快就开始了新的工作内容。第一个使我印象深刻的是我加入工作的第一个月,我解决了困扰该小组技术专家半年的技术专家的问题。
背景就是这样。我们有一个监视系统。监视探针直接安装在客户ECS上。客户可能会购买很多ECS,并使用Kubernetes或非Kubernetes形成一个集群。网络拓扑关系(例如TCP连接),然后绘制视觉拓扑结构,并与一般分布式微服务相比,其中有三个困难:其中:
我们通过/proc目录下的TCP文件解决了这些困难,但不能保证完整的数据。最好的解决方案是当时使用新技术EBPF,但是很难降落,因为大多数客户的环境无法很好地支持EBPF我花了一个星期的时间进行研究,发现内核模块Auditd可以更好地解决这个问题。几周后,我们推出了我们的新版本的探测器。这半年的问题已经解决,并且在进入工作场所后也已成为第一个非常充实的工作结果。
但是,我逐渐发现该小组的工作是典型的管理和控制方面。管理和控制方面的麻烦是适应用户的各种复杂环境,但是它们的核心功能,技术困难和挑战明显弱于平台方面。因此,我可以挑战的问题并不像我想象的那样多,进步的速度逐渐缓慢,并且团体业务的发展也不好。
为了解决无聊的工作和做数据库的核心,我从未死亡,我和我的朋友们参加了Pingcap 2020的黑客马拉松。我们选择的主题是基于Raft Log来实现属于实质性观点的,属于属于的观点内核工作。在时间表上,我和我的朋友们整夜都写了代码,调试和解决问题,这使我感到在工作代码,解决问题和我自己的进步方面感到长期的幸福感。
在这场战斗之后,我开始思考未来。尽管我受到老板的信任,并成为当前工作中某些项目的所有者,但可能会逐步促进,但是这些没有波浪的生活轨迹也使我感到越来越多。我决定离开,但是为了避免重复同样的错误,我必须首先确定目标。
我计划转移或换工作。我开始联系公司的不同团队,但结果使我失望:我认为我从事内核研发的许多部门实际上只能控制和写作控制台;尽管其他内核部门,整个小组的范围太小了。有一些,还有一些,不欢迎招募新移民更改帖子...
另一方面,整个数据下属环境正在悄悄地发生变化。我旁边有一些令人兴奋的声音,例如::
“每个人都对这些明星前IPO感到乐观,而雪花等公司很难招募人员,但后来他们发现那些去买了一大袋数百万刀的人……”
“ Snowflake的发行价格已经提高,上市的一天飙升了100%以上……”
“ Snowflake的数据确实很好:它的NRR为173%,也就是说,假设用户去年在Snowflake上花费了1美元,那么今年他平均花费1.73美元...”
“汇合清单,Databricks大型融资……”
本国的
目前,我醒了。当时,招募的学校的最终官员有多年的工作经验,而在大型工厂管理数百人的Fudan高级人员是错误的 - 启动进行数据库,不再是它不再是事物这需要受到感情的支持。在这个行业中涌入的热钱,许多有前途的创业公司都实现了大量的融资。更重要的是,对于这样的技术公司,技术人才是核心,因此他们愿意花钱并且有能力负担得起钱抓住大型工厂的人;虽然互联网的TOC业务是如此乐观。
经过一段时间的系统学习和研究,我认为我已经准备好了。我首选的目标是执行Tdengine数据库的TAO SI数据。有两个原因:首先,Tdengine是开源的。在此之前,我已经在Github上看到Tdengine趋向多次。我可以直接看到该代码,并直接判断它是否通过实践具有真实的材料。首先,尽管GM OLAP被解雇了,但竞争也非常激烈。也许最好从细分轨道开始,并且轨道中的时间序列数据库和图形数据库的增长是最快的。在越来越多的数据中,我对其前景感到乐观。
为了了解顺序数据库的领域,我完全阅读了“ Tao Si Data的创始人Tao Jianhui”创建的“十大特征”和“架构设计”以及其他文章。解决问题,对问题的真实建模和分析以及对该领域的深刻见解,我们可以真正制造核心和竞争性产品。在杰夫(Jeff)的文章中,我意识到我意识到我已经意识到自己已经添加了Itessencein,Tao Si Data的招聘页面上的招聘页面上写下了“超越蝙蝠的薪水”页面。我同意这种对才华的看法,并希望招募高质量的才能。视力和治疗是必不可少的。
在陶士的故事中,它才刚刚开始。
2021年7月,我正式加入了Tao Si数据,很快就开始了数据库Core的研究和开发。我在第一季度之后的第一季度摘要中获得了“最佳新人奖”。
现在,我负责TAO SI DATA中当前计算引擎的开发。Tdengine2.0提供了连续查询的能力。从本质上讲,这是一个时间驱动的批处理处理,无法处理障碍数据的问题,并且性能消耗很棒。我的目标是为现有的Tdengine实现真实的流计算引擎。
这项工作的范围远远超过了我以前的所有工作和项目。一方面,我系统地学习Eomp(恰好一次消息处理),分布式快照和其他容错理论,同时研究Kafka和Flink的源代码和实现机制,在跟踪Sigmod,VLDB,ICDE和其他峰会的最新研究时,有关最新研究的最新研究。流媒体数据库的定义,例如流媒体ETL工具,例如物质化和可解码以及ksqldb。设计的开始。
每个人都见面。
在过去的几年中,我得到了许多人的帮助,以帮助我找到新的方向和道路,以便我有勇气和决心接受新的挑战。因此,我也愿意分享我的经验,并可能给您一些灵感。并提供帮助。
与盲目的努力相比,我相信“选择”将对生活和职业发展产生更大的影响。这篇文章已经恢复了我的生活。从时间开始,AI被切换到Instra,放弃国外和Baoyan加入Ali,并从Ali离开Ali加入Tao Si.当然,这些选择的结果远非如此总结,但至少现在,无论是否正确,它已经开始变得更加清晰。我相信读者也会有自己的判断。
如果您想了解有关Tdengine的特定细节的更多信息,请在GitHub上查看相关的源代码。