首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

通过自学数据科学和机器学习,我在一年内薪水增加了40%

在不断扩大的数据领域,存在着许多职业机会。找到你自己的位置——找到你的薪水(水平)——很大程度上取决于你的付出、专注和学习的动力。如果你是一个有抱负的数据科学家或者已经开启你的职业生涯,有很多种策略可以最大化你的潜在收入。

首先声明,这篇文章只是更多地反映了我为达到今天的水平所做的一切。我并不是说你会通过同样的步骤来实现同样的目标,但我认为这可能会为你提供一个你之前没有想过的独特视角。

为了让我的收入翻番,我做了三件主要的事:

  1. 提升技能(在数据科学和机器学习方面)
  2. 写博客(关于数据科学和机器学习)
  3. 自由职业(数据科学和机器学习项目)

一、提升技能

如今,许多人倾向于寻找高风险高回报的投资,比如比特币,以期“快速致富”,但正如沃伦•巴菲特(Warren Buffett)所言,你所能做的最好投资就是投资你自己。对于那些没有钱但想要改善他们的财务状况的人来说更是如此。

通过简单的自我提升,学习数据科学和机器学习,我在一年内使薪水增加了 40%。

在过去一年中,我关注了 3 个主要领域:

数据操作 (SQL/Pandas)

在我看来,用 SQL 和 Pandas 进行数据操作是给我带来最大好处的最重要的领域。根据我的经验,大部分时间都是用来查询数据、探索数据和打包数据,所有这些都需要 SQL 和 Pandas。

在我的所有与数据有关的工作中(增长营销分析师、数据分析师、数据科学家),SQL 一直是共同所需的技能,可以说是数据专家最重要的技能。

下面是我自学 SQL 和 Pandas 的一些资源:

  • Mode的SQL教程:我总是推荐这个资源,因为它是一个用来了解要学习哪些概念的很好的指南,即使你不用它来实际学习概念。他们将概念拆分为不同的难度级别,这一点非常棒。
  • Mode的SQL案例研究:这些案例研究非常好,因为它们使你能够应用已经学到的知识,并批判性地思考如何处理现实场景。
  • LeetCode数据题:我总是将此作为资源使用,特别是在寻找新工作的时候。这是一个很好的方法来模拟涉及 SQL 的编码面试。
  • Pandas习题:Pandas 的语法不是很直观(至少不像 SQL),我一直记得不是很深刻,直到我做完这个 Pandas 习题库!

脚本 (Python)

我因为学校的原因开始使用 Python,我可能会在我的余生中一直坚持使用 Python。它在开源贡献方面遥遥领先,而且学习起来非常简单。

有两个主要资源我强烈推荐用来提高 Python 技能(除了做副业项目之外):

  • LeetCode算法题: 与 SQL 类似,我使用 LeetCode 来学习如何为各种问题编写(有点儿)高效的 Python 脚本。
  • Tech with Tim: Tech with Tim 是一个 YouTube 频道,这意味着它是免费的,但它比大多数付费课程和训练营要好。我强烈建议你看一下他的视频,并一直关注他。

机器学习

当然,作为一名数据科学家肯定是要学习机器学习的。下面是我在职业生涯开始时使用的两个最重要的资源。

  • Kaggle的机器学习简介:如果你像我一样,不太了解机器学习是如何工作的,或者你不知道机器学习使如何在代码中实现的,那么我强烈建议你看一看。
  • StatQuest: StatQuest 对于理解机器学习模型是如何工作的非常棒。一旦你理解了理论,用代码实现它就非常简单。

如果你想了解机器学习的各种算法,请查看我的文章

实际上,我写了一个 52 周的课程,涵盖 SQL、Pandas、Python 和机器学习,你可以在这里查看

既然我已经讲了我自己的技巧,你可能很想知道我是怎么做到的,而这正是我接下来要讲的。

二、数据科学和机器学习博客

你们中的一些人可能知道,我发起了一个名为“52 周的数据科学和机器学习”的个人计划,在这个计划中,我在一整年的每一周都学习、编码、撰写与数据科学和机器学习有关的东西。这主要是为了让我自己对不断学习新东西负责。

在写了 100 多篇文章并建立了超过 20,000 名读者的关注者群体之后,写作现在为我带来总收入的大约 25%。

下面是给我带来巨大成功的三个秘诀:

秘诀 1:找出你擅长写什么、喜欢写什么和人们喜欢读什么的交叉点。

这是我给有抱负的作家的第一个建议。理想情况下,你要找到一个满足所有这三点的合适的位置。

如果你发现一些你擅长写的东西,而且你也喜欢写,但是人们不喜欢读,那么你就不会建立一个关注者群体(假设你关心这点的话)。

如果你找到一个你擅长写的话题,而且人们也喜欢读,但是你并不喜欢写这个话题,那么你不会坚持多久,因为你会失去兴趣。

最后,如果你找到一个你喜欢写且人们喜欢读的话题,但是你并不擅长写这个话题(例如,因为你没有足够的专业知识),那么你可能就没有什么吸引力。

所以,在一开始的时候要找到你的定位。我将在秘诀 #3 中对此进行详细说明。

秘诀 2:理解你写作平台的机制

无论你是在使用 Medium、Substack、Patreon 还是其它平台写博客,请务必花时间了解该平台的运作机制。

关于这个,我也没法说的太详细,但是收益是如何计算的、这个平台如何帮你做广告,诸如此类的事情都是需要考虑的重要问题。

通过理解 Medium 的机制和运作方式,我能够最大限度地扩大我的影响力,并最终更快地扩大我的关注者群体。

下一个秘诀将帮助你实现秘诀 #1 和 #2:

秘诀 #3:在创建内容时,考虑“开发 vs. 探索”的概念。

为了找到秘诀 1 中三者的交叉点,并理解你正在写作的平台的机制,要考虑“开发 vs. 探索”的概念。

这个想法来自一个被称为“多臂老虎机问题”的统计学问题。我不想谈太多细节,但“探索和开发”背后的主要思想是决定探索和寻找新的潜在想法,还是利用你已经知道的有效的想法。

在你写作/写博客的职业生涯的初期,最好探索和尝试尽可能多的想法,看看什么是最适合你的。这意味着写作不同的主题,在不同的出版物上发表文章,并尽可能尝试新的写作风格。

当你在写作风格和偏好上越来越成熟时,你可能会偶然发现一个“秘方”,它能让你在写作中获得持续的成功。这时你就可以开始利用这一突破,并加倍利用你的秘诀。

总之,在早期尽可能多地探索,当你开始定义自己并找到成功时,开始利用那些让你成功的见解和想法。

三、自由职业项目

我剩下的一部分收入来自与数据科学和机器学习相关的自由职业项目。我承担的这些项目包括撰写技术论文、撰写营销内容和构建模型。

当我刚开始工作的时候,我只从自由职业项目中赚取几乎最低的薪水。这是有道理的,因为我没有太多的经验,我也不知道我的价值。但是,到了年底,我可以每小时收费 50 美元以上。

我的大部分收入来自科技行业的回头客。事实上,我也不需要接触任何人——我可以通过我的数据科学和机器学习博客来获取我的客户的注意,这也是本文的重点。

我的数据科学和机器学习博客不仅帮助我持续不断地学习,它还帮助我建立了自己的关注者群体,并帮助我获得了一些自由职业项目的客户。

作者介绍

Terence Shin 一位具有 3 年 SQL 经验和 2 年 Python 经验的数据爱好者,Towards Data Science 和 KDnuggets 的博主。

原文链接

https://www.kdnuggets.com/2021/06/double-income-data-science-machine-learning.html

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/4khRBQCrCqLSV18137BH
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券