如何不成为一个垃圾科学家
不做垃圾科学家的方法
如何成为一名优秀的数据科学家而不是垃圾科学家:启动数据之旅的技巧和窍门
“我如何在一周内成为数据科学家?”
“有没有一个胶囊内容可以在一天之内学习AI和机器学习?”
“有没有一门Moocs可以在一夜之间学会分析,下周赚到6位数的收入?”
这些是我每天从社交媒体上接收到的最常见的问题,来自许多人工智能和分析学爱好者。
- 自监督学习和Transformer?— 解读DINO论文
- 认识QLORA:一种高效的微调方法,可以降低内存使用量,使得在单个48GB的GPU上微调一个65B参数的模型,并保持完整的16位微调任务性能
- 加州大学伯克利分校的研究人员引入了视频预测奖励(VIPER):一种利用预训练的视频预测模型作为无动作奖励信号的强化学习算法
每天都有无数的通讯、Moocs和课程被非人工智能/机器学习影响者推出,通过展示荒谬的梦想并灌输许多毫无价值的想象和做法来愚弄学习者。
我见过很多最近成为数据科学家或人工智能专家的人找不到最低工资的工作,这些工资甚至不能让他们在完成数据科学大学课程或Inlfunecers Moocs胶囊后继续生存。
让我们了解为什么?
谷歌搜索:“什么是数据科学?”
是的,谷歌搜索始终非常重要;甚至在启动某事之前。
无论你要学习什么科目,学习者在开始学习之前需要调整好以下三个方面:
- 学习者的背景是否相同或不同。
- 在深入学习之前了解学科的先决条件。
- 在获得知识后如何在现实世界中应用?
在开始学习之前对学科有一个清楚的了解,可以增加学习的成功率。
无论你是在谷歌上搜索还是向Bard或Chatgpt提问,你都可以引导你的学习之旅。
这同样适用于任何学科。
了解为什么?
这个理念在世界上每个成功的专家都非常重要,也是大多数人遵循的。
无论是你要开始在数据科学领域开展职业生涯,还是计划从其他领域转行到这个领域,你都应该有一个明确的理由来启动它,而不仅仅是购买几门课程或参加培训班。
我的几个朋友和前同事从不同的专业领域转入这个领域。但是,他们并没有成为数据科学家;他们也不想成为。他们学习分析作为一种为个人目的服务的工具。
工具只是工具:
学习Python、R或任何其他语言或机器学习工具不会让你成为一名数据科学家。这些只是机器学习从业者用来解决业务问题的工具,这些问题需要在客户端交付,或者可能是用于个人研究。
后天可能会出现一种工具,轻而易举地取代它们。但是,这并不会改变分析的形式。它们将改变你将来解决问题的技术栈;而不是你的解决方案。
选择特定领域并制定路线图
选择特定领域并在该领域制定路线图?
如果你是一名航空航天工程师,正在学习数据科学和人工智能技术,你可以关注你每天处理的设备类型,然后只学习与数据科学相关的部分。
假设你正在学习数据科学,以应用于涡轮发电系统。只需深入学习AI可以增加价值的领域,然后只学习解决这些问题的相关工具和技术。例如,你正试图提前检测涡轮中的故障并预测发电量。那么,你需要学习时间序列技术、传感器数据的细节以及专门的预测和异常检测算法。你可能不需要在那时花时间学习自然语言处理。
“你没有必要学习所有东西。永远不要!”
从非IT到IT趋势:
学习数据科学或人工智能后,您不必立即进入IT行业。您可以在任何领域应用这些知识。
选择应用领域并选择学习的工具和技术后,将更容易制定出完整的规划路线图。
如今,我们看到每个人都选择进入IT行业,以期在月底挖掘出六位数的收入。但是,这只是一种伪装,是培训机构和个人压榨学习者钱包的手段。
如果您能用一把简单的锤子真正解决现实生活中的问题,您总是可以赚到超过六位数的收入。
不要过度炒作:
如果您周围的每个人都在学习LLM和Chatgpt,并且使用一些Prompt工程方法一夜暴富。您不需要被迫跟随他们。这些只是噪音和炒作趋势。
您最终只会陷入炒作,几乎没有任何帮助您在工作中实时解决业务问题。
在学习过程中摒弃各种炒作。
至今仍然可以从这个经典资源中学习:链接
咨询:
与长期从事该领域工作的专家咨询,而不是社交媒体影响者。许多社交媒体影响者制作了人工智能和数据科学课程,并销售并赚取了数百万。与此同时,学习者却在毫无收获的情况下花费了大量金钱。
找到一个在该行业中并以自己的能力为许多项目做出贡献的人(在GitHub、LinkedIn或其他任何地方都有时间戳的证据)。与他们咨询关于学习策略以及您计划实现的目标,即使您是从开源内容学习的。这样也可以。
传统方式学习:
最好的方法是采用三步学习技术。
- 学习统计学和机器学习:全面的理论和详细的概念
2. 根据需要学习工具(例如Python、Rapidminer、Julia等)
3. 学习表达方式:在制定完整的人工智能和机器学习策略之后,您将如何向业务利益相关者、合作伙伴、同事和老板展示?
在数据科学中,您的工作表达方式非常重要。构建无法为利益相关者或消费者所理解的花哨模型只会导致混乱。
我始终建议以传统方式学习,而不是尝试从抖音或Instagram的影响者那里学习,他们每天都在进行营销。
在20分钟内学习20个主题只是垃圾而已。
欢迎在Linkedin,VoAGI和Topmate上与我联系。