机器学习最近非常受欢迎。时刻都在发生如此多的事情,可能很难弄清楚您应该学习哪些想法。当你记得许多流行技术(ChatGPT、AI Art 等)都内置了多种技术和想法时,这会变得更加复杂。对于初学者来说,在没有先验知识的情况下以任何有意义的深度理解这些技术是不可能的。
在阅读了数百篇论文并与多位专家交谈后,我认为您应该将以下 3 个想法添加到您的武器库中,以便在未来几年内在机器学习领域取得领先。这些都是有很大潜力但没有得到人们足够重视的想法。将这些添加到您的武器库中将使您成为更好的数据科学家,并为您提供许多人目前所缺乏的独特技能。
一、特征重要性
您在数据科学/深度学习任务中经常遇到的最重要的挑战之一是发现机器学习中不同特征的重要性。您的模型最重要的方面是什么?哪些数据点会影响您的最终预测,它们有多重要?了解对您的模型/最终预测变量的最大影响是构建更好的智能系统的关键。
当涉及到传统的监督学习时,这个问题在很大程度上得到了解决。一种非常有效的标准方法是使用基于排列的特征重要性(我已经在下面介绍了算法的详细信息)。使用它,您可以为您的回归/分类任务找到最重要的特征。
但是,这不适用于其他类型的系统。据我所知,没有固定的方法来计算时间序列预测和基于深度学习的方法等任务的重要性。当谈到顺序步骤(例如供应链预测)时,找到瓶颈/最重要的步骤是至关重要的。没有很好的方法可以做到这一点。我已经使用像条件依赖这样的概念来代替特定阶段的重要性,但这是一种 hacky 方法。如果你是一名机器学习工程师,正在寻找要掌握的概念,那么研究计算特征/阶段/组件