数据科学已死?

既然有了人工智能,训练自己的机器学习模型是否还值得?

既然有了人工智能,学习 Python 是否还值得?

既然有了人工智能,KNIME 还在营业吗?

既然有了人工智能,数据科学是否仍然需要?或者我们应该宣布它已死?

既然有了人工智能,我们还需要数据科学家吗?

在这一长串问题中,我还要加上我的个人疑问:既然有了人工智能,我们还需要平面设计师吗?

这些都是非常好的问题,虽然有点夸张。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

1、生成式AI已经成长起来

你可以要求 Gen AI 生成某某图像,它会生成。你可能不喜欢它,你可以对其进行改进,但它会生成。或者你可以要求 Gen AI 围绕主题 X 写一首诗,它会生成。专业诗人可能不喜欢它,但它足以在朋友之间的餐桌上进行诗歌比赛。你还可以要求给圣诞老人写一封信,或者写一封关于产品 Y 不起作用的投诉信。在这两种情况下,都会如此。

图 1. KNIME 工作流使用 LLM 和 AI 节点创建对话代理并与其交互

所以,是的。Gen AI 可以生成文字或图像,非常适合日常任务。但是,它足够专业吗?它能写出一整本有意义的书或一部电影的情节吗?也许,如果你只是确切地说明要写什么,如何旋转它,但对于真正的专业工作来说,它可能还不够好。不过,它可能只适合世俗。

2、AI 可以编写 Python 代码

AI 可以几乎完美地编写 Python 代码。这不是很棒吗?编码时间减少,我们有更多的时间考虑要实现什么。

你读过 Dennis Ganzaroli 关于 1812 年拿破仑在俄罗斯战役的 Minard 图表的帖子吗?好吧,他有数据,他决定通过 KNIME Analytics Platform 提供的 Python 节点用 Python 对其进行可视化。

自 5.1 版以来,KNIME Analytics Platform 在其框架中集成了一些 Gen AI 功能,也称为 KNIME AI 或简称 K-AI。特别是,所有 Python 节点都在配置对话框中提供了一个 K-AI 聊天机器人,工作流构建者可以在其中寻求有关如何编写所需的特定 Python 代码的建议。

Dennis 基本上是在和 K-AI 闲聊,要求编写 Python 代码来可视化 Minard 的数据。虽然第一次尝试并不令人满意,但他不断完善它,并提出了 K-AI 接受并包含在草稿代码中的进一步建议。在不影响 Dennis 编写 Python 代码能力的情况下,这里 K-AI(KNIME 的人工智能代理)完成了所有工作。

注意。请记住,K-AI 是 KNIME 扩展,必须在安装 KNIME Analytics Platform Core 后单独安装。还请记住,要查询 K-AI,你需要使用 KNIME Community Hub 上的免费帐户登录。

3、AI 可以创建 KNIME 工作流程

K-AI 还可以创建 KNIME 工作流程。

图 3. K-AI 在 KNIME Analytics Platform 中的运行情况。请注意顶部的“问答”和“构建”模式

自 5.1 版以来,KNIME Analytics Platform 已在其框架(称为 K-AI)中集成了一些 Gen AI 功能,以帮助用户构建工作流。如果安装了 K-AI 扩展,KNIME Analytics Platform 工作台左上角的第四个选项卡将引导至 K-AI 聊天区。在这里,用户可以与 K-AI 聊天以获取建议(“问答”选项)或构建工作流(“构建”选项)。Vittorio Haardt 的这篇文章教您什么是 LLM,以及 K-AI 如何帮助您节省组装工作流的时间。

K-AI 在构建 KNIME 工作流方面不如编写 Python 代码那么专业,但其工作流构建技能正在一个又一个版本中快速提高。

4、数据科学家还能做什么?

所有这些新的 AI 功能听起来有点让人不知所措,让我们想知道我们还能做些什么。尤其是作为数据科学家、模型训练师、Python 程序员、KNIME 工作流构建者,我们还能做什么呢?

首先,AI 不会自己构建东西,不会训练模型,不会编写 Python 脚本,不会构建 KNIME 工作流,只是因为。需要有人告诉它如何构建以及如何构建。在 Dennis Ganzaroli 的文章中,作者必须给出任务,然后不断完善,直到结果符合他的预期。即使在使用 AI 作为支持时,项目所有者仍然需要在后续步骤中描述整个过程:构建什么、如何构建、从哪些数据构建等等。

其次,AI 不会检查正确性。AI 提供结果。评估这是否正确不是其任务的一部分。AI 仍然需要由专家用户检查正确性:检查数据科学的正确性和业务健全性。为此,我们需要一个熟练的最终用户,他知道必须实现什么以及如何实现。

如果结果不正确或与提示的任务不符,最终用户需要通过更好的提示对其进行改进,或者手动添加缺失的部分。这直接引出了第三点:AI 模型的微调。现在出现了微调 AI 模型的趋势。为此,你肯定需要数据科学家。

继续 AI 生成的图像和图形设计师的平行,AI 可以生成各种图像。但是,只有最后的图形设计师才能验证图像质量并在需要时帮助改进。最近,我看到了太多丑陋的图像,当人们告诉我它们是 AI 生成的时,它们并没有得到改善。能够使用 AI 生成图像并不意味着你就是图形设计师。能够纠正和改进它们才是。

5、我们还需要数据科学家吗?

综上所述,我们将不再需要纯粹的实施者。尤其是对于基本任务,人工智能将变得越来越好,将使纯粹的实施者变得不那么必要。然而,我们仍然需要了解数据科学过程及其数学要求、知道如何纠正和重新定向人工智能工作以及如何解释人工智能生成结果的专业人士。在实践中,我们正在从创建和训练模型和服务转向使用和改进它们。

长话短说,我们仍然需要数据科学家。不过,这个角色在未来可能会发生变化。它将更多地关注算法和数据科学过程,而不是编程。同时,低代码工具将使整个过程的实施更加平易近人、速度更快。我们将需要更多的通用数据科学家,他们精通算法的数学,善于沟通,并善于引导和纠正人工智能以实现预期结果。

6、数据科学死了吗?

数据科学可能没有死,但它肯定在发生变化。最好的数据科学家不是能够更快地编写代码的人,而是能够更好地指导数据科学项目的组装的人,同时考虑到数据集成、数据质量、数据历史、机器学习算法、结果解释和过程的正确性。

我们会变得更加通才吗?可能,在数据科学项目的初始阶段,我们需要更多的通才来更多地参与这个过程。然而,我们仍然需要专家数据科学家来审查和纠正人工智能的输出。就像平面设计师一样,数据科学家将利用人工智能更快地实施解决方案,但仍需要对人工智能提供的解决方案的质量保持警惕。


原文链接:数据科学已死? - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/405279.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

指挥调度平台——数字赋能,让出行更有温度

智慧交通指挥调度平台是基于信息技术和智能化系统的创新解决方案,旨在提升城市交通管理效率、改善交通流畅度、减少拥堵问题,以及增强城市交通运行的智能化水平。该平台整合了大数据分析、实时监测、智能优化算法等技术,为交通管理部门提供全…

牛!6个大模型的核心技术!

大家好,我是花哥。本文我们谈下火爆的大模型背后,有哪些的核心技术! 一、Transformer Transformer 是大模型的底层模型。在深度学习的早期阶段,循环神经网络(RNN)是处理序列数据的常用方法。尽管RNN及其变…

1.XV6环境配置

安装虚拟机 这个就不多说了,搞一台Ubuntu虚拟机即可,最好是通过vscode 用ssh远程连接进行实验会比较方便,具体怎么做可参考我这篇博客: VsCode配置SSH连接远程服务器(手把手,学不会打我)_vsco…

【GitLab】使用 Docker 安装 GitLab 1:配置 SSH 端口

使用 Docker 安装 GitLab 要求修改ssh端口 GitLab 使用 SSH 通过 SSH 与 Git 交互。默认情况下,GitLab 使用端口22。 要在使用 GitLab Docker 映像时使用其他端口,您可以执行以下操作之一: 更改服务器的 SSH 端口(推荐)。 更改 GitLab Shell SSH 端口。 更改服务器的 SSH …

数据链路层 III(介质访问控制)【★★★★★】

(★★)代表非常重要的知识点,(★)代表重要的知识点。 介质访问控制所要完成的主要任务是:为使用介质的每个结点隔离来自同一信道上其他结点所传送的信号,以协调活动结点的传输。 下图所示是广播…

ubuntu安装虚拟环境(tensorflow、torch)

一、安装需求 1、确保ubuntu可以ping通百度 2、设置好了pip镜像源,(具体可看:ubuntu配pip的源-CSDN博客) 二、安装虚拟环境(务必使用sudo进行) step1:执行安装命令 更改了pip默认使用pip3的…

基于WonderJourney生成电影级连续的3D场景视频

在本文中,我将详细记录在Windows环境下配置和使用WonderJourney项目的完整流程,包括环境搭建、常见问题的解决方案以及如何修改源码以兼容Windows系统。WonderJourney项目能够生成高度逼真的村庄视频,并允许用户通过配置文件对视频生成过程进行精细化控制。 由于官方文档在…

基于Java语言的能源管理系统-水电气热油数据采集系统

介绍 基于SpringCloud的能源管理系统-能源管理平台源码-能源在线监测平台-双碳平台源码-SpringCloud全家桶-能管管理系统源码 适用于建筑、工厂、商场、医院、园区、高耗能企业、城市双碳建设平台等的水、电、气、热、油等能源数据采集、加工、分析、预警、碳指标、碳排放计算…

vue使用axios请求后端数据

前后端分离项目的基础: 前后端跨域访问 vite.config.js中加入 // 1.为什么要跨域 //因为浏览器的同源策略,不同站点之间访问需要跨域 //实现跨域的方式:server: {proxy: {// 假设要跨域访问的后端 API 地址以 /api 开头/api: { //表示拦截以/api开头的…

域名注册查询方法

域名不仅是网站的地址标识,更是企业和个人在互联网上的身份证明。要确保自己的在线品牌安全,了解域名注册查询方法至关重要。本文将介绍几种常见的域名查询方式,帮助您轻松了解网络资产的归属。 1. WHOIS查询: WHOIS(…

产品经理-​​实习中的自我迭代(41)

实习中的自我迭代,优秀实习生必备素质 跟大家认识了之后,就要开始做事情了,那我们怎么做一个优秀的实习生呢?以下几点作为参考。 1. 目标明确 知道自己的工作为什么要做,要做到什么程度,目前存在什么问题,该…

C++11:右值引用、移动语义和完美转发

目录 前言 1. 左值引用和右值引用 2. 引用范围 3. 左值引用的缺陷 4. 右值引用的作用 5. 右值引用的深入场景 6. 完美转发 总结 前言 C11作为一次重大的更新,引入了许多革命性的特性,其中之一便是右值引用和移动语义。本文将深入探讨其中引入的…

如何科学设定短信群发频率

在利用短信群发作为营销策略时,平衡好发送频率至关重要。过于频繁的短信可能招致客户反感甚至被屏蔽,而发送不足则可能导致品牌信息被遗忘。因此,精准把握短信群发频率,是提升客户体验与品牌记忆度的关键。以下是几个常见行业短信…

Aop切面编程

学习视频 一、定义模型:订单保存模型,订单更新模型,业务层,日志模型 订单保存模型 /*** author durunwu* date 2024-08-20-21:04*/ Data public class SaveOrder {private Long id; }订单更新模型 /*** author durunwu* date …

Veritas NBU8.3.0.2 安装Master Server及汉化包(篇二)

一、环境自检阶段 1、Master角色地址为192.168.189.2,计算机名称为bakmaster,域名为sszz.com 2、防火墙均已关闭 二、安装Master Server 1、右击“Browser”以管理员身份运行 2、单击“NetBackup Server Software Installation” 3、忽略UAC告警&#…

iOS18升级出现白苹果、无法重启等问题,要怎么解决

随着苹果iOS 18系统beta版本的推出,不少用户在私信说升级后遇到了白苹果和无法重启等问题。这些问题不仅影响了大家的正常使用,还会导致数据丢失和系统崩溃。本文将详细介绍iOS 18升级后出现白苹果、无法重启等问题的原因及解决方法,帮助大家…

Mysql的相关编程基础知识

一. 配置MySQL 首先下载mysql-5.0.96-winx64,安装过程如下图所示。 1.安装MySQL 5.0 ​ ​ 2.选择手动配置、服务类型、通用多功能型和安装路径 ​ 3.设置数据库访问量连接数为15、端口为3306(代码中设置URL用到)、编码方式为utf-8 ​ 4.设…

Opencv-C++笔记 (20) : 距离变换与分水岭的图像分割

文章目录 一、图片分割分水岭算法理解分水岭算法过程 二、距离变换与分水岭距离变换常见算法有两种分水岭变换常见的算法步骤 主要函数c代码四、结果展示 一、图片分割 图像分割(Image Segmentation)是图像处理最重要的处理手段之一 图像分割的目标是将图像中像素根据一定的规则…

python之matplotlib (6 等高线和热力图)

等高线 import numpy as np import matplotlib.pyplot as pltdef f(x,y):return (1-x/2x**5y**3)*np.exp(-x**2-y**2) n256 xnp.linspace(-3,3,n) yx X,Ynp.meshgrid(x,y) plt.contourf(X,Y,f(X,Y),8,alpha0.75,cmapviridis) plt.colorbar() Cplt.contour(X,Y,f(X,Y),8,colors…

【Python机器学习系列】建立XGBoost模型预测小麦品种(案例+源码)

这是我的第344篇原创文章。 一、引言 对于表格数据,一套完整的机器学习建模流程如下: 针对不同的数据集,有些步骤不适用,其中橘红色框为必要步骤,欢迎大家关注翻看我之前的一些相关文章。前面我介绍了机器学习模型的二…