通过减少数据源的重复建设,提高数据透明度,可组合数据源将为企业带来更高的数据利用效率
在 TC24 用户大会上,Tableau 产品团队提出了一个非常重要的功能概念——可组合的数据源。这意味着你将很快能够对 Tableau 已发布的数据源进行连接、关联和修改,从而扩展支撑分析与解答棘手问题的数据源。
目前,这一概念已初步在 Tableau 2024.3 中落实。通过显示已发布数据源的数据模型,分析师可以直观了解数据模型语义,更自信地创建可视化。
为了帮助大家更轻松地理解与使用这项功能,就让我们跟随 Tableau Visionary(愿景领袖)Sean Miller 一起来看看吧~
Before & After,区别在哪里?
在讨论可组合数据源之前,首先要允许数据作者查看已发布数据源的底层数据模型。
之前,当用户连接到 Tableau 中的已发布数据源时,如果他们并非数据源所有者,那么这个数据源就像一个还没破译的“黑匣子”,除非第三方系统中有非常完善的文档记录了数据模型。
换句话说,由于缺乏可视性和详细的说明文档,用户无法看到底层的数据模型或理解数据源是如何构建的,这使得数据源的使用和分析变得困难。
因此,为了更直观地展示这个新功能,我们将对新、旧版本中的界面进行比较。首先,下图是 Tableau 2024.2 版本中已发布数据源的样子:
Before:Tableau 2024.2
如你所见,不仅功能有限,而且与我们习惯的视图完全不同。底部窗格预览了前 N 行,列出了列标题,与数据源创作体验一致。
但是,顶部视图仅列出了所有已发布数据源和有关每个数据源的元数据。想象一下,如果没有关于数据源细节的可视化展示,如何创建并推进 Tableau 已发布数据源的使用和灵活性。
现在,让我们将其与 Tableau 2024.3 中的新视图进行比较:
After:Tableau 2024.3
作为一名 Tableau 用户,你是否觉得似曾相似?是的!已发布数据源的数据模型以“Tableau 关系”的形式进行呈现。
其中,我们可以看到使用了哪些数据表,更重要的是能看到各个表之间的关系,就像你从头开始构建新数据源时创建的关系模型一样。PS:为了简单起见,Sean 使用的是我们都熟悉的 Superstore 数据模型。
此外,我们不仅可以看到数据表的名称及其“线条”,还能在单击每条线时,获得这条关系相关的更多信息。如下图,提示框里显示了 Order 表和 People 表通过 Region 字段关联在一起,并且这是一个多对多关系。作为创建者或探索者,这个信息更有助于我们创建分析内容。
适用于哪些实际分析场景?
假设,我们手上有一份跨国商贸集团的数据源,包含了此集团在全球各个地区拥有的产品、门店和客户数据。
如果想分析客户行为与门店位置的关系,需要确保使用的区域字段来自正确的表。然而,在单个数据模型中,我们可能有客户区域、门店区域、产品制造商区域等多个字段。
在这种情况下,通过使用新功能“显示已发布数据源的数据模型”来查看底层数据模型,创建者(Creators)和探索者(Explorers)就能够确保在分析中使用正确的区域字段。
结语:可组合数据源是未来
自从 Tableau 接连推出关系、多事实关系模型后,可以感觉到 Tableau 对于数据建模功能的规划已经到达了全新的层级。
显然,可视化底层数据模型的能力不仅让我们更深入地了解数据,还能为构建可组合的数据环境打下了坚实基础。通过减少数据源的重复建设,提高数据透明度,可组合数据源将为企业带来更高的数据利用效率,从而推动数据驱动型文化的蓬勃发展。
如需进一步了解已发布数据源,请回顾 Tableau 已发布数据源的最佳实践,或查看最新版本中的所有功能。