自带谷歌“血缘”,越超Oracle,“蟑螂”成为分布式数据库新标杆?

ef5ba003654f13ab37fe3ac2b5412a1b.gif

a1217c8f2efc55de9525653886200560.png

b7582ff1cff83196ee1448b7f7210ce7.png

《中智观察》第1581篇推送

作者:赵满满

编辑:小瑞瑞

头图来源:摄图网be44683ff3f21bc7791aabe32a0e761d.png

Heroic labs是一家为游戏等用户提供分布式服务器架构的企业,满足游戏公司全球上百万用户24小时实时多人对抗游戏服务的需求。其中一项业务就是为客户从本地开发到投入生产提供相同的环境,而传统的数据库因为需要分区而难以在本地测试。

俗称蟑螂数据库的CockroachDB成为了Heroic labs的一个最终选择;

另一家提供博彩类游戏的公司kindred,主要是为全球用户提供高可用、低延时、强一致性的游戏数据如用户信息,以及超过200项业务的金融事务。

因此kindred需要高并发读写,支持多点写入,多副本数据强一致。传统的关系型数据库的分布式和强一致性表现差强人意。同样,kindred也选择了开源的分布式数据库CockroachDB。

2021年,大量投资投向基础软件——数据库领域。对于事务处理数据库的融资排行榜来说, CockroachDB 遥遥领先:年初就筹到1.6亿美元,后在12月又筹到2.78亿美元。

这个让友商恶心的“蟑螂数据库”,究竟是何方神圣?

81d2c207ce04594b65f84127ccf0d69c.png

b179db735c8b35d86531cda2985af736.png

融资创新高,CockroachDB估值会过百亿?

对于交易数据库来说,融资排行榜上号称蟑螂数据库的CockroachDB 遥遥领先。

2021年1月,CockroachDB背后的开源软件公司Cockroach Labs获得了1.6 亿美元的融资,估值达到20亿美元。

在2021年底,Cockroach Labs再获2.73亿美元的融资,现估值达到50亿美元。

这轮融资使Cockroach Labs迄今为止的总融资额达到6.281亿美元。

频频获得巨额融资的CockroachDB,未来即将跨入市值超百亿美元的开源软件公司。

云原生成为CockroachDB的重要旗帜。

数据库是业务逻辑和基础设施之间的分界线,在分布式系统中处于非常重要的位置。在当前云原生大趋势下,企业需要考虑用云原生数据库重建遗留系统。

凭借Comcast、eBay和Nubank等大型客户,Cockroach Labs在过去一年里收入增加了一倍以上。随着数据库即服务(Database-as-a-service)使用者增多,Cockroach Labs上2021年第三季度的云收入增长了500%。

数据表明,该公司有一半客户使用了云托管服务。基于数据库的云版本,用户可以按小时定价模式在亚马逊云科技、Google Cloud等云服务上使用。

因为当前的云原生热潮,2020 年“云原生”数仓企业Snowflake市值在一年内从120亿美元飙升至1200亿美元。而在2018年初,Snowflake的估值也只有15亿美元。

2015年,Cockroach Labs开始使用云原生开源环境重写数据库,帮助公司创建可以随需求变化而扩展的软件。该公司的管理系统已帮助企业在新冠疫情期间更快地将其功能转移到云上。

CockroachDB是公司专有的云原生数据库,旨在帮助Cockroach Labs在与由Microsoft Azure,AWS、甲骨文等主导的云世界中竞争。同时也与大量的其他数据库初创公司竞争。

fa7efd561875d386727a358a0bd813e8.png

CockroachDB另一个看家本领是数据隔离和高可用性特性。

CockroachDB是一个分布式的SQL数据库。首要设计目标就是可扩展性、强一致性、可存活性,与它的蟑螂名字一样。

CockroachDB的目标是在无人工干预的情况下,以极小的中断时间容忍磁盘、主机、机架甚至数据中心灾难。CockroachDB 的节点是对等的,部署去中心化的。

2021年11 月,Cockroach Labs发布了 CockroachDB 21.2 版本。CockroachDB云原生SQL数据库与Kubernetes兼容,该公司宣称即使在重大技术故障(如数据中心内的整个服务器机架都脱机)的情况下,CockroachDB仍可保持企业信息的可访问性。

54e2e4d06558f5e727820a4deb936636.png

带有谷歌“血统”的创新团队

谷歌素来以工程师文化闻名于世,为业界贡献了大量成功的开源软件。

近十年来,Google为业界贡献了大量影响深远的论文,也催生了许多优秀的开源产品,如MapReuce、Google File System、Bigtable、Percolator、Pregel、Dremel、Spanner,其中Hadoop、HBase成为大数据处理、储存的通用平台,Spanner更是成为分布式数据库的“祖师爷”。

CockroachDB也带有谷歌的血统。2015年谷歌工程师Spencer Kimball、Peter Mattis和Benjamin Darnell创立Cockroach Labs,团队成员有Big Table、GFS、Colossus、Gmail等项目背景。

edfa3d23ecd87aa95d417eea40715393.png

 Cockroach Labs联合创始人、CEO Spencer Kimball

以蟑螂为项目命名,旨在建立Spanner的精简开源版本——CockroachDB,一个分布式的NewSQL交易型数据库。

CockroachDB实现了NewSQL。

对于MySQL、Oracle、PostgreSQL这样的单机数据库,随着数据量的增长,在计算容量和存储容量上都会出现问题。

2010年,Google发起了NoSQL的运动。为了简单,NoSQL牺牲了传统关系型数据库的一些性能,允许商品化硬件透明地扩展。自此分布式数据库开发可以像使用单个数据库一样,同时这个数据库背后的数据库集群所能支持的数据量也达到闻所未闻的程度。

但是NoSQL最终成为了开发人员的致命弱点,不得不使用越来越复杂的应用程序逻辑来处理NoSQL所缺失的一些功能,比如事务处理。NoSQL面临的这些问题需要下一代的数据库系统设计来解决一致性和事务性问题。

2011年分析师Matthew Aslett首次提出NewSQL概念,期望将NoSQL和传统的数据库的优势融合,将现有数据库存在的缺陷在下一代中解决掉。而Google首先将这一概念工程化,提出Spanner。

Spanner允许Google将数据分布到全球上百个数据中心的上百万台服务器。系统的开发大约会耗时5年,离普通用户实际应用很遥远。

而CockroachDB 则致力于实现Spanner系统,并让NewSQL在用户的应用场景中落地。

正像CockroachDB所言,蟑螂实验室(Cockroach Labs)的目标是建立一款优秀的分布式数据库产品,让数据变得简单(Make Data Easy)。

CockroachDB的几大优势。

数据库是世界上每个企业的心脏,支撑着小至几个简单的表格,大到成千上万台服务器。

并且他们进化的速度非常快。

大型企业随着业务的发展,事务型工作负载开始出现跨地理位置的趋势,同时也出现了对数据放置位置的细粒度控制以及高性能。

其需求概括为三点:一是遵循所在地区的数据本地化合规要求,同时尽量保证数据就近访问以提供高性能;为用户提供高可用的服务,容忍哪怕是region级的失效;简化上层应用的开发,提供SQL的操作接口和可串行化的事务语义。

CockroachDB就是一款面向具有全球级用户的企业或组织,基于云平台提供扩展性、高可用性、强一致性和高性能的OLTP事务型数据库。如其蟑螂名字,具有很强的容灾和自动恢复能力。

为此,CockroachDB通过多副本提供容错能力,通过自动化的快速恢复实现高可用能力;通过share-nothing架构,可以自动实现水平扩展,它内部基于一些启发式规则来决定数据的放置方式,用户也可以为数据设置分区方案,并从分区粒度上控制数据的放置位置;事务协议非常严格且对性能做了大量优化,支持跨分区事务和可串行化的隔离级别并且不依赖任何特殊的硬件,只需要常规服务器和基于软件的时钟同步协议,因此可以做到跨云部署。

31c7a25d891eca41bb1d516a35648762.png

Cockroach Labs推出无服务器版本的SQL数据库

在无服务器技术兴起的时候,CockroachDB也于2021年10月推出了其无服务器版本SQL数据库的公开测试版,为开发者提供了一种更容易和低成本的方式来访问数据库资源。这些资源可以向上和向下扩展,而不需要明确定义。

CockroachDB联合创始人兼首席执行官Spencer Kimball说,无服务器版本的目标是为开发者降低复杂性,同时提供按细化的使用量计费,用户只需为所使用的确切内容付费。

最关键的是,采用无服务器的数据库方法,可以为开发人员消除所有的容量规划和与之相关的一切问题。这意味着他们不再需要预测运行应用程序所需的节点或机器类型,而是简单地指向Cockroach无服务器数据库,它将提供运行工作负载所需的确切资源数量。

618cea899902b8c81e4ad8fbac5cee63.png

开源数据库正成主流,但商业化面临挑战

开源数据库在数据库市场占据半壁江山。

放眼世界,许多开源软件项目为全球主要行业带来了转型创新,例如,在数据处理和存储领域出现Spark、Ceph、Hadoop、Kafka,在数据库领域出现MongoDB、CockroachDB、Neo4j、Cassandra等。

而在操作系统领域,Linux和FreeRTOS独领风骚。

半导体(RISC-V)、网络/ CDN(Envoy,Varnish)、软件工程(Docker,Go)、计算(Kubernetes),搜索(ElasticSearch)、AI(TensorFlow,PyTorth)等领域的开源项目更是世界无限延伸。

在数据库领域,商用软件与开源系统在2021年实现了黄金交叉,开源系统的使用率首次超过商业系统。

203fc0d5e6ef1e89ba4d56d6aab78c2b.png

在国内,国产数据库开源颇为引人关注。从OceanBase对外宣布开源,到PorlaDB最新的开源动态,再到华为openGuass开源。在近两年来,国内数据库在开源领域不断发力。

从文档数据库MongoDB、图数据库Neo4j、时序数据库Cassandra,到CockroachDB,开源数据库塑造一个个发展传奇。

2021年,大量投资投向数据库公司。

交易型数据库依然是其中一个重要的投资方向。其中Yugabyte 获得了1.88亿美元的C轮融资。PlanetScale 推出了价值2000万美元的B系列,用于其托管版 Vitess。作为相对较老的NoSQL数据库, DataStax 也在一轮风险投资中为其 Cassandra 业务筹集了3760万美元。

令人称奇的是在2021年12月,甲骨文的创始人Larry Ellison超越了谷歌创始人Larry Page和Sergey Brin,成为了世界上第五位最富有的人。Larry Ellison在2021年12月的一天里赚了160亿美元,因为甲骨文的股票在这一天快速增长速度,数据库业务让甲骨文公司辉煌的40多年。

开源数据库商业化正面临运服务商等多重挑战。

在国外,为了适应数据库开源商业化的需要,几个著名的开源数据库不断修改开源协议,一方面是要通过许可协议,限制云服务商的数据库托管服务收费,但另一方面,也给用户和行业带来不同的困扰。

CockroachDB也不能独善其身,于2019年将开源协议修改为BSL,限制商业构建DBaaS。

数据库软件MongDB、Redis Lab、图数据库Neo4j等在2018年就修改过相关的开源许可协议,以改变其在数据库商业化方面面临的被“吸血”困境。

Cockroach官方表示,一些大公司可以直接在业务中高度集成竞争对手的开源核心软件,并将其以服务的形式(XX as a Service)提供给用户。

为了回应这一类竞争对手,Cockroach对核心源码的开源协议进行修改,从原本的Apache 2.0 协议修改为BSL(Bussiness Source License)。

在该协议之下,CockroachDB用户可以将CockroachDB扩展到任意数量的节点,可以使用 CockroachDB或将其嵌入到其应用中,无论是将这些应用分发给客户,还是将其作为服务运行,甚至还可以在内部将其作为服务运行。

但是唯一不能做的是在没有取得授权的情况下,以商业形式用 CockroachDB 提供数据库即服务(DBaaS)。

同时,BSL还具有滚动时间限制,具体到 CockroachDB 中,其每一个版本在基于BSL发布三年后,License将切换为标准定义的开源协议Apache 2.0。这个举措一方面可以使 CockroachDB官方维持一个有竞争力的DBaaS,另一方面也保证了CockroachDB 核心还是纯粹的开源项目。

改开源软件许可协议,必然会对大量用户生产重大影响,尤其会对公有云上的用户造成冲击。如何规避影响,保证应用稳定持续运营,是大量用户面临的一个主要问题。

另外,在开源软件得到大量应用的情况中,用户不得不面对开源软件协议修改带来的巨大风险。

未来,CockroachDB能否项蟑螂一样,繁衍、生长,并成为几千年来唯一存活的生物呢?我们不妨骑驴看唱本走着瞧。

d86511d357282ba03599aa29d67aa6d4.png

93bd9e0e077f202ec9f94b1017991aec.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9103.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【生活中的逻辑谬误】稻草人谬误和无力反驳不算证明

目录 1 稻草人谬误 The Straw Man Fallacy 2 无力反驳不算证明 The Inability to Disprove Does Not Prove 【引】 在生活中避免犯逻辑谬误,就可以在计算相关的工作中更好地运用逻辑思维,目前介绍了 【生活中的逻辑谬误】对人不对事和两难陷阱_苹果二…

蟑螂随机走动问题(数据结构图问题)

一、问题概要 1.1 题 目: 《随机走动》 1.2 初始条件: 一只贪杯的蟑螂醺醺然在室内地面游荡。地面铺满方砖,共计m*n块,构成大面积矩阵。蟑螂在方砖间随机爬行,可能想撞大运,找片阿司匹林解酒。假定蟑螂从…

CodeSmith 简单使用和常用模板

1、简介 CodeSmith 是一种基于模板的代码生成工具,它使用类似于 ASP.NET的语法来生成任意类型的代码或文本。 2、软件布局 整体布局和visual studio系列相似,用过VS开发对此软件布局会很熟悉,加上模板语句类似ASP.NET对.NET开发人员相对友…

蟑螂背上芯片板子,组队去救人类

丰色 发自 凹非寺量子位 | 公众号 QbitAI 一头大蟑螂,背上“大背包”,和几百只同伙一同出发,浩浩荡荡杀到一片废墟。 这这这……是要干啥? 去救人! 它们的“背包”里有摄像头、有各种传感器,可以检测到废墟…

Python基于OpenCV监控老鼠蟑螂检测系统[完整源码&部署教程]

1.视频演示: [项目分享]Python基于OpenCV监控老鼠蟑螂检测系统[完整源码&部署教程]_哔哩哔哩_bilibili 2.图片演示: 3.明厨亮灶: 餐饮企业的厨房卫生状况一直饱受消费者诟病,许多宾馆饭店大厅、包间富丽堂皇&#x…

国外科学家发明激光炮打蟑螂!AI自动识别,项目开源!

如果有一种生物,能让堂堂八尺猛男,吓得大惊失色,屁滚尿流。 除了北方“小强”,就是南方“大强”了! 不光个大,还会飞! 想想自己睡眼朦胧上个厕所,或者迷迷瞪瞪到厨房拿个夜宵&#x…

【运筹优化】CSO蟑螂算法求解无约束多元函数最值(Java代码实现)

文章目录 一、前言二、优化目标三、求解结果四、迭代结果可视化五、算法流程图六、Java代码实现6.1 算法部分代码6.2 可视化部分代码 一、前言 本文以求解二元函数最小值为例,如果需要求解多元函数,只需要修改以下变量即可: varNum&#xf…

基于OpenCV监控老鼠蟑螂检测系统[完整源码&部署教程]

1.视频演示: [项目分享]Python基于OpenCV监控老鼠蟑螂检测系统[完整源码&部署教程]_哔哩哔哩_bilibili 2.图片演示: 3.算法原理: 该博客提出的移动侦测即是根据视频每帧或者几帧之间像素的差异,对差异值设置阈值&am…

蟑螂相关菌与人类健康风险

谷禾健康 说起蟑螂,大部分人都不太喜欢,甚至生理性恐惧... 你可能有100个讨厌它的理由,见到它就想消灭它,然而怎么都灭不完... 算起来,蟑螂早在3亿年前就已经存在了。蟑螂在线数据库中登记了4685种蟑螂(截止…

群体智能优化算法之蟑螂算法((Cockroach Swarm Optimization,CSO)

获取更多资讯,赶快关注上面的公众号吧! 文章目录 第十二章 蟑螂算法12.1 介绍12.2 聚集行为(Chase-Swarming behavior)12.3 分散行为(Dispersing behavior)12.4 残忍行为(Ruthless behavior&…

李开复首谈ChatGPT:看好六大领域、三大投资机会

李开复表示,AI2.0的发展范式是迭代的,第一阶段是人机协同,第二阶段是局部自动,第三阶段是全程自动。 基于此,李开复提出,AI2.0将在六大领域加速点燃商业潜能,进入提升生产力的应用井喷期。 第一…

精选|商汤4月10号将发布大模型,3万字实录、腾讯研究院,真格基金chatgpt深度报告...

点击上方“Python与机器智能”,选择“星标”公众号 第一时间获取价值内容 一、商汤(4月10号将发布大模型)报告 这是由商汤(4月10号将发布大模型)一个半小时,近3万字的实录,解答关于人工智能,大模型的非常多关键问题,强…

企业如何稳定、安全使用ChatGPT?

随着人工智能技术的不断发展,商业模式正在发生颠覆。ChatGPT作为当下最热门的AI技术之一,已经在各行各业中广泛应用。 ChatGPT技术的应用可以使企业更高效、更智能地处理业务需求,大幅提升各类型工作任务的完成效率。 然而对于国内企业&#…

国内企业开发出类ChatGPT模型

最近,一款由国内高新技术企业开发的类ChatGPT模型问世,据悉该模型自主积累了40TB的数据集,还可以自动生成高达100G以上的优质语料,被称为“硅基知识大模型”。 该模型不仅具备了ChatGPT的功能,对数据的本地化的优化更好…

ChatGPT的快速发展究竟给我们带来了什么?

😚一个不甘平凡的普通人,致力于为Golang社区和算法学习做出贡献,期待您的关注和认可,陪您一起学习打卡!!!😘😘😘 🤗专栏:算法学习 &am…

图观 | ChatGTP是如何通过知识图谱回答问题的?

文/Emma Z 1950年,图灵发表了具有里程碑意义的论文《计算机器与智能》(Computing Machinery and Intelligence),提出了一个关于机器人的著名判断原则——图灵测试,也被称为图灵判断,它指出如果第三者无法辨…

Java程序员摸鱼技巧,推荐这9个 !

小编给大家推荐几个优质的公众号 他们都是各领域的资深主理人 他们的每一个公众号都值得你关注 简说Python RECOMMEND 推荐理由: 关注「简说Python」遇见老表,AI与数据分析的探索者!Python学习路上的伙伴,原创文章超200篇。涵盖P…

LLM探索:环境搭建与模型本地部署

1前言 最近一直在炼丹(搞AIGC这块),突然发现业务代码都索然无味了… 上次发了篇AI画图的文章,ChatGPT虽然没法自己部署,但现在开源的LLM还是不少的,只要有一块差不多的显卡,要搞个LLM本地部署还…

超越诺奖?生物界「ChatGPT」首次实现从零合成全新蛋白,登Nature子刊!喂了2.8亿种氨基酸序列...

新智元报道 编辑:好困 Aeneas 【新智元导读】这家成立三年的小初创公司,首次利用深度学习语言模型合成出了自然界中不存在的全新蛋白质,引爆蛋白质设计革命。 人工智能的应用,已经极大地加速了蛋白质工程的研究。 最近&#xff…

【R】Mac如何配置R和RStudio

前言 本篇文章将讲述如何在Mac上配置R和RStudio,惯例是先看看chatgpt会怎么回答这个问题: miniconda配置R和RStudio( Mac m系列芯片暂不适用) 安装R 在终端中执行一下命令 conda search -c conda-forge r-base # 备注-c conda…