架构思维:通用系统设计方法论_从复杂度分析到技术实现指南

文章目录

  • Question
  • 订单履约
    • 原始架构
    • 痛点
    • 目标架构
    • 架构图说明
    • 关键设计点
    • 优点
  • 设计方法论
    • 复杂来源
    • 解决方案
    • 评估标准
      • 从设计原则出发
    • 技术实现 (以选型Redis为例)
      • Redis消息队列的实现细节
      • 高可用设计
  • 总结

在这里插入图片描述


Question

我们经常聊如何设计一个比较完善的系统(或子系统/模块/功能), 很多小伙伴往往忽略“系统设计思路”关键词,而是陷入某个技术点细节里,缺乏全局思维。

一般可以采用架构师的视角回答,即从全局技术视角阐述设计的过程

接下来通过一个案例,讲解如何从全局技术视角介绍技术方案。


订单履约

原始架构

在业务建设之初,考虑到快速开发与上线,用户下单后,订单系统通过 同步RPC 依次调用: 库存系统(扣减库存) → 支付系统(发起支付) → 物流系统(生成运单) → 营销系统(发放积分)。

在这里插入图片描述

但随着业务快速发展,通过 RPC 同步调用的问题逐渐暴露出来。由于过多地依赖其他系统,导致评论发布的接口性能很低,可用性也容易受到其他系统影响。而且每当点评系统需求上线时,其他系统都需要跟着进行联调测试,导致需求迭代速度缓慢。

痛点

  • 链路长、性能差(RT高);
  • 任一系统故障导致整个订单失败;
  • 联调测试成本高。

目标架构

通过 事件驱动架构 解耦,订单系统仅需发布订单事件,各子系统异步消费事件并处理。

在做系统架构升级改造时,如果有互联网设计理念,会很容易想到问题在于系统间的耦合度太高。解决办法就是采用异步化解耦,从而通过引入 MQ 消息管道,在架构上进行系统业务逻辑拆分,将原本强依赖的系统间的同步 RPC 调用变成异步消息触发

在这里插入图片描述

架构图说明

  1. 改造前架构(同步RPC):

    • 订单系统强依赖库存、支付、物流等子系统,形成链式调用。
    • 任一环节失败(如库存不足、支付超时)导致整个订单失败。
  2. 改造后架构(事件驱动):

    • 订单系统:仅负责发布订单事件(如 OrderCreatedEvent)到消息队列(Kafka)。
    • 消息队列:作为事件总线,解耦生产者和消费者。
    • 消费者系统
      • 库存系统消费事件并扣减库存;
      • 支付系统监听事件并触发支付;
      • 物流系统异步生成运单;
      • 营销系统发放积分。

关键设计点

  1. 事件驱动解耦

    • 订单系统无需等待下游系统响应,发布事件后即可返回用户。
    • 各子系统独立消费事件,故障隔离(如物流系统宕机不影响支付流程)。
  2. 消息队列选型

    • 选择 Kafka(高吞吐、持久化、分区顺序性)保障事件可靠传递。
  3. 消费者幂等设计

    • 通过事件唯一ID(如 event_id + 业务主键)避免重复处理。
  4. 补偿机制

    • 若库存扣减失败,触发事件回滚(如发送 OrderCanceledEvent)。

优点

通过事件驱动架构,系统间的强依赖被解耦为基于事件的异步协作。此方案适用于 长链路业务流程(如电商交易、保险理赔、物流配送),核心优势在于:

  • 提升系统吞吐量和可用性;
  • 降低跨系统联调成本;
  • 支持弹性扩展(消费者可独立扩容)。

设计方法论

对于上面的案例,如果我们直截了当地说“引入了 MQ 消息队列,做了系统解耦,采用异步消息通知的方式来触发系统调用” , 随便在网上搜一下都会有大量类似的解决方案。很难令人信服。

作为研发工程师,正确的思考方式是要拥有解决问题的思维。相比一上来就说用了什么技术,阐述解决思维更困难,因为解决技术问题的方法有很多,这是“术”,但解决技术问题的底层思维逻辑是一样的,这是“道”。

一般来说,都逃不过如下四个层面的:

  • 谈复杂来源;

  • 谈解决方案;

  • 谈评估标准;

  • 说技术实现。

接下里,再看个案例:当用户发表一条商品评论,后台的逻辑是点评系统会调用一系列的远程 API 接口,如调用风控系统、广告系统、消息系统……几个甚至十几个系统的接口

复杂来源

之所以要先分析系统的复杂度,是因为只有正确分析后才能明确设计原则,进而设计架构方案,整体项目才不会找错方向。

如果一个系统本来因业务逻辑复杂导致功能耦合严重,我们却设计了一个 TPS达到 10000/秒 的高性能架构,那么即使架构性能再优秀,也没有现实意义,因为技术设计没有解决主要问题的复杂度。这是很多研发工程师的通病,设计偏离了方向,只是为了设计而设计。

那么如何正确评估系统的复杂度呢? 通常分为功能性的复杂度和非功能性的复杂度两种。

在这里插入图片描述

从功能性复杂度方面来看, 产品业务发展快速、系统越来越多、协作效率越来越低。问题根源在架构上各业务子系统强耦合。于是引入消息队列解耦各系统,这是系统业务领域带来的本质上的复杂度,也就是功能性的复杂度,解决的是系统效率的问题。

此外, 还需要考虑非功能性的复杂度,例如高性能、高可用和扩展性等的复杂度的设计。

从非功能性复杂度方面来看,我们假设系统用户每天发送 100 万条消息,那么消息管道一天会产生 100 万条消息,再假设平均一条消息有 10 个子系统读取,那么每秒的处理数据,即点评消息队列系统的 TPS 和 QPS(Queries Per Second,每秒查询次数)就分别是 11(1000000/60*60*24)和 115(10000000/60*60*24)。

不过系统的读写不是完全平均的,设计的目标应该以峰值来计算,即取平均值的 4 倍。于是点评消息队列系统的 TPS 变成了 44,QPS 变成了 460,这个量级的数据意味着并不需要设计高性能架构方案。

接着还要考虑业务规模发展。架构设计的目标应该满足未来业务增长,我们把未来业务增长的预估峰值设定为目前峰值的 4 倍,这样最终的性能要求分别是:TPS 为 176,QPS 是 1840。这样的读写指标还达不到系统压测的性能基线,所以可以确定的是这个系统的复杂度并不在高性能问题上

对于点评系统来说,还需要考虑高可用的问题。假设消息队列挂掉,将导致用户评论发送失败,当然在用户体验层面,解决方式可以在页面端提示用户重新操作,但如果问题影响到了点评消息的读取,导致评论没有走风控策略,就会造成严重的影响。所以高可用性是点评系统的设计复杂度之一,包括点评写入、点评存储,以及点评消息的读取,都需要保证高可用性。

为了方便理解非功能性的复杂度,这里只分析了“高性能”和“高可用”这两点,在实际应用中,不同的公司或者团队可能还有其他方面的复杂度分析。例如有的公司会考虑安全性,有的公司会考虑成本等。

所以综合分析来看,点评系统改造的复杂度来源于两点。

  • 功能性复杂度:要解决业务发展带来的系统耦合、开发效率缓慢问题

  • 非功能性复杂度:要保证系统的高可用性


解决方案

在确定了系统面临的主要复杂度问题后,就有了明确的方案设计目标,这时就可以开始进行架构方案设计了。

方案核心思路优点缺点
MQ消息队列引入Kafka/RocketMQ解耦成熟、高吞吐运维复杂
Redis消息队列基于Redis List/PubSub实现轻量、低延迟需处理消息持久化
MySQL+内存队列异步写入MySQL,定时任务消费无新组件依赖扩展性差、单点风险

一般情况,至少要设计两到三套备选方案,考虑通过不同的技术方式来解决问题。方案设计不用过于详细,而是要确定技术的可行性和优缺点**。


评估标准

设计完三套解决方案之后,摆在眼前的问题就是需要选择最合适的一个。这就需要一套评估标准了。

在软件架构中,架构师常常会把一些通用的设计原则写到设计文档中,比如设计松耦合、系统可监控,这些原则似乎不常用,但好的架构师会通过设计原则来控制项目的技术风险。比如系统无单点,限制了系统技术方案不可出现单点服务的设计;再如系统可降级,限制了系统有具备降级的能力,进而约束了开发人员需要设计数据兜底的技术方案。

这些看似不重要的设计原则,其实是评估架构解决方案的重要手段。做系统架构,需要站在更高的层面考虑系统的全局性关注点,比如性能、可用性、IT 成本、投入资源、实现复杂度、安全性、后续扩展性等。这在不同场景的不同阶段会起到决定性作用。

那么针对案例中的点评系统来说,要如何评估方案呢?这要从点评系统的复杂度来源进行评估。

从设计原则出发

  1. 无单点原则:所有方案需支持集群部署。
  2. 可水平扩展:MQ和Redis天然支持,MySQL需分库分表。
  3. 可降级能力
    • MQ/Redis故障时降级到MySQL兜底。
    • 确保风控系统熔断后评论仍可发布(有损服务)。

常用手段主要有三种。

  • 限流,即抛弃超出预估流量外的用户。

  • 降级,即抛弃部分不重要的功能,让系统提供有损服务,如详情页不展示收藏的数量,以确保核心功能不受影响。

  • 熔断,即抛弃对故障系统的调用。一般情况下熔断会伴随着降级处理,比如展示兜底数据。

针对案例场景中三个解决方案的降级策略,在一般的情况下,我们默认数据库是不可降级的,MQ 和 Redis 都可以通过降级到数据库的方式做容灾处理。所以案例中的三个解决方案,MQ 和 Redis 要考虑降级到 MySQL 或其他方式,这里就还需要根据情况投入降级的开发成本。

最终决策

  • 选择Redis方案:团队熟悉Redis,且业务规模在Redis能力范围内。
  • 关键考量:降低运维成本,快速落地。

通常来说,方案没有优劣之分,而是要看哪个更适合当下的问题,只要架构满足一定时期内的业务发展就可以。


技术实现 (以选型Redis为例)

Redis消息队列的实现细节

方案1:List结构(LPUSH/BRPOP)


方案2:Streams(Redis 5.0+)


高可用设计

  • Redis Cluster:多分片+主从复制,容忍节点故障。
  • 哨兵监控:自动故障转移,VIP切换。
  • 降级策略
    • Redis不可用时,写入本地MySQL队列,异步重试。
    • 风控系统熔断后,评论正常发布,但标记为“待审核”。

总结

架构师思维的本质

  1. 全局视角:在空间维度关注系统边界,在时间维度预见业务发展。
  2. 问题驱动:技术方案必须解决主要矛盾(如案例中的高可用)。
  3. 权衡思维:没有完美方案,只有最适合当前场景的决策。
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39245.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

llama源码学习·model.py[7]Transformer类

一、源码展示 class Transformer(nn.Module):def __init__(self, params: ModelArgs):super().__init__()self.params paramsself.vocab_size params.vocab_sizeself.n_layers params.n_layersself.tok_embeddings VocabParallelEmbedding(params.vocab_size, params.dim,…

MD2Card(markdown)

MD2Card 介绍: 1.小红书爆款神器,Markdown笔记秒转高颜值卡片 2.实时预览15种主题,自动拆长文,图片/SVG导出即用 3.零门槛不登录,免费无限生成,专治排版废和设计手残党 网站地址: https://md2…

第二节第一部分:String字符串

一、导包 二、String字符串 三、String注意事项 四、字符串的比较 五、面试例题 六、String案例一 需求分析: 代码: package com.StringTest;import java.util.Scanner;public class StingTest {public static void main(String[] args) {//1.开发一个…

动态规划(01背包恰好装满型详解):和为目标值的最长子序列长度

0-1背包:有n个物品,第i个物品的体积为w[i],价值为v[i],每个物品至多选择一个,求体积和不超过capacity的最大价值和。 对于第i个物品,我们只有两种选择:选,或者不选。如果选&#xf…

Spring漏洞再现

一、CVE-2017-8046 1、开环境 2、访问目录 /customers/1 3、在当前页抓包,并修改数据包 PATCH /customers/1 HTTP/1.1 Host: 150.158.199.164:8080 Accept-Encoding: gzip, deflate Accept: */* User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1;…

Ftrans飞驰云联受邀参加“2025汽车零部件CIO年会“并荣获智象奖

2025年3月6日,由栖观汽车、栖观资讯和飞羽商务主办的“2025第二届中国汽车&零部件CIO年会暨智象奖颁奖盛典”于上海盛大召开,Ftrans飞驰云联作为国内领先的企业文件传输与数据交换解决方案提供商,受邀出席了年会,并凭借卓越的…

西门子 CPU 1513-1 PN TCP Server 接收字符串前多了一个问号

TIA V17编程环境中(CPU 1513-1 PN),调用TSEND_C以TCP协议向TCP Server发送字符串:abded1234,TCP Server接收到的字符串多了一个问号:?avded1234. TSEND_C 指令的 DATA DB为非优化string类型数据 截图如下: 字符串前面两个字节不是起始字符,第一个是字节是字符串最大长度…

Matlab2024a免费版下载教程

Matlab是一个高性能的数学计算与仿真软件,广泛应用于科学计算、数据分析、算法开发以及工程绘图等多个领域。它提供了强大的矩阵运算能力、丰富的内置函数库以及灵活的编程环境,使得用户能够高效地解决复杂的数学问题。本文,我将为大家详细介…

SpringCould微服务架构之Docker(1)

项目中微服务比较多的时候,一个一个手动的部署太麻烦了,所以就需要用到Docker。 项目部署中的问题: Docker是一种快速交付应用、运行应用的技术。

软件公司高新技术企业代办:机遇与陷阱并存-优雅草卓伊凡

软件公司高新技术企业代办:机遇与陷阱并存-优雅草卓伊凡 在科技飞速发展的当下,软件公司如雨后春笋般涌现,众多企业渴望通过申请高新技术企业来获得政策支持与发展助力。随之而来的,是高新技术企业代办业务的兴起。然而&#xff…

动捕技术革新虚拟直播:解码虚拟主播的“拟真感“破局之路

在元宇宙技术加速落地的今天,虚拟直播已从早期的卡通形象展示,进化为具备情感交互的沉浸式体验,用户对"高拟真度互动"的需求也逐渐增加,这场行业变革的核心驱动力,离不开动捕技术的持续迭代。 虚拟直播的&q…

python字节码文件.pyc反编译成.py文件

一、前言 在 Python 开发过程中,.pyc 文件(Python 字节码文件)是 Python 解释器运行程序时生成的一种中间文件。它通常用于提高程序的运行效率,避免每次运行时都重新编译源代码。然而,由于各种原因,我们可…

C++友元:跨墙访问的三种姿势

目录 友元 友元之普通函数形式 友元之成员函数形式 友元类 友元的特点 友元 什么叫友元? 一般来说,类的私有成员只能在类的内部访问,类之外是不能访问它们的。但如果将其他类/函数设置为类的友元,那么友元类/函数就可以在前…

Typora安装使用教程 简单易用的Markdown编辑器

Typora markdown 编辑器下,最后一个免费版本 0.11.18,但可能会提示过期无法使用, 建议大家可以使用 0.9.96 Windows 版,下载 Windows X64 版。 Typora简介 Typora 是一款由 Abner Lee 开发的轻量级 Markdown 编辑器,与其他 Mark…

图解AUTOSAR_SWS_WatchdogInterface

AUTOSAR Watchdog Interface (WdgIf) 详解 AUTOSAR经典平台看门狗接口模块技术详解 目录 1. 概述 1.1 WdgIf模块的作用1.2 WdgIf在AUTOSAR中的位置2. 架构设计 2.1 WdgIf架构概览2.2 接口设计2.3 序列设计3. 配置详解 3.1 配置参数3.2 配置结构3.3 配置类型4. 总结 4.1 主要特点…

(Arxiv-2025)Magic 1-For-1:在一分钟内生成一分钟视频剪辑

Magic 1-For-1:在一分钟内生成一分钟视频剪辑 paper是PKU发布在Arxiv 2025的工作 paper title:Magic 1-For-1: Generating One Minute Video Clips within One Minute Code:地址 Abstract 在本技术报告中,我们提出了 Magic 1-For-1&#xff…

谷歌大型推理模型曝光!击败Claude-3.7-Thinking

哎!最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula,效果据说特别好,打败了o1、o3-mini、Claude 3.7 Thinking等模型: 网友们通过询问和分析 API,发现这似乎是谷歌正在秘密测试的新推理模型!推…

css-grid布局

文章目录 1、布局2、网格轨道3、间距Gap4、网格线5、网格别名 当一个 HTML 元素将 display 属性设置为 grid 或 inline-grid 后,它就变成了一个网格容器,这个元素的所有直系子元素将成为网格元素。 1、布局 启用grid布局类似与flex布局,不过g…

菱形虚拟继承的原理

一 :菱形继承的问题 普通的菱形继承存在数据冗余和二义性的问题 ,如下代码: class Person { public:string _name; //姓名 };class Student : public Person { protected:int _num; //学号 };class Teacher : public Person { protected:int…

<数据集>轨道异物识别数据集<目标检测>

数据集下载链接:https://download.csdn.net/download/qq_53332949/90527370 数据集格式:VOCYOLO格式 图片数量:1659张 标注数量(xml文件个数):1659 标注数量(txt文件个数):1659 标注类别数:6 标注类别…