网络传输,请每次都开启 TCP_NODELAY

在这里插入图片描述

原文:Marc Brooker - 2024.05.09

(注:不必过于担心这个问题,大部分现代库,语言(如 Go),代理(如 Envoy),都默认设置了 TCP_NODELAY。如果遇到网络延迟问题,可再检查该套接字选项。)

我们已经不再生活在上世纪 80 年代了,谢天谢地!

在调试分布式系统的延迟问题时,我首先检查的就是 TCP_NODELAY 是否启用。不仅仅是我,我认识的每个分布式系统构建者,都曾因为启用了这个简单的套接字选项而迅速修复了延迟问题,这说明默认行为是错误的,也许整个概念都过时了。

首先,要明确我们在讨论什么。没有比 John Nagle 1984 年的 RFC896 更好的资料来源了。下面是问题陈述:

有一个与小数据包相关的特殊问题。当 TCP 用于传输源自键盘的单字符信息时,典型的结果是每传输一个字节的有效数据,就要传输 41 个字节的数据包(1 个字节的数据,40 个字节的报头)。这 4000% 的开销虽然令人讨厌,但在负载较低的网络中还是可以忍受的。

简单地说,Nagle 想要更好地摊销 TCP 报头的成本,以便从网络中获得更好的吞吐量。吞吐量最多可提高 40 倍!造成这些微小数据包的主要原因有两个:一是像 shell 这样的人机交互应用程序,人们一次只输入一个字节;二是程序的实现不佳,通过多次 write 调用向内核发送信息。Nagle 提出的解决的方案既简单又聪明:

我们已经找到了一个简单且优雅的解决方案。

这个解决方案就是,当用户发送新数据时,如果网络连接上之前传输的任何数据仍未被确认,则禁止发送新的 TCP 段。

很多人在谈到 Nagle 算法时都会提到计时器,但 RFC896 并没有使用除网络往返时间以外的任何计时器。

Nagle 的算法与延迟确认

Nagle 清晰、简洁的提案与另一个 TCP 功能交互不畅:延迟确认。延迟确认背后的理念是延迟发送对数据包的确认,至少要等到有数据要回传(例如 telnet 会话回传用户输入的内容),或者等到计时器到期。1982 年的 RFC813 似乎是第一个提出延迟确认的文件:

数据接收方在某些情况下将不发送 ACK,在这种情况下,接收方必须设置一个计时器,使 ACK 在稍后发送。不过,接收方只有在可以合理推测会有其他事件介入,从而避免定时器中断的情况下,才应该这样做。

随后,在 1989 年的 RFC1122 中,得到了进一步的正式规定。这两个特性之间的相互作用引发了一个问题:Nagle 算法会阻止发送更多数据,直到收到一个 ACK;而延迟确认则会延迟该 ACK,直到准备好一个响应。这对于保持数据包满载很有帮助,但对于延迟敏感的高并发应用就没那么好了。

这也是 Nagle 自己多次提出的观点。例如在这个 Hacker News 评论 中:

这仍然让我感到恼火。真正的问题不是防止小报文。而是 ACK 延迟和那个愚蠢的固定计时器。这两个问题大约同时出现在 TCP 中,但各自独立。在 1980 年代初,我做了小报文优化的 Nagle 算法,伯克利做了延迟确认。两者的结合非常糟糕。

作为系统建设者,这种情况应该不陌生:系统中两个合理的特性相互作用,产生了不良行为。这种相互作用正是协议设计之所以如此困难的原因之一。

Nagle 算法真的无可指责吗?

遗憾的是,问题不仅仅在于延迟确认。即使没有延迟确认和那个愚蠢的固定定时器,在分布式系统中,Nagle 算法的行为可能也不是我们想要的。单个数据中心内的 RTT 通常约为 500 微秒,同一区域内的数据中心之间为几毫秒,全球范围内则高达数百毫秒。考虑到现代服务器在几百微秒内就能完成大量工作,即使延迟一个 RTT 发送数据也不会有明显的优势。

为了更清楚地说明这一点,让我们回到 Nagle 算法背后的理由:摊销报头成本,避免单字节数据包的 40 倍开销。但现在还有人发送单字节数据包吗?大多数分布式数据库和系统都不会。部分原因是它们有更多的数据,部分原因是 TLS 等协议的额外开销,部分原因是编码和序列化开销。但最主要的是,它们有更多的内容和数据。

不发送微小信息的核心问题依然存在,但我们已经非常有效地将其推向了应用层。无论 Nagle 算法如何处理,一次发送一个用 JSON 封装的字节都不会非常高效。

还需要 Nagle 算法吗?

首先,没有争议的观点是:如果你正在构建一个对延迟敏感的分布式系统,并在现代数据中心级别的硬件上运行,那么请放心启用 TCP_NODELAY(禁用 Nagle 算法)。你不必感到难过,这不是罪过。没关系,放手去做吧。

更有争议的是,考虑到流量和应用程序的组合,以及我们今天所拥有的硬件能力,我怀疑现代系统并不需要 Nagle 算法。换句话说,TCP_NODELAY 应该是默认设置。这将使一些“写入每个字节”的代码变得比原来更慢,但如果我们关心效率,无论如何都应该是修复这些应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/327121.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

光耦 IS314W中文资料 IS314W引脚图及功能说明

IS314W是一款IGBT/MOSFET输出型光耦,由Isocom公司制造。它主要用于驱动用于电机控制和电源系统变频器的功率IGBT和MOSFET。以下是该产品的部分功能和参数: - 两个独立的光耦输出通道 - 轨对轨输出电压 - 最大峰值输出电流:1.0A - 最小峰值输…

DDoS攻击揭秘与网站防护策略

DDoS攻击(分布式拒绝服务攻击)是一种利用大量被控制的计算机或智能设备(如僵尸网络)对目标网站或服务器发起大量无效请求或数据流量,从而导致目标系统资源耗尽、服务崩溃或无法处理正常请求的攻击方式。这种攻击通常是…

【cpp】并发多线程 Unique

1. unique_lock 何时锁定资源。 unique_lock lock1 时候&#xff0c;还没有锁住资源。 实际是后面&#xff0c;显式的出发&#xff1a; 比如&#xff0c; lock.lock, 或 std::lock(lk1,lk2), 或者条件变量CV.wait(mtx, []{!re})。 #include <iostream> #include <mu…

《大数据分析-数据仓库项目实战》学习笔记

目录 基本概念 数据仓库 数据仓库整体技术架构 数据仓库主题 数据集市 数据仓库的血缘关系 数据仓库元数据管理 数据仓库的指标 数据仓库维度概念 HDFS Flume Hadoop Kafka 数据仓库分层模型 Superset 即席查询 Sqoop Atlas元数据管理 项目需求描述 系统目标…

python 对矩阵与矩阵之间对应位置的元素,做softmax操作,代码实战

1.对矩阵中对应位置的元素&#xff0c;做softmax 对于一个向量&#xff0c;softmax函数会对其中每一个元素进行指数运算&#xff0c;然后除以所有元素指数和的结果。当将其应用到多个矩阵的相应位置上时&#xff0c;我们实际上是在对每个位置的一组数&#xff08;从各个矩阵的同…

pyqt学习过程中的问题

1&#xff0c; 2. 3.传递参数&#xff1a; 第二个函数缺少参数self, 第三种方法&#xff1a;可以使用 lambda 表达式 # 连接按钮的点击信号到槽函数&#xff0c;传递一个参数 self.button.clicked.connect(lambda: self.onButtonClicked(10))def onButtonClicked(self, value)…

基于ChatGPT 和 OpenAI 模型的现代生成式 AI

书籍&#xff1a;Modern Generative AI with ChatGPT and OpenAI Models: Leverage the capabilities of OpenAIs LLM for productivity and innovation with GPT3 and GPT4 作者&#xff1a;Valentina Alto 出版&#xff1a;Packt Publishing 书籍下载-《基于ChatGPT 和 Op…

Taro 快速开始

大家好我是苏麟 , 今天聊聊Trao. 官网 : Taro 介绍 | Taro 文档 (jd.com) 点击快速开始 全局安装 CLI 初始化一个项目 选择配置 : 根据自己需求选择 安装失败先不用管 , 用前端工具打开项目 npm install 安装 , 显示安装失败 怎么解决 ? : 查看报错信息 百度 , 问 AI 工具 运…

【Docker系列】Linux部署Docker Compose

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

前端无样式id或者class等来定位标签

目录&#xff1a; 1、使用背景2、代码处理 1、使用背景 客户使用我们产品组件&#xff0c;发现替换文件&#xff0c;每次替换都会新增如下的样式&#xff0c;造就样式错乱&#xff0c;是组件的文件&#xff0c;目前临时处理的话就是替换文件时删除新增的样式&#xff0c;但是发…

【C++11】std::async函数介绍及问题梳理

目录 &#x1f31e;1. std::async 简介 &#x1f31e;2. 问题梳理 &#x1f30a;2.1 std::async 到 future get 直接调用会如何抛异常 &#x1f30a;2.2 std::async 如果通过劫持让 new 内存不够&#xff0c;有没有可能抛异常 &#x1f30a;2.3 std::async 如果系统线程不…

电商平台接口自动化框架实践||电商API数据采集接口

电商数据采集接口 语言&#xff1a;python 接口自动化实现流程 红色为可实现/尚未完成 绿色为需要人工干预部分 自动生成测试用例模板&#xff08;俩种方式二选一&#xff09;&#xff1a; mimproxy&#xff0c;通过浏览器代理抓包方式&#xff0c;访问 H5 或者 web 页面&a…

万物生长大会 | 创邻科技再登杭州准独角兽榜单

近日&#xff0c;由民建中央、中国科协指导&#xff0c;民建浙江省委会、中国投资发展促进会联合办的第八届万物生长大会在杭州举办。 在这场创新创业领域一年一度的盛会上&#xff0c;杭州市创业投资协会联合微链共同发布《2024杭州独角兽&准独角兽企业榜单》。榜单显示&…

【强化学习-Mode-Free DRL】深度强化学习如何选择合适的算法?DQN、DDPG、A3C等经典算法Mode-Free DRL算法的四个核心改进方向

【强化学习-DRL】深度强化学习如何选择合适的算法&#xff1f; 引言&#xff1a;本文第一节先对DRL的脉络进行简要介绍&#xff0c;引出Mode-Free DRL。第二节对Mode-Free DRL的两种分类进行简要介绍&#xff0c;并对三种经典的DQL算法给出其交叉分类情况&#xff1b;第三节对…

Tomcat的实现

在一台电脑上启动tomcat&#xff0c;tomcat是server&#xff0c;即服务器。服务器只会被实例化一次&#xff0c;tomcat这只猫就是服务器。服务器下包含多个子节点服务&#xff0c;即service&#xff0c;顾名思义就是对外提供服务。服务器通常只有一个服务&#xff0c;默认是卡特…

申请免费的域名证书

免费域名证书主要是由一些证书颁发机构&#xff08;CA&#xff09;提供的&#xff0c;用于为网站启用HTTPS加密的数字证书&#xff0c;目的是保障网站数据传输的安全性。这些证书的特点和获取途径如下&#xff1a; 功能与目的&#xff1a;免费域名证书能够帮助网站实现基本的加…

Edge浏览器自动翻译功能按钮不见了

前言&#xff1a; 平时偶尔会用到Edge的页面翻译功能&#xff0c;使用挺方便。突然发现Edge浏览器的翻译功能不见 了。如下图所示&#xff1a; 解决思路&#xff1a; 1、从网上找各种解决方案也没有解决&#xff0c;其中有一个说到点右上角的三个点 2、点击设置…

有哪些值得买的开放式耳机推荐?2024年开放式运动耳机选购指南

开放式耳机因其独特设计&#xff0c;能在一定程度上保护听力。相较于传统封闭式耳机&#xff0c;开放式设计允许周围环境声音自然流入耳内&#xff0c;降低了耳内共振和声压&#xff0c;减少了耳道的不适感&#xff0c;从而减轻了对听力的潜在损害。对于追求音质与听力保护并重…

均线金叉死叉及应用案例

5日均线和10日均线交叉 5日均线和10日均线交叉指的是5日和10日均线的相互交汇,根据5日均线运行方向的不同可以分为两种交叉。一是5日均线向上运行并交叉10日均线,二是5日均线向下运行并交叉10日均线,前面的交叉被称为金叉,后面的交叉被称为死叉。 技能解析: 5日均线和10日均…

N5183B是德科技n5183b信号源

181/2461/8938产品概述&#xff1a; 简  述&#xff1a; N5183B 频率范围&#xff1a;9 kHz 至 20 GHz&#xff0c;具有 AM、FM、相位调制功能。N5183B MXG X 系列微波模拟信号发生器拥有 9 kHz 至 40 GHz 的频率覆盖范围&#xff0c;以及接近 PSG 级别的相位噪声性能&…