技术速递|使用 .NET 为 Microsoft AI 构建可扩展网关

作者:Kara Saucerman
排版:Alan Wang

Microsoft AI 团队构建了全面的内容、服务、平台和技术,以便消费者在任何设备上、任何地方获取他们想要的信息,并为企业改善客户和员工的体验。我们的团队支持多种体验,包括 Bing、Copilot、广告、地图和 Edge,并通过 Edge 新标签页、Windows 10 和 11 等入口点呈现,这些入口点每月有超过 10 亿活跃用户。我们意识到需要一个高性能且可靠的网关作为 Microsoft AI 的前端和入口层。这将使多个团队能够利用我们开发的通用功能来帮助运营业务并专注于客户体验和功能。在本文中,我们将介绍在 .NET 8 上借助 YARP 构建网关(代号为 CETO)的过程。
在这里插入图片描述

反向代理

在开始编写 CETO 之前,我们必须决定使用反向代理。我们应该使用外部的还是尝试自己制作?这些外部的能涵盖我们所有的用例吗?我们还必须考虑定制这些代理的高成本和持续维护。我们的需求包括支持 HTTP/2、HTTP/3、WebSocket 等流协议、简单的可扩展性等等。当我们开始了解 Microsoft 其他内部团队正在做的事情时,我们遇到了 YARP 项目。YARP 代表:“又一个反向代理”。该项目使用 ASP.NET 和 .NET(.NET 6 及更高版本)提供一个灵活的解决方案,可以通过 .NET 代码进行修改。这有多方便呢?事实证明这正是我们所需要的。

Bing 运行着世界上最大、高性能且可靠的 .NET 应用程序之一。我们依赖于与 .NET 团队的密切合作关系,并且是每个 .NET 版本的早期采用者。通过尝试并升级到每个新版本,我们可以向 .NET 团队提供有用的反馈。这有助于我们的平台和那些将升级服务以使用这些新版本的外部客户。我们将 YARP 纳入该反馈周期。

在现代 .NET 上创建新服务

由于 CETO 是一项新的服务,我们当时有机会使用最新的.NET版本。如今,它构建在 .NET 8、Kestrel + YARP 2.1 之上,可以在多个基础设施平台和数千台服务器上运行,既支持Linux容器也支持Windows容器。跨平台运行的能力增加了我们模块的可移植性和兼容性,以及在任何地方部署的灵活性和效率。在这个层面上的性能非常快,每一毫秒都至关重要。CPU%较低,从而降低了运营成本。

CETO 通过统一我们平台上的业务逻辑来实现融合,然后将请求交给 YARP,以完成路由到适当上游服务的繁重工作。我们希望我们的路由和映射能够高度定制化,因为我们要处理许多具有不同流量模式的不同群体,这会影响其他关键功能。

灵活性至关重要

我们对如何使用 .NET 和 YARP 有很多选择和控制权,因为它们非常灵活且功能多样。.NET提供了各种各样的API,以满足不同的需求,例如配置、依赖注入、日志记录、测试和调试等。通过使用 .NET,我们的 CETO 开发人员可以编写灵活、易于维护的代码,无缝连接到我们的其他服务。

我们采取了以下几种方法来满足我们的需求:

我们希望从一个中心位置管理我们内部团队的客户流量路由和目的地。使用 YARP,我们可以通过提供几个实现 IProxyConfigProvider 和 IProxyConfig 接口的类来选择从外部加载配置。团队可以创建任意数量的简单或复杂的路由,并与其他团队分开部署。更改会在后台重新加载,然后我们用新的快照交换代理配置状态,通知旧的配置已过时。

由于使用完整的 YARP 代理,我们具有路由和负载平衡的优势。我们希望提供一个选项,当从服务收到某些 http 状态代码时,转发到另一个位置。团队可以在 YARP 路由配置的 IReadOnlyDictionary<string, string> 元数据部分中设置此配置。我们在响应返回到客户端之前对其进行检查,从匹配的路由中获取元数据,然后使用 direct IHttpForwarder 将请求转发到另一个位置。通过使用 IHttpForwarder,我们仍然可以获得这些请求的错误处理、流协议和 http 客户端定制。

YARP 有多种默认的负载均衡策略,适合大多数场景。我们不需要修改这些策略的目标选择,而是干预选择过程并做一些其他事情。从 ILoadBalancingPolicy 创建一个新策略并利用目标属性中的 IReadOnlyDictionary<string, string> 元数据,我们可以对特定目标进行分类以用于其他目的。
在这里插入图片描述
在这种情况下,我们希望将一定比例的请求镜像到不同的目的地。流量镜像或流量阴影用于将生产流量重播到测试环境中,而不影响最终用户体验。请求被克隆并发送到队列进行处理,同时我们继续正常的选择逻辑,为请求选择可用的目标(不是镜像类型)。

.NET 速率限制是另一个便于使用的功能。它具有使用 PartitionedRateLimiter 的选项,可以基于任何唯一的 UserId 或其他标识符设置速率限制策略。我们通过使用 YARP RouteId 作为密钥的一部分来实现每个路由的速率限制。这些路由的所有者可以直接在 YARP 路由配置(元数据部分)中指定他们的许可值,并将其传递给速率限制器扩展。该密钥被创建为 routeId + 唯一标识符,以便当团队更新其许可限制时,我们会生成一个新密钥。限速库可以自动获取这些信息,无需重启服务。如果策略已经存在,速率限制将不会更新权限限制,因此我们创建一个新密钥。库会在大约 30 秒后删除过时的策略。这使我们可以保护每条路由的服务并有能力在单一位置管理我们团队。

大多数 CETO 配置使用 .NET 中的 Configure 和 IOptionsMonitor 接口以及 Json 配置提供程序。IOptionsMonitor 接口用于检索选项并管理 IOptions 实例的选项通知。

配置是通过我们的自定义服务扩展 AddSingletonServiceConfig 添加的,该扩展使用 ConfigurationBuilder 按顺序加载(以最后加载的键为准):

  • 默认值 services.Configure(serviceConfig.GetSection(“Default”));
  • 环境组值 services.Configure(serviceConfig.GetSection(environmentAlias));
  • 每个环境值 services.Configure(serviceConfig.GetSection(environmentName));

然后将配置添加到接收 IOptionsMonitor 的单例 IConfigurationReader 中。

简单示例:
在这里插入图片描述
在环境 2(生产组的一部分)上启动服务时,会产生以下配置:

"ModuleA": {"SSLCertificateSecretIdentifier": "ProdCert","PollingIntervalInSec": 30
},

当模块所有者想要添加新配置时,他们会创建一个新的模式模型作为 C# 类,添加 Json 配置文件,并更改 CETO 以调用我们的服务扩展。他们的类现在通过依赖注入接收特定于运行时的配置。由于我们使用 IOptionsMonitor,它还支持更改通知的功能。

性能很重要,.NET 8 速度更快

我们始终对我们的服务表现负责。随着服务所有者不断增加功能数量,延迟时间可能会逐渐增加。每个 .NET 版本都带来了性能改进。我们很高兴能够免费升级并获得这些性能改进。然而,我们仍然需要定期分析我们的服务,以确保我们明智地使用我们的资源。对于我们的开发人员来说,阅读开发博客文章以获取有用的提示非常有用。

展望未来

通过使用现代 .NET 及其功能,我们能够毫不费力地为我们的组织创建一个有效且高质量的网关。我们展示了几个示例,说明如何轻松扩展 .NET 库以满足我们组织的需求。我们对未来的 .NET 版本以及我们与 .NET 团队的持续合作充满期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/321407.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 线程池 ( Thread Pool )的简单介绍

想象一下&#xff0c;你正指挥着一支超级英雄团队&#xff0c;面对蜂拥而至的敌人&#xff08;任务&#xff09;&#xff0c;不是每次都召唤新英雄&#xff08;创建线程&#xff09;&#xff0c;而是精心调配现有成员&#xff0c;高效应对。这就是Java线程池的魔力&#xff0c;…

毕业就业信息|基于Springboot+vue的毕业就业信息管理系统的设计与实现(源码+数据库+文档)

毕业就业信息管理系统 目录 基于Springboot&#xff0b;vue的毕业就业信息管理系统设计与实现 一、前言 二、系统设计 三、系统功能设计 1学生信息管理 2 公司信息管理 3公告类型管理 4公告信息管理 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设…

探索GitHub上的GPTs项目:泄露和被破解的GPT提示

GPTs项目是一个在GitHub上由用户linexjlin发起的开源项目&#xff0c;专注于提供泄露的GPT&#xff08;生成式预训练转换器&#xff09;提示。这些提示用于指导和优化AI模型的输出&#xff0c;进而提升代码生成的质量和效率。项目页面提供了丰富的功能和资源&#xff0c;旨在帮…

3D渲染是什么?渲染100邀请码1a12

3D渲染是把3D模型转换为2D图像或动画的过程&#xff0c;涉及到多方面知识&#xff0c;这篇文章我们就来了解下。 1、3D渲染的原理 3D渲染的原理是模拟光线在三维空间中的传播和反射&#xff0c;根据物体在空间中的分布&#xff0c;计算出每个像素的颜色和亮度等数值&#xff…

如果insightface/instantID安装失败怎么办(关于InsightFaceLoader_Zho节点的报错)

可能性有很多&#xff0c;但是今天帮朋友解决问题的时候又收集了一种新的思路。 首先&#xff0c;可以先按照这篇文章里边提到的方法去安装&#xff1a; 【全网最详细】ComfyUI下&#xff0c;Insightface安装指南-聚梦小课堂_insightface如何安装-CSDN博客 其次&#xff0c;…

在Java中如何有效地处理内存泄露

在Java中&#xff0c;处理内存泄露有多种方法&#xff0c;以下是其中三种常见的方法及其原理和适用场景&#xff1a; ## 1. 合理使用垃圾回收机制 Java中的垃圾回收机制&#xff08;Garbage Collection&#xff0c;GC&#xff09;是一种自动化的内存管理技术&#xff0c;它可以…

2005-2021年全国各地级市生态环境注意力/环保注意力数据(根据政府报告文本词频统计)

2005-2021年全国各地级市生态环境注意力/环保注意力数据&#xff08;根据政府报告文本词频统计&#xff09; 2005-2021年全国各地级市生态环境注意力/环保注意力数据&#xff08;根据政府报告文本词频统计&#xff09; 1、时间&#xff1a;2005-2021年 2、范围&#xff1a;2…

嵌入式开发常见概念简介

目录 0. 《STM32单片机自学教程》专栏总纲 API Handle(句柄) 0. 《STM32单片机自学教程》专栏总纲 本文作为专栏《STM32单片机自学教程》专栏其中的一部分&#xff0c;返回专栏总纲&#xff0c;阅读所有文章,点击Link: STM32单片机自学教程-[目录总纲]_stm32 学习-CSD…

Linux变量的认识及环境变量配置详解

文章目录 1、变量的划分2、局部变量3、全局变量4、环境变量4.1、概述4.2、配置临时环境变量4.3、配置永久环境变量4.3.1、用户级配置文件1&#xff09;配置方法一&#xff1a;~/.bashrc文件2&#xff09;配置方法二&#xff1a;~/.profile文件3&#xff09;配置方法三&#xff…

Python读取ASC文件并转换成Excel文件(坐标)

import pandas as pd# 读取asc文件&#xff0c;指定空格为分隔符 df pd.read_csv(out_view2.asc, sep , headerNone)# 去掉空列 df df.dropna(howall, axis1)# 将数据保存到Excel文件 df.to_excel(out_view2.xlsx, indexFalse, headerFalse)效果图

用户管理中心——数据库设计用户注册逻辑设计

用户管理中心——数据库设计&用户注册逻辑设计 规整项目目录1. 数据库自动生成器的使用实现基本的数据库操作&#xff08;操作user表&#xff09; 2. 注册逻辑的设计(1) 写注册逻辑(2) 实现(3) 测试代码 3. 遇到的问题 规整项目目录 utils–存放工具类&#xff0c;比如加密…

【工作记录】openjdk-22基础镜像的构建

背景 近期使用到的框架底层都用的是springboot3.0&#xff0c;要求jdk版本在17甚至更高。 于是决定制作一个基于openjdk22的基础镜像&#xff0c;本文对这一过程进行记录。 作为记录的同时也希望能够帮助到需要的朋友。 期望效果 容器内可以正常使用java相关命令且版本是2…

Redis 入坑基本指南

引言 本指南将帮助您了解如何安装、配置和基本使用 Redis。Redis 是一款开源的高性能键值存储系统&#xff0c;可用于缓存、数据库、消息中间件等多种用途。 1. 安装 Redis a. 下载 Redis&#xff1a; 可以从 Redis 官方网站&#xff08;https://redis.io&#xff09;下载最…

jenkins目录下的vue3项目——pnpm install后运行报错——奇葩问题解决

昨天到今天&#xff0c;同事那边遇到一个问题&#xff0c;就是关于vue3vite的项目&#xff0c;在执行了自动打包后&#xff0c;运行代码会提示报错的问题。 报错信息如下&#xff1a; 具体错误信息如下&#xff1a; ERROR 11:28:14 [vite] Pre-transform error: Cannot find …

动手写一个简单的Android 表格控件支持固定列

Android 动手写一个简洁版表格控件 简介 源码已放到 Github Gitee 作为在测绘地理信息行业中穿梭的打工人&#xff0c;遇到各种数据采集需求&#xff0c;既然有数据采集需求&#xff0c;那当然少不了数据展示功能&#xff0c;最常见的如表格方式展示。 当然&#xff0c;类似…

一机游领航旅游智慧化浪潮:借助前沿智能设备,革新旅游服务效率,构建高效便捷、生态友好的旅游服务新纪元,开启智慧旅游新时代

目录 一、引言 二、一机游的定义与特点 &#xff08;一&#xff09;一机游的定义 &#xff08;二&#xff09;一机游的特点 三、智能设备在旅游服务中的应用 &#xff08;一&#xff09;旅游前的信息查询与预订支付 &#xff08;二&#xff09;旅游中的导航导览与互动体…

stm32之hal库串口中断和ringbuffer的结合

前言 结合hal库封装的中断处理函数使用rt-thread内部的rt-ringbuffer数据结构源码改造hal库串口部分的源码&#xff0c;将内部静态方法变为弱引用的函数&#xff0c;方便重写标志位采用信号量或变量的两种方式&#xff0c;内部数据分配方式采用动态和静态两种方式 hal库部分串…

开箱子咸鱼之王H5游戏源码_内购修复优化_附带APK完美运营无bug最终版__GM总运营后台_附带安卓版本

内容目录 一、详细介绍二、效果展示2.效果图展示 三、学习资料下载 一、详细介绍 1.包括原生打包APK&#xff0c;资源全部APK本地化&#xff0c;基本上不跑服务器宽带 2.优化后端&#xff0c;基本上不再一直跑内存&#xff0c;不炸服响应快&#xff01; 3.优化前端&#xff0c…

【再探】设计模式—适配器、装饰及外观模式

结构型设计模式是用于设计对象和类之间关系的一组设计模式。一共有7种&#xff1a;适配器模式、装饰器模式、外观模式、桥接模式、组合模式、享元模式及代理模式。 1 适配器模式 需求&#xff1a;在软件维护阶段&#xff0c;已存在的方法与目标接口不匹配&#xff0c;需要个中…

【DeepLearning.AI】吴恩达系列课程——使用ChatGPT API构建系统(持续更新中——)

目录 前言一、Language Models, the Chat Format and Tokens&#xff08;LLM&#xff0c;交互形式&#xff09;1-1、加载api-key1-2、使用辅助函数&#xff08;即指令调整LLM&#xff09;1-2、使用辅助函数&#xff08;聊天格式&#xff09;1-3、辅助函数修改&#xff08;输出字…