docs: 添加配置文档和更新笔记内容

xinetzone · xinetzone · commit 7ad8ea3edbfa · 2025-10-14T14:23:25.000+08:00
添加CMake配置文档和Databricks限流方案笔记
更新文档索引和笔记工作区配置
diff --git a/doc/configs/cmake.md b/doc/configs/cmake.md
@@ -0,0 +1,54 @@
+# 🔧 CMake 构建环境配置
+
+参考文档：[CMake 示例](https://daobook.github.io/pygallery/study/examples/cmake/index.html) · [Conan 使用](https://daobook.github.io/pygallery/study/fields/conan/index.html)
+
+---
+
+## 1. 安装依赖工具
+
+```bash
+# 更新 conda
+conda update -n base -c defaults conda
+
+# 安装 CMake
+pip install cmake -i https://pypi.tuna.tsinghua.edu.cn/simple
+
+# 安装 Ninja（作为 CMake 的构建后端）
+conda install -c conda-forge ninja
+
+# 安装 Clang/LLVM 作为 C/C++ 编译器
+conda install -c conda-forge clangdev
+```
+
+---
+
+## 2. 配置 `pyproject.toml`
+
+```toml
+[build-system]
+requires = ["scikit-build-core-conan"]
+build-backend = "scikit_build_core_conan.build"
+
+[tool.scikit-build]
+cmake.args = ["-G", "Ninja"]
+cmake.build-type = "Release"
+
+[tool.scikit-build.cmake.define]
+CMAKE_C_COMPILER = "clang"
+CMAKE_CXX_COMPILER = "clang++"
+```
+
+说明：
+- `-G Ninja` 指定使用 Ninja 作为生成器  
+- `CMAKE_C_COMPILER` / `CMAKE_CXX_COMPILER` 显式指定 Clang 编译器  
+- `cmake.build-type` 可选 `Debug` / `Release` / `RelWithDebInfo` 等  
+
+---
+
+## 3. （可选）安装 Conan 依赖管理器
+
+```bash
+pip install conan -i https://pypi.tuna.tsinghua.edu.cn/simple
+```
+
+Conan 可用于自动化管理第三方 C/C++ 库依赖，推荐在需要复杂依赖时启用。
diff --git a/doc/configs/index.md b/doc/configs/index.md
@@ -0,0 +1,7 @@
+# 配置
+
+```{toctree}
+:hidden:
+
+cmake
+```
diff --git a/doc/index.md b/doc/index.md
@@ -4,6 +4,7 @@
 :hidden:
 
 readme
+configs/index
 InsightHub/index
 notebook/index
 ```
diff --git a/doc/notebook/.obsidian/workspace.json b/doc/notebook/.obsidian/workspace.json
@@ -13,12 +13,12 @@
             "state": {
               "type": "markdown",
               "state": {
-                "file": "Clippings/index.md",
+                "file": "Clippings/Databricks开源限流方案，抛弃redis，性能提升10倍.md",
                 "mode": "source",
                 "source": false
               },
               "icon": "lucide-file",
-              "title": "index"
+              "title": "Databricks开源限流方案，抛弃redis，性能提升10倍"
             }
           }
         ],
@@ -203,10 +203,11 @@
   },
   "active": "07968a073a48be13",
   "lastOpenFiles": [
-    "Clippings/正则表达式.md",
     "index.md",
-    "Clippings/the-art-of-command-lineREADME-zh.md at master · jlevythe-art-of-command-line.md",
+    "Clippings/Databricks开源限流方案，抛弃redis，性能提升10倍.md",
     "Clippings/index.md",
+    "Clippings/正则表达式.md",
+    "Clippings/the-art-of-command-lineREADME-zh.md at master · jlevythe-art-of-command-line.md",
     "Clippings/工作流初探.md",
     "Clippings/obsidian程序下载.md",
     "Clippings/tasks语法快速参考.md",
diff --git a/doc/notebook/Clippings/Databricks开源限流方案，抛弃redis，性能提升10倍.md b/doc/notebook/Clippings/Databricks开源限流方案，抛弃redis，性能提升10倍.md
@@ -0,0 +1,121 @@
+---
+title: "Databricks开源限流方案，抛弃redis，性能提升10倍"
+source: "https://mp.weixin.qq.com/s/VLkB6OWtLa_bn9OBeQvVHQ?from=industrynews&color_scheme=light#rd"
+author:
+  - "[[winkrun]]"
+published:
+created: 2025-10-11
+description:
+tags:
+  - "clippings"
+---
+![cover_image](https://mmbiz.qpic.cn/mmbiz_jpg/aaN2xdFqa4EnpvgWHR4Uhvn3dWB7HeNiagN4UYBS87lzPABiaWSnicvF9e1LqJdaNapx10QXqIFiaxRbph83kNPz7Q/0?wx_fmt=jpeg)
+
+原创 winkrun [AI工程化](https://mp.weixin.qq.com/s/) *2025年10月05日 05:33*
+
+Databricks 最近开源了他们的高性能限流系统设计，这个方案跳出了"限流必须用 Redis"的思维定势，通过内存分片和批量上报机制，实现了 10 倍的性能提升。
+
+## 抛弃redis
+
+2023 年初，Databricks 的限流系统还是个标准配置：Envoy 网关调用限流服务，后端用单个 Redis 实例存储计数。随着实时模型服务等高 QPS 场景的引入，这套架构开始力不从心。P99 延迟达到 10-20ms，而且 Redis 成了整个系统的瓶颈和单点故障。
+
+Databricks 的工程师们意识到一个关键事实：大部分限流都是按秒计算的，这些计数本质上是临时数据。既然不需要持久化，为什么要用 Redis？
+
+## 两个关键设计
+
+他们用了两个关键设计来重构整个系统：内存分片和客户端批量报告。
+
+### 内存分片：分而治之
+
+传统的集中式限流有个天然瓶颈 - 所有请求都要经过同一个 Redis 实例。内存分片的思路是把限流计数分散到多个节点上：
+
+```
+传统方式：
+所有请求 → Redis（单点） → 返回结果
+
+内存分片方式：
+用户A的请求 → 节点1（负责用户A-F）
+用户M的请求 → 节点2（负责用户G-M）  
+用户Z的请求 → 节点3（负责用户N-Z）
+```
+
+通过引入 Dicer 自动分片技术，相同的限流键总是被路由到同一个节点。每个节点在自己的内存里独立计数，完全不需要跨节点同步。需要更大容量时，加节点就行。
+
+![Dicer 架构示意图](https://mmbiz.qpic.cn/mmbiz_png/aaN2xdFqa4EnpvgWHR4Uhvn3dWB7HeNiau1aN0olOTVuCa3HPFATm14E19lWsmNMxxWGE5xUJGYVDAO7yibE7SXQ/640?wx_fmt=png&from=appmsg&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=0)
+
+### 批量报告：化零为整
+
+客户端批量报告则从另一个角度优化性能。传统方式下，每个请求都要查询限流服务并等待响应，这意味着大量的网络往返。
+
+新方案采用了完全不同的思路：
+
+```
+1. 客户端默认放行请求（乐观限流）
+2. 本地记录放行和拒绝的数量
+3. 每 100ms 批量上报：{API_A: 45次, API_B: 55次}
+4. 服务器返回哪些需要限流，以及限流比例
+5. 客户端根据指令调整后续的限流行为
+```
+
+这种设计把原本的 N 次网络往返减少到 1 次，而且是异步的，不阻塞请求处理。限流判断的延迟因此接近于零。
+
+### 两者的巧妙结合
+
+这两个设计相互补充，解决了不同维度的问题：
+
+- **内存分片** 解决了服务端的扩展性，打破了集中式瓶颈
+- **批量报告** 解决了客户端的性能问题，消除了同步等待
+
+更妙的是，批量报告时会按目标节点分组，避免了扇出爆炸：
+
+```
+100个请求按目标节点分组：
+- 节点1：35个请求合并成1个批量请求
+- 节点2：40个请求合并成1个批量请求  
+- 节点3：25个请求合并成1个批量请求
+```
+
+## 令牌桶：更智能的限流算法
+
+在实现内存限流后，他们还把限流算法从固定窗口改成了令牌桶。固定窗口算法有个问题：每个时间窗口开始时计数器都会重置，可能导致窗口边界的流量突发。
+
+令牌桶算法可以"记住"超限情况。如果某个客户在上一秒发了 150% 的请求，令牌桶会变成负数，下一秒需要等桶慢慢恢复才能继续。这种连续性让限流更加平滑和准确。
+
+## 工程挑战与解决
+
+理想很美好，但实现过程充满挑战：
+
+**精度控制** ：批量上报的异步特性可能导致超限。他们用了三重保护：基于历史数据的拒绝率预测、客户端本地限流器、以及令牌桶算法的连续性。
+
+**在线迁移** ：最棘手的是如何在不停服的情况下完成改造。他们采用了渐进式方案，先给 Envoy 加 sidecar，用 Lua 脚本优化 Redis 批量写入，最后才切换到完全的内存方案。
+
+![最终架构图](https://mmbiz.qpic.cn/mmbiz_png/aaN2xdFqa4EnpvgWHR4Uhvn3dWB7HeNiaD3F3ZaWDDklJxicPJFnheVn68LZCCl41FJxr4iblAwTMlujJfjrLAlcw/640?wx_fmt=png&from=appmsg&tp=webp&wxfrom=5&wx_lazy=1#imgIndex=1)
+
+## 一致性的权衡
+
+这个方案在分布式一致性上做了明智的权衡。通过 Dicer 保证同一个限流键的所有请求都路由到同一实例，避免了分布式计数。批量上报提供了最终一致性 - 可能有 100ms 的延迟，但最终会收敛到正确状态。
+
+这种权衡对大多数场景是合理的。API 限流、资源保护这类场景，5% 的短暂超限通常在系统容量范围内。但对于金融交易、库存扣减这类需要强一致性的场景，还是需要传统方案。
+
+## 改造成果
+
+改造后的系统取得了显著成效：
+
+- 尾部延迟改善高达 10 倍
+- 彻底解决了 Redis 单点故障问题
+- 内部服务调用限流时零延迟
+- 系统可以通过加节点线性扩展
+
+从方案可以看出，没有什么奇技淫巧，Databricks没有试图用一个复杂的方案解决所有问题，也没有墨守固定的模式，而是用内存分片和批量报告两个相对独立的机制，分别解决服务端扩展性和客户端性能问题，没有一味追求强一致性，进而换来整体性能的巨大提升。
+
+关注公众号回复“进群”入群讨论。
+
+继续滑动看下一个
+
+AI工程化
+
+向上滑动看下一个
+
+![](https://mmbiz.qpic.cn/mmbiz_png/aaN2xdFqa4HHZgg9abQ55cSWZu23JrNMHD5SBdsYLURCtEcAfhyxNzG4boYKKWTUibhOx8wbupSOzFD1Dd0PFzw/300?wx_fmt=png&wxfrom=18)
+
+AI工程化