API 点赞排序
最新 热门 点赞 热评 相关

just-js 高性能 javascript 运行时

一个非常小的 v8 javascript 运行时，仅适用于 Linux。在Techempower第21回测试中，获得第一名！！！ github地址： https://github.com/just-js/just 构建和运...

1 3467 3 2022/8/14 javascript
Python爬虫过五关斩六将：绕过反爬机制的实用技巧

想用Python写个爬虫，结果一不小心就被网站的反爬机制给拦住了？别灰心！反爬虫和反反爬虫就像猫捉老鼠，是个永恒的游戏。今天，我就来分享一些实用的技巧，助你轻松绕过常见的反爬机制，让你的爬虫畅通无阻。 1. 伪装身份：User-Age...

1344 1 2025/6/24 Python爬虫反爬机制爬虫技巧
CSS Houdini动画工作单元?让Web动画性能飞跃的秘诀

Houdini？你可能听说过这个名字，但它究竟能给你的Web动画带来什么翻天覆地的变化？今天，咱们就来聊聊CSS Houdini中的Animation Worklet API，看看它如何助力你打造高性能、自定义的动画效果，尤其是在实现复杂...

1047 1 2025/4/26 CSS Houdini Animation Worklet Web动画性能优化
Faiss, Annoy, HNSW 谁更强？ANNS 库性能大比拼，代码示例与实战解析

嘿，哥们儿！想在海量数据里快速找到你想要的东西？别担心，今天咱们就来聊聊那些能帮你“大海捞针”的利器——近似最近邻搜索 (ANNS) 库。特别是，我们会重点比较当下最火的三款：Faiss、Annoy 和 HNSW。准备好了吗？咱们这就开始...

2144 1 2025/3/18 ANNS Faiss Annoy HNSW 近似最近邻搜索
2022年卡塔尔世界杯：国际足联世界国家排名（男子）TOP 50

1810 1 2022/11/23 世界杯足球排名国家
Linux 共享内存跨进程读写锁：如何系统性搞定进程崩溃后的死锁难题？

在多进程高并发场景下，共享内存（Shared Memory）因其“零拷贝”的特性，堪称进程间通信（IPC）的性能王牌。然而，高收益伴随着高风险。最让人头疼的问题莫过于：如果一个进程在持有共享内存的锁时，突然被 kill -9 、...

7 2026/6/20 Linux 共享内存死锁避免
Go 语言中 File.Fd() 引起的 GC 惨案：flock 锁为何会悄悄失效？

直接给出结论：是的，绝对会。这是 Go 语言底层内存管理（垃圾回收）与 Unix 系统调用交互时，一个非常经典且极其隐蔽的“坑”。如果你在获取了 File.Fd() 之后，后续代码中不再直接使用 File 对象本身，那...

17 2026/6/19 Go语言垃圾回收操作系统
多进程共享内存中，如何优雅地处理 pthread_mutex_lock 返回的 EOWNERDEAD？

在多进程高并发场景下，使用共享内存（Shared Memory）配合互斥锁（Mutex）是极常见的 IPC 设计。但这种设计有一个致命的痛点：如果持有锁的进程突然崩溃（比如被 kill -9 ，或者发生 Segment Fault），...

33 2026/6/17 Linux 并发编程操作系统
Triton共享内存在C++与Python客户端下的性能差异与调优实践

在利用 Triton Inference Server 部署高吞吐、低延迟的深度学习模型时，传统的 gRPC 或 HTTP 协议往往会因为数据序列化/反序列化以及网络栈拷贝成为系统瓶颈。特别是在处理超大图像、视频流或高维张量时，这...

43 2026/6/16 Triton 共享内存性能调优
Triton 报 Shared Memory 内存不足？免重启在线清理与重建指南

在生产环境中部署 Triton Inference Server 时，为了追求极致的吞吐和极低的延迟，我们通常会开启**共享内存（Shared Memory，包括 System SHM 和 CUDA SHM）**来传输 Inference...

43 2026/6/16 Triton 共享内存深度学习部署
突破 IPC 瓶颈：如何在 Triton Python Backend 中优雅地使用 CUDA Shared Memory？

在高性能深度学习推理场景中， Triton Inference Server 凭其优秀的并发处理能力被广泛采用。然而，许多团队在使用 Python Backend 编写自定义预处理或模型后处理逻辑时，常常会遇到性能瓶颈。这个瓶...

51 2026/6/15 Triton CUDA 性能优化
舍弃外部网关，改用 Triton BLS 编排模型，延迟能降多少？

在多模型级联（如 ASR + NLP + TTS，或者目标检测 + 裁剪 + 属性分类）的业务场景中，如何编排模型一直是个经典架构问题。常见的做法有两种：外部网关分桶/编排：在 Triton 外部写一个 Go/Pyth...

50 2026/6/15 Triton 模型部署延迟优化
用好 Ragged Batching，解决 Triton 动态批处理中的 NLP 显存爆炸

在生产环境中部署 BERT、GPT 等 NLP 模型时，我们几乎都会开启 Triton Inference Server 的 Dynamic Batching（动态批处理）。这个功能很香，能把多个客户端的单条请求攒成一个 Batch ...

53 2026/6/15 Triton NLP推理显存优化
高并发生产环境下，如何无损动态更新 Triton BLS 路由逻辑？

在生产环境的高并发场景下，直接重启 Triton Inference Server 来更新 BLS（Business Logic Scripting）脚本的路由逻辑是不可接受的。这不仅会导致瞬时服务中断，还可能造成正在处理的（In-fli...

52 2026/6/15 Triton 高并发 MLOps
高并发下的多卡 Triton 推理优化：如何利用 CUDA IPC 与 NCCL 实现跨卡零拷贝级联？

在多卡（Multi-GPU）环境下部署复杂的大模型流水线或级联模型（Ensemble/Pipeline）时，GPU 之间的数据传输延迟往往会成为整个吞吐链路的致命瓶颈。典型的级联场景（例如： Visual Grounding 任务中...

53 2026/6/15 Triton CUDA IPC NCCL
拒绝万恶的H2D拷贝：在Triton中用CUDA共享内存实现大图推理极速优化

在智能视觉、工业缺陷检测、超分辨率等场景中，我们经常需要处理 4K 甚至 8K 的超大尺寸图像。在传统的推理流程中，即使你把 GPU 上的模型优化到了极致，端到端的时延依然可能高达几十甚至上百毫秒。用 Profiler 仔细分析就会...

53 2026/6/14 Triton CUDA 性能优化
Triton 复杂推理流水线：Ensemble 与 BLS 的时延损耗深剖与选型指南

在将深度学习模型推向生产环境时，极少有单体模型能包揽全部业务逻辑。一个典型的工业级推理服务往往由多个模块级联而成：例如“ 目标检测（YOLO） -> 抠图与对齐（预处理） -> 特征提取（ResNet） -> 向量检索与...

58 2026/6/14 Triton 模型推理性能优化
突破通信瓶颈：vLLM 混合并行与 K8s 拓扑感知调度深度实践

在大规模 LLM（如 Llama-3-70B、Mixtral-8x22B 等）推理场景下，基于 vLLM 的分布式推理服务面临着极其严苛的时延挑战。 Tensor Parallelism（张量并行，简称 TP）由于在每个 Transf...

47 2026/6/14 vLLM Kubernetes 拓扑感知调度 GPU优化
白嫖 Meta 算力：无显卡如何在 Colab 快速部署 ESMFold 并搞定单点突变分析

做结构生物学和计算生物学的同学，或多或少都经历过被显卡支配的恐惧。想跑个 AlphaFold2，光是配环境和下载那几个 TB 的数据库就能让人崩溃，更别提本地那块瑟瑟发抖的 RTX 3060 显卡了。其实，如果你只是想针对某个靶点蛋...

74 2026/6/12 ESMFold 单点突变
AlphaFold 3 开源了却动不了？无 GPU 预算的生信避坑与替代工作流指南

不少做结构生物学和药物研发的同学最近都在关注 AlphaFold 3 (AF3) 的开源进展。好消息是，DeepMind 在 2024 年 11 月终于迫于学术界压力，正式开源了 AlphaFold 3 的源代码和模型权重（仅限...

69 2026/6/12 AlphaFold3 蛋白质结构预测生物信息学

API 点赞排序 最新热门点赞热评相关

just-js 高性能 javascript 运行时

Python爬虫过五关斩六将：绕过反爬机制的实用技巧

CSS Houdini动画工作单元?让Web动画性能飞跃的秘诀

Faiss, Annoy, HNSW 谁更强？ANNS 库性能大比拼，代码示例与实战解析

2022年卡塔尔世界杯：国际足联世界国家排名（男子）TOP 50

Linux 共享内存跨进程读写锁：如何系统性搞定进程崩溃后的死锁难题？

Go 语言中 File.Fd() 引起的 GC 惨案：flock 锁为何会悄悄失效？

多进程共享内存中，如何优雅地处理 pthread_mutex_lock 返回的 EOWNERDEAD？

Triton共享内存在C++与Python客户端下的性能差异与调优实践

Triton 报 Shared Memory 内存不足？免重启在线清理与重建指南

突破 IPC 瓶颈：如何在 Triton Python Backend 中优雅地使用 CUDA Shared Memory？

舍弃外部网关，改用 Triton BLS 编排模型，延迟能降多少？

用好 Ragged Batching，解决 Triton 动态批处理中的 NLP 显存爆炸

高并发生产环境下，如何无损动态更新 Triton BLS 路由逻辑？

高并发下的多卡 Triton 推理优化：如何利用 CUDA IPC 与 NCCL 实现跨卡零拷贝级联？

拒绝万恶的H2D拷贝：在Triton中用CUDA共享内存实现大图推理极速优化

Triton 复杂推理流水线：Ensemble 与 BLS 的时延损耗深剖与选型指南

突破通信瓶颈：vLLM 混合并行与 K8s 拓扑感知调度深度实践

白嫖 Meta 算力：无显卡如何在 Colab 快速部署 ESMFold 并搞定单点突变分析

AlphaFold 3 开源了却动不了？无 GPU 预算的生信避坑与替代工作流指南

API 点赞排序
最新热门点赞热评相关