代码搜索的下一形态:ast-grep 与 PageIndex 的双向增强

问题:代码搜索的两难困境 “这个项目的用户认证流程是怎么实现的?” 这个问题看似简单,但现有工具都不太好回答: 向量搜索:把代码切成 chunks,做 embedding,然后相似度匹配。问题是"相似"不等于"相关"——搜"认证"可能返回一堆包含 auth 字符串的注释和配置文件,而不是真正的认证逻辑。 ...

2025-11-28 · 7 分钟 · 3292 字 · zjding

SGLang:面向复杂LLM程序的高效推理框架

本文介绍了SGLang,一个旨在解决传统LLM推理框架在复杂交互场景中性能瓶颈的高效推理框架。SGLang通过共享前缀缓存、约束解码加速等技术优化内存与计算效率,并简化编程模型,支持控制流和并行处理,降低复杂LLM程序的开发成本。 ...

2025-01-22 · 4 分钟 · 1563 字 · zjding