
本期的嘉宾是 vLLM 团队的李卓翰、Simon Mo、柳晓萱 Lily、游凯超,和真格基金管理合伙人戴雨森。两年时间,vLLM 从加州大学伯克利分校的一个 Demo 项目成长为全球范围内最受欢迎的开源大模型推理加速框架。AI 技术不断突破极限,大语言模型正处于浪潮之巅。而在开发以外,模型的部署常常受到推理速度过慢、GPU 利用率过低的阻碍。vLLM 以 PagedAttention 核心算法,支持 30+ 生成式大语言模型,多种硬件厂商的适配和前沿的优化,能够做到与 Hugging Face Transformers 相比 24 倍的吞吐量。昨天,真格基金正式宣布对 vLLM 项目进行捐赠。对于创造未来的重要基石,我们愿尽绵薄之力。本期播客,我们请来了 vLLM 项目的四位主要团队成员以及主导这次捐赠的真格基金管理合伙人戴雨森,聊聊 vLLM 背后的开源故事,以及这个项目是如何在 AI 浪潮中势如破竹的。在本期节目里,我们聊到了 vLLM 如何在短短两年成为了炙手可热的开源大模型推理加速框架?从学界项目起始,vLLM 团队是如何精准发挥自身优势同时进行适应的?为何 vLLM 开源项目能够建立起如此活跃的技术社区生态,吸引全球人才共创?vLLM 的团队如何看待商业化,他们对作为开源项目的 vLLM 有什么愿景?相信无论你是大模型领域的技术开发者,还是对 AI 的发展与创新感兴趣,抑或是开源社区的经营者,这期节目都能带给你启发。【本期嘉宾】戴雨森 真格基金管理合伙人李卓翰 加州大学伯克利分校博士生, vLLM 创始人之一,目前负责 vLLM 的高层设计与开源社区管理Simon Mo 加州伯克利分校博士生,目前在 vLLM 承担产品经理/开源社区生态管理的角色柳晓萱 加州伯克利分校博士生,目前在 vLLM 负责科研导向的设计与改进游凯超 清华博士生,赴伯克利访问,目前在 vLLM 负责开源内容的维护管理【时间轴】02:07 vLLM 项目与团队的基本介绍12:04 在 vLLM 之前,没有 LLM 推理框架尝试在多请求角度做优化15:38 从零到一,成为最快、最好用的开源引擎23:12 「大卫战胜哥利亚」,开源模式和代码质量是核心<p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;
Podzilla Summary coming soon
Sign up to get notified when the full AI-powered summary is ready.
Free forever for up to 3 podcasts. No credit card required.
Free AI-powered recaps of 此话当真 and your other favorite podcasts, delivered to your inbox.
Free forever for up to 3 podcasts. No credit card required.