网页链接:https://mlsys-learner-resources.github.io/Awesome-MLSys-Blogger/
分享我个人在机器学习系统(MLSys)领域推荐关注的一些优秀资源,包括学术界的教授、业界专家、以及优秀的同龄人和博士生(排名不分先后)。我将这些推荐内容大致分为两个方面:系统与算法(请注意,我个人的研究重点偏向算法领域,系统方面的推荐可能有所不足)。如果有遗漏或不完全之处,恳请大家在issue中提出,非常感谢。
考虑到隐私因素,若列表中的朋友不希望被推荐,请联系我,我会立即删除相关信息,感谢理解。
P.S. 欢迎大家自荐或推荐,亦可提出PR,我们一起共同建设一个有价值、信息密度高的MLSys社区!
-
方佳瑞:知乎著名MLSys专家,Colossal-AI/xDiT/YunChang作者
-
手抓饼熊:知乎著名MLSys专家。
-
InterestingLSY(主页):DistServe/LoongServe/Mirage/RLHFFuse作者。
-
Yinmin Zhong (主页):DistServe/LoongServe/RLHFFuse/DistTrain/Megascale作者,值得一提的是,他还是著名的开源学习项目CsDiy.wiki的作者。
-
赵轩磊:Colossal-AI/VideoSys/OpenDiT(现在应该改名叫OpenSora了)作者,并行训练/视频推理。
-
谁来救救我:Hanayo作者,同样也是NUS系,并行训练推理(主要偏训练)。
-
Fazzie:知乎知名文章MLSys入坑指南/Colossal-AI作者,同样还是NUS系,ByteDance Seed。
-
Ying Sheng(主页):SGLang/FlexGen/S-LoRA作者,Stanford PhD/Incoming UCLA AP/LMSys.org,在SGLang社区非常热情地帮助大家解决问题。
-
Lianmin Zheng(主页):SGLang/FlexGen/vLLM/Chatbot Arena作者,UCB PhD/xAI/LMSys.org,在SGLang社区非常热情地帮助大家解决问题。
-
Chayenne Zhao:SGLang作者,UCLA PhD,在SGLang社区非常热情地帮助大家解决问题。
-
Hsword:SpecInfer/SpotServe作者,Purdue AP,经常在知乎上分享高质量的最新会议Paper总结。
-
Byron Hsu(主页):SGLang/Liger Kernel(我今年最喜欢的工具之一)作者,LinkedIn,在SGLang/Liger Kernel社区非常热情地帮助大家解决问题。
-
Pentium PRO:上古时代MLSys综述作者 Pentium PRO:MLsys各方向综述,BU PhD。
-
ZZYSonny:Triton/SASS专家。
-
陈乐群:Punica/Atom作者,UW PhD。
-
Zihao Ye:FlashInfer/TVM作者,UW Phd。
-
陈天奇:大名鼎鼎的TVM作者,CMU AP。
-
BBuf:会更新很多MLSys相关笔记(GPU Mode、SGLang),GiantPandaCV运营者,Skywork AI。
-
Yineng Zhang:SGLang作者,在SGLang社区非常热情地帮助大家解决问题。
-
zzk again:知乎著名MLSys专家,Oneflow(SiliconFLow),GiantPandaCV。
-
初七123334:知乎著名MLSys/RL专家,OpenRLHF作者,Nvidia。
-
尘伊光:MAGIS/ArkVale作者,PKU PhD。
-
Kan Zhu:NanoFlow作者,我今年最喜欢的一篇之一,UW Phd。
-
乔枫惜:SGLang作者,Stanford PhD,非常喜欢个人Blog内容,每次看都很有启发。
-
KuangjuX:TiledCUDA作者,知乎内容非常硬。
-
SiriusNEO:Parrot作者,年轻的时候就有OSDI了呜呜呜,会在Github/知乎更新一些新手友好的CUDA/Triton Toy Demo。
-
SuSun:DB/MLSys,很有分享欲的同龄人(学习了www)。
-
拜月神使曌鹓鶵:鸟哥,分享欲也是超级强的!
-
进击的Killua:量化系列专家,SJTU。
-
ZHANG Mingxing:Disaggregated推理框架Mooncake作者,THU AP。
-
左鹏飞:主要做推理,华为。
-
Uranus:主要做推理,无问芯穹。
-
LeiWang1999:BitBLAS/SparTA作者,TVM专家,Microsoft Intern。
-
66RING:很多新手友好的知乎文章,强推!
-
LRY89757:MuxServe作者,Umich PhD。
-
灰墙:MInference/LLMLingua作者,MSRA。
-
闲鱼:DB/MLSys,著名知乎作者。
-
游凯超:Pytorch/CUDA分享,著名知乎作者。
-
Eigensystem:xDiT作者,Video Inference专家。
-
Simon Mo:vLLM核心维护者,UCB。
-
lvhan:LMDeploy核心维护者,Shanghai AI Lab。
-
猛猿:图解十分易懂,写作能力很强很细心。
-
紫气东来:解读非常细致!新手友好向!
-
sonta:小迷弟肯定把Sonta小姐姐放第一个,主要做Linear Attention,GLA/GSA/DeltaNet/HGRN2作者,如果想入坑Linear Attn可以看小姐姐知乎/博客,MIT PhD。
-
yzhangcs:Linear Attention too, GSA/FLA库作者,苏州大学PhD。
-
朱小霖:Ring Flash Attention仓库作者,同时也做训练框架,知乎文章质量非常高。
-
Tri Dao (主页):Flash Attention-1, 2, 3 & Mamba作者,无需多言,Princeton AP & Together.ai。
-
Albert Gu(主页):Mamba & Hydra作者,无需多言,CMU AP & Cartesia.ai。
-
Weilin Zhao:给ex-Mentor推一个,Ouroboros/CA-LoRA/Seq1F1B/BMTrain/作者,THUNLP PhD。
7.5. SageAttention2:Work很Nice,但作者们不怎么写东西,开一个7.5,THU-ML组。
-
Song Han(主页):AWQ/SVDQuant/EfficientViT/QServe/DuoAttention/StreamingLLM等作者(导师),量化/推理方面的专家,手下学生如Ligeng Zhu/Zhijian Liu/Hanrui Wang同样水平非常高,MIT AP。
-
Hazy Research/Christopher Ré (主页):NLP/MLSys,工作比较杂,Tri Dao/Beidi(PostDoc)/Dan Fu导师,很多有趣的Efficiency Work,Stanford Professor。
-
Sasha Rush (主页):NLP/MLSys,工作比较杂,但做一些很有趣的Efficiency Work,Cornell Professor。
-
Atlas Wang(主页):GaLore作者(导师),产量巨高,UTA AP。
-
Beidi Chen(主页):ShadowKV/MagicPig/H2O/Deja Vu作者,量化/推理都做,高产,CMU AP。
-
Celine Lin(主页):各种各样的Efficiency,软硬件都做,Gatech AP。
-
Tim Dettmers(主页):LoRA & LLM.int8()作者,量化滴神(但似乎跑去做Agentic AI了),UW PhD,Incoming CMU AP。
-
Hao Zhang(主页):OSD等工作作者,UCSD AP。
15.5 DeepSeek MLA:MLA今年表现亮眼。
-
Lin Zhang:NLP/MLsys:系统/算法都有很多很好的文章。
-
CS二猹树:LLM压缩 & 量化,HKUST PostDoc。
-
pprp:LLM压缩 & 量化。
-
水木皇工仔:LLM量化,也做系统,incoming爱丁堡PhD。
-
LiteAI:量化LLM & 端侧部署,华为。
-
Amir Gholami:Squeezed Attention作者(导师),算法 & 系统都做,UCB Research Scientist。
-
王鸿钰: BitNet系列作者。
-
Zirui's Homepage:KIVI作者,2bit量化,UMN AP。