FlexGen: high-throughput generative inference of large language models with a single GPU 发表于 2024-05-21 更新于 2025-08-22 分类于 paper 推理llm里面搞卸载的。百篇阅读计划(5/100)。看到和以前有点相关联的地方了,卸载和内存优化都是偏系统的。 因为大的背景过于重复了,以后论文注解只记录小的背景了。 阅读全文 »
DexGraspNet 发表于 2025-03-06 更新于 2025-08-22 分类于 it DexGraspNet,灵巧抓取数据集,我需要用它的数据辅助我的机械臂面对物体生成抓取姿态(dof)然后配置torchSDF的时候失败 阅读全文 »
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models 发表于 2024-04-16 更新于 2025-08-22 分类于 paper 思维链论文阅读,百篇paper计划(4/100),思维链这个技术还是prompt这个部分里面的,所以这篇论文还是算prompt 阅读全文 »
CLLMs: Consistency Large Language Models 发表于 2024-10-22 更新于 2025-08-22 分类于 paper 百篇paper计划(8/100),关于持续性,不知道对我有没有启发,先看看吧。 这一篇的实验要求比较高,不精读了,看思想。它有个前提是jacobi方法,没这个基础的话看不太懂。 阅读全文 »
CALVIN: A Benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks 发表于 2025-03-23 更新于 2025-08-22 分类于 paper 来不及自己看了,量子速读,发动! 阅读全文 »