VideoWorld: Exploring Knowledge Learning from Unlabeled Videos
做的是从视频数据中获得action的工作。(17/100)
做的是从视频数据中获得action的工作。(17/100)
小样本llm论文阅读,百篇paper计划(3/100)
看上去是那种一句话生成仿真环境的。
RDT-1B: A DIFFUSION FOUNDATION MODEL FOR BIMANUAL MANIPULATION。双臂机器人操作,扩散模型
百篇paper计划(6/100),好像是LoRA的改进,随便找的,而且这篇还没投会议呢。
这一篇也是微调,改lora
我以前看论文居然这么龟毛orz我的百篇paper计划创业未半而中道崩殂啊