没啥标题

活下去

写完之后发现编码器和解码器这个框架不是很麻烦,就是一种思想,但是要扯上transformer就很麻烦orz。

一句话总结一下:编码器是可变->固定,解码器是固定->可变

阅读全文 »

要求:灵巧手(手臂尽可能简单)抓取不同摩擦力的常见物体(能抓到就行,不需要用模型)

阅读全文 »

“冻结”的模型在训练时是只做 forward,不做 backward。= 只做推理,不参与训练

对齐?

checkpoint:保存模型

embedding层是干啥的?干了一些得到task的工作?把 图像嵌入、语言嵌入、状态嵌入 拼接成一整段前缀序列,并且同时构造:

pad_masks:标记哪些 token 是“真实的” (1) 哪些是 padding (0);

att_masks:标记这个 token 属于哪一类域(0=图像/语言,1=状态/动作),以便后面 make_att_2d_masks 限制注意力连接。

概括之后,构造条件输入序列

图论,求两点之间的最短路径

我记得一共有3种算法: Bellman-Ford algorithm、、 总结一下然后找个例题,用c++写一遍 希望这一篇不会鸽了 好像有向图和无向图有一点不一样

阅读全文 »

思维链针对的是大模型搞推理问题,让它直接从直接输出一个结果变成写推理过程+结果的形式。

阅读全文 »
0%