models/sam3/model/vitdet.py 中存在一处可能的bug 在ViT的 forward函数中

此处的条件特征被编码为 BLC 格式 却被_resize_handcrafted误当作 BCHW 处理 虽然运行不会报错
(因为后续代码中强行给3维张量unsqueeze了一个新维度,但本意应该是兼容BHW的输入而非BLC)
因此该条件注入可能不符合设计本意? 我理解由于还有一个patch条件注入 且SAM3本身backbone升级,所以我仍然可以正常训,但一但我的任务需要强依赖这个条件(原代码是fft 可能改为其他)就可能导致问题?
请作者能否解释或修正一下
非常感谢您的工作!