OmniRe 训练全流程拆解:五类参数联合优化,以及你会踩到的那些坑
上一篇聊了 OmniRe 里 extract mask 为什么比看起来重要得多。这篇接着往下走,进入真正的训练阶段:拿到 mask 和初始化之后,OmniRe 到底是怎么把整个动态场景一起训出来的,以及这中间哪些地方最容易出问题。
阅读更多Xingyao Huang 的个人博客,记录编程、阅读与生活
上一篇聊了 OmniRe 里 extract mask 为什么比看起来重要得多。这篇接着往下走,进入真正的训练阶段:拿到 mask 和初始化之后,OmniRe 到底是怎么把整个动态场景一起训出来的,以及这中间哪些地方最容易出问题。
阅读更多这两天在看 OmniRe 这篇做动态城市场景重建的工作。它的主线当然是 Gaussian Scene Graph + dynamic actor reconstruction,但我越看越觉得,真正落到工程里,最容易被低估的一步反而是前面的 extract mask。
阅读更多这个问题我以前也纠结过:Transformer 到底是不是一种“特殊的 RNN”?
阅读更多最近又在看 DINOv3,顺手拿它做了一些自车 mask 相关的观察。一个很直观的感受是:它在识别自车区域时,尤其是车身反光比较严重的情况下,表现比我预期得更稳。
阅读更多这几年大家聊得最多的是 Transformer、LLM、Diffusion、VLM,好像深度学习的历史是从 attention 开始的。 但如果往前倒一点,卷积、CNN、RNN 才是真正奠定现代神经网络直觉的那一代方法。
阅读更多前几年如果你做计算机视觉,semantic segmentation 往往是一个“终点任务”:输入一张图,输出每个像素的类别,最后用 mIoU 来衡量模型强不强。那个时期的问题很明确——类别表是固定的,数据集是封闭的,目标是把像素分类做得更准、更快。
阅读更多最近又开始重新学习 Transformer。第一次看这套东西的时候,更多是在记结论:Self-Attention、Multi-Head、Positional Encoding、Encoder-Decoder……名词都知道,但总觉得像在背模板。现在再回头看,才慢慢觉得自己抓到了它真正厉害的地方:它不是单纯把 RNN...
阅读更多之前写了个 HTML5 的打砖块游戏(breakout.xingyao.info),最近在给它加 RL(强化学习)训练系统——让 AI 从零学会玩这个游戏。记录一下设计思路。
阅读更多SegFormer 是 NVIDIA 在 NeurIPS 2021 上发表的一个语义分割模型。虽然发布已经快五年了,但它至今仍被广泛使用,尤其是在需要轻量、高效的语义分割场景中。前几天写了一篇关于 Meta SAM 3 的文章,正好借这篇来对比一下两者的定位差异。
阅读更多Meta 在今年初发布了 Segment Anything Model 3(SAM 3),三月底又更新了 SAM 3.1。作为 SAM 系列的长期关注者,趁这个机会整理一下这次更新带来了什么。
阅读更多最近 GitHub 上出现了一个颇受关注的仓库:asgeirtj/system_prompts_leaks,作者通过各种方式提取了 Claude Code、ChatGPT、Gemini、Grok 等主流 AI 工具的完整 system prompt,并悉数公开。
阅读更多AI 编程助手已经流行了几年,身边的同事对它的评价两极分化——有人觉得它是革命性的生产力工具,有人觉得它就是个高级自动补全,写出来的代码一堆坑。我自己用下来,感觉这两种评价都有道理,关键在于你有没有找到正确的使用姿势。
阅读更多参考链接: https://learngitbranching.js.org/
阅读更多由2019.10面试经历总结而来。
阅读更多本文原作者Rick Hoskinson(链接为原文通道),仅供学习用途
阅读更多本文原作者Rick Hoskinson(链接为原文通道),仅供学习用途
阅读更多随着大数据的普及,MapReduce和Spark也被运用的越来越广泛,有些时候我们为了更好的了解我们的历史执行记录,甚至分析我们的历史,我们需要获取平台的metrics.本篇内容针对MapReduce v2,也就是Yarn,关于新旧版本MapReduce区别以及Yarn介绍可参考https://www.ibm.c...
阅读更多数据库
阅读更多放假归来,这几天复习了一下好久不用的python,总结了一下知识点。
阅读更多几十年来,计算机的基本结构没有改变,改变的是各个部分的规模,工艺改进。所以学习计算机的基本架构是很有必要的。
阅读更多今天好好游了一下自由泳(爬泳),突然感觉自己开窍了比之前游的快了很多,趁有兴致看了一下”Personal best freestyle”自由泳教程,记录了一些要点,下次继续提升游泳水平。
阅读更多FUSE
阅读更多SQL调优及函数
阅读更多2018年计划要读的开源库:
阅读更多文件系统是用户和硬盘数据打交道的接口,用户通过文件系统可以对文件内容进行各种操作。本篇将讨论目前最常见的两种文件系统: FAT和Ext
阅读更多本文介绍的是我的一个课程项目OpenStack的自动部署实现 ,附英文版详细报告详细报告以及代码。
阅读更多术语介绍
阅读更多条款32: 确定你的public继承塑模出is-a关系
阅读更多最简单的SQL数据库中,所有的数据都在一张表内,这张表看起来大概是这样的:
阅读更多条款26: 尽可能延后变量定义式的出现时间
阅读更多本文原作者Michal Ptaszek(链接为原文通道),仅供学习用途
阅读更多条款18: 让接口容易被正确使用,不易被误用 “促进正确使用”的办法包括接口的一致性,以及与内置类型的行为兼容 获得大小时全部用size而不是偶尔有length 如果和int类似,就要是他的行为(比如加减)和int一样 “组织误用”的办法包括建立新类型...
阅读更多临界区
阅读更多如果用过Unix系统,相信对下面这三个命令绝对不陌生
阅读更多条款13: 以对象管理资源
阅读更多条款5: 了解C++默默编写并调用了哪些函数
阅读更多条款1: 视C++为一个联邦
阅读更多OpenMP 编程学习 本周的主题是Shared Memory Programming,也就是共享内存编程。首先,我们需要明确一下共享内存编程的基本概念。
阅读更多NVIDIA CUDA 编程学习
阅读更多本文参考: http://www.linuxhowtos.org/C_C++/socket.htm, 仅供学习用途 客户端(Client)/服务端(Server)模型
阅读更多本文参考: https://discuss.leetcode.com/topic/50315/a-summary-how-to-use-bit-manipulation-to-solve-problems-easily-and-efficiently
阅读更多本篇将介绍一个很简单的MPI程序。程序的要求是:
阅读更多这学期选了一门并行系统的课程,打算讲所学知识稍微整理一下记录下来,以便以后复习。内容主要侧重于实际编程。
阅读更多有时候我们需要编辑一些远程服务器上的文件,但是由于屏幕刷新延迟等问题,直接使用vim等编辑器会使得效率比较低。本文将详细介绍如何使用sublime text 3 对远程文件进行编辑。
阅读更多Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in trouble...
阅读更多Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in trouble...
阅读更多