GitHub Io - 搜索 News

资讯

Meta团队突破视觉压缩极限：让AI用更少算力生成更好的图像和视频

说到底，这项来自Meta的研究为我们揭示了视觉AI系统中一个长期被忽视但至关重要的组件——视觉标记器的深层运作规律。研究团队通过大规模实验发现，决定压缩质量的核心因素竟然是一个相对简单的数值：压缩后总浮点数的数量。这个发现就像发现了烹饪中面粉用量决定蛋糕质量的基本法则一样，为整个领域提供了清晰而实用的指导原则。

3 小时

宇树机器人被「虐」视频火出圈，海外网友看傻了：这真的不是特效？

他本、硕、博分别毕业于中国矿大、哈工大、澳大利亚 Newcastle 大学，曾在悉尼大学野外机器人研究中心开展博士后研究，致力于机器人的多模态感知及融合、最优滤波与参数辨识、机器人与航天器控制、野外机器人系统与技术等方面的研究。

腾讯网

宇树：开源机器人世界大模型！

官方称，UnifoLM-WMA-0属于UnifoLM（Unitree机器人统一大模型）系列成果，是团队专为通用机器人学习量身打造的，能适配多种机器人本体。

23 小时

宇树开源 UnifoLM-WMA-0 世界模型架构：可理解机器人与环境交互物理规律

IT之家 9 月 15 日消息，宇树科技今晚宣布开源 UnifoLM-WMA-0，其为宇树科技跨多类机器人本体的开源世界模型-动作架构，专为通用机器人学习而设计，其核心成分在于一个可以理解机器人与环境交互物理规律的世界模型。

3 小时on MSN

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里 ...

AI日报汇总最新行业动态：腾讯发布混元3D+3.0模型，建模精度提升3倍；昆仑万维Mureka上线音乐创作功能；阿里Qoder推出付费订阅服务；VEED Fabric 1.0实现图片转视频；OpenAI发布GPT-5-Codex革新编程；全国发布AI安全治理框架2.0；Mini-o3实现超长视觉推理；上海AI Lab推出多模态模型Lumina-DiMOO；腾讯微调技术提升图像美感300%；Meta ...

8 小时

OpenVision 2：大道至简的生成式预训练视觉编码器

近日，来自加州大学圣克鲁兹分校、苹果公司、加州大学伯克利的研究者提出了 OpenVision 2，一种极简的生成式视觉预训练新方向。这项工作在保持最优性能的同时，大幅提升了训练效率，并在生成式框架下实现了 10 亿参数规模的可扩展训练。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果