资讯
这项由南京大学的谢睿、刘银洪等研究者与字节跳动、西南大学合作完成的研究发表于2025年1月,题为《STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World ...
于是,研究团队提出了一种全新的训练方法,他们称之为"批评微调"。这就像是把AI从一个被动的模仿者变成了一个敏锐的评论家。不再是简单地学习如何给出正确答案,而是学习如何识别、分析和批评错误答案中的问题。这种方法的灵感来源于人类的学习过程——我们往往通过 ...
科技行者 on MSN
阿里巴巴团队发布MinMo:让AI和人类像朋友一样自然聊天的革命性语音 ...
这项由阿里巴巴集团通义实验室FunAudioLLM团队完成的研究发表于2025年1月,论文题目为《MinMo: A Multimodal Large Language Model for Seamless Voice ...
科技行者 on MSN
香港大学团队让视频编辑像玩拼图一样简单:把任何物体精准插入 ...
这项由香港大学的涂远鹏、赵恒爽教授等人与阿里巴巴达摩院合作完成的研究于2025年1月发表在计算机视觉顶级会议上,研究成果名为"VideoAnydoor: High-fidelity Video Object Insertion with ...
他曾在高中接触深度学习,本科机器人创业、实习助力Gemini 2.0开发、横跨AI与哲学双领域……如今,不到4年读完MIT博士,完成答辩。在OpenAI,他将继续推进「世界模型」——这项可能重塑通用人工智能路径的前沿技术。
字节跳动的研究团队发现,当前的大语言模型智能体在处理需要多步骤完成的长期任务时面临着一个根本性问题:稀疏奖励信号让系统难以判断中间步骤的价值。这个问题就好比一个厨师在做一道复杂菜品时,只有在客人品尝后才知道菜品好坏,却不知道在准备食材、调味、烹饪的各 ...
全面掌握 ChatGPT 中文版,无需翻墙即可体验 GPT-4 与多功能服务! 本指南旨在为用户提供详尽的 ChatGPT 中文版使用指南,并整理国内常用的 ChatGPT镜像网站 与 官方使用教程,帮助您快速上手,不论是个人使用还是专业需求。 什么是 ChatGPT 中文版? ChatGPT 中文版 ...
本文提供 ChatGPT 中文版使用指南,推荐国内直连的 ChatGPT 镜像网站,支持GPT-4,无需翻墙。 本项目为用户提供全面的 ChatGPT 中文版使用指南,同时整理了国内可用的 ChatGPT镜像网站和 官网使用教程,帮助您快速上手 ChatGPT,无论是个人使用还是专业需求。 什么是 ...
科技行者 on MSN
字节跳动与清华联手:实现电影级说话视频生成
当你看到好莱坞大片中栩栩如生的人物说话时,是否想过有一天你也能仅仅用一张照片和一段音频就制作出同样逼真的说话视频?ByteDance智能创作实验室与清华大学的研究团队在2025年9月发表了一篇突破性研究论文,题为"HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning",这项研究让这个梦想变成现 ...
科技行者 on MSN
南大团队突破:海量视频数据集让AI理解空间关系
这项由南京大学姚耀教授团队领导的前沿研究发表于2025年9月的arXiv预印本平台,论文编号为arXiv:2509.09676v1。有兴趣深入了解的读者可以通过https://nju-3dv.github.io/projects/SpatialVID 访问项目主页获取完整信息。 设想一下,如果你要教一个从未见过真实世界的AI系统理解我们生活的三维空间,你会怎么做?传统的方法就像给盲人描述颜色一样困 ...
现为设计研究员关注于量化分析用户空间体验,曾作为软件工程师就职于KPF Urban ...
当你坐在一辆自动驾驶汽车里,车载AI系统通过摄像头观察路况并告诉你"前方有行人正在过马路,我们需要减速",你会完全相信这个电子司机的判断吗?最近,由上海AI实验室、新加坡国立大学、加州大学尔湾分校等多个顶级研究机构组成的国际团队发表了一项突破性研究, ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果