微软近日发布了 Visual Studio Code 1.114 版本。这次更新对这款广受欢迎的代码编辑器进行了多项改进,重点优化了 AI 聊天体验,包括在聊天附件的图像轮播中新增视频预览支持、在聊天上下文菜单中添加"复制最终回复"命令、简化 ...
本周网络安全领域呈现多维度威胁态势:国家级APT攻击持续活跃,供应链安全风险加剧,AI安全漏洞引发广泛关注,同时加密货币领域再度成为攻击目标。以下为本周主要资讯汇总。 伊朗关联组织对以色列发起大规模密码喷洒攻击 Check ...
回过头来,Mythos 预览版寻找漏洞的能力已经初见端倪。 尤其对比之前 Claude 最强模型 Opus 4.6 自主发现并利用漏洞的成功率接近 0%,Mythos 预览版的表现可以堪称逆天。
面向软件工程的 SWE-bench Verified 从 Opus 4.6 的 80.8% 暴涨到 93.9%,SWE-bench Pro 从 53.4% 冲到 77.8%;面向高难度数学推理的 USAMO 2026,更是从从 42.3% 直接飙到 97.6%——几乎满分。
另外从测试报告来看,在过去几周的内部红队测试里,Mythos 预览版展现出的进攻能力,已经远超人类顶尖安全专家。它不只是「能找漏洞」,而是能自主发现、链式利用、数千个高危零日漏洞。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果