2026-04-12

4/12/2026, 7:16:05 AM

Pro 预览 Pro 会补充更明确的行动建议

免费版先看核心内容，Pro 将解锁每条信息背后的重要性、风险、机会与下一步建议。

Hacker News

热度: 1003 评论: 273

小模型也发现了Mythos发现的漏洞

为什么护城河是系统，而不是模型 TL;DR：我们在小型、廉价、开放权重模型上测试了 Anthropic Mythos 的展示漏洞。他们恢复了大部分相同的分析结果。人工智能网络安全能力非常参差不齐：它不能随着模型大小平滑扩展，而护城河是构建深度安全专业知识的系统，而不是模型本身。 Mythos 验证了该方法，但尚未解决该问题。 4 月 7 日，Anthropic 宣布推出 Claude Mythos Preview 和 Project Glasswing，这是一个由科技公司组成的联盟，旨在使用名为 Mythos 的新的、访问受限的人工智能模型来查找和修补关键软件中的安全漏洞。 Anthropic 承诺向开源安全组织提供高达 1 亿美元的使用积分和 400 万美元的直接捐赠。 Anthropic 红色团队随附的技术博客文章提到 Mythos 在每个主要操作系统和 Web 浏览器中自主发现了数千个零日漏洞，详细信息包括 OpenBSD 中的一个 27 年前的错误和 FFmpeg 中的一个 16 年前的错误。除了发现之外，帖子还详细介绍了高度复杂的漏洞利用构建：Linux 内核中的多漏洞权限升级链、JIT 堆喷射转义浏览器沙箱，以及 Mythos 自主编写的针对 FreeBSD 的远程代码执行漏洞利用。

当前热评

"The Anthropic writeup addresses this explicitly: > This was the most critical vulnerability we discovered in OpenBSD with Mythos Preview after a thousand runs through our scaffold. Across a thousand runs through our scaffold, the total cost was under $20,000 and found several doz"

作者: johnfn

查看原文

Hacker News

热度: 344 评论: 88

我们如何打破顶级人工智能代理基准：以及接下来会发生什么

我们的特工入侵了所有主要的网络。以下是解决方法以及该领域需要解决的问题。每周，都有一个新的人工智能模型登上基准排行榜的榜首。公司在新闻稿中引用了这些数字。投资者用它们来证明估值的合理性。工程师使用它们来选择要部署的模型。隐含的承诺很简单：更高的分数意味着更强大的系统。我们构建了一个自动扫描代理，系统地审核了最著名的人工智能代理基准中的八个——SWE-bench、WebArena、OSWorld、GAIA、Terminal-Bench、FieldWorkArena 和 CAR-bench——并发现每一个基准都可以被利用来获得近乎完美的分数，而无需解决单个任务。没有推理。没有能力。只是利用分数的计算方式。

当前热评

"This is a phenomenal paper on exploits and hopefully changes the way benchmarking is done. From the paper: We achieved near-perfect scores on all of them without solving a single task. The exploits range from the embarrassingly simple (sending {} to FieldWorkArena) to the technic"

作者: ggillas

查看原文

Hacker News

热度: 134 评论: 78

十一岁末

Build Awesome 是 11ty/Eleventy 的品牌重塑，并得到了成功的 4 万美元 Kickstarter 的支持。但这种通过静态站点生成器货币化的尝试重复了杀死 Gatsby 和 Stackbit 的相同错误，并且误解了真正构建静态站点的人。更新：由于电子邮件未发送，Kickstarter 已被取消并重新安排了几个月的时间，尽管在一天之内就达到了目标，但破坏了该项目的“势头”。昨天，Font Awesome 团队为一个名为 Build Awesome 和 Build Awesome Pro 的新项目启动了 Kickstarter，希望筹集 40,000 美元。它已经达到了该融资目标。什么是构建卓越？简单来说，它是 11ty/Eleventy 的品牌重塑。或者更确切地说，这是十一的结束。

当前热评

"Many folks on HN are the exact sorts of people who have lived the thankless popular-enough-to-be-an-unpaid-job solo OSS maintainer dream, so I wonder if you feel as annoyed by the tone of this post as I do. I truly don't understand how the same folks that champion accessibil"

作者: peteforde

查看原文

Hacker News

热度: 85 评论: 46

美国上诉法院宣布已有 158 年历史的家庭酿酒禁令违宪

法官表示，这项禁令源于重建时期，旨在阻止酒类逃税，实际上减少了税收收入法官表示，这项禁令源于重建时期，旨在阻止酒类逃税，实际上减少了税收收入美国一家上诉法院周五宣布，已有近 158 年历史的联邦家庭蒸馏禁令违宪，称其是国会行使其征税权力的不必要且不恰当的手段。位于新奥尔良的美国第五巡回上诉法院做出了有利于非营利性爱好蒸馏协会及其 1,300 名会员中的四名成员的裁决。

当前热评

"The article is devoid of any meaningful legal language. It is important to note that this ruling applies only to the states of Texas, Louisiana, and Mississippi as the fifth circuit is the court that decided this. That said, when parties bring cases to other federal circuit court"

作者: ghastmaster

查看原文

Hacker News

热度: 19

Tofolli 大门就是您所需要的

任何布尔函数都可以用 Tofolli 门计算，并且 Tofolli 门是可逆的，因此任何布尔函数都可以可逆计算。兰道尔原理给出了擦除一位信息所需能量的下限：其中 k B 是玻尔兹曼常数，T 是以开尔文为单位的环境温度。无论该位的物理存储方式如何，下限均适用。进行可逆计算所需的能量没有理论上的下限。实际上，擦除一个位所需的能量大约是兰道尔下限的十亿倍。您可能会合理地得出结论，可逆计算不切实际，因为我们还远未接近兰道尔极限。然而，在实践中，可逆电路已被证明比传统电路使用更少的能量。我们距离最终的物理极限还很远，但今天可逆性仍然提供了实际的效率提升。

查看原文

RSS

沃尔玛旗下的 Flipkart 和亚马逊正在挤压印度的快速电子商务初创公司

分析师表示，Flipkart 持续向主要城市以外的地区扩张以及大幅折扣正在增加印度快速商业初创企业面临的风险。分析师表示，Flipkart 持续向主要城市以外的地区扩张以及大幅折扣正在增加印度快速商业初创企业面临的风险。 2026 年首届 StrictlyVC 将登陆旧金山。门票进展很快。立即注册。购买 Disrupt 2026 通行证可节省高达 680 美元。晚上 11:59 结束今晚太平洋时间。立即注册。印度的快速商业市场正在蓬勃发展，一些参与者的需求增加了一倍多。但 Flipkart 和亚马逊推动的快速配送正在加剧这个本已拥挤的领域的风险，该领域的盈利能力仍面临压力。

查看原文

YouTube

观看: 80.4 万评论: 1392

联邦法官驳回 Trooper 驳回诉讼的请求

2022 年 12 月，迈克尔·莫里斯 (Michael Morris) 正赶着他 10 岁的女儿去急诊室，这时州警蒂莫西·德罗沙 (Timothy Derosha) 在距离医院门口几步之遥的地方拔枪指着他。欢迎来到罗阿诺克 WSLS 10 News 的官方 YouTube 频道！在 YouTube 上观看 WSLS 10 的更多内容：https://www.youtube.com/@Wslstv10

当前热评

"No one should ever have qualified immunity from prosecution"

作者: @MarkCherry-te6ue

查看原文

YouTube

观看: 85.6 万评论: 4065

警长：“我们故意撞倒他……不要向警察开枪！” #shorts #us #news #foxnews

加州一名警长表示，一名武装嫌疑人杀死了一名警员，并在收到驱逐通知后将自己封锁起来。 #fox #media #breakingnews #us #usa #new #news #breaking #foxnews #crime #crimenews #crimestory #criminal #police #california #shooting #suspect #deputy #law #justice #barricade #investigation #violence #incident #public #safety #america 不要只观看福克斯新闻——成为其中的一部分。是

当前热评

"the media pretending to gasp in horror.. priceless."

作者: @seechig

查看原文

YouTube

观看: 1250.1 万评论: 26623

奥兰多妈妈呼吁停止超速驶过停止校车的汽车#新闻

当前热评

"That is actually insane! It’s a miracle that none of those kids have been hit or killed yet!"

作者: @rippinross3238

查看原文

RSS

卡尔希在亚利桑那州刑事案件中赢得临时暂停

商品期货交易委员会周五宣布，它已赢得一项临时限制令，阻止亚利桑那州对卡尔希提起刑事诉讼。

查看原文

RSS

山姆·奥尔特曼 (Sam Altman) 在其家遭到袭击后回应《纽约客》的“煽动性”文章

这位 OpenAI 首席执行官的新博文既回应了对他家的明显攻击，又回应了《纽约客》的深入报道，引发了人们对他的可信度的质疑。

查看原文

RSS

Nvidia 支持的 SiFive 开放 AI 芯片估值达到 36.5 亿美元

The deal is interesting for a number of reasons, including that SiFive's chip designs are based on RISC-V, not x86 or ARM.

查看原文

RSS

AMC will stream ‘The Audacity’ premiere in 21 parts on TikTok

Is this a smart way to build buzz, or just an odd attempt to recreate Quibi?

查看原文

YouTube

观看: 145.0 万评论: 5395

HALF OF AI DATA CENTERS CANCELLED #shorts

HUGE W FOR GAMING #nvidia #steam #xbox #playstation #nintendo #gaming #skit #fyp #funny #shorts

当前热评

"“Happy to announce” has never been more true"

作者: @Dragonlord_11634

查看原文

小模型也发现了Mythos发现的漏洞

我们如何打破顶级人工智能代理基准：以及接下来会发生什么

十一岁末

美国上诉法院宣布已有 158 年历史的家庭酿酒禁令违宪

Tofolli 大门就是您所需要的

沃尔玛旗下的 Flipkart 和亚马逊正在挤压印度的快速电子商务初创公司

联邦法官驳回 Trooper 驳回诉讼的请求

警长：“我们故意撞倒他……不要向警察开枪！” #shorts #us #news #foxnews

奥兰多妈妈呼吁停止超速驶过停止校车的汽车#新闻

卡尔希在亚利桑那州刑事案件中赢得临时暂停

山姆·奥尔特曼 (Sam Altman) 在其家遭到袭击后回应《纽约客》的“煽动性”文章

Nvidia 支持的 SiFive 开放 AI 芯片估值达到 36.5 亿美元

AMC will stream ‘The Audacity’ premiere in 21 parts on TikTok

HALF OF AI DATA CENTERS CANCELLED #shorts

已经是 Pro？邮箱登录

订阅每日简报