
【今日资讯】 Grok 4 对所有用户免费开放
1.谷歌发布世界模型 Genie 3
谷歌 DeepMind 宣布正式发布了其最新一代世界模型 Genie3,不仅在生成时长、分辨率和物理一致性上实现显著提升,还支持通过文本动态改变虚拟世界事件。
Genie3 作为一款通用世界模型,能够以 24 帧每秒的速度生成 720P 分辨率的交互式 3D 环境,较前代 Genie2(360P,10-20 秒一致性)实现了显著飞跃。据谷歌 DeepMind 官方介绍,Genie3 通过自回归方式逐帧生成虚拟世界,最长可维持数分钟的环境一致性,视觉记忆时长高达 一分钟。
同时,Genie3 引入了革命性的 “可提示世界事件” 功能,用户可以通过简单的文本指令动态修改虚拟世界。Genie3 无需依赖传统物理引擎,而是通过大规模视频数据集训练,自主学习重力、物体运动和交互等物理规律。无论是火星表面越野车的颠簸、河流中喷射的水花,还是风吹草动的自然效果,Genie3 都能以高度逼真的方式呈现。Genie3 的发布被 DeepMind 视为迈向人工通用智能(AGI) 的重要一步。研究主任 Shlomi Fruchter 表示,Genie3 的通用性和实时交互能力使其成为训练 AI 智能体的理想平台。
尽管 Genie3 在技术上取得了显著突破,但仍存在一些局限性。例如,模型当前仅支持数分钟的连续交互,远未达到数小时的理想状态。此外,AI 智能体在模拟环境中的交互能力有限,复杂多智能体交互仍需进一步探索。
谷歌 DeepMind 表示,Genie3 目前以研究预览形式向部分学者和创作者开放,旨在进一步优化模型并评估潜在风险。未来,DeepMind 计划逐步扩大测试范围,并探索将其应用于更广泛的场景。(OSCHINA,节选)
2.马斯克旗下 xAI 公司宣布 Grok 4 免费开放
马斯克宣布 Grok 4 现在对所有用户免费开放。免费用户每天可完成少量查询,超过限制则需要订阅。
根据 xAI 的介绍,只需使用 “自动” 模式,Grok 就会将复杂的查询路由到 Grok 4。若用户偏好 “掌控一切”,则可以切换到 “专家” 模式。在限定的时间内,xAI 将提供 “慷慨的” 使用额度。马斯克曾宣称 Grok 4 是全球最强 AI 模型,在处理学术问题上的表现已经达到博士级别。
从官方公布的跑分数据来看,Grok 4 模型具备非常亮眼的成绩,在实时速度、推理能力和高级视觉等方面,将和 OpenAI、Anthropic 顶尖模型同台较量。Grok 4 模型具备深度推理能力,经过 xAI 的 Colossus 超级计算机训练,承诺提供更强的逻辑推理和文本生成能力。Grok 4 还具备自然的人类语音特征、实时网络访问能力,以及理解互联网文化的智能,包括对梗、俚语和幽默的高精度识别。
3.阿里通义千问首个图像生成基础模型 Qwen-Image 开源,支持中文高保真输出
8 月 5 日消息,阿里通义千问团队今日宣布开源 Qwen-Image,这是一个 20B 的 MMDiT 模型,也是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。
Qwen-Image 的主要特性包括:
文本渲染能力:Qwen-Image 在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。
一致性的图像编辑能力:通过增强的多任务训练范式,Qwen-Image 在编辑过程中能保持编辑的一致性。
跨基准性能表现:在多个公开基准测试中的评估表明,Qwen-Image 在各类生成与编辑任务中均获得 SOTA。
通义千问团队在多个公开基准上对 Qwen-Image 进行了全面评估,包括用于通用图像生成的 GenEval、DPG 和 OneIG-Bench,以及用于图像编辑的 GEdit、ImgEdit 和 GSO。
Qwen-Image 在所有基准测试中均取得了最先进的性能。此外,在用于文本渲染的 LongText-Bench、ChineseWord 和 TextCraft 上的结果表明,Qwen-Image 在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型。(IT 之家)
4.QuestMobile 发布 2025 年 AI 应用市场半年报,6 月全网 token 消耗量 116.3 万亿
QuestMobile 数据显示,上半年 AI 应用快速发展,形成了 “四大梯队” 的应用格局,其中,第一梯队由 AI 搜索引擎、AI 综合助手两个赛道构成,已经遥遥领先,截止到 2025 年 6 月,二者的月活跃用户规模分别达到 6.85 亿、6.12 亿。第二梯队由 AI 社交互动、AI 专业顾问组成,月活跃用户规模分别为 1.26 亿、1.11 亿。第三梯队由 AI 效率办公、AI 图像处理构成,月活跃用户规模分别为 0.69 亿、0.49 亿;第四梯队包括 AI 创作设计、AI 文案写作、AI 学科教育等等,均在 0.2 亿左右。
四大梯队应用的表现,落到应用模式上,形成三大类型模式的此消彼长态势。截止到 2025 年 6 月,“移动端 - 应用插件 (In-App AI)” 用户规模 6.3 亿,“移动端 - 原生 App” 用户规模为 5.7 亿,“PC 网页应用” 用户规模为 1.8 亿,相比 3 月份变化分别为增长 0.5 亿、下降 0.2 亿、下降 0.3 亿。
“应用插件” 的增长,反映出了用户使用 AI 时往往采用 “场景化工具” 的定位,更深层,则体现出用户对 “大模型稳定输出结果” 的诉求。与移动端 6.8 亿用户规模对应的是,有效 Token 消耗量上升至 116.3 万亿,其中五大互联网集团占总消耗量的 51.8%,达 60.3 万亿(OSCHINA,节选)
5.工信部通报《保卫萝卜 2》《贪吃蛇大作战》等 23 款侵害用户权益 App
8 月 4 日消息,工业和信息化部信息通信管理局今日发布公告,根据中央网信办、工业和信息化部、公安部、市场监管总局等四部门联合发布的《关于开展 2025 年个人信息保护系列专项行动的公告》,依据《个人信息保护法》《网络安全法》《电信条例》《电信和互联网用户个人信息保护规定》等法律法规。工信部对 App、SDK 违法违规收集使用个人信息等问题开展治理。(IT之家)
上下滑动图片查看名单
图片、内容来自网络,部分内容经AI整合,侵删