每日资讯

未分类19小时前更新 18903315559
10 0
每日AI快讯

AI工具集每个工作日实时更新 AI 行业的最新资讯、新闻、热点、融资、产品动态、爆料等,让你随时了解人工智能领域最新趋势、更新突破和热门大事件。加入AI交流群,获取最新一手信息!

5月14·周四

小米具身智能团队开源自动驾驶大模型 Xiaomi OneVL

小米具身智能团队开源Xiaomi OneVL一步式潜空间语言视觉推理框架。模型在业内率先实现 VLA、世界模型与潜空间推理的统一,兼具强悍推理能力与高速响应,精度超越显式 CoT,速度对齐潜空间 CoT 方案。在 ROADWork、Impromptu、Alpamayo-R1 等多项基准上达到 SOTA,提供语言与视觉双维度可解释性。来源:IT之家

Runway推出AI视频创作智能体Runway Agent

Runway正式推出Runway Agent,对话式AI视频创作智能体。用户仅需描述需求,Agent在单轮对话中完成从概念构思、故事分镜到视觉方向的全流程规划,自动生成包含多场景、配音、对白及配乐的高分辨率成品视频。来源:Runway

豆包输入法推出macOS版本

字节跳动旗下豆包输入法macOS版本正式上线,苹果电脑用户可通过语音实现”用嘴打字”。macOS版本基于豆包App同款语音模型,支持任意输入框实时语音转文字,边说边出字且无时长限制。功能上支持多种方言及中英混说,可智能修正语气词、语病和口误,能记住用户个性化改词习惯等。来源:豆包

5月13·周三

谷歌推出 Gemini 电脑 Googlebook,把 AI 塞进光标

谷歌在安卓Show大会上推出首款为Gemini量身打造的Googlebook笔记本,搭载智能光标并支持跨设备体验。同时发布安卓版Gemini Intelligence,支持跨App自动执行多步骤任务、Chrome集成Gemini插件、Rambler语音转文字及自定义桌面组件。谷歌还与苹果联手新增端到端加密RCS,预告下周I/O大会将抢先预览智能眼镜。来源:智东西

MiniMax 推出 MiniMax Agent 升级版 Mavis

MiniMax推出MiniMax Agent升级版Mavis,上线Agent Teams功能,支持多角色Agent并行协作,通过Owner、Worker、Verifier架构解决单Agent停摆、漂移等痛点;同时合并TokenPlan与Agent Plan,一份订阅打通CLI、API、Agent全链路,覆盖M2.7及音视频模型,Credits额度灵活共享。来源:MiniMax 稀宇科技

林俊旸创业,新公司估值约20亿美金

前阿里千问大模型技术负责人林俊旸已正式创业,聚焦世界模型与具身大脑。他已招募来自字节、腾讯及海外背景的核心成员,以约20亿美元估值启动融资,接触红杉中国、高榕创投等机构。此前,林俊旸因阿里云计划拆分Qwen团队离职,具身智能也是其在阿里未竟之业。来源:智能涌现

Claude Code 推出 Agent View,一个界面管理所有 AI 会话

Anthropic为Claude Code推出Agent View研究预览版,支持开发者在一个终端界面内同时调度、监控多个并行AI会话,无需多开窗口。用户可实时查看各任务状态,随时介入回复或切换会话且不丢进度。功能支持后台持续运行,将Claude Code从单线程对话工具升级为多任务”指挥中心”,适用所有付费计划。来源:AI工具集

5月12·周二

OpenAI推出AI网络防御工具Daybreak,斥资40亿美元成立新公司

OpenAI宣布成立OpenAI Deployment Company,获超40亿美元初始投资并收购英国AI咨询公司Tomoro,将150名前沿部署工程师嵌入企业,帮助客户将AI部署到销售、法务等核心业务流程,从模型提供商转型为AI经济部署层。同时推出AI网络安全工具Daybreak,整合最强模型、Codex及安全合作伙伴,自动化漏洞发现与修复,加速网络防御并持续保障软件安全。来源:机器之心

办公小浣熊桌面版 2.0 升级发布

商汤办公小浣熊桌面版2.0升级发布,从”桌面入口”转型为”执行助手”,新增六大能力:直接读取本地20+格式文件、一句话操控浏览器、⌘K全局快捷唤起、连接飞书/企微/钉钉、本地跨会话记忆、定时自动执行任务。现Mac端已开启首批内测招募,限时免费使用,Windows端预计5月中下旬上线。来源:商汤小浣熊

OpenBMB开源端侧多模态大模型MiniCPM-V 4.6

OpenBMB开源 MiniCPM-V 4.6 端侧多模态大模型,LLM 参数量仅 1.3B,模型总体积约 1.6GB,最低 6GB 内存即可流畅运行。模型基于 llama.cpp 框架,完整支持 iOS、Android、HarmonyOS NEXT 三大平台纯本地离线部署,具备图像理解、OCR、视频理解等多模态能力。来源:AI工具集

码上飞全新升级!不仅做APP,还能帮你做生意

码上飞宣布全新升级,进化为”用AI帮你做生意”的一站式平台。用户用中文可一句话生成微信小程序、App及网站。新版本为每个应用自动配备专属AI员工,支持内容创作、客户回复、数据分析等运营。同时自动生成管理后台集中管理订单、商品与经营数据,助力个人及小团队零门槛跑通业务。来源:码上飞-CodeFlying

阿里千问与淘宝全面打通

千问APP与淘宝全面打通,用户更新至6.9.1版本后,可在千问内直接完成商品挑选、对比及下单。依托AI能力,千问支持复杂条件精准筛选、模糊需求智能理解、场景化商品组合推荐,能识别”智商税”理性劝退,实现从搜索到购买的全链路AI购物体验。来源:千问APP

5月11·周一

Uncharted Dynamics 获数百万美元融资

具身智能底层基础设施公司 Uncharted Dynamics 完成数百万美元种子轮融资,由险峰长青领投。公司聚焦高精度多体动力学求解器研发,为具身智能提供物理层面的”真值地基”,解决现有仿真系统在刚柔耦合、柔性接触等复杂交互中物理失真、导致模型难以迁移至现实的问题。来源:Z Finance

中国移动推出MoMA大模型聚合平台与MobileClaw智能体框架

2026移动云大会在苏州召开,中国移动围绕”算力新动能、智能新空间”为主题,设8大分论坛及8000㎡展区,吸引超10万人次观展。中国移动发布三大首创:桌面级AI办公智能体MobileClaw、大模型聚合平台MoMA、支持电话交互的移动AI云电脑,和AI-eSIM卡及万亿级Token服务体验包,布局吉瓦级AI数据园区。来源:中国移动

火山引擎推出Agent套餐包「Agent Plan」

火山引擎正式推出Agent套餐包Agent Plan,首次将多模态模型与Harness工具深度整合。套餐聚合字节跳动自研的Doubao-Seed、Seedance、Seedream系列及GLM-5.1Kimi-K2.6等主流模型,内置联网搜索、embedding等工具,适配Claude CodeOpenClaw等平台。来源:火山引擎

谷歌云智能体开源官方命令行工具agents-cli

谷歌云智能体开源官方命令行工具agents-cli,专为简化企业级 AI Agent 从开发到部署的全生命周期设计。工具集成 Gemini CLIClaude CodeCodexCursor 等主流编程 Agent,内置 Workflow、Scaffold、Eval、Deploy 等7个技能包,支持本地模拟评估、自动化部署至 Cloud Run/GKE,提供人工模式随时接管流程。来源:AI工具集

QClaw上线文件空间功能,QClaw×腾讯文档× ima全面互通

腾讯QClaw正式上线「文件空间」功能,一次授权可打通本地文件、腾讯文档与ima知识库。用户可直接在QClaw内调用腾讯文档和ima资料让AI处理,生成内容后一键保存为腾讯文档并生成协作链接,或沉淀回ima知识库。实现从资料调取、AI加工到团队协作的全流程闭环。来源:腾讯云

© 版权声明

相关文章

暂无评论

none
暂无评论...