AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI发布两款多模态推理模型o4-mini、满血版o3

OpenAI在技术直播中推出了其最新多模态模型o4-mini和满血版o3,这两款模型具备同时处理文本、图像和音频的能力,并能调用外部工具进行复杂任务的处理。o4-mini在各项测试中表现优异,准确率高于o3,并在编程竞赛中名列前茅。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

2、微信首个AI助手 “元宝” 正式上线,可以添加为微信好友

腾讯推出的“元宝”是首个在微信平台上运行的AI助手,用户可以直接在微信中搜索并添加为好友,享受更真实的聊天体验。元宝不仅能解析微信公众号文章、图片和文档,还能进行智能互动,回答用户的进一步提问。该助手关注用户隐私,具备证件照自动打码功能,虽然目前不支持语音或视频通话。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

【AiBase提要:】

🌟 微信首个 AI 助手 “元宝” 上线,用户可直接在微信中搜索添加。

📊 元宝支持解析公众号文章、图片和文档,提供智能互动。

🔒 具备隐私保护功能,支持证件照自动打码。

3、字节发布豆包1.5深度思考模型:多模态深度思考、延迟低

在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动发布了豆包1.5深度思考模型,展示了其在数学、编程、科学推理及创意写作等领域的卓越能力。该模型采用MoE架构,参数配置优越,推理成本低。结合视觉理解技术,模型能够分析照片、辅助旅行和项目管理,并且视频搜索能力显著增强,提升了用户获取信息的便利性。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

【AiBase提要:】

📈 豆包1.5模型在数学、编程等领域表现出色,采用MoE架构,参数配置优越。

🌍 新模型结合视觉理解技术,能够分析照片,辅助旅行和项目管理,功能强大。

🎥 视频搜索能力显著增强,用户可快速获取视频中的相关信息,使用量持续增长。

4、月之暗面Kimi开源数学定理证明模型Kimina-Prover

Kimi技术团队发布了Kimina-Prover的预览版,开源了多个模型和数据集,展现出在形式化定理证明领域的出色性能。Kimina-Prover通过结合大规模强化学习与形式化推理,显著提升了模型的推理能力和样本效率,达到了80.7%的通过率,超越了以往最佳结果。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

【AiBase提要:】

🔍 Kimina-Prover在miniF2F基准测试中达到了80.7%的通过率,超越了之前的最佳结果。

🚀 该模型结合了大规模强化学习与形式化推理,显著提升了推理能力和样本效率。

📚 Kimina-Prover的可解释性强,用户可以查看推导过程,为理解模型行为提供便利。

详情链接:https://arxiv.org/abs/2504.11354

5、OpenAI开源超Agent:Codex CLI,五小时内破5000颗星

OpenAI最近发布了Codex CLI,这是一款轻量级的代码智能体工具,发布后迅速获得了极大的关注,仅在五小时内便突破了5000颗星的评价,预计当天将突破1万颗星。Codex CLI具备自动生成、运行代码、重构和测试等强大功能,极大地提升了开发者的工作效率。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

【AiBase提要:】

🌟 Codex CLI 在发布后仅5小时便获得5000颗星评价,预计今天将突破1万颗星。

💻 该工具可以自动生成代码、运行代码、重构和测试代码,功能强大且实用。

📈 OpenAI 计划持续推出更多智能体产品,并在探索收购 AI 编程平台以增强竞争力。

详情链接:https://github.com/openai/codex?tab=readme-ov-file

6、谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验

谷歌最近宣布将其 Gemini 应用中的 Gemini Live 功能免费向所有安卓用户开放,此前该功能仅限于 Pixel9和三星 Galaxy S25用户。Gemini Live 的强大之处在于能够实时识别摄像头和屏幕上的内容,为用户提供即时反馈和信息,极大增强了互动体验。随着用户反馈积极,谷歌决定推广这一功能,预计在未来几周内全面上线。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

【AiBase提要:】

🌟 Gemini Live 功能现已免费向所有安卓用户开放,原本仅限于 Pixel9和 Galaxy S25用户。

📸 该功能可以实时识别摄像头和屏幕内容,提供即时信息和反馈,提升用户互动体验。

🚀 微软同日推出类似的 AI 工具 C o p i l o t Vision,显示出实时信息识别技术的快速进步。

7、OpenAI 拟以30亿美元收购 AI 编程工具 Windsurf

OpenAI 正在与 AI 编程工具 Windsurf 展开收购谈判,交易金额约为30亿美元。这一收购将成为 OpenAI 最大的并购交易,标志着其在 AI 开发者工具市场的重要布局。Windsurf 是一款受欢迎的 AI 编程助手,能够生成和解释代码,并已获得超过2亿美元的融资。

【AiBase提要:】

💰 OpenAI 正在与 Windsurf 进行30亿美元的收购谈判,若达成将成为其最大规模的并购交易。

🚀 Windsurf 是一款广受欢迎的 AI 编程助手,支持代码生成和解释,已获得超过2亿美元的融资。

📈 此次收购将增强 OpenAI 的编程能力,帮助其在竞争激烈的 AI 工具市场中占据领先地位。

8、JetBrains 推出编码智能体 Junie AI,助力编程与调试全新体验

JetBrains 最近宣布其新编码智能体 Junie AI 已达生产就绪状态,旨在帮助开发者更高效地进行代码编写与调试。Junie AI 的推出标志着 JetBrains 在 AI 工具领域的重大进展。此外,JetBrains 还更新了其旧版 AI 助手,支持最新的 AI 模型,并增强了用户体验。为了应对市场竞争,JetBrains 计划推出免费套餐,吸引更多开发者使用其工具。

【AiBase提要:】

🤖 Junie AI 已达生产就绪状态,专注于复杂任务的处理与调试。

📈 更新的 AI 助手支持多种最新 AI 模型,并新增多文件编辑功能。

🌐 JetBrains 将推出免费套餐,提供无限代码补全,以满足不同开发者的需求。

详情链接:https://blog.jetbrains.com/blog/2025/04/16/jetbrains-ides-go-ai/

9、Reachy2开源人形机器人正式开售

Pollen Robotics推出的Reachy2是一款开源人形机器人,售价7万美元,已在多所顶级大学和研究机构中得到应用。其模块化设计和强大的AI驱动能力使其成为人形机器人领域的先锋,适用于多种研究和教育场景。Reachy2的开源特性和灵活的编程支持为开发者提供了广阔的创新空间,推动了机器人技术的进步。

AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

【AiBase提要:】

🤖 高度仿人设计,具备7自由度手臂,能够自然、精准地执行动作,适合多种应用场景。

🔄 模块化与开源架构,支持Python SDK编程,开发者可根据需求扩展功能,推动技术创新。

🌍 已在全球20多个国家部署,客户包括知名机构,展现出在医疗、零售及教育等领域的广泛应用潜力。

10、上海人工智能实验室推出升级版多模态大模型 “书生・万象3.0”

上海人工智能实验室推出的“书生・万象3.0”是一个全新的多模态大模型,具备更强的文本和多模态输入处理能力,表现出色。该模型在性能和用户体验上都有显著提升,响应速度更快,理解能力更强,能够满足用户多样化的需求。

【AiBase提要:】

🚀 升级版“书生・万象3.0”在多模态处理能力上有显著提升,适用于多种应用场景。

💡 该模型在性能和用户体验上都有明显进步,响应速度和理解能力均增强。

🌐 开源举措为开发者提供了新的平台,鼓励创新和应用,推动行业发展。

11、豆包深度思考和文生图3.0模型正式开放API 对企业客户开放

豆包大模型近期发布了豆包1.5·深度思考模型和豆包文生图模型3.0,正式通过火山引擎开放API,供开发者和企业客户使用。这两款模型在推理和图像生成任务上表现卓越,推动了AI技术的应用与发展。深度思考模型在专业推理任务中表现突出,而文生图模型则在图像生成质量上有显著提升。

【AiBase提要:】

🧠 豆包1.5·深度思考模型在专业领域推理任务中表现优异,接近全球第一梯队水平。

🎨 豆包文生图模型3.0实现高分辨率图像生成,提升了创作效率,具备商业级设计能力。

🚀 两款模型的开放API为企业客户提供了更高效、通用的推理与图像生成能力,推动AI技术发展。

详情链接:https://github.com/ByteDance-Seed/Seed-Thinking-v1.5

快讯转自站长之家,转载请注明出处

上一篇:

下一篇:

最新资讯

  • 爱思助手无法绑定Apple ID怎么办?

    不少人在用爱思助手的时候,都会遇到一个挺让人头疼的问题:明明 Apple ID 和密码都没错,但就是提示无法绑定,反复尝试也不成功。看着一堆提示弹窗,心态很容易直接崩掉。其实这个问…

    2025年12月24日
  • 苹果系统什么版本最好用

    每次苹果发布新系统,总会有一波人跃跃欲试,也总会有一波人默默观望。升级还是不升级,几乎成了果粉的年度哲学问题。系统版本这么多,到底哪个才是真的“最好用”,其实并没有一个放之四海而皆…

    2025年12月24日
  • 苹果手机丢了怎么追踪手机位置显示离线

    (图片来源网络,侵删) 苹果手机丢了,本来就够闹心了,结果打开“查找”,一看:设备显示离线,那种感觉基本等于心凉了一半。很多人第一反应是——是不是彻底找不回来了?其实不一定,关键要…

    2025年12月24日
  • 苹果手机密码忘记了怎么解开不刷机

    (图片来源网络,侵删) 不少人都有过这种崩溃时刻:手机放桌上好好的,拿起来一解锁,突然发现密码怎么都不对。多试几次,直接被提示“已停用”,这时候再去网上一搜,全是“刷机”“清空数据…

    2025年12月24日
  • 鸿蒙系统跟安卓系统有什么区别?

    这几年只要一聊国产手机系统,鸿蒙和安卓几乎绕不开。很多人会问:鸿蒙系统和安卓系统到底有什么区别?是不是换了个名字的安卓?值不值得用?这个问题网上说法很多,但真正能把差别讲清楚的并不…

    2025年12月24日
  • 手机蓝牙打不开一打开就自动关闭怎么回事

    很多人都遇到过这种情况:想连个耳机、车载或者手表,结果蓝牙刚打开,“啪”一下自己又关了,反复几次都一样,看着就让人上火。其实这种问题并不稀奇,原因也没你想的那么玄乎,大多数都能自己…

    2025年12月24日
  • 电脑运行速度慢的原因及解决方法

    电脑变慢这件事,本质上不是“老了”,而是系统在悄悄给自己加负重。优化的目标只有一个:让系统回到“只干正事、不内耗”的状态。下面给你一套优先级明确、有效且不过度折腾的方案。 (图片来…

    2025年12月24日
  • 腾讯会议怎么使用

    腾讯会议作为一款高效便捷的远程会议工具,已经成为许多企业和个人的首选。本文将详细介绍腾讯会议的使用方法,帮助您轻松掌握这款工具。 (图片来源网络,侵删) 准备工作 在使用腾讯会议之…

    2024年8月6日
  • 微信收款积分在哪里查

    微信收款积分是微信平台上的一种激励机制,用户通过使用微信支付进行收款,可以积累积分,并在微信平台内兑换相应的奖励或优惠。对于很多用户来说,如何查找微信收款积分却是一个令人头疼的问题…

    2024年8月6日
  • 管理员权限在哪里设置

    在许多操作系统中,管理员权限是控制计算机或网络系统中特定功能的关键。拥有管理员权限的用户可以对系统进行更深层次的操作,包括安装程序、修改系统设置等。对于一些用户来说,如何设置管理员…

    2024年8月6日