以下是 250305 期AI资讯日报,共 50 条
侧边有公众号二维码,与站长一起交流,了解 AI 快人一步!
Claude公司估值615亿美元再融35亿

Anthropic宣布完成新一轮35亿美元融资,投后估值达615亿美元。此轮融资由光速创投领投,多家机构参与。截至目前,Anthropic总筹集资金达182亿美元,资金主要用于扩大计算能力、研究AI模型可解释性和对齐、加速国际扩张。Anthropic近期计划提升Claude-3.7的编程能力,并开发协作式AI系统。Anthropic已与谷歌和亚马逊合作,分别获得30亿美元和80亿美元的投资。Anthropic估值迅速上升,其竞争对手OpenAI和xAI也在寻求高额融资,估值分别达到3000亿和750亿美元。
国内首个AI产前超声获批

开立医疗获得国内首个产前超声人工智能医疗器械证,其产品凤眼™S-Fetus®通过深度融合超声技术和人工智能,实现了全流程、全场景产前超声智能化,自动抓取标准切面并进行测量分析,显著提高了检查效率和准确性。该技术特别适用于医疗资源有限的基层地区,有助于提升产前超声诊断的质量和效率。开立医疗与多家医疗机构合作,持续优化技术,并参与多中心研究项目,以推动产前超声技术的智能化发展。此外,结合远程医疗和5G技术,智能超声医学影像迎来新的发展机遇。
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法

研究者提出了一种基于内置思维链的思考方法,以解决大语言模型在多轮对话中容易出错、推理能力弱等问题。该方法定义了模型思考时的五个要素:会话历史、全局思考上下文、内置行动调用、记忆和知识,并引入了局部思考上下文来优化系统上下文的局限。通过收集行动任务数据集,有监督微调基础模型,并利用一致性奖励模型进行强化学习,模型的推理和计划能力得到显著提升。
台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电宣布在美国投资1000亿美元扩建工厂,总计将投资1650亿美元在亚利桑那州建设更多芯片制造工厂及封装设施,预计将创造数千高薪职位。英特尔也在争取英伟达和博通等主要客户的芯片制造订单,其18A工艺若能成功吸引这些客户,将是对英特尔的重大胜利。然而,英特尔的18A制程交付时间已推迟至2026年下半年,导致其代工业务收入增长面临挑战。
通用汽车任命首位首席人工智能官
通用汽车任命49岁的巴拉克·图罗夫斯基为首位首席人工智能官,以加强其在人工智能领域的战略布局。图罗夫斯基曾任谷歌和思科的人工智能部门负责人,将在电动汽车、内燃机及自动驾驶等领域推动AI技术的应用。他的任务包括整合AI软件功能至通用汽车全线产品,优化充电站选址、库存管理和生产线效率。
AI 大战超级玛丽!Claude 3.7 封神:Gemini、GPT-4o 全军覆没,谁才是游戏界真王者?

加州大学圣地亚哥分校Hao人工智能实验室进行了一场AI挑战经典游戏《超级马力欧兄弟》的比赛。Claude3.7模型在比赛中表现出色,力压群雄,而GPT-4和Gemini1.5Pro则表现不佳。比赛在一个名为GamingAgent的高科技模拟器中进行,AI通过接收指令和游戏截图来控制马力欧的动作。值得注意的是,那些以推理能力强著称的AI模型因反应速度慢而在实时游戏中表现不如预期。尽管如此,这场竞赛展示了AI技术的进步,但也引发了对AI实际能力在现实世界中应用的讨论。
自变量机器人成功融资,迈向具身智能新纪元

南京市创投集团宣布,国产机器人初创企业自变量机器人已完成Pre-A++轮融资,由光速光合与君联资本领投,北京机器人产业基金及神骐资本等机构跟投。此轮融资旨在支持下一代具身智能通用大模型的训练与应用。自变量机器人成立于2023年12月,目标是通过研发此类模型推动通用机器人技术发展,使其能自主执行任务。公司CEO王潜和CTO王昊分别毕业于清华大学和北京大学,在机器人和人工智能领域有深厚背景。该融资将助力公司在具身智能领域的研究,推动机器人技术在日常生活和工业自动化中的广泛应用。
Stability AI与 Arm 合作 推出离线生成音频技术

Stability AI与Arm合作,开发了能在移动设备上运行的Stable Audio Open模型,使用户能在设备上生成音效、音频样本等,无需互联网连接。该模型经过优化,在Arm CPU上生成11秒音频的时间从240秒减少到8秒,效率提升30倍。此技术适用于大部分搭载Arm架构CPU的智能手机,未来将扩展到图像、视频和3D领域,革新移动设备上的视觉媒体创作。
Viam 融资 3000 万美元,携手巨头加速全球 AI 自动化布局!
Viam 完成3000万美元C轮融资,使总融资额达到1.17亿美元,由联合广场创投主导,Battery Ventures和Neurone等参投。Viam是一家专注于数据、人工智能和自动化的工程平台,已在多个行业扩展客户基础,如机器人、快餐和工业制造。Neurone的投资将助力Viam在欧洲尤其是意大利的发展。Viam的技术平台帮助硬件和软件工程师开发适用于各类设备和智能机器的技术解决方案。
飞猪推出 AI 行程助手:在线旅游行业首个融合多模型智能产品

阿里巴巴旗下旅游平台飞猪宣布,3月5日将推出首个融合DeepSeek-R1和阿里云通义千问模型的AI产品——“AI行程助手”,旨在提供个性化旅行方案。该产品能根据用户偏好、预算和时间等需求,快速生成定制化行程规划。此消息在社交媒体上引起热议,被视为AI技术在旅游行业的新里程碑。飞猪计划在4月前进行多次更新,包括优化多语言支持和实时数据整合等功能。这一创新产品有望推动在线旅游服务向智能化和个性化转型。
讯飞星火X1单挑满血版DeepSeek-R1,全国产算力单机部署!中国AI再下一城

星火X1,一款全国产算力训练的深度推理模型,在数学能力上取得显著进展,70B参数规模已追平甚至超越了其他国际领先的模型。尤其在竞赛级难题和中小学实用任务上表现突出,无需依赖昂贵的英伟达GPU,星火X1展现了算法创新在国产算力上的巨大潜力。该模型不仅适用于教育和医疗领域,还在政务、司法等多个行业展现出了高效和低成本的优势。通过技术创新和行业适配,星火X1正在推动中国AI技术的广泛应用和发展。
Spotify 推出 AI 音乐创作工具,允许用户个性化改编歌曲

Spotify宣布开发名为”Music Pro”的新服务,包含AI音乐创作工具,使用户能个性化改编歌曲,如改变节奏或替换演唱者。Spotify已利用AI技术推荐音乐、创建混合播放列表及自动标记音乐。新功能预计提升用户参与度并开辟更多收入来源。目前,Spotify正与业界伙伴商讨,目标是开启”Streaming2.0″时代,提供更多高级功能,进一步丰富音乐体验。
科幻照进现实!耶鲁大学发布 MindLLM:AI 读懂大脑,fMRI 信号秒变文字!

耶鲁大学、达特茅斯学院和剑桥大学的研究团队联合开发了AI模型MindLLM,能够将功能性磁共振成像(fMRI)扫描的大脑信号解码为人类可理解的文字。这一技术突破了神经科学领域长期面临的难题,相较于先前模型,MindLLM在各种fMRI到文本的测试中,性能提升了12.0%,未知主题泛化能力和新任务适应能力分别提高了16.4%和25.0%。该技术有望帮助语言障碍患者恢复沟通能力,并拓展健康人群的数字设备操作方式,开启人机交互的新时代。
可灵 AI 正式登陆 Android平台

KLING AI Android移动应用程序现已全面上线,支持Android和iOS设备。该应用包含Frames和Elements等核心功能,提供便捷的AI创意体验,包括视频生成和图像编辑。这款应用的发布标志着KLING AI向“让创意无处不在”目标迈进的新里程碑。用户可通过提供的链接下载应用。
实测字节免费AI编程,还让不让Cursor活了

字节跳动推出的国内首个AI集成开发环境(IDE)Trae,支持中文开发场景,提供免费服务。用户只需用自然语言描述需求,如生成Flappy Bird游戏,Trae即可自动完成代码编写及部署。Trae具备Builder模式,可处理基本编程任务,修正错误,调整游戏难度。安装Trae后,用户可在Chat或Builder模式下操作,后者能自动拆解需求并完成多轮编码。虽然在处理复杂任务时表现不如Cursor,但对于编程新手而言,Trae已足够实用。Trae作为AI原生IDE,与传统插件式AI工具不同,从底层架构即围绕AI能力构建,提升了流畅性和准确性。
17 岁华裔大学生的 AI Wrapper 火了,发布 5 小时收入 1 万美金

AI搜索引擎Genspark宣布完成1亿美元融资,估值达5.3亿美元,月活跃用户超200万。该公司推出了一个集AI搜索、浏览器和代理功能于一体的移动应用,强调广告拦截功能。Genspark表示这只是他们计划的一部分,目标是挑战Google。此外,17岁华裔大学生Eddy Xu开发的AI产品CrowdTest,通过AI预测推文传播效果,发布5小时收入即突破1万美元,24小时内收入达3万美元,体现了年轻一代的创新能力。CrowdTest目前收费较高,每月订阅费为1000美元。Eddy Xu还有多次创业经历,并计划进行Pre-Seed轮融资,降低产品价格。
豆包团队开源SuperGPQA:挑战285学科AI推理极限

字节跳动豆包大模型团队与M-A-P开源社区联合发布了SuperGPQA,这是一个包含26,529道专业问题的基准测试数据集,覆盖285个研究生级学科,包括主流学科及轻工业、农业、服务科学等长尾学科。相比传统基准如MMLU和GPQA,SuperGPQA通过专家-LLM协同机制,从权威来源筛选问题,弥补了现有测试在长尾知识领域的不足。实验显示,最优模型DeepSeek-R1的准确率为61.82%,表明大语言模型在多样知识领域仍有提升空间。SuperGPQA采用三阶段流程提升质量,评测结果表明指令微调可显著提升模型性能。
智谱开源AI绘图CogView4,曾经的开源之光回来了。

智谱与清华团队近日开源了AI绘图模型CogView4,支持中英文生成并能在单张12GB显卡上运行。该模型在语义理解和多场景应用上表现突出,但中文字识别准确性有待提高。作为开源五虎之一,智谱在过去两年间推出了多个模型,尽管在2024年后半程取得进展,但在开源领域的影响力有所减弱。智谱计划将CogView4于3月13日在智谱清言上向普通用户开放,并将其定义为2025年的开源年。
GPT-4.5崛起仅六小时便失宠,xAI Grok-3 逆袭夺冠

OpenAI的GPT-4.5和马斯克的xAI Grok-3模型在发布后六小时内分别登上人工智能排行榜首。最终,Grok-3以1412比1411的微弱优势超越GPT-4.5,主要因其在“带风格控制”和“困难提示词”任务上的表现更优。尽管GPT-4.5在多数项目中表现良好,且用户对其高情商的认可度提高,甚至有用户请求其不再被下架。此外,GPT-4.5还在类似“大模型狼人杀”的游戏中展示了卓越的合作和策略能力。
中文开源图片模型终于来了!智谱霸气发布 CogView4:中文 prompt 随便喂,汉字都能给你画出来!

智谱AI发布的中文图片生成模型CogView4,具备对中文的强大理解能力,支持直接在画面中“写”出汉字,突破了图片尺寸和prompt长度的限制。该模型在DPG-Bench基准测试中排名第一,展现了优秀的图像生成质量。此外,智谱AI还将开源配套的ControlNet、ComfyUI支持和模型微调工具,帮助用户根据需求定制个性化模型。CogView4的技术优势包括使用GLM-4编码器进行双语处理,采用动态文本长度技术和混合分辨率训练,以及精细的多阶段训练流程。
Mercury:颠覆性扩散大语言模型如何重塑AI生成领域

Inception Labs发布了全球首个商业级扩散大语言模型”Mercury”,标志着从自回归到扩散模型的范式转变。Mercury通过并行化文本生成,显著提升了生成速度和硬件效率,降低了成本。在NVIDIA H100 GPU上,Mercury的旗舰模型”Mercury Coder”达到每秒超过1000个token的生成速度,比传统模型快4-10倍,训练成本降低40%,推理成本降至十分之一。Mercury在代码生成、文档自动化等方面表现出色,准确率达到92%,支持长达32K token的上下文理解。此外,Mercury的发布推动了模型轻量化和领域定制化发展,有望重新定义人机协作。
播客平台 Podcastle 推出AI文本转语音模型:提供 450 种语音

Podcastle 平台推出了新的 AI 文本转语音模型 Asyncflow v1.0,提供超过450种不同的AI语音,并以每500分钟约40美元的价格向用户开放服务,相比竞争对手ElevenLabs的99美元更具成本优势。该模型还允许开发者通过API接口集成此功能。Podcastle的语音克隆功能升级后,训练时间从70句对话缩短到只需几秒。尽管新语音略显机器人化,但可通过更多录音样本持续优化。Podcastle的创始人表示,将多种功能整合到重新设计的网站中,有助于公司在竞争中脱颖而出。
三星Galaxy S25系列国行版接入DeepSeek-R1:AI能力全面升级

三星宣布,Galaxy S25系列在中国市场整合了DeepSeek-R1大模型,增强了AI功能。用户只需升级三星生活助手或通过三星智慧主页、Bixby中的“智能体中心”选择DeepSeek-R1智能体,即可使用深度思考、联网搜索、情绪价值、上下文记忆及视觉解析等功能。深度思考功能利用多阶逻辑推理引擎解答复杂问题,联网搜索功能连接权威数据库和互联网资源。Bixby即将推出“语聊视界”功能,以提升情绪价值交互能力。此次升级提升了生产力和生活场景的智能化水平,优化了沟通体验。
亚马逊的 AGI 负责人表示,AI 已深入每个业务角落

亚马逊AI副总裁Vishal Sharma在移动世界大会上表示,AI已深度融入亚马逊各业务,包括AWS云服务、仓库机器人及Alexa等。亚马逊拥有约75万台仓库机器人,并在AWS推出Nova文本生成模型。Sharma称,不同场景对AI的需求各异,亚马逊推出Bedrock服务,使企业能灵活使用多种基础模型,包括中国的DeepSeek模型。亚马逊正与Anthropic合作,投资80亿美元建立大型AI计算集群。面对开源模型的挑战,Sharma表示亚马逊并不担忧,强调客户选择的重要性。关于欧美关系紧张对欧洲公司选择AI资源的影响,他认为未来变化难以预测。
火山引擎宣布大模型应用开源:上线“大模型应用实验室”,释放 AI 创新潜力

火山引擎宣布其大模型应用正式开源,并推出“大模型应用实验室”平台,涵盖手机助手、DeepSeek联网版、实时视频理解、互动双语视频生成器及语音实时通话-青青等应用。这些应用展示了火山引擎在AI领域的技术实力,如DeepSeek联网版支持实时联网查询,语音实时通话-青青具备高保真语音合成与低延迟交互功能。此举旨在降低AI开发门槛,推动行业协作,预计将成为AI创新的新平台。
颠覆城市建模!AI生成3D城市模型GaussianCity,生成速度提升 60 倍!

南洋理工大学的研究团队开发了一种名为”GaussianCity”的新框架,用于生成超大规模的3D城市模型。该技术在CVPR2025会议上被接收,显著提升了3D城市模型的生成速度,比现有方案快60倍,达到10.72帧每秒。GaussianCity通过采用“BEV-Point”方法和空间感知的高斯属性解码器,解决了传统方法在规模和计算效率上的限制,实现了无边界生成。这一技术对虚拟现实、自动驾驶和数字孪生等领域具有重要意义。目前,GaussianCity的代码和资料已开源。
周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视

全国政协委员、360集团创始人周鸿祎在两会前表示,需正确看待AI安全问题,既不应夸大也不应忽视。他认为美国某些AI公司通过渲染AI不安全来为其垄断策略辩护,这实际上是“耍流氓”。周鸿祎强调,抓住AI发展机遇,提升生产力才是首要任务。针对AI“幻觉”问题,他认为这是大模型智能和创造力的表现,而非单纯的安全隐患,可以通过技术手段解决。他主张AI安全与业务发展应同步进行,推动技术进步。
a16z等顶尖VC投资,又有华人入局AI图像/视频赛道

Flora是一款由华人创始人Weber Wong开发的AI创意工具,于3月1日上线。Weber Wong拥有金融、技术和艺术背景,并曾在投行Evercore和Menlo Ventures工作。Flora采用“节点与连线”模式,支持文字、图像、视频三种模态,整合了GPT、Claude、Flux、SD、Kling、Pika等大模型。该工具注重优化可控性和交互体验,允许用户自由组合节点形成工作流,以实现特定任务。尽管Flora在一致性优化方面有所进步,但在可控性方面的效果仍待验证。此外,Flora还提供了可追溯性和复制节点功能,便于用户优化输出和生成系列资产。Flora已吸引a16z、Menlo Ventures、Long Journey Ventures等知名投资机构的支持。
超强视频生成模型 Wan2.1 GP:低配GPU也能搞定大片!

Wan2.1GP 是 DeepBeepMeep 团队发布的一款优化视频生成模型,基于 Alibaba 的 Wan2.1,专为低端 GPU 用户设计。该模型在多个基准测试中表现出色,超越现有开源和商业解决方案。Wan2.1GP 需8.19GB 显存,能在约4分钟内用 RTX4090 显卡生成一段5秒的480P 视频,支持文本到视频、图像到视频、视频编辑等任务,并具备中英文文本生成能力。该模型还具有视频变分自编码器(VAE),能高效处理1080P 视频,且不断更新以提高性能和用户体验。
Google发布SpeciesNet,这是一个旨在识别野生动物的 AI 模型

全球生态学家面临红外相机产生的大量野生动物照片数据处理难题,影响濒危物种研究。Wildlife Insights平台升级SpeciesNet模型,基于6500万张图片训练,能识别2000多种标签,准确率高且效率提升数十倍。该模型开源,推动AI在野生动物监测和保护区管理的应用,可能改变盗猎防控规则。未来有望扩展至珊瑚礁识别和昆虫多样性普查等领域。
NYU教授震怒警告:孩子不学编程,只会葬送美国未来!

专栏作家Kevin Roose通过AI开发了几个应用程序,声称AI使得编程变得容易,甚至让非程序员也能制作应用。然而,马库斯批评这种观点是贩卖焦虑,误人子弟,并指出实现AI编程的美好愿景面临重重阻碍。文章强调AI编程虽有潜力,但仍需人类监督,尤其在调试和维护方面。此外,过度炒作可能导致编程教育受阻,进而引发科技人才短缺。
挪威版“宇树”刷屏:人形机器人进工厂是伪命题,干家务才是正路

人形机器人Neo Gamma由1X Technologies发布,旨在家用市场应用。它具有仿人体结构的手掌,能执行握持等操作,并具备AI能力,能理解自然语言指令并作出反应。视频展示了其摆正画框、擦玻璃及使用吸尘器等功能,表明其有空间感知和推理能力。然而,尽管展示了潜力,Neo Gamma尚未正式推出。相比之下,宇树机器人已实现量产并销售,更具市场前景。未来人形机器人能否成功,取决于能否平衡硬件、智能算法和量产能力。
Opera 推出首个 AI 驱动的智能浏览代理,重新定义网页浏览体验

Opera推出了名为“浏览器助手”的AI代理,这是一个重大的浏览器功能升级。该AI代理具备自主性、感知能力、决策能力、行动执行和学习适应等功能,允许用户通过自然语言描述任务,由浏览器助手自动完成。例如,用户可要求购买特定商品,助手将展示执行进度。此工具在浏览器内部原生运行,利用DOM树和布局数据获取信息,无需依赖外部服务器,从而提高响应速度和效率,同时保护用户隐私。目前,浏览器助手处于预览阶段,即将在Opera的功能更新中推出。
Google Gemini 应用为 iPhone 用户带来锁屏小部件,力图超越 Siri

Google 更新了其 Gemini 应用,在 iOS 和 iPadOS 平台上新增了六个锁屏小部件,包括“输入提示”、“现场聊天”、“打开麦克风”、“使用相机”、“分享图片”和“共享文件”。这些功能旨在简化用户操作并提供更多便利。目前,苹果的 Siri 升级进展缓慢,面对来自 Google Gemini 和 OpenAI ChatGPT的竞争压力,Google的更新为其提供了吸引更多用户的契机。
AI 聊天机器人吞噬流量:出版商面临 96% 下降危机

AI聊天机器人正显著减少出版商网站的流量,导致广告收入下降。数据显示,AI机器人抓取网站次数高达200万次,每页平均7次,但这种行为并未转化为实际收益。OpenAI和Google等公司虽承诺增加媒体流量,实际情况却相反。TollBit分析发现,AI聊天机器人提供的内容总结使用户无需点击原始页面即可获得答案,从而削弱了出版商的流量。教育科技公司Chegg因谷歌AI概览功能受损,已起诉谷歌并考虑私有化。这一现象表明,AI驱动的流量变化可能重塑数字内容行业的格局。
Appfigure:用户2024年为AI付费达14亿美元,教育是关键领域之一

Appfigure发布的年度AI趋势报告显示,2024年全球AI应用市场规模接近20亿美元,用户支出达14亿美元,较2023年增加10亿美元,同比增长274%。AI助理、文生图、AI陪伴和教育AI是主要板块。AI教育&学习应用年花费4200万美元,12月收入为450万美元,同比增长181.25%。AI写作工具年收入2900万美元,12月收入210万美元。AI陪伴全年下载量1.18亿次,内购收入超5500万美元,同比增长652%。18-24岁用户占AI陪伴用户65%,教育AI用户56%;女性用户在教育&学习AI应用中占比31.4%,仅次于AI陪伴领域。
雷军两会建议:建议加强“AI换脸拟声”违法侵权重灾区治理
雷军在2025全国两会提出五项建议,涉及推进自动驾驶量产、发展智能网联新能源汽车产业生态、加速人工智能终端产业高质量发展、优化新能源汽车号牌设计及加强“AI换脸拟声”违法侵权治理。他建议完善人工智能终端标准体系,编制智能化分级标准等,力争2027年初步建成标准体系,2030年形成全球领先的标准体系。
AI “狼人杀” 大战!GPT-4.5 封神:社交推理 + 顶级欺骗,把 Claude 和 DeepSeek 都 “玩弄于股掌”!

最近的“Elimination Game”AI“狼人杀”基准测试显示,GPT-4.5在社交博弈中表现出色,胜率达到62.6%,远超Claude3.7Sonnet(59.3%)和DeepSeek R1(53.8%)。这项测试通过模拟多人在线游戏,展示了AI在策略、社交推理和语言表达方面的进步。结果显示,GPT-4.5不仅擅长合作和结盟,还能有效说服陪审团,而其他AI则在社交策略和稳定性方面稍显不足。
高通最新5G芯片,AI爆了

高通在世界移动通信大会上发布了X85 5G调制解调器及射频系统,该系统支持高达12.5Gbps的下行速度和3.7Gbps的上行速度,同时引入了AI技术,包括第四代集成AI处理器,AI推理速度比上一代提升30%,并支持双卡双通技术和AI辅助波束选择。这使得设备能更好地适应数据流量模式,提升响应速度和连接稳定性。高通还推出了基于X85的固定无线接入平台,支持AI优化,提升Wi-Fi性能和连接体验。这些进展表明AI正深度融入5G技术,推动连接与AI的深度融合。
中国AI的半壁江山,藏在这所大学里

2月17日,埃隆·马斯克的xAI发布了新一代人工智能大模型Grok 3,引起关注的是团队中包括多位华人成员,其中张国栋毕业于浙江大学。这一发现引发了关于浙江大学在人工智能领域实力的讨论。《经济学人》杂志也撰文肯定了浙江大学在人工智能领域的重要性。浙大通过竺可桢实验班等项目推动了AI在医疗影像、金融科技等领域的应用。尽管在QS世界大学排名中,浙大位列第47位,但它在AI领域的研究和创业氛围使它成为中国顶尖大学之一。浙大本科生创业率高达4.16%,连续三年蝉联中国本科院校创新创业教育指数榜首。浙大的成功与其所在的浙江地区浓厚的创业氛围密切相关。
通义灵码上线Qwen2.5-Max推理模型

通义灵码发布了最新的推理模型Qwen2.5-Max,该模型基于超过20万亿token的预训练数据,并通过精心设计的后训练方案优化。在多项基准测试中,Qwen2.5-Max的表现优于其他领先模型,如DeepSeek V3、GPT-4o和Claude-3.5-Sonnet。在MMLU-Pro等评估中,Qwen2.5-Max也展现出竞争力。根据Chatbot Arena的最新榜单,Qwen2.5-Max以1332分位列全球第七,成为中国非推理类大模型的冠军,在数学和编程能力上排名第一,硬提示能力排名第二。目前,Qwen2.5-Max已集成到通义灵码中,用户可通过下载插件体验其功能。
秘塔AI搜索上线「视频」搜索功能

上海秘塔网络科技有限公司宣布其AI搜索功能新增“视频”模块,覆盖上亿条视频内容,支持高效查找学习和娱乐视频。用户可通过该功能快速定位到特定主题的视频,如线性代数课程或超级碗广告,并能进行创意分析及播放。秘塔AI搜索还接入满血版DeepSeek R1推理模型,提升智能化水平,用户可在metaso.cn体验此功能。
QQ浏览器推出“AI作文辅导”功能 拍照即可提供解题思路
QQ浏览器新推出的“AI作文辅导”功能,旨在帮助学生在写作过程中提升能力,而非仅仅提供答案。该功能包括立意、提纲、素材和范文生成等环节,引导学生如何思考。用户可在QQ浏览器的“文件-学习工具”中找到此功能,输入作文题目及相关要求后,AI将解析题目、提供立意、生成提纲、补充素材并完成作文。QQ浏览器强调,AI只是辅助工具,真正的提升还需学生多阅读、观察和体验。
谷歌发布 SpeciesNet AI 模型 助力野生动物识别

谷歌开源了SpeciesNet AI模型,用于识别相机捕捉到的动物照片,加速野生动物研究数据处理。SpeciesNet基于6500万张图片训练,可识别2000多种标签,包括动物种类和非动物物体。该项目在GitHub上以Apache2.0许可证开源,促进生物多样性监测。
谷歌 Gemini 助手升级:支持实时视频分析与屏幕共享

在世界移动通信大会上,谷歌宣布为Gemini助手新增实时视频分析和屏幕共享功能,首先面向Google One AI Premium订阅用户。新功能包括通过外部摄像头实时分析视频内容及支持屏幕共享,使AI能解读手机信息并提供反馈。此次更新将在Android设备上推出,并支持多种语言。这标志着AI助手向现实世界交互迈进重要一步,谷歌计划将其整合到更多工具中,如搜索、Lens和地图。随着新功能的推出,谷歌与OpenAI的竞争加剧,Gemini的表现值得关注。
MiniMax推全新图像生成模型 Image-01,使用成本仅为 1/10

MiniMax发布了一款名为Image-01的文本到图像生成模型,通过API平台供用户访问。该模型具有精确的提示控制能力和高质量的视觉构图,能生成逻辑一致、艺术性强的图像。Image-01还能逼真地表现光影、复杂的场景和材质。用户可选择多种纵横比进行创作,每次请求最多生成9幅图像,每分钟处理10个请求。MiniMax提供高性价比服务,价格仅为同类产品的一成。
12万美国人,疯抢“AI死亡通知书”

“死亡时钟”是一款通过AI计算预测个人寿命的应用,基于1200项研究和5300万参与者的数据集,通过29个问题评估用户的健康状况和生活习惯,给出寿命预测和死亡日期。自去年7月推出以来,已获得超过12.5万次下载。该应用不仅提供死亡日期,还能生成身体年龄和健康评分,鼓励用户改善生活方式。此外,它还具有社交化特性,通过社交媒体平台的传播,吸引了大量年轻用户。未来,”死亡时钟”可能在财务规划和保险产品设计领域发挥更大作用。
华科字节推出 Liquid:重新定义多模态模型的生成与理解

Liquid是一种新的多模态生成框架,由华中科技大学、字节跳动与香港大学的研究团队提出,旨在解决现有多模态模型在视觉处理上的局限。Liquid通过采用VQGAN作为图像分词器,实现了图像和文本的统一处理,无需依赖外部视觉组件。实验显示,Liquid在不同规模(0.5B到32B参数)的语言模型上表现出色,视觉生成任务性能随模型规模扩大而提升,且遵循与语言任务一致的缩放规律。该框架在多模态理解、图像生成及文本任务中均展现优异性能,生成的图像与文本语义一致性高。
百川智能调整 To B 业务,金融团队裁撤聚焦 AI 医疗

百川智能近期对其To B业务进行了调整,裁撤了负责金融行业的B端组,并将PE团队并入统管算法团队和C端产品的产研组。公司表示,此举旨在集中资源发展AI医疗技术。目前,百川智能与北京儿童医院合作研发的AI儿科医生已投入疑难病例的专家会诊,成为全球首个正式应用的AI医生。未来,公司将整合资源,提升团队效率,推动AI在医疗领域的应用,促进优质医疗资源的普及。
AI教父手撕马斯克,他或成英国皇家学会首位被除名会士

“Hinton”批评马斯克对美国科学机构造成破坏,并呼吁英国皇家学会将其除名。马斯克反驳称,只有怯懦的人才在意这些称号,并指责Hinton的评论无知且不实。马斯克因被任命为美国政府效率部门负责人,导致美国国立卫生研究院(NIH)面临经费削减,可能严重影响科研活动。多名科学家联名签署公开信,表达了对马斯克行为的担忧,认为其行为违反了英国皇家学会的行为准则。英国皇家学会计划召开会议讨论马斯克会士资格的问题。
本文部分素材来自网络,侵删请联系站长。
扫码关注本站公众号/加入知识星球,订阅更多精彩内容