以下是 250304 期精选AI资讯日报,共 10 条
侧边有公众号二维码,与站长一起交流,了解 AI 快人一步!
智谱AI宣布完成新一笔金额超10亿元战略融资

智谱近期完成了超10亿元人民币的战略融资,由杭州城投产业基金、上城资本等多家机构参与。资金将用于推进国产基座GLM大模型的技术创新和生态发展。作为国内最早开源大模型的AI公司,智谱计划到2025年发布并开源全新大模型,以促进AI技术的应用。此次融资将加速公司在技术研发和生态建设上的投入,支持区域经济实体的发展。
谷歌提示词比赛冠亚军:把AI当同事,而不是机器

谷歌与Digitalidag联合举办了一场AI提示词比赛,冠军Magnus Gille认为编写提示词如同指导实习生,需提供清晰起始指令并保持互动。亚军Joakim Jardenberg建议将AI视为平等的同事,理解其能力和知识,并给予空间发挥创造力。成功的关键在于与不同AI服务频繁互动,将注意力放在可实现的应用场景而非难题上,从而形成积极循环。
阿里通义实验室开源视觉文档RAG系统ViDoRAG,准确率达79.4%

阿里巴巴通义实验室开源了最新研发的ViDoRAG系统,这是一个专为视觉文档理解设计的检索增强生成(RAG)系统。ViDoRAG采用多智能体框架,结合动态迭代推理代理和基于GMM的混合检索技术,在GPT-4o模型上的准确率达到79.4%,比传统RAG系统提升了10%以上。该系统通过多模态数据融合显著提高了处理复杂文档的能力,适用于法律文件分析、医疗报告解读和企业数据处理等场景。ViDoRAG的开源促进了多模态AI系统的进一步发展。
深圳发布具身智能机器人技术创新行动计划,聚焦多模态大模型构建

深圳市科技创新局发布《2025-2027年具身智能机器人技术创新与产业发展行动计划》,目标是通过构建具身智能基座及垂直领域大模型,推动智能机器人技术发展。该计划聚焦于基于世界模型和多模态输入输出(如视觉、触觉、语言、动作)开发具备交互、预测和决策能力的大模型。深圳将在医疗、物流、制造等领域研发垂直应用大模型,提升效率和准确性。此外,计划还包括建立训练和推理技术体系,支持大规模模型开发,并研发新型AI芯片以提供硬件支撑。该行动计划有望推动深圳成为智能机器人技术创新的领头羊,并为全国技术创新提供经验。
中国2025一季度人工智能现状分析:摆脱“学生”标签,从追赶者到竞争者

2025年第一季度,《Artificial Analysis: State of AI: China Q12025》报告显示,中国AI已从追赶者变为与美国并驾齐驱的竞争者。DeepSeek的R1模型智能指数达到89,几乎与OpenAI的o1模型(94)持平。此外,中国已有七家AI实验室推出了具有推理能力的模型。中国科技巨头如阿里巴巴、字节跳动、百度、腾讯和华为均推出了各自的AI模型系列。尽管美国对高端AI加速器的出口限制带来挑战,中国AI实验室在开源权重模型方面仍取得显著进展。报告显示,中国AI正迅速缩小与美国的差距,未来可能超越美国。
百度文库、百度网盘AI创作新物种「自由画布」全量上线

百度文库与百度网盘联合推出AI创作工具“自由画布”,该工具通过大模型技术,实现公域和私域内容的打通,支持图片、PPT、PDF、视频及音频等多种格式的混合理解和创作。用户可通过“一拖一圈”操作,以及“AI全网搜”功能,快速生成和编辑内容。“自由画布”允许用户通过多种方式上传素材,支持个性化批注和内容生成,并提供便捷的分享和存储功能。该工具结合百度文心大模型,优化了内容生产和消费体验。
字节跳动AI编程产品Trae国内版发布 配置豆包1.5pro、满血版DeepSeek模型

中国首款AI原生集成开发环境Trae国内版由字节跳动技术团队推出,配置Doubao-1.5-pro及支持切换DeepSeek R1、V3模型,显著提升编程速度。Trae以动态协作为核心,实现人机协同开发,适用于代码补全、理解、Bug修复及基于自然语言生成代码等场景。其Builder模式让开发者能通过自然语言快速生成应用,大幅缩短项目筹备周期。在代码理解方面,Trae通过对项目上下文的极致理解,提供精准的解决方案,并具备实时代码续写功能,提升编码效率。
当传统搜索走向黄昏:看夸克AI搜索如何用自研模型打造“深度思考”新体验

夸克AI搜索推出的”深度思考”功能基于阿里通义千问基模,通过推理模型理解用户问题本质,提供综合深度解答,改变传统搜索引擎仅依赖关键词匹配的方式。例如,在医疗健康领域,它能提供全面的防护方案而非零散链接。相比传统搜索,夸克AI搜索在问题理解、思考过程透明及回答结果整合方面表现更佳,适用于专业写作、学术研究和战略决策支持等场景,且部分功能免费。未来,夸克计划接入更大规模的推理模型,拓展其能力边界。
超越DeepSeek-R1!阿里万相大模型登上全球开源榜首

阿里巴巴股价近期上涨超4%,报价至133.1港元,这与其在人工智能领域的进展有关。阿里推出的万相大模型在开源6天后,登上Hugging Face的模型热榜和模型空间榜榜首。该模型的2.1版本在Hugging Face及魔搭社区总下载量已超百万,Github上的Star数超过6000。这些数据表明万相大模型受到开发者的欢迎,为AI技术进步提供了支持。
开源OCR工具olmOCR:高效实现 PDF 转文本,支持表格与手写识别

olmOCR是一款开源OCR工具,能高效将PDF及其他文档转换成纯文本,保留阅读顺序,支持表格、公式和手写内容识别。它通过独特提示技术提高准确率,目前主要优化用于英语文档。用户可在在线演示或自己GPU上部署以提升处理速度,支持PDF、JPG、PNG格式。olmOCR提升了文档电子化的效率与便利性。
本文部分素材来自网络,侵删请联系站长。
扫码关注本站公众号/加入知识星球,订阅更多精彩内容