5月全球人工智能领域新看点大模型推动技术革新

军事新闻 2025-06-03 16:20:27

5月，全球多家科技公司在语义理解、多模态等方面进一步提升人工智能的能力。随着无人驾驶和机器人技术借助AI快速进化并逐步投入市场，不少国家通过推进法规建设、开展国际合作等方式，为AI领域创新提供更好的土壤。

中国深度求索公司表示，其DeepSeek R1模型已完成小版本升级，当前版本为DeepSeek-R1-0528，模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，呈现出更加贴近人类偏好的写作风格。

美国Anthropic公司推出“克劳德4”系列两款新模型：“奥普斯4”（Opus 4）与“十四行诗4”（Sonnet 4），旨在为业界提供更高标准的编程、推理和智能体应用。Opus 4是行业领先的编程模型，能够高效完成复杂且持续时间长的任务；而Sonnet 4在此前的3.7版本基础上显著升级，具备更强的指令理解能力与推理、编程表现。

谷歌公司在5月推出了整体性能和智能推理能力均较以往版本大幅提升的多个“双子座2.5”系列模型，并发布了多个多模态模型，如图像生成模型Imagen 4和视频生成模型Veo 3，具备从文本等多种输入形式生成高质量视觉内容的能力。音乐生成模型Lyria 2为音乐人提供了多模态创作工具。AI电影制作工具Flow集成了先进的多模态技术，使用户通过自然语言描述就能生成高质量的视觉作品。

尽管当前AI应用已相当广泛，但不少缺陷还是会影响其实用性。研究人员正努力分析导致这些缺陷的原因并寻求新的解决方法，从而改善AI的性能。一个比较明显的问题是，AI生成内容虽然非常流畅，但提供的信息很多时候并不准确。日本研究人员在德国《先进科学》杂志发表的一项研究成果中指出，这一问题与人类的语言障碍——失语症类似。大模型在出现严重错误时仍表达流畅，这与感觉性失语症的症状有相似之处，即说话流利却总说不出什么意思。未来研究人员可以针对相关问题找到改善措施。