5月全球人工智能领域新看点 大模型推动技术革新


5月,全球多家科技公司在语义理解、多模态等方面进一步提升人工智能的能力。随着无人驾驶和机器人技术借助AI快速进化并逐步投入市场,不少国家通过推进法规建设、开展国际合作等方式,为AI领域创新提供更好的土壤。
中国深度求索公司表示,其DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528,模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,呈现出更加贴近人类偏好的写作风格。
美国Anthropic公司推出“克劳德4”系列两款新模型:“奥普斯4”(Opus 4)与“十四行诗4”(Sonnet 4),旨在为业界提供更高标准的编程、推理和智能体应用。Opus 4是行业领先的编程模型,能够高效完成复杂且持续时间长的任务;而Sonnet 4在此前的3.7版本基础上显著升级,具备更强的指令理解能力与推理、编程表现。
谷歌公司在5月推出了整体性能和智能推理能力均较以往版本大幅提升的多个“双子座2.5”系列模型,并发布了多个多模态模型,如图像生成模型Imagen 4和视频生成模型Veo 3,具备从文本等多种输入形式生成高质量视觉内容的能力。音乐生成模型Lyria 2为音乐人提供了多模态创作工具。AI电影制作工具Flow集成了先进的多模态技术,使用户通过自然语言描述就能生成高质量的视觉作品。
尽管当前AI应用已相当广泛,但不少缺陷还是会影响其实用性。研究人员正努力分析导致这些缺陷的原因并寻求新的解决方法,从而改善AI的性能。一个比较明显的问题是,AI生成内容虽然非常流畅,但提供的信息很多时候并不准确。日本研究人员在德国《先进科学》杂志发表的一项研究成果中指出,这一问题与人类的语言障碍——失语症类似。大模型在出现严重错误时仍表达流畅,这与感觉性失语症的症状有相似之处,即说话流利却总说不出什么意思。未来研究人员可以针对相关问题找到改善措施。


版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:http://cpqg.com/html/xinwen/junshixinwen/94863.html