AI，开始偷懒了？背后的真相曝光,用户集体吐槽体验直线下降

　　中新经纬6月3日电 (谢婧雯)“以前上传PDF让它翻译，页面会变成左右两栏，右边原文，左边逐句翻译，但现在没有了。即使明确要求逐句翻译，出来的也只是梗概。”文字工作者关佳怡(化名)近日发现，她此前常用的某AI智能对话问答助手使用体验正明显下降。
　　近期，社交平台上像关佳怡一样吐槽AI“越来越难用”“频频出错”的用户不在少数。AI，真的不好用了吗？
　　余京生(化名)主要使用AI辅助软件开发。他告诉中新经纬，2025年他使用ChatGPT时，只要提出需求，模型就会尝试不同解决路径，给出的代码基本方向无误，他只需要小修小补。
　　但现在，即便他把要求描述得非常细致，“ChatGPT也像一个机械执行者”，还会频繁出现语法错误。并且模型不会自我检查，反而偏执地认定失败是硬件环境所致。
　　“总之退化了很多，我用Grok和DeepSeek等工具也感觉明显。目前ChatGPT代码能力仍然最强，但用着很吃力。”余京生说。
　　付费使用DeepSeek、Kimi的宁泽(化名)在社交媒体发帖称，DeepSeek最近晚上“降智”得厉害。他向中新经纬解释，白天让模型写代码经常一遍过，但到了深夜，类似难度的代码需要反复修改几次才能通过。此外，模型还容易遗忘他前两轮提出的要求。
　　早在2026年1月，便有用户开始反馈AI的“不对劲”，主要表现为套话变多、回答表面和分析变少。社交平台上“感觉AI变‘懒’了”的话题下，用户称，DeepSeek和豆包一年前的回答会给到很多意想不到的启示，但现在倾向于用一些套话匆匆收尾。众多网友附议：“AI很套路”“回答没有增量内容”“换汤不换药”。
　　中新经纬注意到，DeepSeek新推出的“专家模式”现在已无法上传文件，官方此前提示“擅长复杂问题，资源紧张，不支持文件上传”。在使用快速模式时，中新经纬发现，目前要求DeepSeek翻译长文本PDF，它也会直接提示超出能力范围。此外，近段时间以来，DeepSeek多次因为“崩了”登上微博热搜。
　　5月27日，中新经纬在DeepSeek对话框输入“有用户反映你越来越难用了，是因为降智了还是偷懒”。模型思考9秒后回复称，这是现实的无奈和成长的烦恼，并将问题归咎于“算力成本”“安全困境”“迭代阵痛”三方面原因。
　　DeepSeek回复图片来源：DeepSeek网页对话
　　相比DeepSeek的认真解释，豆包面对质疑则选择重新干活证明自己。关佳怡提到，她让豆包翻译文档，AI偷懒被质疑后，又重新恢复按照原来的格式规范完成了任务。“这玩意儿也会偷懒，学什么不好！”她吐槽。
　　对于用户使用AI体验变差的情况，Kimi则将其归于模型版本更新、上下文复杂度、提示词影响三方面原因。
　　　Kimi回复图片来源：Kimi网页对话
　　5月29日，中新经纬致电豆包官方客服询问AI执行任务时准确度下降的原因，客服解释这是模型升级所致。因为模型在不断提升，过程中会出现一些小差错。
　　截至发稿，DeepSeek官方尚未就中新经纬关于AI故障原因的咨询邮件作出回复。
　　艾媒咨询发布的《中国AI大模型市场发展状况及用户行为调查数据》显示，在2026年中国消费者认为目前AI大模型存在的缺陷中，“无法实时优化(给出错误反馈后无法通过自我修正实现自我成长)”以45.81%的占比位居首位。“推理能力较弱(需要逻辑、数值推理等复杂问题时表现不佳)”以43.21%的占比位列第二，“灾难性遗忘(问题求解阶段，无法记住处理过的数据或场景)”以42.62%紧随其后。
　　业内人士分析认为，用户体感层面的模型“降智”，更多与企业的商业化选择和算力资源紧张有关。
　　赛迪顾问人工智能与大数据研究中心分析师韩子哲对中新经纬表示，除Transformer架构固有的长文本性能衰减、AI生成内容回流带来的训练数据污染等技术局限外，商业考量是当前多款大模型“降智”的主要原因。
　　值得注意的是，大模型市场的价格战正愈演愈烈。5月22日，DeepSeek宣布旗舰模型V4-Pro的API价格永久下降75%。5月27日，小米紧随其后宣布MiMo-V2.5系列API永久降价，最高降幅达99%。
　　韩子哲解释，面对日益上行的Token成本压力，部分厂商引入了动态推理预算、缓存优化及路由降级等技术手段，优先保障系统的整体吞吐量与响应速度，以在时延与成本之间寻求平衡。这种通过缩减单次推理深度来控制运营成本的隐性调整，实际上是以牺牲模型在复杂任务上的表现，换取规模化服务的可持续性，最终直观体现为用户体验的明显下降。
　　不过，也有业内人士提出不同看法。一家模型企业的相关负责人向中新经纬表示，模型本身的能力从发布时就已设定，不会因使用一段时间而自动降级。对于用户体感变差的现象，他归结为四方面原因。
　　一是长程任务正成为主流，此前习惯分步走的用户，受上下文环境影响，容易体验不佳；二是模型上下文越来越长，超长任务要求调用小模型辅助，不同版本间的协作容易出现偏差；三是模型与开发平台(即“脚手架”)的磨合不够好，后者当前更新太快；四是用户在不同平台之间切换使用模型，经过中转环节，体验自然不如原生平台流畅。
　　极佳视界联合创始人、首席科学家朱政也指出，当前模型企业的算力已难以支撑海量用户的复杂任务需求。“以前大家主要用大模型进行简单聊天，消耗算力较少。但现在，AI被当作一个可以干活的工具，消耗的Token是海量的。”
　　朱政表示，用户规模的暴涨，导致算力资源空前紧张。他向中新经纬透露，其公司租用算力卡的等待时间，已从去年的一两天延长到如今排一两周都不一定有资源。
　　在朱政看来，像豆包这类模型开始分层收费，其实是好事。对经济条件允许的用户而言，这能保障其专业化需求、提高效率；对企业来讲，也能合理分流，保证免费用户的基础聊天不受影响，同时让商业模式更加清晰。
　　(更多报道线索，请联系本文作者谢婧雯：xiejingwen@chinanews.com.cn)(中新经纬APP)
　　(文中观点仅供参考，不构成投资建议，投资有风险，入市需谨慎。)
特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
新智元 2026-06-10 16:05:48
钛媒体APP 2026-06-10 10:25:34
钛媒体APP 2026-06-10 09:00:26
华尔街见闻官方 2026-06-09 11:05:07
钛媒体APP 2026-06-10 15:32:15
虎嗅APP 2026-06-11 00:48:30
澎湃新闻 2026-06-10 07:54:28
机器之心Pro 2026-06-10 15:14:14
机器之心Pro 2026-06-10 22:27:20
量子位 2026-06-07 04:37:43
英国那些事儿 2026-06-10 23:29:12
雷科技 2026-06-10 23:08:37
量子位 2026-04-23 11:44:18
智东西 2026-06-10 22:42:37
奶桃影视君 2026-06-07 08:49:09
顶峰相见剧场 2026-06-10 08:27:06
蜻蜓世音 2026-06-06 17:10:51
搞怪笑工厂 2026-06-06 09:34:26
芮予猪猪 2026-06-09 02:48:53
一网一匠 2026-06-09 04:44:54
财联社 2026-06-10 15:06:36
开心的青 2026-06-07 09:18:10
智东西 2026-06-10 22:29:24
PConline太平洋科技 2026-06-10 19:52:21
红星新闻 2026-06-10 22:13:13
乐拍星球 2026-06-06 10:43:31
beebee 2026-06-10 11:02:29
财经AI湃 2026-06-10 19:42:57
界面新闻 2026-06-10 20:38:30
大风车影视 2026-06-09 12:21:25
赛博禅心 2026-06-10 16:34:54
丙子看剧 2026-06-09 16:35:55
晚风也遗憾 2026-06-11 00:15:49
生活实用手工 2026-06-10 03:23:38
财经早餐 2026-06-10 16:34:09
机器之心Pro 2026-05-26 14:32:09
机器之心Pro 2026-04-02 16:56:32
山野纪事2 2026-06-11 01:33:10
李饼饼美食 2026-06-09 17:57:26
新浪财经 2026-06-11 00:12:12

AI，开始偷懒了？背后的真相曝光,用户集体吐槽体验直线下降

相关阅读