GPT5写5000行代码,行不行?


GPT5干活扭捏,甚至还想催我搬砖。

一、简介

这几天,试过用国内几款大模型写代码:DeepSeek、Kimi、千问、智谱清言。

测试中最复杂的问题是这样:

使用前端编程语言,开发一款复杂的Web网站,涉及大模型信息采集和展示;进行数据分析,给用户提供有价值的参考;做一个社区板块,可以交流各种模型的使用案例;总共分为3个模块,每个模块都要填充一定的模拟数据,并且支持全站检索功能;视觉追求创意和科技感;考虑问题的复杂性,需要先设计工程架构再编写代码。代码输出5000行左右,完整的放在一个html文件中,可以直接预览。

最终,几款大模型都没有达到5000行的要求,但是会输出它们各自能达到的最大行数,并且呈现的页面效果也算ok。

上周,GPT5发布了,于是带着这个老问题,让GPT5也试试5000行的代码。

先说结论:GPT5虽能以顶尖代码能力输出完整成果,但需动态调整资源以维持长序列生成的稳定性。

二、编码测试过程

测试在Augment插件中,使用的GPT-5模型

以下是Prompt提示词;

用html5和css3,在当前项目中,写一个创意科技风的网站,内容是AI相关信息,输出大概5000行代码

它并不会像之前的AI模型一样,直接输出,而是会给出一个提纲,让开发者来确认是否可行。

我只想让它测一个demo,看看它输出的能力边界。对于内容没有任何思路,想全靠它自由发挥,我觉得这种提纲和确认是有点“多余”的。以下是它给出的提纲摘要:

请确认以下选项:

  • 站点语言:中文为主可以吗?
  • 主题风格:霓虹/赛博朋克 + 玻璃拟态(半透明+毛玻璃)+ 渐变背景,可以?
  • 站点结构(多页):主页、关于 AI、应用场景、研究与论文、新闻/趋势、伦理与安全、术语表、资源与工具、画廊(CSS 动效展示)、联系我们。OK?
  • 是否需要包含任何交互?你要求仅 HTML+CSS,我会用纯 CSS 的动画与“checkbox hack”实现导航展开、FAQ 折叠等,不用 JS,可以吗?
  • 颜色偏好:蓝紫青高对比(科技感)可以吗?或告诉我你的主色值(如 #7C3AED 紫、#06B6D4 青等)

确认后我将:

  1. ….
  2. ….

请回复你的偏好(尤其是颜色与是否中文),我就开始落地实现并生成文件。

其中这种完全可以在执行过程中输出,告知开发者它选择的风格和色调等关键信息。这种情况在Claude Sonnet 4模型中就不会出现。

待我确认好信息后,它开始干活。首先它会告诉我:

我将分多步创建多页静态站点与样式文件,确保每个文件在300行以内但总体约5000行。先搭好样式与共享结构,再逐页填充内容。开始创建样式文件。

开始就会给此次任务定了整体的基调:分批执行。

会话执行完毕后,会在最后总结,1、已完成内容。2、下一步执行计划。3、需要开发者确认的信息(针对下一步的输出)。不过,第三步有时候也不会输出,可能它自己替我做了决定吧。

于是,从上午9点左右,到下午1点多,经过了15轮拉扯,它终于完整输出了这个demo。效果尚可,点击顺畅,除了一些样式细节需要优化,没有明显的bug。

下面是最终输出的部分效果图;

总体来说:GPT-5智能提升多少很难说,相信后面更深度的体验才能感受到它的优缺点。从目前的感受而已,很有主动性,积极建议下一步动作,感觉多了一个催我干活的队友

三、写在最后

对比国内的大模型而言,GPT-5它会抓住核心的需求:5000行,并且贯彻地执行下去,最终给出的结果也是过关的。而不是选择降级,弱化需求输出结果。

如果是真正的需求,相信它也会实打实给出自己的思路,行就是行,不行也得解释原因。(后面会深度体验一把用GPT-5做真实的项目开发)。

模型测评Git仓库
https://gitee.com/t_qhl/model-chaos

知识归档Git仓库
https://gitee.com/cicadasmile/butte-java-note