2025-03-04

关于代码文件在多大程度上算太大,人们已经争论了很久。有些人说它应该基于单一责任原则(每个文件一个类),另一些人说大文件在某些情况下是可以的,这取决于它是否引起问题。

不要制作太大的文件,如果你的 RAG 系统用于提供代码上下文只能在每个文件的级别上运行,你将会耗尽你的上下文;此外,像 Cursor 这样的 IDE 将开始无法应用 LLM 创建的补丁(即使它成功了,应用补丁也可能需要很长时间——例如,在 Cursor 0.45.17 上,对 64KB 文件应用 55 个编辑需要)。在 128KB 时,你将难以让 Sonnet 3.7 实际修改整个文件(Sonnet 的上下文窗口只有 20 万个 token)。

也没有什么理由不保持你的文件小;LLM 可以处理所有繁琐的工作,以确保你的拆分文件上的导入正确。

示例