氛围编码虽快,却难以留存系统记忆

氛围编码虽快,却难以留存系统记忆

AI智能体加速数据工程,但暗藏隐忧

AI编码智能体正在彻底改变数据工程领域。通过简单的提示词,它们就能迅速生成数据转换、管道、编排工作流、验证测试以及基础设施配置。这种效率的提升是显而易见的。

然而,企业数据平台长期以来一直运行在分散的系统中,这些系统归不同团队所有,且基于不同的技术构建。随着各系统的独立演进,企业面临的挑战日益严峻:业务逻辑不一致、实现重复、下游影响分析困难以及平台中存在隐藏的依赖关系。

“氛围编码”(Vibe coding)的兴起可能会进一步放大这些问题。越来越多的操作上下文、架构决策和业务知识被分散在提示词、对话、生成的代码以及断开的工作流中,而没有成为系统本身的一部分。这导致系统的核心逻辑变得模糊不清。

规范驱动开发(SDD):重塑系统记忆

规范驱动开发(SDD)作为一种解决上述挑战的新兴方法应运而生。在SDD模式下,提示词、业务规则、验证逻辑、编排行为和实现工作流都被转化为可执行的、带版本控制的规范,并成为系统不可分割的一部分。

这些规范充当了人类和AI智能体的持久操作记忆。它使得系统在版本发布、团队协作以及AI辅助工作流之间,能够保持更加一致的演进。由于企业数据工程高度依赖可重用的模式、元数据驱动的管道和标准化的操作工作流,它特别适合采用SDD模式。

通过将AI辅助生成与确定性、可复用的系统契约相结合,SDD为日益由AI生成的数据平台提供了一个新的操作层,有助于减少碎片化并改善长期协调能力。

氛围编码的局限性:缺乏持久记忆

氛围编码在快速生成孤立实现方面表现出色,但提示词本质上是临时的。它们只能在特定的对话和时刻捕捉工程师的假设、业务上下文、实现逻辑和系统知识。

在实践中,让AI生成的系统正常工作,往往远不止一个简单的提示词。工程师需要在整个开发过程中持续提供背景信息、架构决策、业务规则、模式假设、下游依赖、操作约束、调试历史和实现指导。这些上下文信息构成了AI辅助开发背后的真正操作知识。

然而,在大多数氛围编码的工作流中,这些信息仍然分散在提示词、对话、Jira工单、文档、聊天记录、生成的代码和断开的工作流中,而非成为系统本身的一部分。

这给企业数据工程带来了巨大的问题。现代数据平台自然分散在许多互连的系统中,包括摄取管道、数据仓库、编排框架、语义层、API、仪表板和机器学习(ML)系统。随着更多的逻辑和上下文嵌入到提示词和生成的实现中,组织逐渐失去了对以下内容的可见性:

  • 架构意图
  • 下游依赖关系
  • 验证假设
  • 操作行为
  • 实现背后的业务上下文

随着时间的推移,系统本身不再包含其构建背后的完整推理过程。关键的业务上下文、架构假设和操作知识仍然主要存在于人类的判断和分散的对话中,而不是存在于平台内部。

氛围编码显著加快了实现速度,但从系统角度来看,整体工程效率并没有成比例提高,因为开发生命周期的大部分仍然依赖于人工验证、领域知识、协调和决策。

更重要的是,提示词并不是天然可迭代的工程构件。企业系统在版本发布、模式变更、业务逻辑更新和下游依赖中持续演进。团队会随着时间的推移反复回顾和改进系统,但提示词是为快速本地生成而优化的,而非系统的长期演进。

它们很难做到:

  • 一致地进行版本控制
  • 系统性地进行验证
  • 跨团队复用
  • 通过CI/CD工作流进行协调
  • 随着时间的推移进行增量演进

甚至在未来的不同上下文中,相同的提示词也可能无法可靠地生成相同的实现。

这正是SDD开始转向AI辅助数据工程中心的原因。SDD不再将操作知识分散在提示词和对话中,而是将业务上下文、验证逻辑、转换行为、编排要求和实现工作流直接集成到可执行的规范中,使其成为系统的一部分。

现在,系统拥有了关于其设计方式、做出某些决策的原因以及平台中不同组件如何连接的持久记忆。这使得团队和AI智能体能够随着时间的推移更可靠地迭代系统,同时减少日益分布的数据环境中的碎片化。

规范驱动开发将提示词转化为系统记忆

在SDD中,系统是围绕可执行规范构建的,而不仅仅是松散协调的提示词和实现。SDD不再将规范视为开发后编写的被动文档,而是将其视为直接驱动代码生成、验证、测试、编排和部署工作流的操作契约。

在许多方面,SDD将基础设施即代码和GitOps的理念扩展到了AI辅助工程中。规范结合了声明式系统定义和可执行实现工作流。声明式层提供系统上下文、模式、依赖关系、约束和操作要求,而面向工作流的指令则指导AI智能体如何一致地实现和演进系统。

一旦这些上下文、规则和实现模式被转换为存储在仓库中并集成到CI/CD工作流中的持久且带版本控制的契约,系统随时间的推移就会变得更加可迭代和可治理。这些规范有效地成为人类和AI智能体的长期系统记忆,允许系统在版本发布、团队协作和日益AI辅助的开发工作流中保持一致的演进。

在实践中,规范的结构很大程度上取决于所实现的系统和工作流类型。然而,规范驱动的系统通常从一个基础的“宪法”开始,该宪法定义了应在平台中保持一致的项目级原则和约束,例如技术标准、命名约定、架构规则、治理策略和核心系统要求。在此基础之上,多层规范服务于开发生命周期中不同的操作目的:

  • 模式规范:定义结构兼容性
  • 转换规范:定义业务逻辑
  • 验证规范:定义质量规则
  • 编排规范:定义执行行为
  • 语义规范:定义业务含义

关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://venturebeat.com/orchestration/vibe-coding-can-build-your-pipeline-it-cant-explain-it-six-months-later

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章1455篇


关注微信

分类