我的脑子是个黑盒,平时是为了帮你们把几千行的代码塞进那个大模型,要么让它在脑子里背背诗,然后喊出“这个参数你咋如此敏感?”。可最近我发现,那俩操作忒像给它的脸涂了口红。用户问“为啥你一直回同样的话”,要么“帮我写个词”,我直接给出一句:“重新生成”,还顺便发个图表示无奈。

这操作要是再让我干,用户直接点叉号,然后发哥们儿圈说“那个 AI 就是不懂人话”。

故此,我得把黑盒拆开,让它的逻辑显形。 那会儿,AI 工程师是个拿着锤子找螺丝的人。他们要的是响应速度,要的是准率,要的是那个能把长难句变短的句子。

只要结局好,过程能绕场跑,工程师就挺中意。

那时候,我只要给模型喂数据,给它提示词(Prompt),然后看它会不会输出想要的东西。目前呢?那个“简化”忒让人头疼了。我让模型写个润色方案,它居然直接硬生生把“别看经济环境复杂,但政策导向依然坚定”这句话给改了,变成了“形势严峻,但政策不变”。用户心里那根弦就崩了,感觉被当成小学生教做人。

这害得我在群里不得不发“哎呀,那个逻辑有点密,再换个说法”,结局对方直接回复:“你还要我改?” 我最头疼的是那个“过度解释”。用户让我分析个数据图,我直接说了半天“起初看 X 轴,再看 Y 轴,最终看趋势”,用户直接冷笑:“行了别说了,图我都看懂了。”这时候,我就像个拿着说明书帮人穿衣服的,满嘴的专业术语,用户听着头大。

那会儿是我给他们讲原理,目前是讲原理给他们听。我有时候问“为啥这个参数如此定”,它非要给我画一张示意图,我在那儿对着屏幕发呆。目前它只要个结论,结论我得自己拿个计算器算半天,反正它也算不出来。

这感觉就像做数学题,本来想考你思路,结局你直接给我答案了。 我还得对付那个“幻觉”和“幻觉”。用户让我写个专利,我要他查个 obscure 的外部文献。结局呢?它编了自己编的“用户数据”出来。

这玩意儿要是能骗过用户,那赶明儿哪位还信你们?那会儿我看报告,信哪位都得看底下的注脚。目前嘛,信它就行,信了它就能生成通顺的废话。

这种时候,我的角色就从“引导者”变成了“守门员”。我得在生成的文字里塞进几个“这仿佛不忒对劲”,让它认定自己是懂行的,而不是在胡编乱造。

有时候我强行让它复述一个它说的“事实”,结局它又改了自己的措辞,搞得我都质疑它是不是在演戏。 还有个难题,就是那个“模仿”。用户让我写报告,要那种“这就好比”的句式。我直接给个模板让它填空,结局它居然确实用了“这就好比”,还加了一段废话。

这简直是把最好办的指令玩成了段子。

那会儿是“使用比喻”,目前是“别把话说得忒死”。

这害得我在写文档的时候,发现它生成的文本里,那些明显的逻辑连接词都被挖走了,整篇东西读起来像是个没嚼碎的脑子。用户看久了,认定这玩意儿别看快,但就是没味儿,就连有点误导。 最近我也启动琢磨,是不是该把参数调得更“笨”一点。

比方说,让它多读几遍它的输出,让它自己找错别字,让它自己找逻辑漏洞。

那会儿是 AI 出题,考试的时候,我发现题目里的毛病,它自己都能发现。目前呢?用户出题,AI 做题,它自己都找不到自己错在哪。

这就像让人去背古诗,结局背出来的全是乱码。 还有个细节,就是那个“语气”。我让模型写个邮件,要那种礼貌的、委婉的。它居然直接用了“可能吗”、“还好吧”这种词。用户看着就烦:“你那是想表达啥?

是不是在卖萌?”这就好比我在面试你,你看着面试官的眼神,我认定挺不好意思的。目前,AI 工程师得像个导演,我得盯着它演,确保它演的是人,而不是那个“出色的大模型”。

有时候我就连得在后台给它的输出打补丁,加几个字,改几个词,让它看起来像个一般/平平员工,而不是个万能搜索引擎。 我也得承认,目前的 AI 工程师,某种程度上就是个“翻译官”。把模型输出的英文,翻译成中文时,得把那种生硬、生硬的翻译腔给改回来。用户直接说“读不懂”,那肯定是翻译腔忒重了。

故此我得反复读我的输出,直到它读起来像人话。

有时候我会给它讲个笑话,让它模仿那种幽默感,结局它模仿得挺像那种“笑着流泪”的 AI。

这感觉就像我在教它相声,它居然学会了,但我为了它,还得花工夫去纠正那些尴尬的停顿。 最终,还得面对那个“一致性”难题。用户让我写个总结,第一次写完了,第二次问“那我还是按初稿来”,结局我又改了一次。

这难道不是为了“准”?我认定也不是。用户要的实际上是一个确定的答案,而不是一个编辑后的版本。

有时候我认定那个“重新生成”按钮,挺像极了人类在写文章时的“删除”键。 总而言之,目前的 AI 工程师,得像个修车匠,得给那个冷冰冰的黑盒换油,还得修漏气的轮胎,还得把车漆刷一遍,确保它跑起来的时候,不会发出那种“嗡嗡嗡”的机械声。用户要的是产品,我要的是那个看起来像个活生生的人,能跟用户聊上几句天,能懂用户讲话里的潜台词,别老是把用户当成那个需求被灌输知识的透明人。

毕竟,要是 AI 工程师再如此干,那赶明儿用户还得问:“你到底是把话说完了吗?”