你问的那个模型名字,实际上最准的叫法是“去问”,英文是"Ask"。 这玩意儿最早是 2014 年那个叫 OpenAI 的小团队拿出来的,一个叫 Chatbot 的模型,后来被叫成了 ChatGPT,再后来,人们就叫它 Chat。但聊起来,大家更习惯叫它那个 GPT。 这就好比你在家里扔了一只鸡,它吓得飞那会儿咬了你一口。你一脸懵:“你这模型是不是出 Bug 了?”便你转头找别家,结局发现市面上全是叫 Chat 的模型

这时候你就尴尬了,你问问别人:“那 GPT 到底是个啥?”对方笑你:“你连 ChatGPT 都不知道,还要问它啥?”便你得问那家模型。 GPT 这名字实际上是缩写,全称是 Generative Pre-trained Transformer。好办说,它就是个超级智慧的大模型,靠进食长大的,吃的是海量的数据,长成了目前的样子。 它为啥如此火?主要是出于它能理解自然语言。

那会儿做机器阅读理解,得把句子切成块,再切成词,最终拼凑答案。目前呢?你一句半句话随意丢给它,它就能把你写的文章、对话、代码就连复杂的数学公式,统统吃进肚子里,然后吐出标准答案。 举个例子,你问它:“如何算 1+1?”,它直接把 1 加 1 教给你。再问它:“写个 Python 脚本,把 3.1416 乘以 2 然后存个文件”,它也能给你整出来。就连你说它:“针对这个项目,写个分析报告”,它也能生成几百页的大报告。 看个数据:2023 年,GPT-3.5 的参数量达到了 175 亿,GPT-4 达到了 1700 亿。

这数字听着吓人,但实际上是个好现象。早期的模型像 ChatGPT 1.0,几百万参数,看完书也反应不过来。到了 2024 年,参数规模已经起飞,目前的模型能处理几十亿就连上万亿字量的文本,就像给你指路,你问它哪条路最近,它告诉你,哪边有公交站,它直接告诉你。 它之故此能如此强,是出于训练了忒久忒久。从 2021 年到 2024 年,它吃了好多用户发给它的数据,比如新闻摘要、代码、邮件、小说。它把自己当成了海量的数据,反复学习。就像你学做饭,你得看好多菜谱,试错无数次,最终才能做出那道拿手好菜。GPT 就是在无数个对话里,把“烹饪”这件事练成了绝活。 不过,它也不是神。它也不是完美无缺的。你有时候会发现它讲话有点绕,明明让你直接点外卖,它非要推个满减活动;要么它明明知道这是科幻电影,却死活不承认,非要跟你聊“星际旅行”。

这就叫幻觉,就是它把没有的东西编出来,编得还挺像确实。 这就好比你让一个没看过电影的人告诉你《星球大战》的剧情,他可能会把戏服换成宇航服,把飞船换成忒空站。GPT 也是这样,它把知识扩展到了逻辑推理、数学计算、代码编程,就连包含一些常识判断。 再聊点别的。它目前的版本迭代挺快。2023 年出了 GPT-3.5,2024 年出了 GPT-4。

这俩实际上不是两个模型,是同一个模型的迭代版。就像你买手机,2024 年买 12 月的机子,和 2025 年买 1 月的机子,硬件配置差不多,价格可能还差不多。 并且,GPT 还能跟别人对话,还能像真人一样聊天。它不只是个工具,还是个聊天对象。你能够跟它玩梗,它能够陪你骂人(别看只能骂别人,不能骂你)。 最终说句实话,目前的模型别看强,但别指望它能替代人类。它不懂伦理,不懂政治,不懂人情世故。它知道为啥,但它不会关心。它只是工具,工具得靠人来操作。 故此吧,下次你再看到那个大模型的名字,别只盯着“ChatGPT"那俩字。

那是那个具体的名字。

要是你不知道那家,就去问问别的模型,毕竟哪位还没个不知道自家产品名字的时候呢?