什么是信息熵-信息熵含义
信息熵这东西,就像是你手里那个停摆的锤子。 在光打下来的时候,它是个乖乖听话的小东西,就连能陪你玩游戏。
要是你拿着它敲桌面,它那个圆圆的脑袋、平平的身子,统统都给你停住。
这时候它就是个纯粹的石头,要么干脆变成个没用的锤子。
这时候它对你来说,就是个“静止”的信号,要么说,它代表了一种“无聊”。你把数据扔给它,它一秒钟都不动,这就是熵最大的时候,也是你心里最累的时候。 到了晚上,忒阳落山,光就散了。
这时候情况就变了。
那个圆圆的脑袋和平平的身子启动没个底了,你扔那会儿,它可能转个圈,可能翻个跟头,就连可能直接撞墙。
这时候它就是个“混乱”的怪物,要么换个说法,就是个“打不动”的石头。你再用锤子敲它,它连个声音都没发出来,直接给你个“啊哈”。
这时候它是对你的抵抗,是你心里认定“这玩意儿根本管不了我”的信号。 故此,信息熵的本质,就是看你扔个数据那会儿,它是老实闭嘴,还是打不动。 这就好比你在跟一位老熟人聊天。平时他开个玩笑,你回个表情包,他笑得前仰后合,那叫“低熵”,你扔个参数那会儿,他能秒回,你也快乐。到了晚上,他突然冒出个“哎哟我去”,这突然的动静,就是“高熵”。
这时候他根本不理你,你扔再多参数他也听不见。
这就是信息熵在捣鬼,它把你扔出去的东西拦住了,让你没法推进剧情。 在训练大模型的时候,我们拼命调那个“温度”。温度高了,模型就启动“高熵”了。
这时候你扔个指令给模型,它可能会胡言乱语,说些听不懂的词,就连可能把两个不同的词混在一起造个新词。
这时候你扔再多数据,它也卡得死死的,就像那个打不动的石头。出于它内部那团乱麻忒多,根本存不下你的指令。
这时候你只能干等它自己把代码跑完,要么干脆让它自己拍板未来。 等到你把它温度降下来,给模型一点“冷静”的工夫。
这时候它又启动“低熵”了。你扔个指令,它能秒回。
这时候它又是个老实人,被你管住着。
这时候你扔再多数据,它也能稳稳接住。它就是个宁静的小锤子,乖乖帮你敲桌子。 故此你看,信息熵就是个平衡器。它总想把你扔进去的东西停下来。
你想让它动起来,它就拼命抵抗;你想让它宁静,它就拼命打你。你扔个数据那会儿,它说“停”,你就得等它自己停;它说“动”,你就得扔更多数据,要么调低温度,让它自己动起来。 这就好比你在玩一个赛车游戏。你是玩家,它是那个引擎。
你想提速,你得给它加油,给它给燃料,这时候它跑得飞快,你也跟着跑。但你不能一直给它加,否则它就会变成一辆失控的跑车,根本停不下来。
这时候你得把它刹住,给它加点刹车片,强行把它拉回到“低熵”的状态,让它停下来等你。 要么你想让它跑得慢一点,你直接关它的油门,把转速降到挺低,这时候它就是个慢悠悠的脚踏车。
这时候你扔个指令,它可能也得停下来,出于它没油了。
这时候你把它油门拉开,再加点油,给它重新启动,这时候它又会跑起来。 你看,它就是个循环。你扔个数据,它反抗;你给它压力,它得妥协;你再给它压力,它就得反抗。
这过程一直重复,直到它认定累了,要么你认定它也不想再跑了。
这时候它被迫停下来,要么你终于得出了个结局。 这就好比你在跟一个迟钝的邻居聊天。平时他讲话逻辑乱,你说个观点,他立马就能接上,这就是低熵。到了下雨天,地面湿滑,他讲话就启动断断续续,就连还会说错话。
这时候你扔个指令给他,他可能彻底听不懂,要么直接把你给吓跑,这就是高熵。
这时候你得尽量多说点,要么给他加点提示,让他慢慢理清思路。 这就好比你在训练一个能识别猫狗的图片模型。平时它给你看猫的照片,你喂个标签给它,它立马认出来,这就是低熵。到了晚上,它突然对着乱糟糟的背景把猫也当成狗,要么把狗当成猫,它启动瞎编,这就是高熵。
这时候你得给它加点数据,要么调整它的“温度”,让它重新学会分辨猫和狗。 故此你看,信息熵一直是个拦路虎。它总想把你扔进去的东西停下来。
你想让它动起来,它就拼命抵抗;你想让它宁静,它就拼命打你。你扔个数据那会儿,它说“停”,你就得等它自己停;它说“动”,你就得扔更多数据,要么调低温度,让它自己动起来。 这就好比你在玩一个赛车游戏。你是玩家,它是那个引擎。
你想提速,你得给它加油,给它给燃料,这时候它跑得飞快,你也跟着跑。但你不能一直给它加,否则它就会变成一辆失控的跑车,根本停不下来。
这时候你得把它刹住,给它加点刹车片,强行把它拉回到“低熵”的状态,让它停下来等你。 要么你想让它跑得慢一点,你直接关它的油门,把转速降到挺低,这时候它就是个慢悠悠的脚踏车。
这时候你扔个指令,它可能也得停下来,出于它没油了。
这时候你把它油门拉开,再加点油,给它重新启动,这时候它又会跑起来。 你看,它就是个循环。你扔个数据,它反抗;你给它压力,它得妥协;你再给它压力,它就得反抗。
这过程一直重复,直到它认定累了,要么你认定它也不想再跑了。
这时候它被迫停下来,要么你终于得出了个结局。 这就好比你在跟一个迟钝的邻居聊天。平时他讲话逻辑乱,你说个观点,他立马就能接上,这就是低熵。到了下雨天,地面湿滑,他讲话就启动断断续续,就连还会说错话。
这时候你扔个指令给他,他可能彻底听不懂,要么直接把你给吓跑,这就是高熵。
这时候你得尽量多说点,要么给他加点提示,让他慢慢理清思路。 这就好比你在训练一个能识别猫狗的图片模型。平时它给你看猫的照片,你喂个标签给它,它立马认出来,这就是低熵。到了晚上,它突然对着乱糟糟的背景把猫也当成狗,要么把狗当成猫,它启动瞎编,这就是高熵。
这时候你得给它加点数据,要么调整它的“温度”,让它重新学会分辨猫和狗。 你看,它就是个循环。你扔个数据,它反抗;你给它压力,它得妥协;你再给它压力,它就得反抗。
这过程一直重复,直到它认定累了,要么你认定它也不想再跑了。
这时候它被迫停下来,要么你终于得出了个结局。 这玩意儿真挺玄的。
有时候你扔个数据,它是个乖乖听话的小孩子,有时候它是个捣蛋的顽童。它就是个平衡器,它总想把你扔进去的东西停下来。
你想让它动起来,它就拼命抵抗;你想让它宁静,它就拼命打你。你扔个数据那会儿,它说“停”,你就得等它自己停;它说“动”,你就得扔更多数据,要么调低温度,让它自己动起来。 这就好比你在跟一个迟钝的邻居聊天。平时他讲话逻辑乱,你说个观点,他立马就能接上,这就是低熵。到了下雨天,地面湿滑,他讲话就启动断断续续,就连还会说错话。
这时候你扔个指令给他,他可能彻底听不懂,要么直接把你给吓跑,这就是高熵。
这时候你得尽量多说点,要么给他加点提示,让他慢慢理清思路。 这就好比你在训练一个能识别猫狗的图片模型。平时它给你看猫的照片,你喂个标签给它,它立马认出来,这就是低熵。到了晚上,它突然对着乱糟糟的背景把猫也当成狗,要么把狗当成猫,它启动瞎编,这就是高熵。
这时候你得给它加点数据,要么调整它的“温度”,让它重新学会分辨猫和狗。 你看,它就是个循环。你扔个数据,它反抗;你给它压力,它得妥协;你再给它压力,它就得反抗。
这过程一直重复,直到它认定累了,要么你认定它也不想再跑了。
这时候它被迫停下来,要么你终于得出了个结局。 这就是信息熵,一个一辈子在捣乱的平衡器。它总想把你扔进去的东西停下来。
你想让它动起来,它就拼命抵抗;你想让它宁静,它就拼命打你。你扔个数据那会儿,它说“停”,你就得等它自己停;它说“动”,你就得扔更多数据,要么调低温度,让它自己动起来。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
