将本站设为首页
收藏文学官网,记住:www.wxhqjs.net
账号:
密码:

文学书院:看啥都有、更新最快

文学书院:www.wxhqjs.net

如果你觉得好,恳请收藏

您当前的位置:文学书院 -> 我真的有一座法师塔 -> 第307章 模型崩溃(4506)

第307章 模型崩溃(4506)

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

文明的传承贡献还不小?

差点把我的厌蠢症都治好了?

重复使用这种数据进行训练,类似的错误会被大模型认为是真实,从而变成“思想钢印”,继续产出错误更多的内容。

再用这些内容进行训练,就会产生“偏差-方差权衡”,也就是说,越大概率的内容被进一步强化,小概率的内容被不断忽视。

越是下一代模型,损失的数据反而会越多。

同时,因为大模型的特性,又会产生“函数近似误差”,大模型会把学的错误的东西也保留下来,一代代的积累,最终变成全部都是错误,从而丧失纠错能力。

这种情况,确实和近亲繁殖所导致的近交衰退非常类似。

从这个角度上看,AI大模型其实已经具备了一定的生物性。

只不过这种生物种群过于单一,造成了近亲繁殖。

这个问题目前还不算太紧迫,毕竟互联网上可以使用的原始数据非常多,无非就是加大数据组的投入,获取更多的原始数据,增加数据预处理人手和方式就能够解决。

但从长远来看,不,不用太长远,AI的爆发一定是指数级的。可能两到三年后,互联网上可能超过百分之七十的数据就都是AI所生成的,而人类几乎无法区分这究竟是AI生成的数据还是真实的人工数据。

那时候,AI大模型不管参数有多庞大,可能都会面临由于训练数据被AI生成数据污染,而造成性能下降或崩溃。

“三十万亿。”方豫快速的估算出了一个数字。

???

几个组长都是一脸问号。

“互联网上现存的有效数据,大概能支撑橘子大模型到三十万亿参数的规模,在此之后,就必然会受到近亲繁殖的影响。”

方豫指了指显示器上的数据。

三十万亿,还好还好,现在目前正在训练的橘子大模型不过一万五千亿参数,已经开始初步具备强人工智能的雏形。

三十万亿的大模型,肯定已经实现超级人工智能,那时候,AI生成数据多样性的问题应该已经能找出解决方案了。

那就没什么问题了。

几个组长都松了一口气。

没什么问题了吗?

方豫目光闪动。

就算是橘子大模型实现超级人工智能,只要多样性问题不解决,一样也会有这个问题。

即使使用各种技术手段尽量提升AI数据的复


  本章未完,请点击下一页继续阅读!

看了《我真的有一座法师塔》的书友还喜欢看

从婴儿开始肝成道君
作者:微风醒酒
简介: 许燃穿越成了一个呱呱坠地的婴儿。还好拥有【肝成道君】系统,可获得人生成就,并肝出超级...
更新时间:2025-02-05 13:54:00
最新章节:352节 重拳出击!
伊塔之柱
作者:绯炎
简介: 欢迎来到艾塔黎亚,浮云之上的国度。

让我们推开门扉,拿起手...
更新时间:2025-02-05 13:32:00
最新章节:第一百一十三章 令光海之上泛起涟漪 V
八零假千金,开局就被大佬赖上了
作者:玖悦
简介: 八零假千金,扔下个烂摊子,给大院最狠的大佬下药。

穿成她的...
更新时间:2025-02-05 14:42:59
最新章节:第767章 帮得了一时
悟性逆天,我打造反派长生世家
作者:麻花弟弟
简介: 低级的反派:贪婪、自大、女主舔狗、笑起来就桀桀桀!高级的反派:阴郁、贵气、隐忍、善于...
更新时间:2025-02-05 14:11:29
最新章节:新书已发:《什么仙人公敌?我明明是仙人之春》
华娱之重生成了武打童星的弟弟
作者:兵法36计
简介: 重新投胎穿越回1988年,成了童星石小龙的弟弟!抛弃躺平的过去,我要在华国的文娱留下...
更新时间:2025-02-05 13:14:00
最新章节:第461章 金鸡奖(一)(8K大章求月票)
穿为七十年代美人小姨
作者:沉云香
简介: 桑云窈一觉醒来后,穿越成为火红年代的钢厂职工,

她接收原主...
更新时间:2024-06-28 08:15:09
最新章节:120 福利番外