Reddit强行向AI厂商收费,国内平台为何没有效仿他只活了42岁,自己生活“一地鸡毛”,却被亿万人奉作精神导师

⭐发布日期:2024年10月02日 | 来源:时间视频

⭐作者:Pettersen 责任编辑:Admin

⭐阅读量:312 评论:3人

【新澳门免费资料大全最新】

【澳门正版资料免费更新结果查询】

【新澳姿料大全正版2024】 【澳门今晚开特马四不像图】 【澳门王中王100%的资料一】 【2024澳门正版资料免费大全】 【澳门结果记录表888】 【今晚澳门码特开什么号码】 【新澳好彩免费资料查询】 【7777788888澳门】
【2024香港今晚开特马】 【澳门结果记录表62期】 【澳门精准正版资料免费公开】 【新澳门2024年资料大全官家婆】 【澳门资料免费期期准免费大全】 【新澳门精准免费资料查看】 【二四六玄机资料最新更新】 【澳门二四六天下彩天天免费大全】

如今在全球范围内,AI大模型之间的“战争”正如火如荼,而决定AI大模型性能的除了基于人类反馈的强化学习(RLHF)、AI反馈强化学习(RLAIF)等方法论,语料同样也是核心要素之一。以ChatGPT为代表的AI大模型之所以比早前的Siri、Alexa更“聪明”,语料规模的量变产生质变是关键,因此对于语料资源的争夺就成为了当下AI大模型赛道的主题,更直接导致了拥有语料资源的内容平台开始待价而沽。

日前据《华盛顿邮报》的相关报道显示,“美国贴吧”Reddit已经与一系列AI巨头会面,商讨付费使用数据的事宜,如果双方无法达成协议、谈判破裂的话,Reddit将考虑禁止谷歌、必应等搜索引擎,以及其他厂商的爬虫从该平台获取内容。其实Reddit向AI厂商收费这件事,此前在今年夏季曾经闹出过一场风波,用户也通过关闭子版块的方式向官方发起抗议,导致Reddit瘫痪了数天之久。

但当时在Reddit方面的“拖字诀”下,用户们缺乏组织性的抗议偃旗息鼓。即使平台被迫停摆,Reddit都不曾向用户妥协,这一点已经证明了Reddit是铁了心想要把这些数据卖个好价钱。就像数据之于算法一样,语料无疑是ChatGPT这类生成式AI更智慧的基础所在。

其实生成式AI的原理,大概可以总结为通过大量的语料库进行训练、以建立相应的模型,从而使得AI能够对人类的问题作出相应的回答和决策,其核心逻辑就是“猜谜游戏”。根据Google和Deepmind联合发布的相关论文显示,模型在没有达到一定规模前,得到的表现较为随机,但在突破规模的临界点后,表现则会大幅度提升。

毫无疑问,这一事实是Reddit方面敢于向OpenAI、谷歌、亚马逊等企业收费的核心,毕竟即便抛开语料质量,作为一个内容平台,拥有5000万日活的Reddit有自信持续产出内容。诚然,Reddit上的内容与出版的书籍或报刊杂志在质量上有着高下之分,但毕竟高质量语料的产能有限,此前也已有研究团队预测,按照现在的速度,AI不出5年就会把人类所有的高质量语料用光。

事实上,效仿Reddit的例子在欧美市场几乎比比皆是,且不提X(原推特),《纽约时报》、《华盛顿邮报》、路透社等530家欧美媒体已经上线了应对生成式AI的“拦截工具”,直接对ChatGPT等产品关上了大门。甚至乔治·马丁等17位作家还向美国法院提起诉讼,指控公司OpenAI“大规模、系统性盗窃”,非法使用知名作家受版权保护的作品训练ChatGPT。

那么问题就来了,为什么关于AI大模型的语料产出在海外市场已经可谓是沸反盈天,在国内却风平浪静呢?诚然,中文和英文两种语言本身具有非常不一样的特性,其中中文是表意文字、而英文是表音文字,并且文化差异导致各自语料库质量的不同也会影响训练结果,但目前国内市场的AI大模型的方法论与海外ChatGPT、Bard、LLaMA 2等没有本质的区别,Copy To China的现象为何没有发生?

其实最直接的原因,是有一部分国内内容平台不像Reddit、X一样“躺平”,Reddit敢于收费是因为它并不在局中。比如说,一直被看作是“ChatGPT概念股”的知乎在“2023知乎发现大会”上,就公布了与面壁智能共建的大模型产品“知海图AI”,短视频巨头快手也有“快意”和“可图”两个自研大模型,抖音背后的字节跳动更是全面进军大模型赛道,推出了大模型服务平台“火山方舟”、AI大模型“豆包”。

所以既然已经介入了大模型赛道,知乎、快手、抖音自然也就失去了向AI厂商收费的理由。因为AI大模型的训练不可能仅靠知乎、抖音、快手自己平台上的内容,必然还需要获取来自第三方的语料,所以一旦效仿Reddit就会瞬间打破平衡,各大内容平台会迅速开启互相收费的争斗,结果就是各家的大模型训练进度陷入停滞。

另一个让国内内容平台不必与AI厂商对垒的因素,是国内互联网厂商不约而同地将Web端进行了阉割。过去数年间已有诸如闲鱼等一大批产品“主动淘汰”了网页版,即便没有这样做的厂商也大多选择了劣化网页版,比如“打开XX,阅读全文”、“打开XX看更多”,千方百计引导用户使用APP、而不是停留在网页上,此外诸如小红书等厂商更是直接采取了用户不登录根本无法使用任何功能的策略。

如此种种就导致了一个结果,网页端功能的残缺使得爬虫工具根本无法获得有效的数据,而拥有完整数据的App又是一个个孤岛般的存在。App的特质导致了高度封闭的生态,使得AI厂商获取数据存在不小的困难。尽管绝大部分App走的都是webservice通讯协议,有心人可以通过截获数据传输包的方式来采集数据,但App通常都有防抓包检测,更重要的是爬取App数据还存在违法的风险。

虽然许多互联网厂商乃至法律工作者可能会认为爬取公开的数据不违法,但在全球范围内关于数据保护不断加强的背景下,爬取公开数据的风险系数并非恒定的,爬取有防抓包设计的App数据就更有风险了,很容易就会构成不正当竞争,相关案例在互联网行业可谓是比比皆是。

当部分国内内容平台已经变成了AI大模型赛道的一份子,另一部分平台靠着弱化Web端让AI厂商不敢抓取数据的情况下,自然就是一团和气,所以也就不会有类似Reddit一般与OpenAI等AI厂商撕破脸的情况发生。

【本文图片来自网络】

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【澳门4949资料免费大全】
上一条新闻 下一条新闻

推荐文章

发表评论

陈中师

6秒前:过去数年间已有诸如闲鱼等一大批产品“主动淘汰”了网页版,即便没有这样做的厂商也大多选择了劣化网页版,比如“打开XX,阅读全文”、“打开XX看更多”,千方百计引导用户使用APP、而不是停留在网页上,此外诸如小红书等厂商更是直接采取了用户不登录根本无法使用任何功能的策略。

IP:33.15.3.*

张雅玲

6秒前:如今在全球范围内,AI大模型之间的“战争”正如火如荼,而决定AI大模型性能的除了基于人类反馈的强化学习(RLHF)、AI反馈强化学习(RLAIF)等方法论,语料同样也是核心要素之一。

IP:57.81.5.*

葛丹丹

1秒前:尽管绝大部分App走的都是webservice通讯协议,有心人可以通过截获数据传输包的方式来采集数据,但App通常都有防抓包检测,更重要的是爬取App数据还存在违法的风险。

IP:37.20.3.*

时间视频APP介绍

APP图标

澳门最准最快免费资料网站APP名:时间视频

版本:V7.99.187

更新时间:2024-10-01 24:20

新澳好彩免费资料查询302期这是一个功能强大的新澳门管家婆免费资料查询APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:【本文图片来自网络】

澳最新开门奖历史记录APP介绍

APP图标

王中王精选公开一肖一码APP名:时间视频

版本:V1.59.563

更新时间:2024-10-01 16:22

澳门今天晚上开什么这是一个功能强大的澳彩资料免费资料大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:事实上,效仿Reddit的例子在欧美市场几乎比比皆是,且不提X(原推特),《纽约时报》、《华盛顿邮报》、路透社等530家欧美媒体已经上线了应对生成式AI的“拦截工具”,直接对ChatGPT等产品关上了大门。

澳门精准免费资料大全APP介绍

APP图标

澳门最精准免费资料大全旅游团APP名:时间视频

版本:V1.14.695

更新时间:2024-10-01 13:20

澳门一肖一码精准100王中王这是一个功能强大的2022澳门免费资料大全下载APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:即使平台被迫停摆,Reddit都不曾向用户妥协,这一点已经证明了Reddit是铁了心想要把这些数据卖个好价钱。

澳门三肖三码精准100%APP介绍

APP图标

7777788888澳门王中王2024年APP名:时间视频

版本:V3.24.137

更新时间:2024-10-01 22:18

2024澳门天天出来这是一个功能强大的新澳历史最新结果查询今天APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:比如说,一直被看作是“ChatGPT概念股”的知乎在“2023知乎发现大会”上,就公布了与面壁智能共建的大模型产品“知海图AI”,短视频巨头快手也有“快意”和“可图”两个自研大模型,抖音背后的字节跳动更是全面进军大模型赛道,推出了大模型服务平台“火山方舟”、AI大模型“豆包”。

澳门六开彩天天正版澳门在线APP介绍

APP图标

澳门王中王王中王免费大全资料注意了APP名:时间视频

版本:V6.98.873

更新时间:2024-10-01 23:19

王中王资料大全枓大全正使用心得这是一个功能强大的澳门彩正版资料网站APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:如此种种就导致了一个结果,网页端功能的残缺使得爬虫工具根本无法获得有效的数据,而拥有完整数据的App又是一个个孤岛般的存在。

澳门正版资料免费大全新闻APP介绍

APP图标

澳门管家婆100%精准APP名:时间视频

版本:V5.33.617

更新时间:2024-10-01 17:22

新版澳门开彩结果走势图这是一个功能强大的494949结果最快APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:毫无疑问,这一事实是Reddit方面敢于向OpenAI、谷歌、亚马逊等企业收费的核心,毕竟即便抛开语料质量,作为一个内容平台,拥有5000万日活的Reddit有自信持续产出内容。

最准的一肖一码100%APP介绍

APP图标

新奥六开彩资料2024在哪下载APP名:时间视频

版本:V5.86.721

更新时间:2024-10-01 18:16

新澳门今晚精准一码这是一个功能强大的澳门最快最精准资料大全APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:因为AI大模型的训练不可能仅靠知乎、抖音、快手自己平台上的内容,必然还需要获取来自第三方的语料,所以一旦效仿Reddit就会瞬间打破平衡,各大内容平台会迅速开启互相收费的争斗,结果就是各家的大模型训练进度陷入停滞。

澳门一肖一码一必中一肖精华区APP介绍

APP图标

香港今晚六给彩结果85期APP名:时间视频

版本:V1.66.240

更新时间:2024-10-01 22:19

新澳门精准资料大全这是一个功能强大的新澳最新开门奖历史记录APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:虽然许多互联网厂商乃至法律工作者可能会认为爬取公开的数据不违法,但在全球范围内关于数据保护不断加强的背景下,爬取公开数据的风险系数并非恒定的,爬取有防抓包设计的App数据就更有风险了,很容易就会构成不正当竞争,相关案例在互联网行业可谓是比比皆是。