读AI赋能05消费者盈余

news/2025/10/21 23:24:39/文章来源:https://www.cnblogs.com/lying7/p/19133096

读AI赋能05消费者盈余

1. 肖莎娜·朱布夫

1.1. Shoshana Zuboff

1.2. 哈佛商学院荣誉退休教授

1.3. 《监控资本主义》

  • 1.3.1. 2019年最佳图书之

  • 1.3.2. 谷歌和Facebook等公司用一种“感知化、网络化、计算化的基础设施”取代了奥威尔笔下的政府和“老大哥”​,朱布夫将其称为“大他者”(Big Other)

  • 1.3.3. 技术不再将国家武器化为“全面控制的项目”​,而是将市场武器化为“全面确定性的项目”​

  • 1.3.4. “大他者”通过无处不在的监控运作,在一次一次获取地理位置数据的请求中耗尽我们的个体能动性,吞噬我们个人数据的算法逐渐削弱了我们的自由意志

  • 1.3.5. 民主逐渐优化或者说是瓦解为市场驱动的极权主义

  • 1.3.5.1. 对不拥堵的出行路线和Yelp上广受好评的比萨外卖的渴望,我们逐渐丧失了自主生活的能力

  • 1.3.6. "大他者”掠夺我们的行为以获取数据盈余,却将蕴藏在我们的身体、大脑和跳动的心脏中的意义抛诸脑后,就像为了得到象牙而对大象进行的可怕屠杀一样

1.4. 只要用户从谷歌有效利用这些行为数据的工作中获得了全部价值,这就是一种公平的交换

  • 1.4.1. 不仅利用数据改善搜索体验,还创造了诸如翻译软件等全新的产品和服务

  • 1.4.2. “行为价值再投资循环”​

1.5. 如果你没有为产品或服务支付费用,那“你本身就是产品”​

  • 1.5.1. 你并不是产品,你只是被遗弃的躯壳

  • 1.5.2. "产品”衍生于从你生活中剥夺的数据盈余

2. 数据尾气

2.1. 谷歌在成立初期就意识到,用户在其网站上执行的每一项操作,包括输入的搜索关键词、点击的链接等,都是可追踪的

2.2. 所有这些从某些角度看似毫无价值,有时甚至被称为“数据尾气”而非“数据”的东西,现在却可以被保存、汇总、分析、重新组合,并最终以全新的方式被大规模应用

2.3. 谷歌最终犯下了朱布夫所认为的“监控资本主义”的原罪:它开始将从用户那里收集的一些行为数据用于增强给用户推荐广告的精准性

  • 2.3.1. 谷歌的理论是,增强广告与用户的相关性,用户会更频繁地点击广告,广告商也能从这个过程中获得更多利益

  • 2.3.2. 从操作层面上讲,这意味着谷歌会把不断增长的行为数据缓存,并将卓越的计算能力和专业知识集中用于将广告与用户搜索相匹配这个单一任务上

  • 2.3.3. “部分数据仍会用于改进服务,但越来越多的附加数据将被重新利用,以提升谷歌及其广告商的广告盈利能力”​

2.4. 谷歌有6个产品的用户规模超20亿,而iPhone的用户数量约为14.6亿

  • 2.4.1. 科技巨头所创造的价值在用户与公司之间是双向流动的

2.5. 广泛而创造性地使用数据通常能为个人用户、整个社会以及开发者创造巨大的价值

3. 提取数据

3.1. 提取数据并不像提取石油、铜矿,或者拔掉一颗牙齿那样

3.2. 当从深埋于地下上千米的煤层中开采出大量烟煤时,地上留下了洞,且这一不可再生资源将不可逆转地被耗尽

3.3. 对于数字文件,提取只是对原件的复制,原件仍然完好无损地保存在其初始位置

3.4. 全球数据储备的增加速度之快超乎想象

  • 3.4.1. 如今,人类每小时产生的新内容足以装满一艘虚拟超级油轮,这些内容包括自拍照、社交媒体上的发帖和点赞、营销演示文稿、谷歌搜索、路线规划、小说、医学研究成果和视频等,它们正在不断扩充我们已经用之不竭的数据储备

  • 3.4.2. OpenAI的GPT-3是在3000亿个词元上进行训练的,而GPT-4的训练数据集规模更大

  • 3.4.3. 非营利性组织Common Crawl维护的同名数据集,包含超过27亿个网页

  • 3.4.4. 名为The Pile的数据集,在Common Crawl数据集修改版本的基础上增加了21个子数据集

  • 3.4.4.1. 包括来自微软的编码网站GitHub的代码,来自PubMed Central和ArXiv的科学论文、各种书籍和文学作品数据集,来自各种法律项目的法律语料库、美国专利局的资料,以及来自YouTube的视频字幕等

  • 3.4.5. 谷歌也创建了自己的数据集C4(Colossal Clean Crawled Corpus),意思是“巨量清洁爬取语料库”​

  • 3.4.5.1. C4的五大来源分别是:专利检索工具Google Patents、维基百科、文档托管网站scribd.com、​《纽约时报》网站和PLOS(一个非营利性的开放性学术出版平台)​

  • 3.4.6. 所有这些数据集都涵盖了来自网站、书籍和科学出版物的内容,却未获得这些材料版权所有者的明确许可

3.5. AI开发者普遍认为,他们对数据的使用在现行版权法下是合法的,并且对用户和整个社会普遍有益

  • 3.5.1. 如果法院裁定,对数据进行训练以提取模式和信息(而非直接复制或整合原作)不属于合理使用,那么我们将需要新的解决方案来管理如此大规模的内容授权

  • 3.5.2. 鉴于互联网上几乎所有内容都自动受到版权保护,我们需要全新的机制来进行清权工作,这涉及数十亿的博客文章、用户评论、产品评论、照片、表情包及新闻文章、书籍或故事片等

  • 3.5.3. 这样的机制必须平衡内容创作者、AI开发者和公共利益之间的关系

3.6. 广泛而创造性地使用数据通常能为个人用户、整个社会及开发者创造巨大的价值

  • 3.6.1. 当那些沉睡的、未被充分利用或仅在特定背景下有意义的数据,被重新利用、合成并以新颖且具有复合效应的方式转化时,就不是一种掠夺,而是一种对资源的有效利用与再创造

3.7. 与其称之为“提取操作”​,不如将其视其为一种“数据农业”​

3.8. 与“大他者”从用户那里篡夺价值的方式不同,我们看到的是开发者、平台、用户和内容创作者之间的互惠生态系统,这种互动和贡献丰富了数十亿人的生活

3.9. 当那些沉睡的、未被充分利用或仅在特定背景下有意义的数据,被重新利用、合成并以新颖且具有复合效应的方式转化时,就不是一种掠夺,而是一种对资源的有效利用与再创造

  • 3.9.1. 在AI时代,数据的价值将会更加凸显

4. 私人公地

4.1. “公地”最有力的定义通常指的是那些既具有开放共享访问权,又受到集体管理的资源,为个体和整个社区的利益服务

  • 4.1.1. 公地是我们共享的财产,它不属于任何个人或团体,而是被共同持有

  • 4.1.1.1. 布朗大学史蒂文·卢巴尔(Steven Lubar)教授

  • 4.1.2. 公园和海滩经常被称为公地,空气、水和公共图书馆也是如此

  • 4.1.3. 公共领域的创意作品是公共公地的一部分,语言、文字、计算机语言、老式鸡尾酒的配方,甚至在晴朗夜空中的猎户座的景色也可以算作公共公地

4.2. 公地是一种有意管理的资源,有明确的使用者群体,有明确界定的访问权限,对违规行为的处罚是分级的,具有可明确阐述和可操作的治理特征

  • 4.2.1. 2009年荣获诺贝尔经济学奖埃莉诺·奥斯特罗姆(Elinor Ostrom)

4.3. "私人公地”这个短语可能听起来自相矛盾,甚至带有奥威尔式的意味

4.4. 自20世纪90年代互联网首次商业化以来,以用户作为生产者和管理者的、由私人拥有或管理的平台大量涌现

  • 4.4.1. 这个模式的不同形式和案例被贴上了各种标签,包括Web2.0、社交媒体、共享经济、零工经济和监控资本主义

  • 4.4.2. 免费的或几乎免费的生活管理资源正在涌现,并有效地充当了私有化的社会服务和公用设施,就像福利国家以资本主义的速度发展一样

4.5. 营利性公司和其他私营机构在私人公地的创建中发挥着至关重要的作用,而公众显然也发挥了重要的作用

  • 4.5.1. 在Facebook、YouTube、X.com等平台上,个人用户提供的大部分内容、所有的关注,以及所有的用户行为(如点击、社交互动、购买商品等)​,这些都会帮助平台运营商实现盈利

4.6. 当一种产品或服务免费时,只要消费者对其赋予一定价值,消费者盈余同样可以存在

  • 4.6.1. 广播电视和电台多年来就是消费者盈余的主要来源

  • 4.6.1.1. 除了购买电视机或收音机的成本,你无须为电视或电台中的节目支付费用,却能获得终身的娱乐和信息服务

4.7. 互联网基本上是一台创造消费者盈余的机器

  • 4.7.1. 人们愿意放弃使用搜索引擎一年所需的中位数补偿金高达17530美元

  • 4.7.2. 对于电子邮件,这一金额是8414美元

  • 4.7.3. 对于数字地图,这一金额则是3648美元

  • 4.7.4. 维基百科作为一项免费服务,所包含的文章数量远远超过《不列颠百科全书》​,且质量相当

  • 4.7.4.1. 《不列颠百科全书》的售价曾高达数千美元,这意味着它的用户认为它至少值那么多钱

  • 4.7.4.2. 维基百科不仅免费取代了一个曾经相当昂贵的产品,它也是一个更好的产品,因为它包含的文章数量明显更多

  • 4.7.4.3. 维基百科也非常易于使用

4.8. 私人公地通过让知识和机会更公平地被获取,增强了个体能动性、教育机会公平性、社会流动性,并最终促进了职业成长

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/942769.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解答这些 Solidity 开发中的重要问题

我来详细解答这些 Solidity 开发中的重要问题: 1. Calldata 的含义和使用场景 Calldata 定义 calldata 是函数参数的存储位置,专门用于存储外部函数调用的参数数据。 使用场景 contract CalldataExample {// 1. 外部…

Day1排版标签,标题与段落

标题标签一般在新闻标题,文章标题等内容上使用,且是双标签,标签名为h1~h6,而h1标签在一个网页中只能用一次,一般用来放新闻标题或网页logo,其余标题标签则无次数限制、 各级标题标签的字号都会加粗,等级越大,字…

梦回大唐王一牛

梦回大唐王一牛英雄不装车. 爱国者,坦克都贴边建.要塞满医疗车.

grpc 哼哈二将,你值得拥有

kong网关转发http服务,各大博主都已经聊包浆了。 kong网关原生支持代理gRPC请求,本文通过一个示例来记录通过kong网关管理gRPC服务,并且使用grpcbin和grpcurl哼哈二将来模拟和验证grpc服务能力。kong网关核心的控制…

一文读懂字体文件

一文读懂字体文件这篇文章是从0到1自定义富文本渲染的原理篇之一,此外你还可能感兴趣: 更多内容欢迎关注公众号:非专业程序员Ping一文读懂字符与编码 一文读懂字符、字形、字体 一文读懂字体文件 从0到1自定义文字排…

解释这些 Solidity 智能合约的核心概念

我来详细解释这些 Solidity 智能合约的核心概念: 1. 合约生命周期 合约部署阶段 // 1. 合约创建 contract MyContract {// 2. 状态变量初始化uint256 public value;address public owner;// 3. 构造函数执行construct…

你的项目一团糟-不是你的错-是框架的锅

GitHub 主页 你的项目一团糟?不是你的错,是框架的“锅”!📂➡️🏛️ 每个程序员都经历过那个瞬间。你加入一个新项目,或者时隔半年重新打开一个自己写的项目,然后,你感到了那种熟悉的、令人窒息的混乱。🌪…

别再猜了-开始测量吧-一份实用的Web性能指南

GitHub 主页 别再猜了,开始测量吧:一份实用的 Web 性能指南 又是一年“黑五”,凌晨三点,我的手机像疯了一样尖叫起来。😱 不是闹钟,是监控警报。我们的主打电商服务,那个我们花了半年心血构建的系统,在流量洪…

你的错误处理一团糟-是时候修复它了-️

GitHub 主页 你的错误处理一团糟,是时候修复它了!🛠️ 我还记得那个让我彻夜难眠的 bug。一个支付回调接口,在处理一个罕见的、来自第三方支付网关的异常状态码时,一个Promise链中的.catch()被无意中遗漏了。结果…

[网络] [iproute2] tc: Linux 带宽限制(Token Bucket Filter 和 HTB)使用指南

[网络] [iproute2] tc: Linux 带宽限制(Token Bucket Filter 和 HTB)使用指南$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");参考:iproute2: 网络管理利…

C++编程练习

// 阿汪面前有两只盲盒,每只盒子打开都有两种可能:或者装了 X 克狗粮,或者是一只容量为 Y 克的狗粮储蓄盒。如果是狗粮,阿汪可以快乐地吃掉;如果是空储蓄盒,那就倒霉了,阿汪必须想办法找到狗粮把这只储蓄盒装满…

newDay14

1.做了几个Java的小练习,背背单词,写了一些英语作业,时间还是不太够 2.明天课就少了,继续往下学 3.自己c++还是太差了,java学得差不多就回去补c++

L07_在RuoYI项目中添加自己的接口并实现CRUD功能(轻松+AI版)

这里是废话部分 从来没有写过如此轻松的作业,上课两个多小时就听进去了几分钟的东西,这几分钟的东西还是操作,其他是半点都没入入脑,靠着这几分钟的东西,轻松的完成了作业的1/2。 在L06中折磨的看了三天的文档,大…

大二to大三暑假大三上前半学期总结

比赛,学习,刚谈上恋爱,可是然后呢?其实心态得到了比较大的改变,比大二下的时候好受了很多,可能是逐渐接收了事实了。 比较大的事情其实也没几个,第一是和同学一起去打了一个超算比赛 是并行应用挑战赛2025,去鄂…

带权拉格朗日中值定理的证明

带权拉格朗日中值定理:设 \(f(x)\) 在 \([a, b]\) 连续,且 \(g(x)\) 在 \([a,b]\) 可积且不变号(恒大于零或恒小于零),那么存在 \(c\in [a,b]\),使得 \[\int^b_af(x)g(x)\text{d}x = f(c)\int^b_ag(x)\text{d}x …

Linux 下将程序打包为安装包

对于 Linux 下的程序打包,个人首推 FPM 构建工具。它比 dpkg、rpmbuild 要好用的多(至少 2021 年那会如此),并且它同时支持 deb、rpm 等包格式。 以下回顾一下以前写过的安装包构建脚本: #!/bin/bash#-----------…

低代码如何推动企业敏捷创新与业务赋能

在创新驱动发展的时代,企业需要更快地响应市场变化,更灵活地调整业务策略。然而,传统的软件开发模式往往无法满足这种敏捷性要求。低代码技术的出现,正在改变这一现状,成为推动企业敏捷创新的重要力量。低代码与敏…

hevc解码器下载

如果你使用的是品牌电脑,那电脑重装系统后会自动下载,无需手动安装,连机械革命都会自动安装的 如果不是,那么直接下载最新版(本文截稿于2025/10/21) Microsoft.HEVCVideoExtensions_2.4.23下载 双击打开即可安装…

低代码如何成为企业数字化转型的加速器

在当今快速变化的商业环境中,企业数字化转型已从"选择题"变成了"必答题"。然而,传统软件开发模式的高成本、长周期,让许多企业在数字化转型的道路上步履维艰。这时,低代码技术应运而生,正以其…

2025.10.18 刷题

2025.10.18 刷题1. P14253 旅行(trip) 一眼,区间肯定到结尾 然后从后面扫,随便统计一下个数即可 2. P14254 分割(divide) 刚看很难 再看诈骗 发现限制是要求同等深度,然后最小的必须有两个 然后这个是个独立问题…