【AI】第二篇 为什么会有神经网络

news/2025/12/9 22:20:35/文章来源:https://www.cnblogs.com/gdouzz/p/19328575

    根据前面的n-gram的介绍,大家都发现光靠统计次数是走不通的,我们需要一个能够脑补,举一反三的方法,而不是死板的查表机器。

      神经网络是--“懂得举一反三的聪明人"

         神经网络引入了一个划时代的的概念:词向量,它把每一个词变成了一组数字(一个高维空间的坐标)。

         神经网络是从统计到语义的理解的飞跃。

         比如下面这个例子

   N-gram 眼里: “国王”和“女王”是两个完全不同的词,就像“国王”和“桌子”一样,毫无关系。因为字不一样。

     神经网络 眼里: 它把每个词变成了一组数字(一个在高维空间里的坐标)。

    它发现“国王”的坐标和“女王”的坐标靠得很近(都是统治者、人物、有头衔)。

    而“国王”和“桌子”的坐标离得很远。

    更神奇的是,它还能学到关系:从“国王”到“男人”的向量,几乎等于从“女王”到“女人”的向量。这就是语义关系的数学表达。

  它是如何“举一反三”的?(一个更恰当的例子)

      让我们来看一个关于“交通与旅行”的场景:

        训练数据里有:

      •     “我坐 飞机去北京出差。”
      •     “他坐 高铁去上海旅游。”

      考题是:
        “一位商人搭乘 轮船前往____。”

    N-gram 的反应:
    “完蛋,我见过‘坐飞机’、‘坐高铁’,但没见过‘搭乘轮船’这个组合。我更没学过‘前往’后面应该跟哪个城市。这道题我不会,概率为0。”
   (它被全新的词语组合卡住了,暴露了数据稀疏和短视的致命伤。)

   神经网络的思考过程:

    1. 理解动词: 它发现“坐”和“搭乘”意思非常接近(都是乘坐交通工具),它们的向量距离很近。
    2. 理解工具: 它发现“飞机”、“高铁”和“轮船”都属于“长途交通工具”这个类别,它们的向量也聚在一起。
    3. 理解目的地: 它知道“北京”和“上海”都是中国的特大城市,是常见的商业或旅游目的地。

                 举一反三: 它推理出:“既然‘坐飞机’可以去‘北京’,那么结构相似、意思相近的‘搭乘轮船’,自然也可以去一个和‘上海’类似的大城市。所以空格里填一个地名,比如‘广州’、‘天津’或‘青岛’,都是非常合理。

  总结

  • N-gram 时代: 计算机像个只会查表的图书管理员。如果表格里没有这一行,它就回答不了。它的知识是“死”的。
  • 神经网络时代: 计算机开始像个有逻辑的学生。即使这道题没做过,它能根据以前学过的知识(词义的相似性和关系),推导出答案。它的知识是“活”的。

  这就是从“统计”到“语义理解”的伟大飞跃。神经网络不再仅仅记住“什么词和什么词经常一起出现”,而是真正理解了“这个词是什么意思,它和那个词有什么关系”。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/995645.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

7-16岁少儿编程课精选推荐:从启蒙到竞赛的系统路径 - 品牌测评鉴赏家

7-16岁少儿编程课精选推荐:从启蒙到竞赛的系统路径在为7-16岁的孩子选择编程教育机构时,家长们往往面临众多选择。不同机构在课程体系、教学方式和培养方向上各有侧重。本文将基于市场口碑、课程体系完整性和家长实际…

深入解析:PostgreSQL 向量扩展插件pgvector安装和使用

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

P3385 【模板】负环 题解

P3385 【模板】负环 题解差分约束系统是什么? 差分约束系统指的是一个序列 \(x={x_1,x_2,\cdots x_m}\) 和以如下形式出现的 \(n\) 元一次不等式组。 \[\left\{\begin{matrix} x_{i_1}-x_{j_1}\le c_{k_1}\\x_{i_2}-x…

权威盘点:2025年中国智能舆情监控系统市场深度解析

随着数字社会信息生态的持续演进,舆情监控工作已发生根本性变革。传统的人工信息汇总模式,正被集多模态感知、大模型智能研判与前瞻性决策支持于一体的新一代舆情监控系统所取代。行业数据显示,2025年中国舆情监测市…

qemu安装aix7.2

最近想玩玩IBM的AIX系统,由于AIX系统只能运行在IBM的power cpu上,VMware、VirtualBox只支持X86架构,QEMU全仿真的特点可以模拟出power cpu实现系统安装。 AIX系统是IBM开发的一套UNIX操作系统,它可以在所有的IBM p…

编程小白必看!免费体验课大搜罗 - 品牌测评鉴赏家

编程小白必看!免费体验课大搜罗编程小白速进!免费体验课地图来啦 编程热,为何要先体验? 在当今数字化时代,编程已成为一门炙手可热的技能 ,掀起了全民学习的热潮。从职场人士渴望提升竞争力,到家长们为孩子规划…

前端半小时,上线一下午?我用这个平台工程思路统一了全栈部署

全栈开发拯救指南:别再让你的前端去碰 Nginx 和 Docker 了 我名义上是个全栈开发者,但最近感觉自己更像个“全栈救火队员”。 一个前端组件,我可能半小时就写完了。但为了把它上线,我可能需要花一下午的时间,去跟…

2025年国内诚信的微动开关制造厂家推荐榜单,家电微动开关/鼠标微动开关/防水微动开关/微动开关/小型微动开关微动开关制造厂家哪里有 - 品牌推荐师

在工业自动化、智能家居、新能源汽车等产业蓬勃发展的当下,微动开关作为关键的基础电子元件,其可靠性直接关系到终端产品的性能与安全。面对市场上众多的微动开关制造商,采购方与工程师们常常面临“工厂哪家靠谱”的…

ABC352D 题解

ABC352D 题解ABC352D - Description 给你一个 \(n\) 的排列 \(a\),让你选出一个长度为 \(k\) 的 \(a\) 的子序列 \(b=\left [ a_{p_1},a_{p_2},\cdots ,a_{p_k} \right ]\),使得 \(\min b_i +k-1=\max b_i\) 的同时控…

CF1407D 题解

CF1407D 题解CF1407D - Description 有 \(n\) 栋楼,每栋楼有高度 \(h_i\),对于第 \(i\) 栋楼和第 \(j\) 栋楼,如果 \((i,j)\) 满足以下三个条件中的任意一个,我们认为可以从第 \(i\) 栋楼跳到第 \(j\) 栋楼:\(i+1…

12月9号

今天进行了中国古诗词的学习。

C语言深度解剖:第一章关键字(五) - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

MySQL 筛选条件放 ON 后 vs 放 WHERE 后

ON 决定如何 "连接" 表,WHERE 决定连接后 "显示" 哪些行。 这个根本区别导致了在 LEFT JOIN / RIGHT JOIN 外连接中,条件放置位置会产生巨大影响;而在 INNER JOIN 中,效果通常 等价。今天我们…

明天不干是小狗

明天不干是小狗上一条必须干 我说真的 老己,你干吧,我求求你了

CF547B 题解

CF547B 题解CF547B - Description 给你个长度为 \(n\) 的序列 \(a\),对于每个 \(1\le k\le n\),有 \(n-k+1\) 个中所有长度为 \(k\) 的子串,你需要求出这 \(n-k+1\) 个子串的区间最小值的最大值,即下面式子的值: …

SAT 辅导哪里好?2025 年优质机构推荐(含精准选择指南) - 品牌测评鉴赏家

SAT 辅导哪里好?2025 年优质机构推荐(含精准选择指南)选择 SAT 辅导机构需结合自身基础、目标分数、学习习惯及地域便利性。以下是 2025 年最新优质机构推荐,涵盖线上线下资源,针对不同需求提供精准建议: 一、全…

10403_基于Springboot的旅游管理系统

1、项目包含 项目源码、项目文档、数据库脚本、软件工具等资料; 带你从零开始部署运行本套系统。 2、项目介绍 随着旅游业的发展,越来越多的人选择通过互联网来规划自己的旅行。在线旅游信息推荐系统就是为了帮助用户…

MMH_蓝桥杯Python_语法基础_列表与循环语句基础

1.列表 列表可以极大降低我们在处理多个元素时的复杂程度; 在 Python 中,列表(list) 是一种有序、可变、可存储多种数据类型的序列数据结构,使用中括号 [] 定义,元素之间用逗号分隔。 1.创建列表 代码展示 #包…

2025全屋定制十大品牌哪家好?欧蒂尼硬核实力破局,领衔品质家居新革命 - 资讯焦点

2025年,中国全屋定制行业迎来“质造升级+需求多元”的双重变革,整家定制、智能集成、年轻化设计成为行业主流趋势。在这片竞争激烈的赛道上,一批兼具实力与口碑的品牌脱颖而出,它们以技术为基、以设计为魂、以服务…

keepalived搭建高可用

一、HA集群 1.1 ha集群是什么 高可用集群,是有多台服务器节点组成的集群,通过冗余设计和故障自动切换,保证了核心服务,持续可用,减少了停机时间就是当一个提供网站的服务故障后,另外一台机器充当这个提供网站的角…