arduinowifi.send怎么获取响应_ChatterBot代码解读-获取对话

d5a90e22ef3b43d668de15510ddfbc81.png

这个过程比较复制,安装处理的流程,依次进行代码解读。

在定义一个ChatBot后,可以进行对话的训练,这个过程参考:

水中的鱼:ChatterBot代码解读-训练数据​zhuanlan.zhihu.com
f938b760e30a0c9f2494f70ab23f78a5.png

然后就是用如下的代码,获取对话的响应:

response = chatbot.get_response('How are you doing today?')。

一. 构造Statement类的对象.

get_response函数中,从75-100行,主要是构造Statement类的对象。类的定义在chatterbot/conversation.py文件中。

803dda43adbeaa8c5c9095029eeb2b6a.png

第75行的代码有点绕,这里详细讲解下。

self.storage是ChatBot类初始化时指定的存储适配器,这里以SQLStorageAdapter为例。SQLStorageAdapter类的定义在chatterbot/storage/sql_storage.py文件中。

self.storage.get_object('statement')应该是调用SQLStorageAdapter类的get_object函数。但是sql_storage.py文件中并找不到get_object函数的定义。

怎么办呢?

熟悉类的继承特性的话,可能会想到是否在父类中定义的呢?这里介绍pycharm的一个技巧,选中SQLStorageAdapter,然后按ctrl+H,可以看到类的继承关系。这样避免需要逐层寻找。

在chatterbot/storage/storage_adapter.py中,get_object的代码:

89b2fe406ab4157d7ce0b7792e7b101e.png

返回的是一个函数,函数的名字是get_%s_object拼装的,值为“get_statement_object”。

在看get_statement_object函数,返回值为一个Statement对象。

这里有读者可能会提问:干嘛不直接import Statement,而采用这种复杂的动态获取的方式呢?

恭喜你,提了一个不错的问题,善于提问,成长的快。

采用动态获取的方式,本意是对于不同的存储适配器,定义不同的Statement类。但是本框架其实并没有实现不同的Statement类。只是这里动态获取的机制值得我们学习。当我们需要的时候,可以应用这种机制。

二. 对输入进行预处理

e674454c7aa18df50b2b18ce2dee9301.png

elf.preprocessors包含了预处理的适配器列表。系统已经预置的适配器有:

clean_whitespace 去掉语句中连续的空白字符

unescape_html 将 html中的转义字符变成对应的原字符,比如“&lt;b&gt;” 变成“<b>”.

convert_to_ascii 将unicode转成对应的ASCII码。

但是对于这个具体的ChatBot,使用那些预处理,要看初始化配置。

这里也可以看到要增加自定义的预处理适配器,只需要定义适配器函数,入参为Statement对象,出参也是Statement对象。

三.生成响应

具体是调用self.generate_response。

入参:input_statement是Statement对象,additional_response_selection_parameters是字典。

出参:Statement类的对象

具体过程如下:

0b342f7f0d2c56d84f8519648e9c984c.png

对于每个逻辑适配器,依次调用适配器的process函数,获得对应的输出语句和置信度。将所有的输出Statement对象保存到results列表中,result保存置信度最大的输出Statement对象。

这里以BestMatch适配器来看process的处理过程。

四. BestMatch.process处理过程

BestMatch类的构造中中,excluded_words参数的作用,可以让返回的语句包含这些词,比如脏话。

process中第三个参数self.search_algorithm,系统定义了两张搜索算法,默认采用IndexedTextSearch。

d7a9b80c519aa33004978a84e32dbb69.png

这里搜索过程描述参考第五步。假定已经完成查询数据库的搜索过程,并将结果保存在search_results中。接着的逻辑:

在search_results列表中查找置信度大于maximum_similarity_threshold(0.95),如果找到,就直接返回。

在search_results列表去掉之前已经使用过的答复(避免重复答复),然后id大小排序,找到最近的10条记录。之前已经使用过的答复保存到Statement.conversation中,由于这里是单轮对话,系统并没有记录之前的对话的conversation,而是实现成通过参数传入,也就是说这个机制其实没有作用。

用additional_response_selection_parameters对search_results列表进行过滤操作。

对search_results列表中选择一条记录,选择的策略有:get_most_frequent_response,get_first_response,get_random_response。默认采用get_first_response的方式。

如果search_results列表为空,就输出默认的响应,对应的置信度为0.

五. 搜索算法的搜索过程

IndexedTextSearch.search,寻找和输入语句最接近的语句列表,并按照置信度做升序排列。输入语句作为pair对的上句,搜索的范围也是数据库中pair对中的上句。

搜索的过程是调用存储适配器的filter函数,参数search_parameters是一个字典。这里就看SQLStorageAdapter.filter,搜索的过程其实就是查询sql的语句。这用到了传说中的ORM技术:Object-Relational Mapping,把关系数据库的表结构映射到对象上。但是由谁来做这个转换呢?所以ORM框架应运而生。在Python中,最有名的ORM框架是SQLAlchemy。

重要的部分是:

f0fa1ab1d92962f2ae1f93599ef80b8f.png

这里采用self.compare_statements计算置信度(也就是相似度)。入参是要对比的两个statement对象。

相似度的算法,系统实现了:LevenshteinDistance,SpacySimilarity,JaccardSimilarity,默认值是LevenshteinDistance。

六.其他逻辑适配器

比如Time Logic Adapter ,Mathematical Evaluation Adapter ,其实现过程比较简单。这里不详述。

其实这里有个疑问:怎么根据业务需要,在这个框架中定制自己的处理逻辑适配器。比如根据用户的输入来执行一些命令,或调用其他在线聊天机器人的接口(比如turingapi)。

相信大家已经有自己的思路了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/433757.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[jQuery] jQuery函数

&#xff08;1&#xff09;文档就绪函数$(document).ready(function(){--- jQuery functions go here ----});为了防止文档在完全加载&#xff08;就绪&#xff09;之前运行 jQuery 代码。如果在文档没有完全加载之前就运行函数&#xff0c;操作可能失败。下面是具体的例子&…

beautifulsoup网页爬虫解析_Python爬虫神器:PyQuery,解析网页更简单,小白也能学会

图/文&#xff1a;迷神我们做python爬虫&#xff0c;通过requests抓取到内容就需要正则匹配&#xff0c;或者其他解析库解析内容。很多可能和我一样的人&#xff0c;都使用jquery的&#xff0c;那用的还是非常爽的。而pyquery库就是jQuery的Python实现&#xff0c;能够以jQuery…

ubuntu设置始终亮屏_ubuntu系统每次启动屏幕都是最大亮度问题的解决方法

这个方法你尝试过没首先你要确保有这个文件:复制代码代码如下:/sys/class/backlight/acpi_video0/brightnesscat出来的值就是你当前的屏幕亮度.我们修改下面的文件加入一些用户启动设置:复制代码代码如下:sudo gedit /etc/rc.local在 exit 0 的上方加入以下代码(确保exit 0没有…

unityios开发--加载视频以及加载完成之后自动跳转 .

在做游戏或者是虚拟漫游一般都会用到在开始的时候加载一段视频&#xff0c;这个视频可能一个介绍整个游戏或者是整个项目的。在加载完了之后自动的跳转到主画面或一个场景&#xff0c;在前在网上百度了一下找到的大部分都是win的好不容易找到了ios的。 Unity3D中播放游戏视频的…

rnn神经网络模型_一文读懂序列建模(deeplearning.ai)之循环神经网络(RNNs)

作者&#xff1a;Pulkit Sharma&#xff0c;2019年1月21日翻译&#xff1a;陈之炎校对&#xff1a;丁楠雅本文为你详细介绍序列模型&#xff0c;并分析其在不同的真实场景中的应用。简介如何预测一个序列中接下来要发生什么事情是一个非常吸引人的课题&#xff0c;这是我对数据…

mysql 人名用什么类型_如何选择合适的MySQL数据类型

一、MySQL数据类型选择原则更小的通常更好&#xff1a;一般情况下选择可以正确存储数据的最小数据类型。越小的数据类型通常更快&#xff0c;占用磁盘&#xff0c;内存和CPU缓存更小。简单就好&#xff1a;简单的数据类型的操作通常需要更少的CPU周期。例如&#xff1a;整型比字…

am335x uart5配置

任务&#xff1a;配置uart5

XML Schema ---complexType-----复合元素

混合的复合类型可包含属性、元素以及文本。 带有混合内容的复合类型 XML 元素&#xff0c;"letter"&#xff0c;含有文本以及其他元素&#xff1a; <letter>Dear Mr.<name>John Smith</name>.Your order <orderid>1032</orderid>will …

Java笔记(一)—StringBuilder类

1、StringBuilder类概述 StringBuilder是一个可变的字符串类&#xff0c;主要指的是StringBuilder对象 中的内容是可变的。与之相比String对象的内容是不变的。2、StringBuilder常用构造方法 public StringBuilder() {} //创建空白可变字符串 public StringBuilder(String st…

ubuntu下制作u盘镜像_deepin下制作win10启动U盘

1.准备①下载multibootusb&#xff1a;http://multibootusb.org/page_download/ ②准备一个win10的镜像文件 ③准备一个U盘&#xff0c;最好先备份U盘数据再格式化一道2.打开multibootusb工具输入开机密码&#xff0c;点击认证3.multibootusb操作部分①选择U盘的第一个分区 ②安…

Shared_from_this 几个值得注意的地方

shared_from_this()是enable_shared_from_this<T>的成员 函数&#xff0c;返回shared_ptr<T>。首先需要注意的是&#xff0c;这个函数仅在shared_ptr<T>的构造函数被调用之后才能使 用。原因是enable_shared_from_this::weak_ptr并不在构造函数中设置&#x…

asterisk1.8 账号信息mysql存储(动态)

1. 首先需要先编译出以下6个模块 res_realtime.so pbx_realtime.so func_realtime.so res_config_mysql.so app_mysql.so cdr_mysql.so 其中有些模块&#xff0c;asterisk默认并不编译&#xff0c;需要修改menuselect.makeopts这个文件&#xff0c;将里面的相应…

签证上的mult是什么意思_申根签证中mult是什么意思

展开全部申根签证中mult是是多次的意思&#xff0c;指可以在有效期内多次往返申根国家。类型申根签证分62616964757a686964616fe78988e69d8331333431373939为入境和过境两类。1.入境签证有一次入境和多次入境两种。签证持有者分别可一次连续停留90天或每半年多次累计不超过3个月…

Java拆分字符串

1、例如给出如下字符串"91 27 46 38 50"如何将其拆分成{"91", "27", "46", "38", "50"}呢&#xff1f;2、我们可以通过String类中的public String[] split(String regex)方法来实现String s "91 27 46 38 5…

Perl正则表达式匹配

\w([-.]\w)*((aa.com)|(bb.com)|(163.com)) 这个正则表达式可实现匹配含有aa.com或bb.com或163.com 的email 转载于:https://www.cnblogs.com/inbase/archive/2013/04/01/2994479.html

大数据翻页_大数据量下的分页解决方法

最好的办法是利用sql语句进行分页&#xff0c;这样每次查询出的结果集中就只包含某页的数据内容。再sql语句无法实现分页的情况下&#xff0c;可以考虑对大的结果集通过游标定位方式来获取某页的数据。sql语句分页&#xff0c;不同的数据库下的分页方案各不一样&#xff0c;下面…

centos7 安装git_Centos7.4 Yapi 服务搭建

Centos Yapi服务搭建转载请标明原文出处参考以下网址&#xff0c;排名不分先后https://github.com/YMFE/yapihttps://blog.csdn.net/guangzhou007_java/article/details/90779222https://www.jianshu.com/p/994bc7b19b26我的服务器环境阿里云服务器 centos 7.4使用 https://one…

asterisk使用MYSQL认证的配置方法

asterisk要使用MYSQL实时认证peers&#xff0c;就必须安装asterisk的realtime 和 mysql 模块&#xff0c;这些模块在asterisk插件包中 下载地址是&#xff1a;http://www.asterisk.org/downloads 下载之后./configure 然后sudo make &&sudo make install && …

Java笔记—字符缓冲流

一、字符缓冲流构造方法简述 BufferedReader&#xff1a;从字符输入流中读取文本&#xff0c;缓冲各个字符&#xff0c;从而实现字符、 数组和行的高效读取。 可以指定缓冲区的大小&#xff0c;或者可使用默认的大小。大 多数情况下&#xff0c;默认值就足够大了。构造方法&am…

手机来电秀怎么开启_360手机卫士怎么设置来电秀 360手机卫士来电秀设置方法...

360手机卫士除了防护等安全功能外&#xff0c;它的来电秀也是比较火热的&#xff0c;很多朋友都喜欢在这里设置自己别具个性的来电秀&#xff0c;这篇文章就一起了解一下360手机卫士怎么设置来电秀。360手机卫士来电秀设置是在【隐私保护】中&#xff0c;所以很多朋友都没找到在…