网站设计公司案例做电子商务网站多少钱

news/2025/9/23 0:03:43/文章来源:
网站设计公司案例,做电子商务网站多少钱,哈尔滨论坛建站模板,头像制作生成器本文转自微信公众号#xff1a;Datawhale#xff08;强烈推荐#xff09; 原创#xff1a; AIUnion Datawhale 今天 【导读】 本文由知名开源平台#xff0c;AI技术平台以及领域专家#xff1a;Datawhale#xff0c;ApacheCN#xff0c;AI有道和黄海广博士联合整理贡献… 本文转自微信公众号Datawhale强烈推荐 原创 AIUnion Datawhale 今天 【导读】  本文由知名开源平台AI技术平台以及领域专家DatawhaleApacheCNAI有道和黄海广博士联合整理贡献内容涵盖AI入门基础知识、数据分析\挖掘、机器学习、深度学习、强化学习、前沿Paper和五大AI理论应用领域自然语言处理计算机视觉推荐系统风控模型和知识图谱。是你学习AI从入门到专家必备的学习路线和优质学习资源。 目录 经典课程 基础知识 数据分析/挖掘 机器学习 深度学习 强化学习 前沿Paper 应用领域 自然语言处理 计算机视觉 推荐系统 风控模型评分卡模型 知识图谱 平台介绍 Datawahle AI有道 黄博机器学习初学者 ApacheCN 经典课程 基础知识 1数学 数学是学不完的也没有几个人能像博士一样扎实地学好数学基础入门人工智能领域其实只需要掌握必要的基础知识就好。AI的数学基础最主要是高等数学、线性代数、概率论与数理统计三门课程这三门课程是本科必修的。这里整理了一个简易的数学入门文章 数学基础高等数学 https://zhuanlan.zhihu.com/p/36311622 数学基础线性代数 https://zhuanlan.zhihu.com/p/36584206 数学基础概率论与数理统计 https://zhuanlan.zhihu.com/p/36584335 机器学习的数学基础资料下载 1) 机器学习的数学基础.docx 中文版对高等数学、线性代数、概率论与数理统计三门课的公式做了总结。 2) 斯坦福大学机器学习的数学基础.pdf 原版英文材料非常全面建议英语好的同学直接学习这个材料。 下载链接:  https://pan.baidu.com/s/1LaUlrJzy98CG1Wma9FgBtg 提取码: hktx 国外经典数学教材 相比国内浙大版和同济版的数学教材更加通俗易懂深入浅出便于初学者更好地奠定数学基础。下载链接 https://blog.csdn.net/Datawhale/article/details/81744961 2统计学 入门教材深入浅出统计学 进阶教材商务与经济统计 推荐视频可汗学院统计学 http://open.163.com/special/Khan/khstatistics.html 3编程 入门人工智能领域首推Python这门编程语言。 1) Python安装 Python安装包我推荐下载AnacondaAnaconda是一个用于科学计算的Python发行版支持 Linux, Mac, Windows系统提供了包管理与环境管理的功能可以很方便地解决多版本Python并存、切换以及各种第三方包安装问题。 下载地址 https://www.anaconda.com/download/  推荐选Anaconda python 3.7版本 IDE推荐使用pycharm社区版免费 下载地址https://www.jetbrains.com/ 安装教程 AnacondaJupyter notebookPycharm https://zhuanlan.zhihu.com/p/59027692 Ubuntu18.04深度学习环境配置(CUDA9CUDNN7.4TensorFlow1.8) https://zhuanlan.zhihu.com/p/50302396 2) python入门的资料推荐 a.廖雪峰python学习笔记 https://blog.csdn.net/datawhale/article/category/7779959 b.python入门笔记 作者李金这个是jupyter notebook文件把python的主要语法演示了一次值得推荐。下载链接:  https://pan.baidu.com/s/1IPZI5rygbIh5R5OuTHajzA 提取码: 2bzh c.南京大学python视频教程 这个教程非常值得推荐python主要语法和常用的库基本涵盖了。 查看地址 https://www.icourse163.org/course/0809NJU004-1001571005?fromstudy 看完这三个资料后python基本达到入门水平可以使用scikit-learn等机器学习库来解决机器学习的问题了。 3补充 代码规范 https://zhuanlan.zhihu.com/p/59763076 numpy练习题 https://zhuanlan.zhihu.com/p/57872490 pandas练习题 https://zhuanlan.zhihu.com/p/56644669 数据分析/挖掘 1数据分析的基础书籍   《利用python进行数据分析》 这本书含有大量的实践案例你将学会如何利用各种Python库包括NumPyPandas、Matplotlib以及IPython等高效地解决各式各样的数据分析问题。如果把代码都运行一次基本上就能解决数据分析的大部分问题了。   2特征工程 https://blog.csdn.net/Datawhale/article/details/83033869 3数据挖掘和项目 https://blog.csdn.net/datawhale/article/details/80847662 机器学习 公开课吴恩达《Machine Learning》 这绝对是机器学习入门的首选课程没有之一即便你没有扎实的机器学习所需的扎实的概率论、线性代数等数学基础也能轻松上手这门机器学习入门课并体会到机器学习的无穷趣味。 课程主页 https://www.coursera.org/learn/machine-learning 中文视频 网易云课堂搬运了这门课并由黄海广等人翻译了中文字幕。 中文笔记及作业代码 https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes 公开课吴恩达 CS229 吴恩达在斯坦福教授的机器学习课程 CS229 与 吴恩达在 Coursera 上的《Machine Learning》相似但是有更多的数学要求和公式的推导难度稍难一些。该课程对机器学习和统计模式识别进行了广泛的介绍。 课程主页 http://cs229.stanford.edu/ 中文视频 http://open.163.com/special/opencourse/machinelearning.html 中文笔记 https://kivy-cn.github.io/Stanford-CS-229-CN/#/ 速查表 这份给力的资源贡献者是一名斯坦福的毕业生 Shervine Amidi。作者整理了一份超级详细的关于 CS229的速查表 https://zhuanlan.zhihu.com/p/56534902 作业代码 https://github.com/Sierkinhane/CS229-ML-Implements 公开课 林轩田《机器学习基石》 台湾大学林轩田老师的《机器学习基石》课程由浅入深、内容全面基本涵盖了机器学习领域的很多方面。其作为机器学习的入门和进阶资料非常适合。而且林老师的教学风格也很幽默风趣总让读者在轻松愉快的氛围中掌握知识。这门课比 Ng 的《Machine Learning》稍难一些侧重于机器学习理论知识。 中文视频 https://www.bilibili.com/video/av36731342 中文笔记 https://redstonewill.com/category/ai-notes/lin-ml-foundations/ 配套教材 配套书籍为《Learning From Data》在线书籍主页http://amlbook.com/ 公开课林轩田《机器学习技法》 《机器学习技法》课程是《机器学习基石》的进阶课程。主要介绍了机器学习领域经典的一些算法包括支持向量机、决策树、随机森林、神经网络等等。难度要略高于《机器学习基石》具有很强的实用性。 中文视频 https://www.bilibili.com/video/av36760800 中文笔记 https://redstonewill.com/category/ai-notes/lin-ml-techniques/ 书籍《机器学习》 周志华的《机器学习》被大家亲切地称为“西瓜书”。这本书非常经典讲述了机器学习核心数学理论和算法适合有作为学校的教材或者中阶读者自学使用入门时学习这本书籍难度稍微偏高了一些。 配合《机器学习实战》一起学习效果更好 读书笔记 https://www.cnblogs.com/limitlessun/p/8505647.html#_label0 公式推导 https://datawhalechina.github.io/pumpkin-book/#/ 课后习题 https://zhuanlan.zhihu.com/c_1013850291887845376 书籍《统计学习方法》 李航的这本《统计学习方法》堪称经典包含更加完备和专业的机器学习理论知识作为夯实理论非常不错。   讲课 PPT https://github.com/fengdu78/lihang-code/tree/master/ppt 读书笔记 http://www.cnblogs.com/limitlessun/p/8611103.html https://github.com/SmirkCao/Lihang 参考笔记 https://zhuanlan.zhihu.com/p/36378498 代码实现 https://github.com/fengdu78/lihang-code/tree/master/code 书籍《Scikit-Learn 与 TensorFlow 机器学习实用指南》 在经过前面的学习之后这本《Scikit-Learn 与 TensorFlow 机器学习实用指南》非常适合提升你的机器学习实战编程能力。 这本书分为两大部分第一部分介绍机器学习基础算法每章都配备 Scikit-Learn 实操项目第二部分介绍神经网络与深度学习每章配备 TensorFlow 实操项目。如果只是机器学习可先看第一部分的内容。 全书代码https://github.com/ageron/handson-ml 实战Kaggle 比赛 比赛是提升自己机器学习实战能力的最有效的方式首选 Kaggle 比赛。 Kaggle 主页: https://www.kaggle.com/ Kaggle 路线: https://github.com/apachecn/kaggle 工具Scikit-Learn 官方文档 Scikit-Learn 作为机器学习一个非常全面的库是一份不可多得的实战编程手册。 官方文档 https://scikit-learn.org/stable/index.html 中文文档0.19 http://sklearn.apachecn.org/#/ 深度学习 公开课 吴恩达《Deep Learning》 在吴恩达开设了机器学习课程之后发布的《Deep Learning》课程也备受好评吴恩达老师的课程最大的特点就是将知识循序渐进的传授给你是入门学习不可多得良好视频资料。 整个专题共包括五门课程01.神经网络和深度学习02.改善深层神经网络-超参数调试、正则化以及优化03.结构化机器学习项目04.卷积神经网络05.序列模型。 课程视频 网易云课堂 https://mooc.study.163.com/university/deeplearning_ai#/c Coursera:  https://www.coursera.org/specializations/deep-learning 课程笔记 之前编写过吴恩达老师机器学习个人笔记黄海广博士带领团队整理了中文笔记 https://github.com/fengdu78/deeplearning_ai_books 参考论文 吴恩达老师在课程中提到了很多优秀论文黄海广博士整理如下 https://github.com/fengdu78/deeplearning_ai_books/tree/master/%E5%8F%82%E8%80%83%E8%AE%BA%E6%96%87 课程PPT及课后作业 吴恩达深度学习课程包含课程的课件、课后作业和一些其他资料 https://github.com/stormstone/deeplearning.ai 公开课Fast.ai《程序员深度学习实战》 说到深度学习的公开课与吴恩达《Deep Learning》并驾齐驱的另一门公开课便是由Fast.ai出品的《程序员深度学习实战》。这门课最大的特点便是“自上而下”而不是“自下而上”,是绝佳的通过实战学习深度学习的课程。 视频地址 B站地址(英文字幕) https://www.bilibili.com/video/av18904696?fromsearchseid10813837536595120136 CSDN地址(2017版中文字幕): https://edu.csdn.net/course/detail/5192 课程笔记 英文笔记原文 https://medium.com/hiromi_suenaga/deep-learning-2-part-1-lesson-1-602f73869197 由ApacheCN组织的中文翻译 https://github.com/apachecn/fastai-ml-dl-notes-zh 公开课CS230 Deep Learning 斯坦福的深度学习课程CS230在4月2日刚刚开课对应的全套PPT也随之上线。从内容来看今年的课程与去年的差别不大涵盖了CNNs, RNNs, LSTM, Adam, Dropout, BatchNorm, Xavier/He initialization 等深度学习的基本模型涉及医疗、自动驾驶、手语识别、音乐生成和自然语言处理等领域。 Datawhale整理了该门课程的详细介绍及参考资料: 吴恩达CS230深度学习开课了视频配套PPT应有尽有 书籍神经网络与深度学习 - 复旦邱锡鹏 本书是入门深度学习领域的极佳教材主要介绍了神经网络与深度学习中的基础知识、主要模型前馈网络、卷积网络、循环网络等以及在计算机视觉、自然语言处理等领域的应用。 复旦教授邱锡鹏开源发布《神经网络与深度学习》 书籍《深度学习》 完成以上学习后想要更加系统的建立深度学习的知识体系阅读《深度学习》准没错。该书从浅入深介绍了基础数学知识、机器学习经验以及现阶段深度学习的理论和发展它能帮助人工智能技术爱好者和从业人员在三位专家学者的思维带领下全方位了解深度学习。   书籍介绍 《深度学习》通常又被称为花书深度学习领域最经典的畅销书。由全球知名的三位专家IanGoodfellow、YoshuaBengio和AaronCourville撰写是深度学习领域奠基性的经典教材。该书被大众尊称为“AI圣经”。 在线阅读 该书由众多网友众包翻译电子版在以下地址获得 https://github.com/exacity/deeplearningbook-chinese   书籍《深度学习 500 问》 当你看完了所有的视频研习了AI圣经一定充满了满脑子问号此时不如来深度学习面试中常见的500个问题。 书籍介绍 DeepLearning-500-questions作者是川大的一名优秀毕业生谈继勇。该项目以深度学习面试问答形式收集了 500 个问题和答案。内容涉及了常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题该书目前尚未完结却已经收获了Github 2.4w stars。 项目地址 https://github.com/scutan90/DeepLearning-500-questions 工具TensorFlow 官方文档 学深度学习一定离不开TensorFlow 官方文档 https://www.tensorflow.org/api_docs/python/tf 中文文档 https://github.com/jikexueyuanwiki/tensorflow-zh   工具PyTorch官方文档 PyTorch是学深度学习的另一个主流框架 官方文档 https://pytorch.org/docs/stable/index.html 中文文档(版本0.3) https://github.com/apachecn/pytorch-doc-zh 强化学习 公开课 Reinforcement Learning-David Silver 与吴恩达的课程对于机器学习和深度学习初学者的意义相同David Silver的这门课程绝对是大多数人学习强化学习必选的课程。 课程从浅到深把强化学习的内容娓娓道来极其详尽。不过由于强化学习本身的难度听讲这门课还是有一定的门槛建议还是在大致了解这个领域之后观看该视频学习效果更佳更容易找到学习的重点。 视频地址 B站地址(中文字幕) https://www.bilibili.com/video/av45357759?fromsearchseid9547815852611563503 课程原地址 https://www.youtube.com/watch?v2pWv7GOvuf0 课程资料 课程PPT http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html 课程笔记 https://www.zhihu.com/people/qqiang00/posts 公开课李宏毅《深度强化学习》 David Silver的课程虽然内容详尽但前沿的很多内容都没有被包括在内这时台大李宏毅的《深度强化学习》就是学习前沿动态的不二之选。 视频地址 B站地址(中文字幕) https://www.bilibili.com/video/av24724071?fromsearchseid9547815852611563503 课程原地址 https://www.youtube.com/watch?v2pWv7GOvuf0 课程资料 课程PPT http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS18.html 课程笔记 https://blog.csdn.net/cindy_1102/article/details/87905272 前沿Paper 1Arxiv Arxiv Stats Arxiv 机器学习最新论文检索主页地址 https://arxiv.org/list/stat.ML/recent?refbestofml.com Arxiv Sanity Preserver Andrej Karpathy 开发了 Arxiv Sanity Preserver帮助分类、搜索和过滤特征 主页地址 http://www.arxiv-sanity.com/?refbestofml.com 2Papers with Code Papers with Code(Browse state-of-the-art) 这个网站叫做 Browse state-of-the-art。它将 ArXiv 上的最新深度学习论文与 GitHub 上的开源代码联系起来。该项目目前包含了 651 个排行榜1016 个深度学习任务795 个数据集以及重磅的 10257 个含复现代码的优秀论文。简直就是一个寻找论文和代码的利器。它将 1016 个深度学习任务分成了 16 大类涉及了深度学习的各个方面。 主页地址 https://paperswithcode.com/sota 举两个例子 CV https://paperswithcode.com/area/computer-vision NLP https://paperswithcode.com/area/natural-language-processing Papers with Code(Sorted by stars) 这份资源收集了 AI 领域从 2013 - 2018 年所有的论文并按照在 GitHub 上的标星数量进行排序。 GitHub 项目地址 https://github.com/zziz/pwc 3Deep Learning Papers 阅读路线 如果你是深度学习领域的新手你可能会遇到的第一个问题是“我应该从哪篇论文开始阅读”下面是一个深入学习论文的阅读路线图 GitHub 项目地址 https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap 这份深度学习论文阅读路线分为三大块 1 Deep Learning History and Basics 2 Deep Learning Method 3 Applications 4Deep Learning Object Detection 目标检测Object Detection是深度学习 CV 领域的一个核心研究领域和重要分支。纵观 2013 年到 2019 年从最早的 R-CNN、Fast R-CNN 到后来的 YOLO v2、YOLO v3 再到今年的 M2Det新模型层出不穷性能也越来越好 本资源对目标检测近几年的发展和相关论文做出一份系统介绍总结一份超全的文献 paper 列表。 GitHub 项目地址 https://github.com/hoya012/deep_learning_object_detection 5知名会议 会议 NeurIPShttps://nips.cc/ ICMLhttps://icml.cc/ ICLRhttps://iclr.cc/ AAAIhttps://aaai.org/Conferences/AAAI-19/ IJCAIhttps://www.ijcai.org/ UAIhttp://www.auai.org/uai2019/index.php   计算机视觉 CVPRhttp://cvpr2019.thecvf.com/ ECCVhttps://eccv2018.org/program/main-conference/ ICCVhttp://iccv2019.thecvf.com/   自然语言处理 ACLhttp://www.aclcargo.com/ EMNLPhttps://www.aclweb.org/portal/content/emnlp-2018 NAACLhttps://naacl2019.org/   知名期刊: JAIRhttps://www.jair.org/index.php/jair JMLRhttp://www.jmlr.org/ 其它 机器人方面有 CoRL学习、ICAPS规划包括但不限于机器人、ICRA、IROS、RSS 对于更理论性的研究有 AISTATS、COLT、KDD。 应用领域 自然语言处理 1:NLP是什么 自然语言处理NLPNatural Language Processing是研究计算机处理人类语言的一门技术目的是弥补人类交流自然语言和计算机理解机器语言之间的差距。NLP包含句法语义分析、信息抽取、文本挖掘、机器翻译、信息检索、问答系统和对话系统等领域。 2:课程推荐 CS224n 斯坦福深度自然语言处理课 17版中文字幕 https://www.bilibili.com/video/av41393758/?p1 课程笔记 http://www.hankcs.com/?sCS224n%E7%AC%94%E8%AE%B0 2019版课程主页 http://web.stanford.edu/class/cs224n/    自然语言处理 - Dan Jurafsky 和 Chris Manning B站英文字幕版 https://www.bilibili.com/video/av35805262/ 学术激流网 http://academictorrents.com/details/d2c8f8f1651740520b7dfab23438d89bc8c0c0ab 3:书籍推荐 Python自然语言处理  入门读物整本书不仅涉及了语料库的操作也对传统的基于规则的方法有所涉及。全书包括了分词tokenization、词性标注POS、语块Chunk标注、句法剖析与语义剖析等方面是nlp中不错的一本实用教程。   自然语言处理综论 By Daniel Jurafsky和James H. Martin 本书十分权威是经典的NLP教科书涵盖了经典自然语言处理、统计自然语言处理、语音识别和计算语言学等方面。 统计自然语言处理基础 By Chris Manning和HinrichSchütze 更高级的统计NLP方法在统计基本部分和n元语法部分介绍得都很不错。 4:博客推荐 我爱自然语言处理 地址http://www.52nlp.cn/ TFIDF、文档相似度等等在这个网站上都有通俗易懂的解释   语言日志博客Mark Liberman 地址 http://languagelog.ldc.upenn.edu/nll/     natural language processing blog  地址https://nlpers.blogspot.com/ 美国Hal Daumé III维护的一个natural language processing的  博客经常评论最新学术动态值得关注。有关于ACL、NAACL等学术会议的参会感想和对论文的点评 5:项目推荐 基于LSTM的中文问答系统  https://github.com/S-H-Y-GitHub/QA 基于RNN的文本生成器  https://github.com/karpathy/char-rnn 基于char-rnn的汪峰歌词生成器  https://github.com/phunterlau/wangfeng-rnn 用RNN生成手写数字  https://github.com/skaae/lasagne-draw 6:开源NLP工具包 中文NLP相关https://github.com/crownpku/Awesome-Chinese-NLP   英文NLP相关 NLTK: http://www.nltk.org/ TextBlob: http://textblob.readthedocs.org/en/dev/ Gensim: http://radimrehurek.com/gensim/ Pattern: http://www.clips.ua.ac.be/pattern Spacy: http://spacy.io Orange: http://orange.biolab.si/features/ Pineapple: https://github.com/proycon/pynlpl 7:相关论文 100 Must-Read NLP Papers  https://github.com/mhagiwara/100-nlp-papers 计算机视觉 1.计算机视觉的应用 计算机视觉的应用 无人驾驶 无人安防 人脸识别 车辆车牌识别 以图搜图 VR/AR 3D重构 无人机 医学图像分析 其他 2.课程推荐 Stanford CS223B  比较适合基础适合刚刚入门的同学跟深度学习的结合相对来说会少一点不会整门课讲深度学习而是主要讲计算机视觉方方面面都会讲到 李飞飞CS231n课程 https://study.163.com/course/introduction.htm?courseId1003223001_trace_c_p_k2_c447ab6b3534441ba4c56fb8e75b6cbc 3.书籍推荐 1.入门学习 《Computer VisionModels, Learning and Inference》 2.经典权威的参考资料 《Computer VisionAlgorithms and Applications》 3.理论实践 《OpenCV3编程入门》 推荐系统 1.推荐系统是什么 推荐系统就是自动联系用户和物品的一种工具它能够在信息过载的环境中帮助用户发现令他们感兴趣的信息也能将信息推送给对它们感兴趣的用户。推荐系统属于资讯过滤的一种应用。 2.推荐课程 推荐系统专项课程《Recommender Systems Specialization》 这个系列由4门子课程和1门毕业项目课程组成包括推荐系统导论最近邻协同过滤推荐系统评价矩阵分解和高级技术等。 观看地址 https://www.coursera.org/specializations/recommender-systems 3.书籍推荐 《推荐系统实践》项亮 著 《推荐系统》Dietmar Jannach等 著蒋凡 译 《用户网络行为画像》牛温佳等 著 《Recommender Systems Handbook》Paul B·Kantor等 著 4.算法库 LibRec LibRec是一个Java版本的覆盖了70余个各类型推荐算法的推荐系统开源算法库由国内的推荐系统大牛郭贵冰创办目前已更新到2.0版本它有效地解决了评分预测和物品推荐两大关键的推荐问题。 项目地址: https://github.com/guoguibing/librec 官网地址 https://www.librec.net/   LibMF C版本开源推荐系统主要实现了基于矩阵分解的推荐系统。针对SGD随即梯度下降优化方法在并行计算中存在的 locking problem 和 memory discontinuity问题提出了一种 矩阵分解的高效算法FPSGDFast Parallel SGD根据计算节点的个数来划分评分矩阵block并分配计算节点。 项目地址 http://www.csie.ntu.edu.tw/~cjlin/libmf/   SurPRISE 一个Python版本的开源推荐系统有多种经典推荐算法 项目地址http://surpriselib.com/   Neural Collaborative Filtering 神经协同过滤推荐算法的Python实现 项目地址 https://github.com/hexiangnan/neural_collaborative_filtering   Crab 基于Python开发的开源推荐软件其中实现有item和user的协同过滤 项目地址http://muricoca.github.io/crab/ 5.常用数据集 MovieLen https://grouplens.org/datasets/movielens/ MovieLens数据集中用户对自己看过的电影进行评分分值为1~5。MovieLens包括两个不同大小的库适用于不同规模的算法。小规模的库是943个独立用户对1 682部电影作的10 000次评分的数据大规模的库是6 040个独立用户对3 900部电影作的大约100万次评分。适用于传统的推荐任务   Douban https://www.cse.cuhk.edu.hk/irwin.king.new/pub/data/douban Douban是豆瓣的匿名数据集它包含了12万用户和5万条电影数据是用户对电影的评分信息和用户间的社交信息适用于社会化推荐任务。   BookCrossing http://www2.informatik.uni-freiburg.de/~cziegler/BX/ 这个数据集是网上的Book-Crossing图书社区的278858个用户对271379本书进行的评分包括显式和隐式的评分。这些用户的年龄等人口统计学属性(demographic feature)都以匿名的形式保存并供分析。这个数据集是由Cai-Nicolas Ziegler使用爬虫程序在2004年从Book-Crossing图书社区上采集的。 6.推荐论文 经典必读论文整理包括综述文章、传统经典推荐文章、社会化推荐文章、基于深度学习的推荐系统文章、专门用于解决冷启动的文章、POI相关的论文、利用哈希技术来加速推荐的文章以及推荐系统中经典的探索与利用问题的相关文章等。 项目地址:  https://github.com/hongleizhang/RSPapers 7.推荐项目 1.今日头条推荐系统机制介绍面向内容创作者。分享人项亮今日头条推荐算法架构师: https://v.qq.com/x/page/f0800qavik7.html? 2. 3分钟了解今日头条推荐系统原理 https://v.qq.com/x/page/g05349lb80j.html? 3.facebook是如何为十亿人推荐好友的 https://code.facebook.com/posts/861999383875667/recommending-items-to-more-than-a-billion-people/ 4.Netflix的个性化和推荐系统架构 http://techblog.netflix.com/2013/03/system-architectures-for.html 风控模型评分卡模型 1.评分卡模型简介 评分卡模型时在银行、互金等公司与借贷相关业务中最常见也是最重要的模型之一。简而言之它的作用就是对客户进行打分来对客户是否优质进行评判。 根据评分卡模型应用的业务阶段不用评分卡模型主要分为三大类A卡Application score card申请评分卡、B卡Behavior score card行为评分卡、C卡Collection score card催收评分卡。其中申请评分卡用于贷前行为评分卡用于贷中催收评分卡用于贷后这三种评分卡在我们的信贷业务的整个生命周期都至关重要。 2.推荐书籍 《信用风险评分卡研究——基于SAS的开发与实施》 3.评分卡模型建模过程 样本选取 确定训练样本、测试样本的观察窗特征的时间跨度与表现窗标签的时间跨度且样本的标签定义是什么一般情况下风险评分卡的标签都是考虑客户某一段时间内的延滞情况。 特征准备 原始特征、衍生变量 数据清洗 根据业务需求对缺失值或异常值等进行处理 特征筛选 根据特征的IV值特征对模型的贡献度、PSI特征的稳定性来进行特征筛选IV值越大越好但是一个特征的IV值超过一定阈值可能要考虑是否用到未来数据PSI越小越好一般建模时取特征的PSI小于等于0.01 对特征进行WOE转换 即对特征进行分箱操作注意在进行WOE转换时要注重特征的可解释性 建立模型 在建立模型过程中可根据模型和变量的统计量判断模型中包含和不包含每个变量时的模型质量来进行变量的二次筛选。 评分指标 评分卡模型一般关注的指标是KS值衡量的是好坏样本累计分部之间的差值、模型的PSI(即模型整体的稳定性、AUC值等。 知识图谱 1.知识图谱是什么 知识图谱是一种结构化数据的处理方法它涉及知识的提取、表示、存储、检索等一系列技术。从渊源上讲它是知识表示与推理、数据库、信息检索、自然语言处理等多种技术发展的融合。 2.推荐资料 为什么需要知识图谱什么是知识图谱——KG的前世今生 https://zhuanlan.zhihu.com/p/31726910   什么是知识图谱 https://zhuanlan.zhihu.com/p/34393554   智能搜索时代知识图谱有何价值 https://zhuanlan.zhihu.com/p/35982177?from1084395010wm9848_0009weiboauthoruid5249689143   百度王海峰知识图谱是 AI 的基石 http://www.infoq.com/cn/news/2017/11/Knowledge-map-cornerstone-AI#0-tsina-1-5001-397232819ff9a47a7b7e80a40613cfe1   译文|从知识抽取到RDF知识图谱可视化 http://rdc.hundsun.com/portal/article/907.html?hmsrtoutiao.ioutm_mediumtoutiao.ioutm_sourcetoutiao.io 3.主要内容 3.1 知识提取 构建kg首先需要解决的是数据知识提取是要解决结构化数据生成的问题。我们可以用自然语言处理的方法也可以利用规则。 3.1.1 使用规则 正则表达式 正则表达式Regular Expression regex是字符串处 理的基本功。数据爬取、数据清洗、实体提取、关系提取都离不开regex。 推荐资料入门 精通正则表达式 regexper 可视化例 [a-z]*(\d{4}(\D)) pythex 在线测试正则表达式  http://pythex.org/   推荐资料进阶 re2 Python wrapper for Googles RE2 using Cython https://pypi.python.org/pypi/re2/ Parsley 更人性化的正则表达语法 http://parsley.readthedocs.io/en/latest/tutorial.html   中文分词和词性标注 分词也是后续所有处理的基础词性Part of Speech, POS就是中学大家学过的动词、名词、形容词等等的词的分类。一般的分词工具都会有词性标注的选项。   推荐资料入门 jieba 中文分词包   https://github.com/fxsjy/jieba 中文词性标记集  https://github.com/memect/kg-beijing/wiki/   推荐资料进阶 genius 采用 CRF条件随机场算法  https://github.com/duanhongyi/genius Stanford CoreNLP分词   https://blog.csdn.net/guolindonggld/article/details/72795022   命名实体识别 命名实体识别NER是信息提取应用领域的重要基础工具一般来说命名实体识别的任务就是识别出待处理文本中三大类实体类、时间类和数字类、七小类人名、机构名、地名、时间、日期、货币和百分比命名实体。 推荐资料 Stanford CoreNLP 进行中文命名实体识别  https://blog.csdn.net/guolindonggld/article/details/72795022   3.1.2 使用深度学习 使用自然语言处理的方法一般是给定schema从非结构化数据中抽取特定领域的三元组spo如最近百度举办的比赛就是使用DL模型进行信息抽取。 序列标注 使用序列生出模型主要是标记出三元组中subject及object的起始位置从而抽取信息。 推荐资料 序列标注问题  https://www.cnblogs.com/jiangxinyang/p/9368482.html seq2seq 使用seq2seq端到端的模型主要借鉴文本摘要的思想将三元组看成是非结构化文本的摘要从而进行抽取其中还涉及Attention机制。 推荐资料 seq2seq详解  https://blog.csdn.net/irving_zhang/article/details/78889364   详解从Seq2Seq模型到Attention模型   https://caicai.science/2018/10/06/attention%E6%80%BB%E8%A7%88/   3.2 知识表示 知识表示Knowledge RepresentationKR也译为知识表现是研究如何将结构化数据组织以便于机器处理和人的理解的方法。 需要熟悉下面内容   JSON和YAML json库 https://docs.python.org/2/library/json.html PyYAML: 是Python里的Yaml处理库 http://pyyaml.org/wiki/PyYAML RDF和OWL语义 http://blog.memect.cn/?p871  JSON-LD 主页http://json-ld.org/   3.3 知识存储 需要熟悉常见的图数据库 a.知识链接的方式字符串、外键、URI b.PostgreSQL及其JSON扩展 Psycopg包操作PostgreSQL  http://initd.org/psycopg/docs/ c.图数据库 Neo4j和OrientDB 1.Neo4j的Python接口 https://neo4j.com/developer/python/ 2.OrientDBhttp://orientdb.com/orientdb/ d.RDF数据库Stardog Stardog官网http://stardog.com/   3.4 知识检索 需要熟悉常见的检索技术 ElasticSearch教程 http://joelabrahamsson.com/elasticsearch-101/ 4.相关术语及技术路线 本体 https://www.zhihu.com/question/19558514 RDF https://www.w3.org/RDF/ Apache Jena https://jena.apache.org/ D2RQ http://d2rq.org/getting-started   4.1 Protege构建本体系列 protege https://protege.stanford.edu/ protege使用 https://zhuanlan.zhihu.com/p/32389370   4.2 开发语言 python或java   4.3 图数据库技术 Neo4jhttps://neo4j.com/ AllegroGraphhttps://franz.com/agraph/allegrograph/   4.4 可视化技术 d3.jshttps://d3js.org/ Cytoscape.jshttp://js.cytoscape.org/   4.5 分词技术 jiebahttps://github.com/fxsjy/jieba hanlphttps://github.com/hankcs/HanLP 5.项目实战 基于知识图谱的问答 https://github.com/kangzhun/KnowledgeGraph-QA-Service Agriculture_KnowledgeGraph https://github.com/qq547276542/Agriculture_KnowledgeGraph 平台介绍 由知名开源平台AI技术平台以及领域专家ApacheCNDatawhaleAI有道和黄海广博士联合整理贡献 1.ApacheCN片刻李翔宇飞龙王翔 2.Datawhale范晶晶马晶敏李碧涵李福光城居居康兵兵郑家豪 3.AI有道红色石头 4.黄海广博士 Datawahle 一个专注于AI领域的开源组织上海交通大学国家级孵化项目目前有7个独立团队聚集了一群有开源精神和探索精神的团队成员汇聚了来自各个高校和企业的优秀学习者致力于构建纯粹的学习圈子和优质的开源项目提供的组队学习涵盖了数据分析数据挖掘机器学习深度学习编程等16个内容领域。 AI有道 一个专注于 AI 领域的技术公众号。公众号主要涉及人工智能领域 Python、ML 、CV、NLP 等前沿知识、干货笔记和优质资源我们致力于为广大人工智能爱好者提供优质的 AI 资源和切实可行的 AI 学习路线。 黄博机器学习初学者 机器学习课程在国内还不够普及大部分初学者还是很迷茫走了很多弯路黄海广博士希望能尽自己的微薄之力为机器学习初学者提供一个学习交流的平台。 ApacheCN 一个致力于提供优质开源项目的开源组织致力于AI文档翻译Kaggle比赛交流、LeetCode算法刷题、大数据交流等项目。我们希望做出广大 AI 爱好者真正需要的东西打造真正有价值的长尾作品。 官方网址http://www.apachecn.org/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910824.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

盗版小说网站怎么赚钱Wordpress 转发后查看

一、基本组件栈 在Flink整个软件架构体系中,同样遵循着分层的架构设计理念,在降低系统耦合度的同时,也为上层用户构建Flink应用提供了丰富且友好的接口。从下图中可以看出整个Flink的架构体系基本上可以分为三层,由上往下依次是 …

pc端网站建设哪里有美德的网站建设

在C#中,垃圾回收(Garbage Collection)是一种自动管理内存的机制。它负责跟踪和释放不再使用的内存,以便程序可以有效地使用内存资源。 C#中的垃圾回收器是由.NET运行时(CLR)提供和管理的。它使用了一种叫做…

技术支持 嘉兴网站建设网站 免费空间

一、基础内容 在Python中,路径可以以不同的表现形式进行表示。以下是一些常用的路径表现形式: 1. 绝对路径:它是完整的路径,从根目录开始直到要操作的文件或文件夹。在Windows系统中,绝对路径以盘符开始,…

质量好网站建设价格wordpress数据库加速插件

大家都知道什么是实时操作系统,但是,大家熟知的实时操作系统,站在更广的角度来看,其实它就是一个实时内核。一、实时内核和实时操作系统一个实时内核是管理微处理器(MPU)、微控制器(MCU&#xf…

洛谷 P13973 [VKOSHP 2024] Nightmare Sum

先用单调栈预处理出 i 位置左右第一个小于 a[i] 的位置,然后计算出 tot 数组 (tot[i]: 所有以 a[i] 为最小值的子数组总数) 和 pos 数组去记录每个数的位置所在 (每个数互不相同)。构造离线查询,对于固定的 i,枚举所…

单调栈01

单调栈01代码问题 困惑什么样的问题会让你想到利用栈这个数据结构? 栈(尤其是单调栈)非常适合解决 “在数组中寻找元素的特定邻居(如下一个更大 / 更小元素、第一个满足条件的元素等)” 类问题。这类问题的核心是…

网站更换关键词怎么做好快速搭建网站软件

1.当想输入一个数字再输入一个字符串要多一个nextLine(); int a scan.nextInt(); String b scan.nextLine(); 在Java编程语言中,使用Scanner类进行输入时,需要注意nextInt()和nextLine()方法的使用。nextInt()用于读取下一个整数,而nextLi…

发布/订阅(Publish/Subscribe)与交换机(Exchange)

本章目标理解交换机(Exchange)在RabbitMQ中的核心作用。掌握发布/订阅模式(Publish/Subscribe)的实现。学习扇形交换机(Fanout Exchange)的使用。理解绑定(Binding)的概念。实现一个日志广播系统。一、理论部分…

线性结构之链表

离散存储[链表]:定义:n个结点的离散分配彼此通过指针相连每个结点只有一个前续结点每个结点只有一个后续结点首结点没有前续结点尾结点没有后续结点专业术语:首结点:第一个有效结点,存放第一个有效数据尾结点:最…

高职教育双高建设网站佛山建设网站公司哪家好

1、基础用法就不再赘述了,重要的属性配置: Disable Catalog Update on Startup:禁用时在初始化Addressables的时候自动更新远程的catalog(启用后可以通过代码 Addressables.CheckForCatalogUpdates()更新) Use…

营销型网站软件建立网站需要多少钱就蓷y湖南岚鸿推荐

目录 一、为什么要有动态内存分配​ 二、C/C中程序内存区域划分​ 三、malloc和free​ 2.1、malloc 2.2、free​ 四、calloc和realloc​ 3.1、calloc​ 3.2、realloc​ 3.3realloc在调整内存空间的是存在两种情况: 3.4realloc有malloc的功能 五、常见的动…

简单的购物网站设计大型免费网页游戏排行榜

SH文件介绍 介绍SH文件示例执行SH文件具体用法 介绍 SH文件通常指的是 Shell 脚本文件,文件后缀名为.sh,其中包含一系列要由操作系统的命令解释器执行的命令。 在 Unix 和类 Unix 操作系统中,通常使用 Bourne Shell(sh&#xff…

博客网站建设源码上海互联网推广找哪家

打卡记录 同积元组&#xff08;哈希表 排列组合&#xff09; 链接 思路&#xff1a;用哈希表将数组中出现的两不同数乘积依次记录&#xff0c;将出现两次以上的乘积组通过排列组合计算总情况个数。 class Solution { public:int tupleSameProduct(vector<int>& num…

分类信息网站如何优化wordpress会员通知插件

一、Array方法 方法参数返回值描述以下Api会修改原属组pushitem1, item2, ...数组新长度向数组的末尾添加一个或多个元素&#xff0c;并返回新的长度pop删除的元素删除数组的最后一个元素&#xff0c;并返回删除的元素unshiftitem1,item2, ...数组新长度向数组的开头添加一个或…

展示型网站一样做seo优化网站维护合同范本

原网址&#xff1a;http://pichcar.iteye.com/blog/676292 URL中的特殊字符 有些符号在URL中是不能直接传递的&#xff0c;如果要在URL中传递这些特殊符号&#xff0c;那么就要使用他们的编码了。编码的格式为&#xff1a;%加字符的ASCII码&#xff0c;即一个百分号%&#xff0…

网站建设和管理是教什么科目成都房地产政策

服务器数据恢复环境&#xff1a; 某单位一台DS5300存储&#xff0c;1个主机4个扩展柜&#xff0c;组建了2组RAID5&#xff08;一组27块硬盘&#xff0c;一组23块盘&#xff09;。27块盘的那组RAID5阵列存放Oracle数据库文件&#xff0c;存储系统一共分了11个卷。 服务器故障&a…

可以做手机网页的网站个人怎么进行网站建设

一、点查看自定义快捷键可以定义一些快速启动方式 然后用不习惯的快捷键也能在这里改 二、android studio 快捷键导出备份 导入方法&#xff1a; android studio &#xff0d;>file->import setting ->选择jar包即可 导出studio的设置方法&#xff1a; android …

AI 编程“效率幻觉”:为何你感觉快了,项目却慢了?

AI 编码工具普及,但为何开发者感觉很快,实际项目却变慢了?本文深入剖析 AI 编程“感知差距”背后的根源,探讨如何通过结构化输入,真正释放 AI 潜能。一、AI 编程的“速度与激情”背后 2025 年,如果你问一个开发者…

lc1033-移动石子直到连续

难度:中等(伪境)题目描述数轴上有三块石子,最左边的石子可以向右移,但不能越过最右边的石子 不能放在有石子的地方最右侧的石子同理 每次只能移动一块石子,在上面规则下不限制距离 问从初始位置到三块石子相邻,…

广东平台网站建设平台小学校园网站建设方案

我的世界换肤教程&#xff0c;本篇教程记录如何使用MCSkin 3D软件、皮肤使用、皮肤预览图制作等相关教程。感兴趣的小伙伴们可以来看看这篇我的世界皮肤教程。一.MCSkin 3D1.4软件介绍及教程&#xff1a;1. 视图-3D设置-屏蔽部位半透明显示在绘制其他部位时&#xff0c;可以用半…