知道这些用于数据科学和机器学习的GitHub存储库和Reddit主题吗?

摘要: 5月最热门的GitHub存储库和顶级Reddit讨论,戳进来~

GitHub和Reddit都是比较有趣的平台,在这里,我不仅学习了数据科学的一些最佳应用,而且还了解数据科学家们是如何编程的。

一直以来,GitHub都是开发人员之间进行协作的终极平台,并且,我们也看到了据科学和机器学习社区以同样的热情来改善它。

而Reddit仍然是一个很好的数据科学领域知识和见解的来源。人们在这个平台上共享代码、数据科学新闻、寻求帮助和意见、发表研究论文等。

这篇文章总结了Reddit平台上5月份一些关于数据科学的讨论,其中包括数据科学家在未来3年的作用以及有史以来最好的机器学习论文集。在GitHub社区中,英特尔开放了其NLP架构库,微软推出ML.NET以支持Dot Net开发者进行机器学习等。

让我们来看看GitHub上的顶级存储库以及Reddit上个月发生的有趣讨论吧。下面是之前四个月较为流行的GitHub存储库和顶级Reddit讨论(从四月起):

一月

二月

三月

四月

ML.NET

 

ML.NET是一个开源机器学习框架。不需要任何构建机器学习模型的经验,机器学习和.NET开发人员就可以轻松使用.NET开发自己的模型。这是预发行版本,包含了基本的分类和回归算法。

ML.NET最初由Microsoft创建的,并且已用于各种产品如WindowsExcelAccessBing等。此版本还捆绑了用于各种模型训练任务的.NET API。

NLP Architect

 

NLP Architect是一个开源Python库,由英特尔实验室的研究人员开发和开源,旨在帮助数据科学家够探索自然语言处理(NLP)和自然语言理解(NLU)领域最先进的深度学习技术。

这个库中我最喜欢的组件之一是可视化组件,可视化组件很整洁的显示模型的注释。更多NLP Architect的信息请点击这里

Amazon Scraper

 

Python包可以让开发人员在亚马逊搜索和提取产品信息。需要分析哪些产品,只需使用该包即可,而不再需要编码来确定。只需输入想要搜索的关键字和最大产品数量(可选),就可以输出CSV格式,然后进行分析。

PIGO – Face Detection in Go

 

Pigo是基于基于像素强度比较的对象检测论文、用Go语言开发的人脸检测库。Pigo库的主要特点如下

1.处理速度快

2.在检测前不需要图像预处理

3.不需要计算积分图像,图像金字塔,HOG金字塔或其他类似的数据结构

4.人脸检测基于以二进制文件数据树结构编码的像素强度比较

RL-Adventure-2: Policy Gradients

这是所有强化学习(RL)爱好者所喜欢的库。深度学习推动了强化学习编写了一个人工智能机器人以人类专家级技能玩Atari游戏。 该存储库涵盖了策略梯度算法的新扩展,这是目前解决强化学习问题最受欢迎的默认选择之一。 这些扩展缩短了训练时间、优化了强化学习的整体表现。

Reddit讨论

实时手势姿态估计

 

这个视频引起了数据科学家和机器学习发烧友的广泛关注,我希望你能看完这个视频,然后你就会很好地了解这项技术是如何实施的。

你会选择哪篇研究论文来证明机器学习是完美的

如果一个机器学习菜鸟或者正在寻找一些用来阅读或参考的研究论文,这是一个很好的话题这个话题中列举了一些优秀的机器学习研究论文,每个数据科学家都将从中受益匪浅。该讨论包括从基本机器学习概念(如高斯模型)到高级概念(如神经艺术风格转换),使用简单功能的增强级联等快速对象检测等论文。这是一个必读话题。

目前,我们对泛化有什么了解? 对于泛化,我们接下来应该提什么问题?

深度学习中的泛化一直是一个争议不断的话题。正如作者所说的那样,我们仍然需要在不少场景努力实现泛化。这个话题围绕目前泛化现状进行了深入探讨,以及它为什么在深度和强化学习中很难理解。这个话题帖子很长,如果你是这个领域的菜鸟,对于你来说可能会有点复杂。不过,我建议无论如何都要阅读这个话题,因为这个话题中包含了一些经验丰富和知识渊博的数据科学家的看法。

医疗行业的机器学习状况

该话题专门研究医疗行业机器学习现状。医疗领域数据科学家分享了他们工作中的经验和观点。想要查看任何生命科学领域机器学习和深度学习的任何信息,请参阅该话题!

数据科学家3年后潜在的职业发展方向

这是大多数人在进入该领域之前非常关心的一个问题。随着自动化机器学习工具的迅速采用,公司在几年内会需要数据科学家吗?本题收集了数据科学中不同人员对未来几年内的职业发展方向的看法。想要寻求职业方向的指导,请查看这一话题!

原文链接

本文为云栖社区原创内容,未经允许不得转载。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521639.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

flutter的按钮如何变为不可选中_Flutter 61: 图解基本 Button 按钮小结 (一)

Button 在日常中是必不可少的,小菜尝试过不同类型的 Button,也根据需求自定义过,今天小菜系统的学习一下最基本的 Button;Flutter 中没有 Button Widget,但提供了很多不同类型的 Child Button Widget;小菜分…

l2-008 最长对称子串 (25分)_小学数学关于时间认识(时、分、秒)的几点总结

本文将通过对照学习一个个知识点,延伸出各种知识点的常用题型。一、时、分、秒之间的换算:1时60分 1分60秒这类题型考的是时间单位之间的换算,一种是大单位换小单位,一种是小单位换大单位。在之前的一篇文章里有关于换算的计算方法…

java.sql.SQLSyntaxErrorException: ORA-00923: 未找到要求的 FROM 关键字

ssm(Oracle)配置druid数据库连接池,正常启动项目,但是请求访问数据库时报错“java.sql.SQLSyntaxErrorException: ORA-00923: 未找到要求的 FROM 关键字”原因:jdbc配置 validationQuery:SELECT 1这是mysql的写法,oracle应改为 va…

linux中退格出现乱码,SSH中的SQL命令按退格键出现乱码的问题解决

用SSH调用SQLPLUS输入SQL语句,按backspace(退格键)出现 ^H的乱码如下所示:[oracleeven ~]$ sqlplus / as sysdbaSQL*Plus: Release 10.2.0.1.0 - Production on Fri Jun 6 00:09:23 2014Copyright (c) 1982, 2005, Oracle. All rights reserved.Connect…

三分钟学会如何在函数计算中使用 puppeteer

摘要: 使用 puppeteer 结合函数计算,可以快速的构建弹性的服务完成各种功能,包括:生成网页截图或者 PDF、高级爬虫,可以爬取大量异步渲染内容的网页、模拟键盘输入、表单自动提交、登录网页等,实现 UI 自动…

如何在阿里云上构建一个合适的Kubernetes集群

摘要: 声明 本文主要介绍如何在阿里云上构建一个K8S集群的实践,只是作为参考,大家可以根据实际情况做出调整。 集群规划 在实际案例中发现,有不少同学使用了很多的小规格的ECS来构建K8S集群,这样其实即没有达到省钱的目…

Could not load oracle/sql/converter_xcharset/lx20354.glb.

将WebRoot\WEB-INF\lib下的mysql-connector-java-5.1.7-bin.jar或者ojdbc14.jar剪贴 到Tomcat 6.0\lib下,移至Tomcat 6.0\lib下。

dedecms右侧悬浮_织梦dedecms网站上添加漂浮广告

在织梦dedecms的网站上添加漂浮广告其实很简单,这篇文章主要讲的是在织梦网站首页添加漂浮广告。我们用本地搭建的织梦默认模板演示。1、准备一个广告图片准备一个广告图片,命名为漂浮.gif ,设置好图片大小150*150 ,之后把图片放到…

360断网急救箱_万事不求人,教你自己动手修复网络断网

日常使用中,我们经常会遇到原来好好的网络忽然无法上网的问题。在排除宽带没有问题,硬件交换机、路由器、网线没有问题的情况下,我们可以充分利用第三方工具的修复功能。前几天,我就遇到一例电脑不能上网的问题,同一办…

linux 网络dma驱动,S3C2410的Linux下DMA驱动程序开发

网上介绍Linux下的一般驱动程序开发示例浩如烟海,或是因为简单,关于DMA驱动的介绍却寥寥无几;近期因工作需要,花了几日时间开发了某设备在S3C2410处理器Linux下DMA通信的驱动程序,有感于刚接手时无资料借鉴的茫然&…

如何开启MySQL慢查询日志

摘要: 前言 数据库日志记录了用户对数据库的各种操作及数据库发生的各种事件。能帮助数据库管理员追踪、分析问题。MySQL提供了错误日志、二进制日志、查询日志、慢查询日志。 MySQL的慢查询日志是MySQL提供的一种日志记录,它用来记录在MySQL中响应时间超…

Pivotal冯雷:以数字化为核心竞争力的时代 自主可控是企业的“必然选择”

戳蓝字“CSDN云计算”关注我们哦!随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发…

druid去掉广告

定位问题 产生广告的JS文件在 druid-1.1.19.jar/support/http/resources/js/common.js。 查看源码可知是buildFooter方法进行植入,由init方法调用。 解决方案: 找到对应的依赖jar包,如druid-1.1.19.jar 找到support/http/resource/js/comm…

阿里巴巴的AI算法程序媛是怎样的一种存在?

摘要: 一个专注人脸识别技术长达11年的程序媛。程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?在见到于鲲之前,我的脑子里是各种…

Hadoop 中zoo_数据分析中的Excel、R、Python、SPSS、SAS和SQL

作为一直想入门数据分析的童鞋们来说,如何选定一门面向数据分析的编程语言或工具呢?注意是数据分析,而不是大数据哦,数据分析是基础了。数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管…

linux下装sqlserver安装包,【sqlServer】CentOS7.x 上Microsoft SQL Server for Linux安装和配置...

SQL Server Documentationhttps://docs.microsoft.com/en-us/sql/sql-server/sql-server-technical-documentation?viewsql-server-2017Installation guidance for SQL Server on Linuxhttps://docs.microsoft.com/en-us/sql/linux/sql-server-linux-setup?viewsql-server-20…

2019云栖大会:逍遥看巅峰,张勇提“百新”,平头哥“再亮剑”

文 | 阿晶、丹丹、王银发于阿里云栖大会现场 出品 | CSDN云计算(ID:CSDNcloud) “今天不是马云的退休,而是制度传承的开始。”9月10日,阿里20周年的大日子,逍遥子接棒风清扬,跟唱《追梦赤子心》…

10行代码让你轻松搞定对象检测

摘要: 十行代码轻松搞定对象检测?快来看看如何使用ImageAI。计算机视觉是人工智能领域中最重要的一个分支。计算机视觉是一门能够识别和理解图像及其场景的计算机软件系统的科学。计算机视觉包括图像识别、对象检测、图像生成、图像超分辨率等多个方面。…

项目集成Flowable工作流

企业级项目集成Flowable工作流,基于(师父)的开源项目的集成,此开源项目是师傅十几年的经验和实战总结而成,直接可以用于企业开发,旨为帮助更多需要帮助的人! 说明链接项目开原地址https://gitee.com/lwj/flowable博客链接https://…

shell softech 面料_求高人指点 猛犸象的SOFTECH面料和GTX PROSHELL面料哪个好

曾经看到一个帖子 关于 MAMMUT 对 SOFTECH的解释,找出来希望对 LZ 有所借鉴。作者L.HO为 我很佩服的一个 业内人士,从业于MAMMUT 公司。 转帖 再次声明 转帖,同时 希望对 MAMMUT 有所偏好的 可以作为借鉴和资料。1) softech & drytech的…