长这么大,才知道数据集不用下载可以直接在线使用

每天清晨打开电脑,搜索所需的数据集,点击“Download”,愉快地眯上眼睛,期待n个小时后醒来乖巧下载好的数据,开始放进模型像小仓鼠进滚轮一样快乐奔跑。

梦醒时分,一个“Error”蹦进眼睛里,美好码农的一天从数据集下载开始崩坏。。。。

v2-8c984342c0071d9b7ffe7e440561f0cb_b.jpg

小夕最近得知一个国内的好东西——Graviti Open Datasets,数据集免翻墙可高速下载,还支持在线筛选,在线预览,在线可视化等,下载之前可以明明白白地知道数据集的具体内容,标注形式和样本分布,使用还完全免费,这谁见了不直呼好家伙!

随便下载了一个数据集试试水,发现速度竟然很随便地达到17.9MB/s,Open Datasets运营姐姐诚不欺我,快乐地接下运营姐姐的饭,略带羞涩并且眼疾手快地吃下:)

v2-be233f26e3587b698a1b8b9a1e2ba2e9_b.jpg

Part 1:其实数据集下载快不是Graviti最大的优点,真正的快,是不用下载直接在线操作!

Open Datasets的数据集覆盖无人驾驶、文本检测、行为/事件检测、语义分割、姿态估计、场景识别、面部检测、目标追踪、ASR、AR/MR、深度估计等 50+ 种AI应用领域;拥有2D分类、2D多边形、2D矩形等 30+ 种标注任务;支持图像、视频、文本、语音、点云、IMU、3D模型等 10+ 种主流数据格式

丰富的数据资源,支持使用者在Open Datasets获取数据集后,选择Fork数据集,之后便能在TensorBay对原数据集进行修改,享受一站式数据管理服务

这边提到Graviti另一神器——TensorBay

面对庞杂的非结构化数据信息,如何存储、查询、分析、挖掘和利用数据显得尤为关键。传统的管理手段已无法满足身处复杂数据环境的智能系统(应用)的AI开发者。为了帮助AI开发者更高效地迭代模型,而不是耗费精力在数据管理上,Graviti打造了TensorBay非结构化数据管理SaaS,为AI开发者与开发团队提供数据托管版本管理数据可视化团队协作等SaaS服务,支持通过开发者工具对数据进行直接管理和使用,与Pipeline轻松集成。

v2-f252557926f21085f7446e0bea1ee487_b.jpg

Part 2:除了数据集资源丰富,支持在线管理数据,在Graviti,0代码轻松实现在线可视化不是梦!

非结构化数据管理的最大难点之一是“无法在线预览”。用户在下完数据集后还要写代码做数据可视化,常常会有图片格式错误、标注质量差,甚至根本不是自己想要的数据集等一系列令人头秃的问题……在Open Datasets,用户可以完美跳过下载步骤,无需另写代码,通过Graviti组件式数据可视化工具在线预览原数据、标注数据、数据特性(数据标签及属性分布),还可以通过COPY预览页面的URL/IFRAME将可视化组件嵌入到自己的页面

平台同时支持列表、柱状图、饼图等多种信息统计方式,帮助工程师提前掌握数据细节,试错成本大幅降低(戳戳下方视频查看Demo)


Part 3:做一只皮卡丘,用爱发电上传数据集,为统一数据集格式一起努力吧!

古有盟主一统武林,今有大G号召各位皮卡丘为标准化数据集格式共同努力!工整的数据集环境,可以支持高效管理共享,避免重复工作,工作流程更加智能流畅!

皮卡丘们可上传符合公开传播标准的数据集,或拿出独家武器——“绝无仅有”原创数据集

用户自助上传数据集指导文档(划掉,武功秘籍)

Part4:最后为各位看官老爷们提供一个数据集大集结

v2-4cfac2de7fe0f2fc2363e6e1bc3f8819_b.jpg

文本识别数据集:MNIST ;SVHN ;CCPD-Green ; The IIIT 5K-word ;Text in the wild ; ICDAR 2013 Handwriting Segmentation Contest

自动驾驶数据集:BDD100K ;CityScapes ;DeepRoute Open Dataset ;KITTI-object;KITTI-raw ;TLR ; Urban Object Detection ;A2D2 ; CURE-TSD

NLP数据集:20 Newsgroups ;THCHS-30 ;THUCNews ;WikiText;aidatatang200zh ;MobvoiHotwords ;curationCorpus ;TaskMaster2

行人检测数据集:SCUT FIR Pedestrian ; Daimler Stereo Pedestrian Detection ;Daimler Pedestrian Segmentation Benchmark ; Penn-Fudan Database for Pedestrian Detection and Segmentation ; GM_ATCI Rear-view Pedestrian

行为/事件检测数据集:COCO ;VOC2012 Action Classification ;TAO ; UCF101;MPII Human Pose ;FIRESENSE ;Furg Fire ;Fall detection ;OTW;THUMOS14 ;Leeds Sports Pose ;HiEve

人脸识别数据集:AADB ;WIDER FACE ;YouTube Faces DB ;CelebA ; IMDB-WIKI ;LFW ;FaceScrub ;PubFig ;FDDB ;Head Pose Image ; VGGFace2;MegaAge-Asian ;CelebA-align ;AFLW

独家合作企业数据集:RP2K(智慧零售) ;NICO(OOD Detection) ;Structured3D Dataset(场景识别) ;RPLAN dataset(Layout Synthesis) ;DeepRoute Open Dataset(自动驾驶) ;Neolix OD(自动驾驶) ;nuScenes(自动驾驶); VVeRI-901(Re-ID)

Open Datasets的数据集覆盖无人驾驶、文本检测、行为/事件检测、语义分割、姿态估计、场景识别、面部检测、目标追踪、ASR、AR/MR、深度估计等 50+ 种AI应用领域;拥有2D分类、2D多边形、2D矩形等 30+ 种标注任务;支持图像、视频、文本、语音、点云、IMU、3D模型等 10+ 种主流数据格式

你想要的可能有,没有也可以在官网进行反馈,或者私信运营姐姐(Wx:Graviti0401),顺便参加近期好玩的数据集征集活动,听说参加即可获得Graviti周边呀!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478740.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

会议交流 - CCKS2020 | 2020年全国知识图谱与语义计算大会

OpenKG开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

LeetCode 739. 每日温度(单调栈)

1. 题目 根据每日 气温 列表,请重新生成一个列表,对应位置的输入是你需要再等待多久温度才会升高超过该日的天数。如果之后都不会升高,请在该位置用 0 来代替。 例如,给定一个列表 temperatures [73, 74, 75, 71, 69, 72, 76, …

令人振奋的好消息!2016年12月8日Google Developers中文网站发布!

令人振奋的好消息! 2016年12月8日Google Developers中文网站发布! 以往我们需要访问Android的开发网站、Google的开发网站都需要翻墙,苦不堪言。现在Google发布了中文网站,怎能不让人开心?! Android中文…

美团外卖Android Lint代码检查实践

概述 Lint是Google提供的Android静态代码检查工具,可以扫描并发现代码中潜在的问题,提醒开发人员及早修正,提高代码质量。除了Android原生提供的几百个Lint规则,还可以开发自定义Lint规则以满足实际需要。 为什么要使用Lint 在美团…

零基础入门NLP - 新闻文本分类,正式赛第一名方案分享

零基础入门NLP - 新闻文本分类,正式赛第一名方案分享:https://mp.weixin.qq.com/s/7WpZUqdlItBToLYuRLm44g

这篇论文提出了一个文本-知识图谱的格式转换器...

文 | 花小花PosyHello, 大家好,我是小花。今天给大家介绍一篇有野心的paper。为何如此说呢?因为该工作提出了一个知识的格式转换器,用于转换 无结构化的纯文本(Text)和结构化的知识图谱(KG) 。换句话说,给模型一打句子&#xff0c…

论文小综 | Using External Knowledge on VQA

本文转载自公众号:浙大KG。本文作者:陈卓,浙江大学在读博士,主要研究方向为图神经网络和知识图谱表示学习我们生活在一个多模态的世界中。视觉的捕捉与理解,知识的学习与感知,语言的交流与表达,…

如何修改TextView链接点击实现(包含链接生成与点击原理分析)

*这篇文章的主要目的是想要大家学习如何了解实现,修改实现,以达到举一反三,自行解决问题的目的。 某天遇到这么一个需求:在TextView中的文本链接要支持跳转,嗯,这个好办,TextView本身是支持的&…

LeetCode 752. 打开转盘锁(图的BFS最短路径)

1. 题目 你有一个带有四个圆形拨轮的转盘锁。每个拨轮都有10个数字: ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’ 。每个拨轮可以自由旋转:例如把 ‘9’ 变为 ‘0’,‘0’ 变为 ‘9’ 。每次旋转都只能旋转一个拨…

使用TensorFlow训练WDL模型性能问题定位与调优

简介 TensorFlow是Google研发的第二代人工智能学习系统,能够处理多种深度学习算法模型,以功能强大和高可扩展性而著称。TensorFlow完全开源,所以很多公司都在使用,但是美团点评在使用分布式TensorFlow训练WDL模型时,发…

docker镜像打包save,载入load,启动run

docker镜像打包save,载入load,启动run docker打包,针对的是镜像,而不是运行中的容器。 查看当前系统的镜像文件: docker images 首先,将当前运行中的,已经自定义修改之后的容器保存为新的镜像…

会议交流 - CNCC 技术论坛 | NLP中知识和数据怎么选?当然是全都要!——第四届中文信息技术发展战略研讨会...

本文转载自公众号:中国计算机学会 。本论坛将于CNCC2020期间,10月23日下午16:00-18:00,在北京新世纪日航饭店3层南京厅举行。本论坛将邀请多位来自国内著名高校和人工智能企业的知名自然语言处理专家介绍他们在知识图谱、知识获取、预训练模型…

从我开发过的Tensorflow、飞桨、无量框架看深度学习这几年

文 | Peter潘欣知乎和深度学习框架打交道已有多年时间。从Google的TensorFlow, 到百度的PaddlePaddle,再到现在腾讯的无量。很庆幸在AI技术爆发的这些年横跨中美几家公司,站在一个比较好的视角看着世界发生巨大的变化。在这些经历中,视角在不…

探索Glide对Gif图片资源的获取、解析过程

先预祝大家汤圆节快乐!很久没写博客了。今天我们来探索一下Glide是如何支持Gif图片加载的。 本篇博客的目的 了解代码分析的基本思路与方法了解Glide是如何对Gif图片进行支持的 探索背景 为什么会有这么一个想法呢,一来一直对Glide是知其名而不知其所…

美团“猜你喜欢”深度学习排序模型实践

引言 推荐作为解决信息过载和挖掘用户潜在需求的技术手段,在美团点评这样业务丰富的生活服务电子商务平台,发挥着重要的作用。在美团App里,首页的“猜你喜欢”、运营区、酒店旅游推荐等重要的业务场景,都是推荐的用武之地。 目前&…

如何关闭docker容器里的进程

如何关闭docker容器里的进程 1、使用docker exec 容器名 ps -ef命令查看进程信息 示例: 创建名为"redis"的容器,并在容器内部和宿主机中查看容器中的进程信息: 2、然后进入该容器中,执行如下命令即可停掉进程&…

论文浅尝 | 一日看尽长安花--NLP可解释研究梳理

本文是对TACL2019《Analysis Methods in Neural Language Processing: A Survey》的翻译和整理。本文转载自知乎,文章链接:https://zhuanlan.zhihu.com/p/265815975导读NLP领域发展迅猛,其模型分析方法也正逐渐火热。为什么要研究NLP的可解释…

简明扼要的反射入门教程

反射 反射作为RTTI语言(比如Java)的基础之一被很多人所熟知,但是有些同学对反射本身还是懵懵懂懂的,不是很清楚它到底有什么用。今天这节课我们就对反射本身来一个通体的认知。 定义 反射所在的包为:java.lang.refl…

人在斯坦福,刚上CS224n

文 | Jazon大家好,我是Jazon,现在是Stanford计算机硕士项目的一只学生,非常荣幸加入小夕的大家庭!请各路大神多多指教呀。2021年1月12日,又一季Stanford CS224n——自然语言处理开课了,我和很多MSCS同学一起…

美团外卖骑手背后的AI技术

背景 随着数字化时代的到来,外卖市场近年来发展非常迅猛。对外卖物流系统而言,配送效率和用户体验至关重要。而实际配送过程是由配送员(骑手)最终完成的,因此,想要真正提升配送效率,不但要在智能…