h5网站的好处做猎头顾问 经常看哪些网站
h5网站的好处,做猎头顾问 经常看哪些网站,wordpress模板与主题的区别,h5作品转 一#xff1a;出行大数据#xff0c;滴滴发布400城数据可视化分析 2018年01月04日 00:00:00 https://blog.csdn.net/zw0Pi8G5C1x/article/details/78976493 二#xff1a;滴滴背后的大数据应用 前言#xff1a;这是一篇大数据应用文章#xff0c;不涉及高深技术#… 转 一出行大数据滴滴发布400城数据可视化分析 2018年01月04日 00:00:00 https://blog.csdn.net/zw0Pi8G5C1x/article/details/78976493 二滴滴背后的大数据应用 前言这是一篇大数据应用文章不涉及高深技术适合大数据入门的同学了解大数据能干什么所有数据/消息全部来源公开网络。先聊个最近的消息近年来发展最快的公司滴滴传言裁员消息真假难辨。网络传言“滴滴出行可能正在进行成立4年多以来最大规模的一次裁员。有多个信息源对36氪称最近滴滴正在裁员甚至有知情人士告知36氪滴滴各个业务线加起来将会有一半的员工被“优化”离职。按照滴滴公开的说法目前各个事业部加起来有6000多人。据此计算这可能意味着滴滴有可能要裁掉3000人”。有没有知道详情的同学告知一下真实情况今天核心要聊的不是这个聊一聊滴滴的大数据应用。1、滴滴的确是一家大数据公司数据显示滴滴平台每天产生超过70TB数据相当于7万部电影每日处理超过90亿次路径规划请求日均定位数据超过130亿。2015年滴滴出行平台完成14.3亿订单这相当于在中国平均每个人都使用滴滴打过一次车累计行驶里程达128亿公里相当于环绕中国行驶29万圈累计行驶时间达4.9亿小时相当于昼夜不歇的行驶56000年。今年滴滴平台日峰值订单超过2000万单2016年的全年订单量将远超去年。2、滴滴的智能交通云滴滴的数据来源有两方面一个是自身软件手机的数据一个是和政府合作获取公共数据。在滴滴智能交通云平台上通过收集到的出行大数据可以实现区域热力图、OD数据分析、城市运力分析、城市交通出行预测、城市出行报告以及信号灯动态配时等同时还能在公共出行服务比如实时路况、实时公交、ETA、城市运力补充等方面发挥巨大价值。未来通过将传感器数据、静态道路数据、道路事件等数据与滴滴的OD数据、司机数据、GPS轨迹数据以及运力等数据整合将为整个城市的交通出行提供更好的服务。3、滴滴的大数据应用大家一起来看看滴滴的用大数据做了什么。1通过大数据精准分析和预测实现预估费用和实际费用一致。2使用热力图提前预测需求蜂窝动态调价提升整体成交率。3智能拼车通过虚拟站点设计撮合不同地点乘客拼车。4此外滴滴通过和政府合作和城市一起实现智能交通。目前已知滴滴和沈阳、武汉都签署了战略合作协议。目前看在这个能力目前应该是还没有实现规划中。例如智能信号灯控制“通过数据模型算出整个区域的车流量情况理想情况下比如让车在主干道上通行效率更高可以靠区域的红绿灯协调实现。”以上简单聊下滴滴的大数据应用知道更多详情的同学留言一起讨论吧。 三滴滴项目描述
滴滴出行预测
赛题详情
在出行问题上中国市场人数多、人口密度大总体的出行频率远高于其他国家这种情况在大城市尤为明显。然而截至目前中国拥有汽车的人口只有不到10%这意味着在中国人们的出行更加依赖于出租车、公共交通等市场提供的服务。另一方面滴滴出行占领了国内绝大部分的网络呼叫出行市场面对着巨大的数据量以及与日俱增的数据处理需求。截至目前滴滴出行平台日均需处理1100万订单需要分析的数据量达到50TB路径规划服务请求超过90亿。面对如此庞杂的数据我们需要通过不断升级、完善与创新背后的云计算与大数据技术从而保证数据分析及相关应用的稳定实现高频出行下的运力均衡。供需预测就是其中的一个关键问题。
供需预测的目标是准确预测出给定地理区域在未来某个时间段的出行需求量及需求满足量。调研发现同一地区不同时间段的订单密度是不一样的例如大型居住区在早高峰时段的出行需求比较旺盛而商务区则在晚高峰时段的出行需求比较旺盛。如果能预测到在未来的一段时间内某些地区的出行需求量比较大就可以提前对营运车辆提供一些引导指向性地提高部分地区的运力从而提升乘客的整体出行体验。
定义及评估标准
问题定义
乘客打开滴滴出行app输入出发地和目的地并点击“呼叫”后就完成一次发单(request)有司机接单后就完成一次应答(answer)。 将一个城市划分为n个互不重叠的正方形区域 Dd1,d2,⋯,dnDd1,d2,⋯,dn。
对于区域 didi 次发单。
对于区域 didi
给定每个区域在时间片 tjtj。
为了简化问题可以把特定区域特定时间段订单信息表中 driver_id 为 null 的数量作为 gapgap 的值。
评价指标 对 nn 作为最终的评价指标 MAE1n∑di(1q∑ti|gapij−sij|) ∀gapij0MAE1n∑di(1q∑ti|gapij−sij|) ∀gapij0MAEMAE 越小越好。
选手提交结果 选手提交的数据格式为区域ID时间片预测值。其示例如下 其中每个字段的具体描述如下
数据名称数据类型示例 区域ID string 1,2,3,4 与区域映射ID一致 时间片 string 2016-01-23-1即2016年1月23日第1个时间片时间片是将每天的时间按10分钟间隔划分到1-144个片中 预测值 double 6.0
数据形式
训练集中给出M市2016年连续三周的数据信息需预测M市第四周和第五周中某五天的某些时间段的供需。测试集中给出了每个需预测的时间片的前半小时的数据信息具体需预测的时间片见说明文件说明文件含在数据集下载包内。 具体数据如下其中订单信息表、天气信息表和POI信息表为数据库中直接的表信息而区域定义表、拥堵信息表是由数据库中其他表衍生的信息。
数据集下载地址http://cn-static.udacity.com/mlnd/public_data.tar.gz
订单信息表
字段类型含义示例 order_id string 订单ID 70fc7c2bd2caf386bb50f8fd5dfef0cf driver_id string 司机ID 56018323b921dd2c5444f98fb45509de passenger_id string 用户ID 238de35f44bbe8a67bdea86a5b0f4719 start_district_hash string 出发地区域哈希值 d4ec2125aff74eded207d2d915ef682f dest_district_hash string 目的地区域哈希值 929ec6c160e6f52c20a4217c7978f681 Price double 价格 37.5 Time string 订单时间戳 2016-01-15 00:35:11
订单信息表主要覆盖了一张订单的基本信息包括这张订单的乘客以及接单的司机driverid NULL表示driverid为空即这个订单没有司机应答及出发地目的地价格和时间。
区域定义表
字段类型含义示例 district_hash string 区域哈希值 90c5a34f06ac86aee0fd70e2adce7d8a district_id string 区域映射ID 1
区域定义表主要表示比赛评测区域的信息选手需选择区域定义表中的区域来做预测并在最终提交的结果中需将区域哈希值映射为其相应的ID。
POI信息表
字段类型含义示例 district_hash string 区域哈希值 74c1c25f4b283fa74a5514307b0d0278 poi_class string POI类目及其数量 1#1:41 2#1:22 2#2:32
POI信息表主要表征区域的地域属性由其中所含的不同类别设施的数量表示如2#1:22表示在此区域中含有类别为2#1的设施22个2#1表示一级类别为2二级类别为1例如休闲娱乐#剧院购物#家电数码运动健身#其他等等。不同类别及其数量以\t分割。
拥堵信息表
字段类型含义示例 district_hash string 区域哈希值 1ecbb52d73c522f184a6fc53128b1ea1 tj_level string 不同拥堵程度的路段数 1:231 2:33 3:13 4:10 tj_time string 时间戳 2016-01-15 00:35:11
拥堵信息表主要表示区域中道路的总体拥堵情况其中主要包括不同时间段不同区域的不同拥堵情况的路段数其中的拥堵级别是越大越拥堵。
天气信息表
字段类型含义示例 Time string 时间戳 2016-01-15 00:35:11 Weather int 天气 7 temperature double 温度 -9 PM2.5 double pm25 66
天气信息表主要表示整个城市的每天间隔5分钟段的天气情况。其中的weather字段表示天气的实时描述信息而温度以摄氏温度表示PM2.5为实时空气污染指数。
FAQ
Q: 最终上传结果有固定格式吗
A: 请按区域ID时间片预测值的格式上传您的结果。预测值为浮点数保留至小数点后15位有效数字。
Q: 最终上传数据有时间顺序要求吗 A: 时间顺序不影响最终成绩。
Q: 在order info 中重复出现的数据应如何处理 A: 数据重复是因为同一个用户可能在一个10分钟片同一个地区发单被多次应答但是这样的情况并不多影响并不大。为了简化问题重复的订单不需要去重直接计入到缺口的计算中。
Q为什么在POI信息表中有的类别没有用#区分 A不是所有设施级关系都是a#bxx的格式有的设施只有一级而有的设施甚至有三级#号只是表示分割层级的关系如果是设施只有一级则为a:xx而如果是2级则是a#bxx如果是3级则是a#b#cxx依次类推。
Q: 关于POI数据的分类一共分多少1级类目多少2级类目且是否有类目示意的对照表? A: 这个问题的答案都在数据中参赛者可以自行统计。类目对应信息其实不是很重要重要的是分析其和目标的关联程度。
Q: 在同一个时间片某个乘客产生了一个null订单接着产生了一个有效订单这个null订单是否计入gap中 A: 这样的null订单会计入gap中但是这样的情况不多不会影响到总体预测任务。
Q: 在order_data表里面有一些区域的哈希值在map映射表中找不到匹配这种情况该怎么处理 A: 只需要按照映射表来获得需要预测的区域无需关注其他区域。
Q: 在traffic_data里同一个地区的道路拥挤程度分为四级但在不同时间片同一地区四个分级下路段的数量的总和不同这是为什么 A: traffic_data中总和不同的原因是有些路段的拥堵情况采集时丢失了。
Q: 数据库中存在单一乘客ID在部分时间内发单数量巨大的极端例子这是数据问题吗 A: 这是因为之前通过其他方式叫车的部分用户没有登录所以都是统一的ID并不是数据问题。 美团打车与滴滴出行用户研究报告 极光大数据 • 2018-07-25 07:37 • 数据报告 • 阅读 5666 高额补贴告一段落后美团打车与滴滴出行的对比如何 美团进军网约车市场已经一年有余。在去年2月份美团开始在南京试点上线网约车服务并于年底发布开城计划在包括北京、上海、成都、杭州、温州、福州和厦门在内的7个城市启动“美团打车用户报名”活动。目前美团打车已经在南京和上海获得《网约车经营许可证》其网约车业务也主要围绕这两座城市开展。和滴滴出行相比美团打车在应用端包括乘客端和司机端上到底有着怎样的表现极光大数据的统计结果可以为我们提供一些参考。 乘客端应用对比 全国范围美团打车渗透率0.22%滴滴出行渗透率14.47% 极光大数据的统计结果显示截至6月30日滴滴出行应用端在全国网民中的渗透率为14.47%而美团打车则为0.22%。从曲线走势可以看出美团打车在3月中下旬采取的高补贴政策对渗透率确实起到了短期的促进作用。但随着补贴额度缩减美团打车应用端的渗透率走势已逐渐趋于平稳。 在DAU日活跃用户数指标上滴滴出行在春节期间呈现节令性振荡与春节前夕相比下滑超16%节后滴滴出行的DAU数据逐步回升在1,500万上下波动。在高额补贴政策的激励下美团打车客户端的DAU数据在3月份显现出增长趋势但随着补贴逐渐淡出美团打车客户端的DAU数据也开始回落。在6月30日当天滴滴出行的DAU数据达到1,468.2万而美团打车为16.05万和峰值相比下降超41%。 应用安装留存率数据显示滴滴出行的7天安装留存率达到72.6%而美团打车为30.2%。与此同时滴滴出行的30天用户安装留存率达到65.8%美团打车仅为25.3%。随着新用户的获取成本越来越高昂如何通过运营手段留住用户将会成为美团打车后续必须考虑的问题。 极光大数据的统计结果显示在全国范围内美团打车应用端用户有78.6%同时装有滴滴出行应用端而在设备上安装有美团打车应用端的滴滴出行用户占比仅为1.8%。结合两款应用的全国渗透率数据可以看出滴滴出行在用户基数上的对比优势突出美团打车对滴滴出行用户的渗透并不显著。 上海地区美团打车渗透率6.51%滴滴出行39.7% 从渗透率的曲线走势可以看出美团打车应用端的渗透率在3月份出现明显增长后趋势有所放缓滴滴出行在6月份出现明显增长。根据极光大数据的统计结果截至今年6月底美团打车应用端在上海移动网民中的渗透率为6.51%滴滴出行达到39.7%。 美团打车3月份进入上海市场后在当地实施高额补贴策略其DAU的攀升趋势也随之显现最高触及10.54万。随着补贴额度下降美团打车应用端在当地的DAU开始下滑后期数据趋于平稳。而滴滴在上海地区的DAU数据除春节期间出现节令性下滑以外其它时期均较为稳定。截至6月30日美团打车应用端在上海地区的DAU数值为7.05万而滴滴出行为63.09万。 在上海地区的用户重合度方面滴滴出行的对比优势依然显著。在上海地区的美团打车应用端用户中同时安装有滴滴出行应用端的比例达到69.5%但重合用户在滴滴出行应用端中的占比仅为16.7%。 南京地区美团打车渗透率4.48%滴滴出行渗透率27.13% 南京是美团打车业务的首个试点城市。在上半年美团打车与滴滴出行在南京地区的渗透率均显现出上升趋势。根据极光大数据的统计结果截至6月份美团打车应用端在南京移动网民中的渗透率为4.48%而滴滴出行应用端达到27.13%。 在南京地区美团打车的DAU走势同样表现出冲高回落后趋于稳定的走势。滴滴出行在南京地区的DAU走势在经历过春节期间的回撤后快速反弹后期数据与春节后相比有小幅增长。截至今年6月30日美团打车在当地的DAU数值为1.98万而滴滴出行则为35.4万。 尽管南京是美团打车业务运营时间最长的城市但其应用端对于滴滴出行用户的渗透依然不显著。用户重合度结果显示南京地区的美团打车应用端用户当中有78.6%同时安装有滴滴出行应用端而美团打车应用端在后者用户群体中的渗透率则为8.9%。 司机端应用对比 全国地区美团打车司机渗透率0.25%滴滴车主2.53% 司机端应用的表现也可以透露出网约车平台的一些运营情况。根据极光大数据的统计结果截至今年6月份美团打车司机端在全国移动网民中的渗透率为0.25%而滴滴车主则达到2.53%。 从DAU曲线走势可以看出美团打车司机应用端的DAU走势与补贴的相关性非常明显。随着补贴额度降低美团打车司机端的DAU也逐步回落而滴滴车主端的DAU波动更多表现在春节期间的季节性下滑上。截止6月30日美团打车司机端的DAU数值为13.5万与峰值相比下降超50%。在同一时期滴滴车主的DAU数据为480.87万和5月份的峰值相比也有所下滑。 作为服务的需求方和提供方乘客和司机可以说是网约车平台的最为关键的两个支点。对于平台而言留住司机和留住乘客一样重要。根据极光大数据的统计结果美团打车司机的7天安装留存率为54.5%滴滴车主为76.6%。在同一观察周期美团打车司机端的30天安装留存比例为33.7%而滴滴车主达到68.4%。 在美团打车司机端用户中有72.7%同时装有滴滴车主应用端。而在滴滴车主用户中美团打车司机端的渗透率不足10%。 上海地区美团打车司机端渗透率1.85%滴滴车主3.01% 在上海地区美团打车司机端的渗透率在4月份达到峰值后开始回落而滴滴车主则呈现出平稳上升的趋势。截至今年6月份美团打车司机端在上海地区的渗透率为1.85%滴滴车主为3.01%。 在上海地区的DAU指标上美团打车司机端的峰值出现在高额补贴期间。随着补贴额度下降美团打车司机端在当地的DAU数值也开始缓慢回落。而滴滴车主的DAU数据经历过春节期间的季节性下滑后呈现出震荡上升的趋势后期数据趋于稳定。截至6月30日当天美团打车司机端在上海地区的DAU数值为1.85万而滴滴车主则达到14.2万。 根据极光大数据的统计结果在上海地区的美团打车司机端用户中有57.4%同时安装有滴滴车主应用滴滴车主应用端用户中有35.3%安装了美团打车司机端。 南京地区美团打车司机端渗透率2.06%滴滴车主4.49% 在南京地区滴滴车主和美团打车司机在渗透率上均表现出上升趋势。极光大数据的统计结果显示截至今年6月份美团打车司机端在南京地区的渗透率为2.06%滴滴车主为4.49%。从两款应用的数据表现看来在南京地区的司机储备上滴滴出行相较于美团打车要更为充裕。 在南京地区的DAU表现上美团打车司机端已经趋于稳定。在春节期间滴滴车主和美团打车司机的DAU数值均表现出季节性波动趋势但滴滴车主的回撤幅度要更为显著。截至6月30日美团打车司机端在南京地区的DAU数值为0.81万滴滴车主达到7.94万。 用户重合度结果显示在南京地区76.1%的美团打车司机用户装有滴滴车主应用端滴滴车主用户中34.9%的人群安装了美团打车司机端。 据招股书介绍美团后续将会在包括上海、成都、厦门、温州、北京、南京、郑州、福州、杭州和潍坊在内的城市开展网络车服务相比年初的开城计划增加了两个城市。但从全国和上海、南京地区的多维度对比结果看来美团打车应用端与滴滴出行相比仍存在明显差距网约车业务能否与美团点评的生活服务生态产生协同效应还有待进一步观察。 本站特约专栏文章作者极光大数据本文链接https://www.afenxi.com/57463.html 。内容观点不代表本站立场如若转载请联系专栏作者。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/88825.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!