文本处理
-  词频统计 绘制词云图 
-  英文词频统计 分词→词形还原(nltk) →去停用词 →统计词频 
-  中文词频统计 分词(jieba) →去停用词 → 统计词频 
评论文本的分析
-  通过词云图展示出现次数较多的词, 可以发现问题 
微博/头条/新闻评论
词云图绘制
可以使用Pyecharts绘制词云
绘制词云图的API
import pyecharts.options as opts from pyecharts.charts import WordCloud
要准备的数据
[(文本, 数值),(文本2,数值2)....]
negtive_words_wordcloud = all_words_n.most_common(100)
(WordCloud().add(series_name="好评词云",data_pair=negtive_words_wordcloud,  #传入绘制词云图的数据 [[要展示的词, int值],[要展示的词2, int值]]word_size_range=[16, 80])  #word_size_range 字号大小取值范围.set_global_opts(title_opts=opts.TitleOpts(title="好评词云", title_textstyle_opts=opts.TextStyleOpts(font_size=23) # 设置标题字号),tooltip_opts=opts.TooltipOpts(is_show=True),  # 设置为True 鼠标滑过文字会弹出提示框).render('neg_wordcloud.html')
) 
 
数据分析报告
周报月报
-  先展示大盘的数据, 最主要的指标 
-  以图为主 -  使用的图形不要过于复杂 
-  折线图, 饼图, 柱状图, 堆积柱状图, 散点图 基本图表为主 
 
-  
-  关键的变化, 需要用文字进行说明 
-  如果是月报的话, 大盘数据展示后, 各个维度的数据都要展示一下 
周报月报一旦做出来了, 框架搭建起来之后, 直接修改数据,和文字内容就可以
专题分析
-  用户评论文本分析 
-  用户留存分析 - 同期群分析 -  明确KPI 当前留存率比较低 当前留存是多少 行业的平均水平是什么样的 
-  拉数据, 最近半年数据列出来, 分渠道, 分城市, 分设备类型.. 做同期群 
-  得出结论 
 
-  
-  活动运营分析 -  活动前: 明确关键的KPI GMV (销售总金额) NMV( 净销售金额) 流量数据(每天访客数) 转化率 -  销售额 = 访客数* 转化率*客单价 
-  人 货 场 (投放) 
 
-  
-  活动中: 做指标监控, 有波动了要及时发现问题 
-  活动后: 回收数据, 做总结出报告 
 
-  
-  新产品投放调研分析