热点专题大数据分析解决方案
专题报道大数据可视化分析平台整合了互联网网页大数据采集技术、搜索引擎技术、信息智能处理技术和知识管理方法,通过对互联网海量信息自动采集、信息加工、自动分类、热点采集、舆情专题,实现新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握行业动态,做出正确对策,提供分析依据。
服务对象
政府宣传部门、业务部门,新闻办、扶贫办、一带一路领导小组等
党委宣传部门,宣传部等
其他媒体,电视、报纸、网站等领导或编辑
各个服务对象可以通过账号、密码登录本平台,可以在线可视化的查看分析结果,可以导出下载相关新闻列表,并可以提供嵌入到其他站点的统计分析内容等多种服务形式。各个用户可以自定义自己关注的维度、角度、时间段的汇总信息和可视化的专题分析内容。
实现目标
通过本方案,可以实现以下几点目标:
建立专题内容大数据库;
实现新闻/专题跟踪报道分析;
实现站群传播影响力分析;
输出专题报道各种榜单报表;
网站重点稿件传播分析。
解决方案
1.建立专题报道大数据库
通过互联网采集,汇聚“报、网、端、微、屏”多种形式的全网新闻信息经过信息同步、分析、处理后索引进入数据采集资源库,建设网站自己的“专题报道全网融媒体大数据库”,掌握全量新闻数据,并基于海量数据进行智能分析,对文本内容进行分类和标注,实现文本聚类和关键词提取,进一步建立新闻监测关键词库,提供可供检索的关键词数据库,从不同维度,不同指标,搭配人名、地名、机构名的分析,通过可视化呈现,为新闻传播提供日常工作服务和其他系统的相关的资源服务。
2. 单篇文章、专题跟踪报道分析
在全网及时采集相关专题报道的基础上,根据单篇新闻、专题新闻进行跟踪报道分析。
单篇新闻可以分析全网的报道量、传播力、趋势、溯源(最早发布媒体)、报道形式的种类等。
3. 专题报道多维度多角度榜单
对专题相关新闻报道进行多维度多角度的排名,通过排名比较来反映各新闻单位、各省地区、各部委等单位的客观实际情况,通过专题相关新闻在传播力度、报道幅度方面的排名。比如,专题热点新闻排行榜、网站报道量排行榜、各省/区报道量排行榜等等。
4. 主流媒体网站新闻传播分析
对主流媒体网站及相应的微信、微博进行采集,利用大数据技术进行传播关系的数据梳理和分析,形成传播力数值评价模型。最终以可视化的方式呈现新闻的传播数据,形成全网新闻传播力分析报告。会为新闻传播机构开展传播状态监测、效果评估提供有力支撑。
传播分析维度包括以下几点:
1)发稿量数据对比
2) 发稿终端对比
3) 稿件类型对比
4) 专题汇总数据
5) 稿件转发量对比
6) 稿件点赞量、阅读量、评论量横向比较
7) 专题单篇稿件数据横向对比
8) 专题单篇稿件数据明细
技术优势
分布式索引和分布式检索
索引库分库、结构优化设计
Nosql技术应用,大数据量,高性能
缓存cache技术应用,减少服务器负载及快速响应
部分效果展示