社区管理风险点识别方法及装置、电子设备、存储介质与流程

文档序号:37620353发布日期:2024-04-18 17:34阅读:9来源:国知局
社区管理风险点识别方法及装置、电子设备、存储介质与流程

本公开涉及数据处理领域,尤其涉及文本处理,公开了一种社区管理风险点识别方法及装置、电子设备、存储介质。


背景技术:

1、社区脆弱点或者社区风险点是指社区空间中出现的各类与民众生活密切相关的问题、多元化的需求,以及社区安全管理中常见的挑战,如不完善的物业管理、医疗资源短缺和社区治安问题等。这些问题可能对社区居民的生活质量和安全造成影响。社区脆弱点或风险点的出现意味着社区存在一些潜在的缺陷,这些弱点可能需要解决,以改善社区居民的生活环境和条件。

2、近几年,随着微博、微信群、qq、公众号等为代表的的社会化媒体迅猛发展,网络公共领域逐渐兴起,社区居民的信息来源、沟通意愿、维权意识和诉求表达都比以往更加迫切,这些进一步对当前社区风险点治理的治理模式、治理工具提出了挑战。目前社区管理中存在如下问题:社区管理协调时间长、依赖经验判断、信息孤岛、数据源分布不均、领域跨度广、社工专业性不强,尤其是社区共同体、社区信息平台、官方对公共舆情回应等三个方面的缺位,对风险点的风险治理主观性和滞后性严重,会不同程度由此导致出现风险事态恶化等不利后果。因而,如何构建协同综合、灵敏可靠的社区管理风险感知系统或方案,不断完善风险点发现体系,是需要解决的技术问题。


技术实现思路

1、本公开至少提供了一种社区管理风险点识别方法及装置、电子设备、存储介质,以提高社区管理风险点的识别灵敏度,以避免风险事件的事态恶化造成及其对社区的不利影响。

2、根据本公开的一方面,提供了一种社区管理风险点识别方法,包括:

3、获取社区原始数据;

4、对所述社区原始数据预处理,得到所述社区原始数据对应的分词;

5、根据各个分词的出现频率和出现时间,分别生成每个预设的第一时间维度的词云图和每个所述第一时间维度的共线图;其中,所述词云图包括对应第一时间维度内各分词出现的频率的信息;所述共线图包括对应第一时间维度内共同出现的各分词之间的关联关系;

6、利用各词云图和各所述共线图,预估在预设的第二时间维度内的存在的风险问题所对应的目标关键词;

7、生成各目标关键词的词向量,并对各词向量进行主题聚类,确定所述第二时间维度内存在的风险问题所对应的主题以及各主题的分布比例信息;

8、利用聚类得到的所述主题以及各主题的分布比例信息,确定社区管理中存在的风险点的信息。

9、在一种可选的方案中,所述对所述社区原始数据预处理,得到所述社区原始数据对应的分词,包括:

10、对所述社区原始数据进行脱敏处理;

11、删除脱敏处理得到的数据中的字符数量小于预设值的文本,得到第一预处理目标文本;

12、利用正则表达式删除所述第一预处理目标文本中的表情符号、人物名称以及转义字符,得到第二预处理目标文本;

13、利用分词工具对所述第二预处理目标文本进行分词处理;

14、删除分词中的名词、身份信息的分词以及停用的分词,并利用相似词表中的分词对分词得到的相似的分词进行替换。

15、在一种可选的方案中,所述第一时间维度包括月,所述第二时间维度的时长大于所述第一时间维度的时长。

16、在一种可选的方案中,所述词云图中包括各个分词,并且每个分词在词云图中占的面积与对应分词出现的频率成正比;所述共线图包括各个分词,并且共同出现的各分词之间通过线连接。

17、在一种可选的方案中,所述对各词向量进行主题聚类,包括:

18、利用k-means聚类方法对各词向量进行主题聚类。

19、在一种可选的方案中,所述社区原始数据包括以下至少一种:

20、社区内居民的反馈数据;社区事件报告数据;社区媒体评论数据;物业管理记录数据;官方对舆情的回应数据。

21、在一种可选的方案中,所述第二时间维度包括年。

22、根据本公开的另一方面,提供了一种社区管理风险点识别装置,包括:

23、数据获取模块,用于获取社区原始数据;

24、分词模块,用于对所述社区原始数据预处理,得到所述社区原始数据对应的分词;

25、可视化模块,用于根据各个分词的出现频率和出现时间,分别生成每个预设的第一时间维度的词云图和每个所述第一时间维度的共线图;其中,所述词云图包括对应第一时间维度内各分词出现的频率的信息;所述共线图包括对应第一时间维度内共同出现的各分词之间的关联关系;

26、问题排查模块,用于利用各词云图和各所述共线图,预估在预设的第二时间维度内的存在的风险问题所对应的目标关键词;

27、聚类模块,用于生成各目标关键词的词向量,并对各词向量进行主题聚类,确定所述第二时间维度内存在的风险问题所对应的主题以及各主题的分布比例信息;

28、结果生成模块,用于利用聚类得到的所述主题以及各主题的分布比例信息,确定社区管理中存在的风险点的信息。

29、根据本公开的另一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的方法。

30、根据本公开的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法。

31、本公开的社区管理风险点识别方法,首先获取社区原始数据;之后对所述社区原始数据预处理,得到所述社区原始数据对应的分词;之后,根据各个分词的出现频率和出现时间,分别生成每个预设的第一时间维度的词云图和每个所述第一时间维度的共线图;其中,所述词云图包括对应第一时间维度内各分词出现的频率的信息;所述共线图包括对应第一时间维度内共同出现的各分词之间的关联关系;之后,利用各词云图和各所述共线图,预估在预设的第二时间维度内的存在的风险问题所对应的目标关键词;之后,生成各目标关键词的词向量,并对各词向量进行主题聚类,确定所述第二时间维度内存在的风险问题所对应的主题以及各主题的分布比例信息;最后,利用聚类得到的所述主题以及各主题的分布比例信息,确定社区管理中存在的风险点的信息。本公开针对社区原始数据的短文本特点,对数据进行分析,通过词云图和共线图的可视化方式,生动地呈现了社区面临的各种问题,使问题一目了然。进一步,本公开采用了词向量技术,将关键词转化为向量表示,并运用聚类方法对这些向量进行聚类,这一步骤有助于识别不同主题的关联性和占比,从而深入分析社区所面临的最主要问题。通过本公开的方法,能够更快、更全面地了解社区的需求和痛点,为社区管理和决策提供了有力支持,以改善社区居民的生活质量。

32、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种社区管理风险点识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述社区原始数据预处理,得到所述社区原始数据对应的分词,包括:

3.根据权利要求1所述的方法,其特征在于,所述第一时间维度包括月,所述第二时间维度的时长大于所述第一时间维度的时长。

4.根据权利要求1所述的方法,其特征在于,所述词云图中包括各个分词,并且每个分词在词云图中占的面积与对应分词出现的频率成正比;所述共线图包括各个分词,并且共同出现的各分词之间通过线连接。

5.根据权利要求1所述的方法,其特征在于,所述对各词向量进行主题聚类,包括:

6.根据权利要求1所述的方法,其特征在于,所述社区原始数据包括以下至少一种:

7.根据权利要求1所述的方法,其特征在于,所述第二时间维度包括年。

8.一种社区管理风险点识别装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。


技术总结
本公开提供了一种社区管理风险点识别方法及装置、电子设备、存储介质,本公开对社区原始数据预处理得到分词;之后根据各个分词的出现频率和出现时间,分别生成每个第一时间维度的词云图和共线图;其中,词云图包括对应第一时间维度内各分词出现的频率的信息;共线图包括对应第一时间维度内共同出现的各分词之间的关联关系;之后利用各词云图和各共线图,预估在预设的第二时间维度内的存在的风险问题所对应的目标关键词;之后生成各目标关键词的词向量,并对各词向量进行主题聚类,确定第二时间维度内存在的风险问题所对应的主题以及各主题的分布比例信息;最后利用聚类得到的主题以及各主题的分布比例信息,确定社区管理中存在的风险点的信息。

技术研发人员:魏家齐,向思奇,李兵
受保护的技术使用者:北京市科学技术研究院
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1