Wordcloud(词云)安装使用以及vscode搭建虚拟环境

  (电脑烧掉了主板,地方上的所有门店全部关闭了,幸好现在京东还通物流,总算是进行把电脑拿回来了。对于一些东西无法实际操作真的是很难受,言归正传,说一下Wordcloud)


Wordcloud安装(全局安装)

  Wordcloud是python的一个第三方模块,其最大的特点就是可以通过我们的内容直接统计出单词出次数,随后以图形化的形式直观的展示给用户(按照大小,出现次数越多,显示的形状越大),这样就对于我们直观的进行查看显的特别方便了。

  对于Wordcloud的安装,一般我们首先会考虑到使用pip进行安装,如果你足够幸运,那就可以进行直接的安装,否则会出现各种各样的问题。不要想着去解决这些问题,否则你会更加的烦躁,所以,安装的方法应该是这样的。

  因为国内的网络访问国外延迟很高,所以在安装的过程中会出现一系列的超时问题,即使你是用了从镜像网站中进行下载暗账,也还是会出现其依赖的其他模块无法安装的问题。所以,这个时候我们可以使用国内的镜像加速器进行安装。比如使用阿里云的镜像加速器。可使用以下命令进行安装。

pip install --user wordcloud -i http://mirrors.aliyun.com/pypi/simple --trusted-host mirrors.aliyun.com

  如果在安装过程中出现以下问题,则说明目前阿里云中没有与你python版本对应的wordcloud版本。

Wordcloud(词云)安装使用以及vscode搭建虚拟环境

   那么你需要到 官方网址 或者 相关镜像网站 进行对应版本的下载,然后使用win+R进入cmd进行pip安装。值得注意的是,如果在此过程中出现一些其他模块的安装失败问题,则任然优先使用阿里云源加速器进行安装,否则到光放网站中或者进入相关镜像网站进行安装。安装成功如下图所示。

Wordcloud(词云)安装使用以及vscode搭建虚拟环境


wordcloud使用

  根据以上安装,就可以正常使用wordcloud模块了。下面以一个小例子进行wordcloud的使用介绍。

  在使用慈云之前,我们应该知道的是词云是按照词云规范的模式进行处理的,即:数据处理的过程中,词云不能够通过内容出现的次数(数值)进行直接统计,而是将这些数值转换为单词,并且在同样的单词之间使用  空格  进行连接。

'''
@Description: 
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
'''

import wordcloud
SAVE_PATH = "test.png"


def main():
    data = dict(小明=10, 小花=30, 老王=100, 老李=70)  # 统计结果
    results = {}  # 用来保存统计结果
    for key, value in data.items():  # 使用元组进行键值对的取出
        # print(key,value)
        for num in range(value):  # 通过value确定单词的比重
            results[key] = results.get(key, " ") + " " + key.strip()
    # clouds = WordCloud(
    #     collocations=
    # )
    clouds = wordcloud.WordCloud(
        collocations=False,  # 去掉重复的词
        font_path="c:/Windows/Fonts/simfang.ttf",  # 设置字体所在路径
        background_color="white",
        width=1000,
        height=380)

    print(" ".join(results.values()))  # 输出结果
    clouds.generate_from_text(" ".join(results.values()))
    clouds.to_file(SAVE_PATH)


if __name__ == "__main__":
    main()

  结果会生成一.png的图片,如下:、

Wordcloud(词云)安装使用以及vscode搭建虚拟环境

'''
@Description: 
@Version: 1.0
@Autor: Montoin Yan
@Date: 2020-02-16 01:05:39
@LastEditors: Montoin Yan
@LastEditTime: 2020-02-16 11:42:42
'''

import wordcloud
SAVE_PATH = "test.png"


def main():
    data = dict(小明=10小花=30老王=100老李=70)  # 统计结果
    results = {}  # 用来保存统计结果
    for key, value in data.items():  # 使用元组进行键值对的取出
        # print(key,value)
        for num in range(value):  # 通过value确定单词的比重
            results[key] = results.get(key, " ") + " " + key.strip()
    # clouds = WordCloud(
    #     collocations=
    # )
    clouds = wordcloud.WordCloud(
        collocations=False,  # 去掉重复的词
        font_path="c:/Windows/Fonts/simfang.ttf",  # 设置字体所在路径
        background_color="white",
        width=1000,
        height=380)

    print(" ".join(results.values()))  # 输出结果
    clouds.generate_from_text(" ".join(results.values()))
    clouds.to_file(SAVE_PATH)


if __name__ == "__main__":
    main()