文本分析

jieba

https://github.com/fxsjy/jieba

jieba是一款非常流行的中文分词Python库,支持三种分词模式, 具有高效率和高准确性,广泛应用于文本分析领域。

SnowNLP

https://github.com/fxsjy/snowNLP

SnowNLP是一个简单的Python库,用于处理中文文本, 包括分词、情感分析、文本摘要等功能,易于上手,适合初学者。

HanLP

https://www.hanlp.com

HanLP是一个面向生产环境的多语种自然语言处理工具包,它基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。 无论您是专家还是初学者,HanLP都可以让您能够轻松快速的构建、处理和“理解”大量文本的AI应用程序。 借助世界上最大的多语种语料库,HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务:分词、词性标注、命名实体识别、依存句法分析、成分语法分析、语义依存分析、语义角色标注、词干提取、词法语法特征提取、抽象意义表示;以及指代消解、语义文本相似度、文本风格转换。

甲言

https://gitcode.com/gh_mirrors/ji/Jiayan

甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标注、断句和标点。

微词云

https://fenci.weiciyun.com/

微词云 · 强大的词频统计分析软件 让文本分析、数据可视化变得简单 微词云致力于让文本分析变简单,支持多语言分词与分析,并包含多种分析方法,如词频统计、共词分析、主题分类等, 不管你是行业数据人、学术研究者、还是市场人员、甚至是老师学生、小白群体,都可以轻松作出优质专业的文本数据分析报告。

NLPIR-parser

http://www.nlpir.org/

NLPIR-parser · 强大的中文自然语言处理工具 让中文文本处理变得简单 NLPIR是由北京大学开发的中文分词和词性标注系统,支持精准分词、词性标注、专名识别、文本分类、 情感分析等丰富的语言处理功能。它适用于文本分析、信息检索、数据挖掘等多个领域, 为研究人员和开发者提供了高效、准确的中文文本处理能力

Voyant Tools

https://voyant-tools.org/

Voyant Tools是一个在线文本分析工具,提供词频统计、共现分析等功能, 帮助用户探索文本数据,适合学术研究和教育使用。

AntConc

https://www.laurenceanthony.net/software/antconc/

AntConc是一款免费的文本分析工具,提供词频统计、共现分析、正则表达式搜索等功能,适合文本挖掘和语料库研究

NVIVO

https://www.qsrinternational.com/products/nvivo

NVIVO是一款专业的定性数据分析软件,支持文本、音频、视频等多种数据类型的分析,适用于社会科学研究。

易词云

易词云是一款在线词云生成工具,支持文本数据的可视化展示,通过词云图直观呈现文本中关键词的分布和重要性。

ROST CM6

ROST CM6是一款文本挖掘工具,提供文本分类、聚类、情感分析等功能,适用于大规模文本数据的分析和处理。

社会网络分析

Gephi

https://gephi.org/

Gephi是一款开源的网络可视化与分析软件,支持大规模网络数据的交互式可视化, 提供多种布局算法和分析工具,适用于社交网络分析、生物网络等领域

VOSviewer

https://www.vosviewer.com/

VOSviewer是一个用于创建和可视化科学文献的网络图和密度图的软件, 支持共被引分析和关键词分析,常用于文献计量学和科学知识图谱。

CiteSpace

http://www.citespace.org/

CiteSpace是一款科学文献分析和可视化软件, 支持文献计量分析、共被引分析和关键词分析,常用于科研管理和战略规划。

时空分析

QGIS

https://qgis.org/

QGIS是一个自由和开源的地理信息系统(GIS), 支持地理数据的查看、编辑、分析和打印,适用于地图制作、空间分析和地理数据管理。

GeoPandas

https://github.com/geopandas/geopandas

GeoPandas是一个开源的Python库,用于地理空间数据处理和分析, 支持地理数据的读取、处理和可视化,适用于地理信息系统(GIS)应用。

数据采集

八爪鱼

https://www.bazhuayu.com/

八爪鱼是一款数据采集工具,支持网页数据的自动抓取和结构化, 适用于网络数据采集和信息提取。

后羿采集器

https://www.huyao.com/

后羿采集器是一款数据采集和处理工具,支持多种数据源的采集和清洗,适用于数据整合和分析。

集搜客

https://www.jsjsearch.com/

集搜客是一款数据采集和分析工具,支持多种数据源的采集和分析, 适用于市场调研和竞争情报。