本仓库是关于如何使用nltk自然语言处理软件包来探索NLP的多个领域,主要包括: 对nltk自带语料的探索性分析,比如第一部分的语料加载,语料中词的探索,词的分布图,密度计算等等。 用户自定义语料的加载,网络文本的下载与解析过程。 对文本的处理过程,比如:分词、词性标注、NER、组块解析、文法分析、逻辑演算等。 另外,还包括了两个应用项目,文本聚类和中文分词。