Skip to content

Latest commit

 

History

History
5 lines (5 loc) · 524 Bytes

README.md

File metadata and controls

5 lines (5 loc) · 524 Bytes

本仓库是关于如何使用nltk自然语言处理软件包来探索NLP的多个领域,主要包括:

  • 对nltk自带语料的探索性分析,比如第一部分的语料加载,语料中词的探索,词的分布图,密度计算等等。
  • 用户自定义语料的加载,网络文本的下载与解析过程。
  • 对文本的处理过程,比如:分词、词性标注、NER、组块解析、文法分析、逻辑演算等。
  • 另外,还包括了两个应用项目,文本聚类和中文分词。