执行标记化(tokenization) 标记化是将文本转换为标记的过程。 这些标记可以是段落、句子和常见的单个单词,并且通常基于单词级别。 NLTK 附带了许多标记器,将在本示例中进行演示。 如何做 P197 执行句子拆分 执行词干提取