中文词法分析
中文分词将连续的汉字、标点符号、英文字母等字序列按一定中文规范重新组合成词序列,并根据《汉语词性对照表》标注出各个词的词性。该能力向用户提供分词、词性标注、实体命名识别三大功能。能够识别出文本串中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性,并进一步识别出命名实体。可应用于文献检索、搜索引擎等诸多领域,提高的相关性排序准确度。
中文分词
是将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列的过程。
词性标注
是指为自然语言文本中的每个词汇赋予一个词性的过程。
实体命名识别
指识别自然语言文本中具有特定意义的实体,主要包括人名、地名、机构名、指标名、商品名、时间日期等。
体验区
请输入需要分析的文本:
分析
标准分词
索引分词
全分词
CRF分词
N-最短路分词
最短路径分词
感知机分词
标准短索引分词
基础分词
短索引基础混合分词
短索引感知机混合分词
2003年10月15日,杨利伟乘由长征二号F火箭运载的神舟五号飞船首次进入太空,象征着中国太空事业向前迈进一大步,起到了里程碑的作用。
体验版最多可输入
10000
字
已输入
67
字
分析结果:
分词词性
实体命名识别