大小:2.37 MB
语言:简体中文系统:Android
类别:网络软件时间:2025-09-03
软件标签: 中文分词 分词器
中文分词软件是一款非常实用的分词器工具,主要为编程工作者进行中文词汇的分词处理,使用户的工作效率更高,也能帮助用户加深对汉语词汇的理解程度,有需要的朋友快来下载试用使用吧!
1.指纹提取
根据文章的内容,结构,词语间的关系,分析出能够表示该文章的语义指纹,使用数字序列表示。
2.分词粒度可调
可以控制分词结果的粒度。共享版本提供两种分词粒度,标准粒度和粗粒度,满足不同用户的需求。
3.用户词典接口扩展
用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。
4.词性标注功能加强
多种标注级的选择,系统可供选择的标注级有:计算所一级标注级,计算所二级标注集,北大一级标注集,北大二级标注集。
5.关键词提取
自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。
6.新词发现与自适应分词功能
从较长的文本内容中,基于信息交叉熵自动发现新特征语言,并自适应测试语料的语言概率分布模型,实现自适应分词。
中文分词(chinese word segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多。
office2013特别版应用软件818.00 MB
下载gb/t8077-2012混凝土外加剂匀质性试验方法行业软件971.00 MB
下载passolo汉化修正版编程开发18.15 MB
下载花儿为什么这样红ppt公开课课件教育教学1.55 MB
下载活版课件教育教学1.94 MB
下载我们的知识是有限的语文课件教育教学3.23 MB
下载gb3095-2012 环境空气质量标准行业软件283.00 MB
下载gb16171-2012炼焦化学工业污染物排放标准行业软件278.00 MB
下载隧道工程防水技术规范2014版行业软件4.25 MB
下载gb30077-2013危险化学品单位应急救援物资配备要求行业软件4.83 MB
下载相关文章
下载排行