Repository navigation

#

jieba

Go efficient multilingual NLP and text segmentation; support English, Chinese, Japanese and others.

Go
2642
8 个月前

Node.js bindings ❤️ Rust crates

Rust
1269
4 天前

jieba中文分词的.NET版本(支持.NET Framework与.NET Core)

C#
1121
2 年前

The Jieba Chinese Word Segmentation Implemented in Rust

Rust
808
2 个月前

Use C Api and Swig to Speed up jieba 高效的中文分词库

Python
641
4 年前

jieba analysis plugin for elasticsearch 7.0.0, 6.4.0, 6.0.0, 5.4.0,5.3.0, 5.2.2, 5.2.1, 5.2, 5.1.2, 5.1.1

Java
533
1 年前

新闻搜索引擎

Python
445
5 年前

用python进行文本分词并生成词云

Python
436
8 年前

Chinese text segmentation with R. R语言中文分词 (文档已更新 🎉 :https://qinwenfeng.com/jiebaR/ )

C++
352
5 年前

Python文本挖掘系统 Research of Text Mining System

Python
341
7 年前

turn natural language into structured data(支持中文,自定义了N种模型,支持不同的场景和任务)

Python
302
8 天前

Chinese-Text-Classification,Tensorflow CNN(卷积神经网络)实现的中文文本分类。QQ群:522785813,微信群二维码:http://www.tensorflownews.com/

Python
292
7 年前

微信机器人,基于Python itchat接口功能实例展示:01-itchat获取微信好友或者微信群分享文章、02-itchat获取微信公众号文章、03-itchat监听微信公众号发送的文章、04 itchat监听微信群或好友撤回的消息、05 itchat获得微信好友信息以及表图对比、06 python打印出微信被删除好友、07 itchat自动回复好友、08 itchat微信好友个性签名词云图、09 itchat微信好友性别比例、10 微信群或微信好友撤回消息拦截、11 itchat微信群或好友之间转发消息

Python
290
5 年前

Python学习第三方库案例总结

Python
259
5 年前

bilibili弹幕分析,包含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化

HTML
166
2 年前

结巴中文分词之php扩展,适用php5,php7

C++
163
7 年前

The jieba-analysis tool for java.(基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现。支持词性标注。)

Java
148
1 年前

Lexicon for Chinese lexical analyzing, 中文语言分词词库

Python
119
3 年前

专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类和文本分类. 为相关领域的研发人员提供完整的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSearch插件.

Java
114
2 年前

基于朴素贝叶斯实现的豆瓣影评情感分析

Python
99
4 年前