Repository navigation

#

trie-tree

👮‍♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。内置支持单词标签分类分级。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。)

Java
4962
2 个月前

敏感词查找,验证,过滤和替换 🤓 FindAll, Validate, Filter and Replace words.

Go
660
3 年前

🇨🇳Open Chinese Convert is an opensource project for conversion between Traditional Chinese and Simplified Chinese.(java 中文繁简体转换,支持台湾、香港、中文日文转换。)

Java
505
8 天前

My implementation of 85+ popular data structures and algorithms and interview questions in Python 3 and C++

Python
328
5 年前

A lightweight full text indexer for .NET

C#
189
1 个月前

The jieba-analysis tool for java.(基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现。支持词性标注。)

Java
148
1 年前
Go
79
4 个月前

基于Netty4开发的简单、轻量级、高性能的的Http restful api server

Java
79
4 天前

使用python实现了一个简单的trie树结构,可增加/查找/删除关键词,用于中文文本的关键词匹配、停用词删除等。

Python
64
5 年前

pinyintokenizer, 拼音分词器,将连续的拼音切分为单字拼音列表。

Python
30
2 个月前

快写完了....支持泛型的数据结构库(vec, linkedlist, skiplist, hashtable, btree, avltree, rbtree, trie, set

Go
26
4 个月前

Tookit-Sihui, a tool of some common algorithm, AI文本混合科学计算器(calculator-sihui), 句子词频-逆文本频率(TF-IDF),搜索BM25, 前缀树搜索关键词(trietree), 模板匹配-递归函数(func_recursive),中文数字转阿拉伯数字(chinese to number),阿拉伯数字转汉语数字, HMM, CRF

Python
24
4 年前

Sensitive Words Detection 一个高性能的敏感词检测和过滤库,基于 Go 语言开发,采用整洁架构设计。专注于中文文本的敏感词检测,支持多种检测策略和灵活的扩展机制。

Go
23
2 个月前

Coordinate Hash Trie: A Trie Variant Balancing between Time, Space, and Simplicity

C
20
2 年前

Python version Aho-Corasic Automaton.

Python
19
4 年前

a simple text editor in java for DS project

Java
17
1 年前