Socket
Socket
Sign inDemoInstall

hanzi-tools

Package Overview
Dependencies
62
Maintainers
1
Versions
31
Alerts
File Explorer

Advanced tools

Install Socket

Detect and block malicious and high-risk dependencies

Install

    hanzi-tools

Converts from Chinese characters to pinyin, between simplified and traditional, and does word segmentation.


Version published
Maintainers
1
Created

Readme

Source

Hanzi Tools 汉字工具

《汉字工具》是四种工具的集合。 Hanzi Tools is a collection of four different tools.

  • segment - 分词。 Divide text into words.
  • pinyinify - 转换汉字为拼音。 Convert Chinese characters to pinyin.
  • simplify - 转换简体汉字为繁体汉字。 Convert traditional characters to simplified characters.
  • traditionalize - 转换繁体汉字为简体汉字。 Convert simplified characters to traditional characters.
  • tag - 词性标注。 Part-of-speech tagging.

安装 Installation

npm install hanzi-tools

segment

分词。 Divide text into words.

var segment = require("hanzi-tools").segment;

segment("我在青岛市崂山区工作。");
// [ '我', '在', '青岛市', '崂山区', '工作', '。' ]

pinyinify

转换汉字为拼音。 Convert Chinese characters to pinyin.

var pinyinify = require("hanzi-tools").pinyinify;

pinyinify("转换汉字为拼音。")
// "zhuǎnhuàn hànzì wéi pīnyīn."

console.log(pinyinify("你好!你今天吃饭了没?"));
// nǐhǎo! nǐ jīntiān chīfàn le méi?

详细输出 Detailed output

pinyinify("人人生而自由,在尊严和权利上一律平等。", true)
// { 
//   segments: ['人人', '生而自由', ',', '在', '尊严', '和', '权利', '上', '一律平等', '。'],
//   pinyinSegments: ['rénrén', 'shēngérzìyóu', ',', 'zài', 'zūnyán', 'hé', 'quánlì', 'shàng', 'yīlǜpíngděng', '.'],
//   pinyinSegmentsSyllables: [['rén', 'rén'], ['shēng', 'ér', 'zì', 'yóu'], [','], ['zài'], ['zūn', 'yán'], ['hé'], ['quán', 'lì'], ['shàng'], ['yī', 'lǜ', 'píng', 'děng', '.']],
//   pinyin: 'rénrén shēngérzìyóu, zài zūnyán hé quánlì shàng yīlǜpíngděng.' 
// }

simplify

转换简体汉字为繁体汉字。 Convert traditional characters to simplified characters.

var simplify = require("hanzi-tools").simplify;
simplify("有朋自遠方來,不亦樂乎?");
// 有朋自远方来,不亦乐乎?

traditionalize

转换繁体汉字为简体汉字。 Convert simplified characters to traditional characters.

var traditionalize = require("hanzi-tools").traditionalize;
traditionalize("起来!不愿做奴隶的人们! 把我们的血肉,筑成我们新的长城!");
// 起來!不願做奴隸的人們! 把我們的血肉,築成我們新的長城!

tag

词性标注。 Part-of-speech tagging.

    var tag = require("hanzi-tools").tag;
    tag("你是我最喜欢的人。");
    // [ { word: '你', tag: 'r' },
    // { word: '是', tag: 'v' },
    //  { word: '我', tag: 'r' },
    //  { word: '最', tag: 'd' },
    //  { word: '喜欢', tag: 'v' },
    //  { word: '的', tag: 'uj' },
    //  { word: '人', tag: 'n' },
    //  { word: '。', tag: 'x' } ]

词性编码表 Part-of-speech codes

代码 Code名称 Meaning举例 Example
a形容词 Adjective冰箱很脏
ad副形词 Adverbial adjective你一直努力工作。
ag形语素 Adjectival morpheme
an名形词 Nounal adjective现在没有危险了。
b区别词 Attributive所有鸟都会飞吗?
c连词 Conjunction你不我吻别吗?
d副词 Adverb没收到他的信。
df副词不要 Adverb "不要"不要客气。
dg副语素 Adverbial morpheme尽管证据在,他们却装作好象没插手这事。
e叹词 Interjection 你干什么呢 不想活了?
f方位词 Location word我从梦醒来。
g语素 Isolated morpheme
h前缀 Prefix工作人员禁止入内。
i成语 Idiom不快乐不请自来
j简称略语 Abbreviation日本办过多少次奥运会
k后缀 Suffix亲爱的朋友
l习用语 Idiomatic phrase我累得再也走不动了。
m数词 Quantity我怀孕四个月了。
mq数量词 Measure word这件事你告诉他妈没?
n名词 Noun电池快没电了。
ng名语素 Noun morpheme你看着像
nr人名 Name of a person我一出门就碰上老王了。
nrfg汉语名字 Chinese name中国国家主席习近平会见美国国务卿约翰·克里。
nrt音译人名 Transliterated name彼得看起来很年轻。
ns地名 Place name伦敦现在七点了。
nt机构团体 Group name我自愿加入中国共产党
nz其他专名 Other proper nouns他会讲一点点英语
o拟声词 Onomatopoeia我的肚子在咕咕叫。
p介词 Preposition你保证。
q量词 Isolated measure word我不是老师。
r代词 Pronoun明白的意思吗?
rg代词性语素 Pronoun-like morpheme向大会转递委员会的此份报告。
rr人称代词 Personal pronoun不用担心其他人
rz指示代词 Demonstrative pronoun这位女士应该知道!
s处所词 Place word天下没有免费的午餐。
t时间词 Time word今天可能会来。
tg时语素 Time morpheme一会就能明白。
u助词 Function word如果可能的话
ud结构助词得 Structural particle "得"他玩很好。
ug时态助词过 Temporal particle "过"我见你的女朋友。
uj结构助词的 Structural particle "的"他们是我兄弟。
ul时态助词了 Temporal particle "了"已经很完美
uv结构助词地 Structural particle "地"请安静关门。
uz时态助词着 Temporal particle "着"让土地闲置很浪费。
v动词 Verb,我发现了这个!
vd副动词 Adverbial form of verb只能持续十五分钟。
vg动词性语素 Verb-like morpheme我每周游一次。。
vi不及物动词 Intransitive verb乌克兰经济上等同于失败的国家。
vn名动词 Noun-like verb他习惯了旅行
vq动词去过 Verb "去过"去过罗马。
x非语素字 Non-morpheme。?!
y语气词 Modal particle你不会害怕
z状态词 Status word我还晕晕乎乎的。
zg状态语素 Status morpheme抱歉。

Keywords

FAQs

Last updated on 16 Dec 2021

Did you know?

Socket for GitHub automatically highlights issues in each pull request and monitors the health of all your open source dependencies. Discover the contents of your packages and block harmful activity before you install or update your dependencies.

Install

Related posts

SocketSocket SOC 2 Logo

Product

  • Package Alerts
  • Integrations
  • Docs
  • Pricing
  • FAQ
  • Roadmap

Stay in touch

Get open source security insights delivered straight into your inbox.


  • Terms
  • Privacy
  • Security

Made with ⚡️ by Socket Inc