news 2026/6/10 19:36:59

二十一、【鸿蒙 NEXT】分词和汉字转拼音

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
二十一、【鸿蒙 NEXT】分词和汉字转拼音

【前言】

在某些功能场景,比如实现一个本地搜索功能时,可能需要支持中文搜索,同时支持拼音搜索。这里就会涉及到两个功能点,一个是中文转拼音,一个是将中文进行分词。同时这里有个注意点如果调用系统接口进行批量分词时,使用不当会导致UI卡顿。下面介绍下在鸿蒙next系统中,怎么实现这两个功能,以及怎么避免UI卡顿

1、中文转拼音

在系统接口中有个i18n的工具类,该工具类提供了一个Transliterator工具类,可以实现中文转拼音能力,代码如下

其中res1是包含声调的,res2是不包含声调的

let res1:string = i18n.Transliterator.getInstance('Han-Latin').transform('中国') let res2:string = i18n.Transliterator.getInstance('Latin-ASCII').transform(res1)

2、分词

在做功能搜索功能时,会将功能名称分词出不同的词语,来适配用户的搜索。这里系统提供了一个 分词功能,textProcessing是系统分词的一个工具类,代码如下,代码将“词语搜索”四个字分词层“词语”和“搜索”两个词

textProcessing.getWordSegment('词语搜索').then(wordSegments => { let words = wordSegments.map(wordSegment => wordSegment.word) console.log(`词语搜索 => ${JSON.stringify(words)}`) })

3、分词的注意点

这里要注意一点,如果使用不当,可能会造成UI界面的卡顿。

在调用系统分词接口时,实际是跨进程调用系统能力。如果我们一次性循环调用很多次分词接口,由于系统的分词进程最大开两个线程处理分词。因此我们如果循环大量调用接口,会导致我们app一直处于等待状态,而且会影响UI的正常展示。这种阻塞即使我们在app中启动子线程去调用系统接口,也没法起到效果。因为实际上我们跨进程调用分词接口时,本身会启动一个子线程去调用,真正造成UI卡顿的原因是,我们循环大批量开启跨进程调用,会导致app的线程资源耗尽,导致我们app其他线程无法正常获取线程资源。比如会影响网络请求,我们很多UI的展示依赖网络请求的返回值,由于线程资源耗尽,网络请求只能等待。从而影响UI正常展示。

解决方法就是我们可以分批次调用系统接口,比如每批次调用4次,等到前面的处理完成后,再继续下一批次调用。完整的代码实现如下,这里首先在app子线程去做分词功能,并在子线程中分批次调用。我们最终在app启动时调用SegmentUtil.segment();方法实现批量分词效果

// 分词工具类,开启子线程执行 import { textProcessing } from "@kit.NaturalLanguageKit" import { PromiseBatchUtils } from "./PromiseBatchUtils" import { taskpool } from "@kit.ArkTS" export class SegmentUtil { public static async segment() { let segmentResult = await taskpool.execute(segments) as Promise<string[][]> console.log(`segmentResult is ${JSON.stringify(segmentResult)}`) } } @Concurrent async function segments():Promise<string[][]> { let arr:string[] = ['词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索'] let arrPromise:(()=>Promise<string[]>)[] = arr.map(str => async () => { let wordSegments = await textProcessing.getWordSegment('词语搜索') return wordSegments.map(wordSegment => wordSegment.word) }) let result = await PromiseBatchUtils.runWithBatch(arrPromise, 4) return result } // 分批次调用系统分词 export class PromiseBatchUtils { public static async runWithBatch<T>(tasks:(() => Promise<T>)[], batchNum:number):Promise<T[]> { let results:T[] = [] let execute:Promise<void>[] = [] let index = 0 while (index < tasks.length) { if (execute.length < batchNum) { let taskIndex = index++ console.log(`start index ${taskIndex}`) let executePromise = tasks[taskIndex]() .then(result => { results[taskIndex] = result console.log(`end index ${taskIndex}`) }).finally(() => { let executeIndex = execute.indexOf(executePromise) if (executeIndex > -1) { execute.splice(executeIndex,1) } }) execute.push(executePromise) } else { await Promise.race(execute) } } await Promise.all(execute) return results } }
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 18:34:31

如何备份docker images

备份Docker镜像主要有以下几种方式&#xff1a;方法一&#xff1a;docker save / docker load&#xff08;推荐&#xff09;备份单个镜像bash复制# 保存镜像为tar文件&#xff08;包含所有标签&#xff09; docker save -o backup.tar <镜像名>:<标签># 示例 docke…

作者头像 李华
网站建设 2026/6/10 14:31:29

探索成熟的FTP替代方案:现代化文件传输的新选择

随着数据规模的扩大和安全需求的提升&#xff0c;传统FTP协议已逐渐显露出诸多局限。企业和技术团队需要更安全、高效、可靠的文件传输解决方案来满足现代化业务需求。本文将系统梳理当前主流的FTP替代方案&#xff0c;为不同场景下的文件传输需求提供参考。 云存储与文件同步服…

作者头像 李华
网站建设 2026/6/10 12:27:55

抽卡机小程序比较常见的功能汇总

盲盒抽卡机小程序的功能丰富多样&#xff0c;最主要的功能有这些&#xff1a;基础抽卡功能&#xff1a;支持单次抽卡和十连抽等方式&#xff0c;用户可以根据自己的喜好来选择奖池参与体验。可设置消耗不同数量的货币或积分对应不同的抽卡池&#xff0c;里面的卡牌稀有度等也会…

作者头像 李华
网站建设 2026/6/10 7:26:05

KeyShot许可证常见问题解答

随着3D渲染技术的广泛应用&#xff0c;KeyShot作为一款业界领先的渲染软件&#xff0c;其许可证问题常常成为用户关注的焦点。为了帮助大家更好地了解KeyShot许可证相关的常见问题&#xff0c;本文将提供详细的解答&#xff0c;让您在使用过程中更加顺畅。 问题一&#xff1a;K…

作者头像 李华
网站建设 2026/6/10 14:07:33

GitHub Wiki搭建PyTorch项目文档的最佳实践

GitHub Wiki 搭建 PyTorch 项目文档的最佳实践 在深度学习项目日益复杂的今天&#xff0c;一个团队最怕听到的一句话是&#xff1a;“为什么在我机器上能跑&#xff1f;” 更糟的是&#xff0c;当你想复现某次实验结果时&#xff0c;却发现环境依赖早已混乱不堪。这不仅是时间的…

作者头像 李华