随着全球对中文学习需求的增加,以及数字化技术的不断发展,传统的教学模式已经无法满足学生的需求。基于国际中文教育创新项目——“中国人的一天”故事化、场景化、交互式汉语听说数字化教材开发及编写项目,需要一款词汇统计软件,旨在能够通过预处理文本、提取词汇并将其归类到不同级别的字典中,最终得出各级词汇在文本中的出现次数、所占百分比的词汇统计方法。用来检测教材脚本中各级中文词汇量,进而评估教材质量。本文主要介绍开发国际中文教育水平等级词汇统计软件功能的技术路线、算法设计、实现过程,及发现的问题的解决方案。