通用分词程序 - Lacking for A Common Segmenter (LACS) 刘兰涛 北京师范大学信息科学技术学院(100875) http://www.liulantao.com/LACS 程序说明: 考虑到便于修改和在线测试,所以使用PHP进行编写。 使用了宋继华老师提供的词表。 并且PHP与C和C++的语法极为相似,可以为后继的移植提供方便。 程序的初始框架参考了织梦算法,并对算法进行了修改,使用了RMM进行切分,会有该算法的固有局限。 基本能够完成标准格式的文本切分。但是对于从网络上复制的文章,需要进行手工处理才能使用,否则会出现少量的乱码。 对于处理结果中不满意之处,可以在原文手工切分(添加空格)并重新提交得到修正的结果。
⇑ 上方用户区可输入原文 ⇓ 下方结果区显示处理结果
通用 分 词 程序 - Lacking for A Common Segmenter ( LACS ) 刘兰涛 北京 师范大学 信息 科学 技术 学院 ( 100875 ) http://www.liulantao.com/LACS 程序 说明 : 考虑 到 便于 修改 和 在线 测试 , 所以 使用 PHP 进行 编写 。 使用 了 宋继华 老师 提供 的 词 表 。 并且 PHP 与 C 和 C + + 的 语法 极为 相似 , 可 以为 后继 的 移植 提供 方便 。 程序 的 初始 框架 参考 了 织 梦 算法 , 并 对 算法 进行 了 修改 , 使用 了 RMM 进行 切 分 , 会 有 该 算法 的 固有 局限 。 基本 能够 完成 标准 格式 的 文本 切 分 。 但是 对于 从 网络 上 复制 的 文章 , 需要 进行 手工 处理 才能 使用 , 否则 会 出现 少量 的 乱 码 。 对于 处理 结果 中 不满意 之 处 , 可以 在 原文 手工 切 分 ( 添加 空格 ) 并 重新 提交 得到 修正 的 结果 。 ------ 处理时间: 0.012382030487061 ------