标签: 提取

3 篇文章

对汉籍全文检索系统的AIxx分析
整理电脑硬盘,发现躺在某个角落里的汉籍全文检索系统,打开看了两眼,忽然想到,如今有了AI,能否借助于它来分析一下这个软件是怎么运行的。几年前下载到这个软件时,便想着能不能把里面的书籍都导出来。当时研究了一番,发现一种方式可以实现,就是使用其打印成pdf的功能,先导出为pdf再转为html格式。不过就是需要一篇篇去导,即使使用按键精灵,也是比较麻烦,…
汉语大词典光盘版3.0数据提取
首先声明,汉语大词典光盘版3.0数据的提取现在没什么实际意义,写这篇文章只是出于兴趣以及存个档。 许多年前(2016年),我在论坛上发过一个汉语大词典光盘版3.0的提取工具:汉语大词典光盘版3.0及提取工具 - 词库制作交流区 - Dictionary-Making - 掌上百科 - PDAWIKI - Powered by Discuz!。 这个…
牛津高阶双解第四版光盘数据简单分析和提取
看到论坛上还有许多人对牛津高阶双解第四版很感兴趣,也有人为了完善此词典而不断修正。然而此词典的数据在不断地转制过程中,失真较多,纵有多个版本相互参照,也不一定能校正过来。昨天有个朋友提起,我又找来原光盘的数据看了看,发现里面的数据基本上是明文存储的,研究了一番,最终基本成功提取。 光盘的数据文件在DATA目录中,比较大的文件有三个:JRDCONV.…