单词学习:unleash your inner butterfly
看到了个推文: Train hard, breathe easy, and unleash your inner butterfly – Shinobu Kocho 想着这里的 butterfly 代表什么意思,刚好newbing可以使用了,于是直接问它,回答完美!以后查单词可以直接用 bing 了。 According to the web se…
牛津现代英汉双解词典第九版(COD9)改错专题–持续更新20231212
这篇文章会记录平时在查阅COD9双解版时遇到的错误及更正,作为前篇文章 COD9和牛津现代英汉双解词典第九版的差异对比 - 孤岛 (haibao.me) 的后续: anapaest 条:“抑抑杨格”,“杨”应为“扬”。 blip 条:“哗哗声”应为“哔哔声”。 calomel 条:“氯化甘汞”,“甘”应为“亚”。 cetane 条:词源部分 “fr…
2023 随心所愿
新冠三年来最糟糕的一年,2022年,终于过去了。 这一年的上半年几乎都是在封控中度过,下半年也都是三天两头做核酸。本以为核酸绵绵无绝期,谁知年底突然来个180度大转弯,所有限制全部取消。随之而来的,便是截止目前的超过一半人的感染。当然,我也未能幸免,好在只有发烧、鼻孔火辣、喉咙稍哑和稍咳嗽这几个症状,没有疼痛,也是万幸。 在上半年的封控开始及下半年…
matebook e go 2022,是兼容性问题还是质量问题?
一直想买个arm处理器的windows电脑玩玩,双十一期间入手了华为matebook e go 2022 性能版,这是第一次购买华为的产品,没想到就遇到了一些问题。 机器到手后,开机简单试用了一下。打开任务管理器,发现华为自身的几个服务包括电脑管家都还是x64架构。既然出的是arm版的电脑,不知道为什么就不能把这些基础服务编译为arm64架构的再发…
汉语大词典光盘版3.0数据提取
首先声明,汉语大词典光盘版3.0数据的提取现在没什么实际意义,写这篇文章只是出于兴趣以及存个档。 许多年前(2016年),我在论坛上发过一个汉语大词典光盘版3.0的提取工具:汉语大词典光盘版3.0及提取工具 - 词库制作交流区 - Dictionary-Making - 掌上百科 - PDAWIKI - Powered by Discuz!。 这个…
DK牛津英汉双解大词典图片版mdx
整理硬盘,从中翻出了一本DK牛津英汉双解大词典PDF,里面的图片还算清晰,而这本词典文字部分可以算是COD9的再编本,刚好现在有了COD9,想着可以利用其词头做个图片版,于是开始动手。 首先是要整理出每页首字。利用abby fineReader OCR整个pdf,然后保存为每页一个txt文件的形式,主要是便于提取页眉字头。保存为word理论上利用v…
COD9和牛津现代英汉双解词典第九版的差异对比
三年前,我从COD9光盘转制数据制作了COD9英文版的mdx,当时没有公开发布,如今三年期已过,再加上论坛上也有了COD9的双解版,所以还是打算发布出来了。在有双解版存在的情况下,英文原版发布的意义就在于两个文本可以互相对照,补其缺失和不足,互相完善。 下面我列出了批量对比词头找出的差异以及我在使用中发现的双解版的错误: 英文版多出的词条 caut…
牛津高阶双解第四版光盘数据简单分析和提取2
自造字的转换 牛津高阶双解第四版光盘数据由于使用的是BIG5码,所以文本会有缺字的情况。上次提取数据后,在处理缺字时发现,一些缺字变成了问号,这给还原缺字造成了一些麻烦,因为都成了问号就无法批量按编码还原了。继续对光盘源文件研究,发现这些缺字也是有编码的。BIG5码有三段分区可以让用户自定义字符,这几个分区对应Unicode的私有区,转换后虽然是乱…