三年前,我从COD9光盘转制数据制作了COD9英文版的mdx,当时没有公开发布,如今三年期已过,再加上论坛上也有了COD9的双解版,所以还是打算发布出来了。在有双解版存在的情况下,英文原版发布的意义就在于两个文本可以互相对照,补其缺失和不足,互相完善。
下面我列出了批量对比词头找出的差异以及我在使用中发现的双解版的错误:
英文版多出的词条
cautery | 双解版遗漏 | |
Dalai Lama | 双解版避讳 | |
lotsa | 双解版遗漏 | |
ski pole | 双解版遗漏 | |
tramline | tramlines | 前者按单数释义,后者按复数释义 |
vitelli | vitellus | 前者单独成主词条 |
英文版和双解版有差异的词条
英文版 | 双解版 | 备注 |
Sherpa | Sherpa | 双解版释义比英文版多一个词 |
B-picture | B picture | 以前者为标准 |
bonemeal | bone meal | 以前者为标准 |
cabinetmaker | cabinet-maker | 以前者为标准 |
sleigh bell | sleigh-bell | 以前者为标准 |
stud book | stud-book | 以前者为标准 |
table mat | table-mat | 以前者为标准 |
time frame | time-frame | 以前者为标准 |
time span | time-span | 以前者为标准 |
surgeonfish | surgeon fish | 以前者为标准 |
gossip monger | gossipmonger | 以前者为标准 |
honey fungus | honey-fungus | 以前者为标准 |
petits pois | petit pois | 以前者为标准 |
open sesame | sesame | 前者既是主词条,又在后者的派生词中 |
enchanter’s nightshade | enchanter | 前者是主词条,双解版是在后者的派生词中,以前者为准 |
oscillator | oscillate | 前者是主词条,双解版是在后者的派生词中,以前者为准 |
draconian | Draconian | 以后者为准 |
jew’s harp | Jew’s harp | 以后者为准 |
Ph.D. | ph.D. | 以前者为标准 |
bps | bpS | 以前者为标准 |
l-dopa | L-dopa | 以前者为标准 |
mons Veneris | mons veneris | 以前者为标准 |
双解版(疑似)错误的词条
英文版 | 双解版 | |
sub judice | subjudice | 以前者为标准,双解版疑似错误,并没有合写的用例 |
binomial nomenclature | binomial classification | 以前者为准,双解版疑似错误 |
coup de grâce | coup de grɒ̃ce | 双解版错误 |
flânerie | flɒ̃nerie | 双解版错误 |
flâneur | flɒ̃neur | 双解版错误 |
papier mâché | papier mɒ̃ché | 双解版错误 |
pâte | pɒ̃te | 双解版错误 |
pâté | pɒ̃té | 双解版错误 |
pâté de foie gras | pɒ̃té de foie gras | 双解版错误 |
look条下look lively双解版释义为”see LIVELY”,然而lively条下look lively释义为“see look”,而英文原版look条下look lively释义为“see look alive”,可见双解版有误 | ||
ask条第三释义:(usu. foll. by out or over, or to (a function etc.)) | ask条第三释义:(usu. foll. by 通常后跟 out or over, or to invite) | 双解版invite错置,且少 (a function etc.)内容 |
precept第一条释义“a command; a rule of conduct 命令,行为,准则”,“行为,准则”之间不应有空格 | ||
yes-man条中文“[口英]义唯诺诺的人”应为“[口]唯唯诺诺的人” | ||
scientism条“[常贬英]义科学主义”应为“[常贬]唯科学主义” | ||
quarter条第5释义“)25”后括号应为中文括号 | 批量错误,凡是中文中,前中文小括号后英文小括号加数字或字母的,皆应改 | |
mod2条:“[数]”应为“【数】”(标签亦要改,下同) | ||
studding-sail条:[海] 应为【海】 | ||
downhill条之downhiller:[滑雪]应为【滑雪】 | ||
officious条:[外交]应为【外交】 | ||
persona条:Literary Criticism要加标签,[文学批评]应为【文学批评】 | ||
figura条:Literary Criticism要加标签 | ||
plea bargaining条:[源美]按其他对orig.的翻译应为[源于美] | 体例不一,亦可不改 | |
employment office条:formerly 只此一处译为“[旧时]”,其他地方都译为“[旧指]” | 体例不一,亦可不改 | |
vini-条和vice-条:只此两处为“[构词成份]”,其余皆为“[构词成分]”,统一为后者 | 体例不一,亦可不改 | |
anapaest条:“抑抑杨格”,“杨”应为“扬” | ||
blip 释义中:“哗哗声”应为“哔哔声” |
双解版多出的词条
blue dahlia 英文光盘版无此词条
crow-bill 英文光盘版无此词条
gayety 英文光盘版没有独立主词条
chop / chop logic 后者在英文原版中没独立成主词条,而在chop下
zenith zenithal 后者在英文原版中没独立成主词条,而在zenith下
time / no time 后者在英文原版中没独立成主词条,而在time下
news-gatherer / news-gathering 后者在英文原版中没独立成主词条,而在news-gatherer下,从释义来看,不应列为主词条。
双解版排版有问题的词条
copyread
Boxing Day
Buddhism
Econ.
Gulf Stream
Hinduism
Judaism
Law Lord
Parl.
Rom.
Rugby League
Rugby Union
plus(第1条释义,按体例,“3 plus 4 equals 7 3 加 4 等于 7”应属例证,英文光盘版“3 plus 4 equals 7”亦是用斜体表示,双解版原文中文释义和例证混一起)
-tron
add-on
-tion
rhyming <ot>slang</ot>
school <ot>slang</ot>
black <ot>slang</ot>
pseudo-<ot>archaic</ot>
fritto misto条 “[通常为海味]”不应有标签,方括号应为全角
antonomasia条:eg中<cn>标签应改为<zh>标签,[英国作家狄更斯小说中的老吝啬鬼],同上
Calvinism:[卒于 1564 年],同上
form criticism条:[如格言、神话],同上
sextillion
septillion
trillion
quadrillion
quintillion
数字之间的</sup><sup>应删除
crenate: & </prx>,类似问题有93处
双解版其他问题
双解版把附录部分(国家、地区、人名等)作为主词条录入;
英文版部分是斜体词头的,双解版缺失标签;
对双解版的修改
针对有差异部分,总体上以英文版为准。
附录部分(国家、地区、人名等)词头以颜色与主词头作区分;
英文版的斜体词头在双解版中加上斜体标签;
合并相同词头(仅大小写不同仍视作不同词头,不作合并);
短语词组和派生词区分开,各为独立一部分。
因为派生词基本都没释义,作独立词头再点击跳转到主词头反倒多了一步,所以直接使用“@LINK=”形式,查询时直接跳转到主词条(个别派生词对应两个主词条的除外);
重新提取短语词组并对其分割,如“make a (or one’s) fortune”分割为“make a fortune”和“make one’s fortune”两条,以前者为主词条,后者跳转到前者。因为这个分割是我用脚本完成的,对于正则无法匹配到的地方,就无能为力了,所以还是会遇到词头没有分割或分割错误的地方;
中文标签“<cn></cn>”在css中作了隐藏;
排版根据自己的喜好做了调整;
总体效果如图:
下载地址
链接: https://pan.baidu.com/s/19cEFMHKyJiS2aY9onV60Ag?pwd=a1bv 提取码: a1bv
灰常感谢 可作参考 => https://forum.freemdict.com/t/topic/10262
煩請大佬方便時也更新一下這個鏈接,多謝!
印象中, mdx.txt 里
应该处理成语体的 cookery , 被处理成了普通文字。
T大!链接失效了,盼能再次分享!新年快乐~~
gossipmonger 有误。
在 ODE 中应取双解版的形式,直接搜索定位本文中的错误。
enchanter’s nightshade 在 ODE 中搜索不到
draconian ODE与COD英版一致
名单中的Jew’s harp 应该是’,便于输入检索,或者多加几个词头,便于复制粘贴时的查询。
能补一下下载链接吗?