COD9和牛津现代英汉双解词典第九版的差异对比

三年前,我从COD9光盘转制数据制作了COD9英文版的mdx,当时没有公开发布,如今三年期已过,再加上论坛上也有了COD9的双解版,所以还是打算发布出来了。在有双解版存在的情况下,英文原版发布的意义就在于两个文本可以互相对照,补其缺失和不足,互相完善。

下面我列出了批量对比词头找出的差异以及我在使用中发现的双解版的错误:

英文版多出的词条

cautery双解版遗漏
Dalai Lama双解版避讳
lotsa双解版遗漏
ski pole双解版遗漏
tramlinetramlines前者按单数释义,后者按复数释义
vitellivitellus前者单独成主词条

英文版和双解版有差异的词条

英文版双解版备注
SherpaSherpa双解版释义比英文版多一个词
B-pictureB picture以前者为标准
bonemealbone meal以前者为标准
cabinetmakercabinet-maker 以前者为标准
sleigh bellsleigh-bell以前者为标准
stud bookstud-book以前者为标准
table mattable-mat以前者为标准
time frametime-frame以前者为标准
time spantime-span以前者为标准
surgeonfishsurgeon fish以前者为标准
gossip mongergossipmonger以前者为标准
honey fungushoney-fungus以前者为标准
petits poispetit pois以前者为标准
open sesamesesame前者既是主词条,又在后者的派生词中
enchanter’s nightshadeenchanter前者是主词条,双解版是在后者的派生词中,以前者为准
oscillatoroscillate前者是主词条,双解版是在后者的派生词中,以前者为准
draconianDraconian以后者为准
jew’s harpJew’s harp以后者为准
Ph.D.ph.D.以前者为标准
bpsbpS以前者为标准
l-dopaL-dopa以前者为标准
mons Venerismons veneris以前者为标准

双解版(疑似)错误的词条

英文版双解版
sub judicesubjudice以前者为标准,双解版疑似错误,并没有合写的用例
binomial nomenclaturebinomial classification以前者为准,双解版疑似错误
coup de grâcecoup de grɒ̃ce双解版错误
flânerieflɒ̃nerie双解版错误
flâneurflɒ̃neur双解版错误
papier mâchépapier mɒ̃ché双解版错误
pâtepɒ̃te双解版错误
pâtépɒ̃té双解版错误
pâté de foie graspɒ̃té de foie gras双解版错误
look条下look lively双解版释义为”see LIVELY”,然而lively条下look lively释义为“see look”,而英文原版look条下look lively释义为“see look alive”,可见双解版有误
ask条第三释义:(usu. foll. by out or over, or to (a function etc.))ask条第三释义:(usu. foll. by 通常后跟 out or over, or to invite)双解版invite错置,且少 (a function etc.)内容
precept第一条释义“a command; a rule of conduct 命令,行为,准则”,“行为,准则”之间不应有空格
yes-man条中文“[口英]义唯诺诺的人”应为“[口]唯唯诺诺的人”
scientism条“[常贬英]义科学主义”应为“[常贬]唯科学主义”
quarter条第5释义“)25”后括号应为中文括号批量错误,凡是中文中,前中文小括号后英文小括号加数字或字母的,皆应改
mod2条:“[数]”应为“【数】”(标签亦要改,下同)
studding-sail条:[海] 应为【海】
downhill条之downhiller:[滑雪]应为【滑雪】
officious条:[外交]应为【外交】
persona条:Literary Criticism要加标签,[文学批评]应为【文学批评】
figura条:Literary Criticism要加标签
plea bargaining条:[源美]按其他对orig.的翻译应为[源于美]体例不一,亦可不改
employment office条:formerly 只此一处译为“[旧时]”,其他地方都译为“[旧指]”体例不一,亦可不改
vini-条和vice-条:只此两处为“[构词成份]”,其余皆为“[构词成分]”,统一为后者体例不一,亦可不改

双解版多出的词条

blue dahlia 英文光盘版无此词条
crow-bill 英文光盘版无此词条
gayety 英文光盘版没有独立主词条
chop / chop logic 后者在英文原版中没独立成主词条,而在chop下
zenith zenithal 后者在英文原版中没独立成主词条,而在zenith下
time / no time 后者在英文原版中没独立成主词条,而在time下
news-gatherer / news-gathering 后者在英文原版中没独立成主词条,而在news-gatherer下,从释义来看,不应列为主词条。

双解版排版有问题的词条

copyread
Boxing Day
Buddhism
Econ.
Gulf Stream
Hinduism
Judaism
Law Lord
Parl.
Rom.
Rugby League
Rugby Union
plus(第1条释义,按体例,“3 plus 4 equals 7 3 加 4 等于 7”应属例证,英文光盘版“3 plus 4 equals 7”亦是用斜体表示,双解版原文中文释义和例证混一起)
-tron
add-on
-tion

rhyming <ot>slang</ot>

school <ot>slang</ot>
black <ot>slang</ot>

pseudo-<ot>archaic</ot>

fritto misto条 “[通常为海味]”不应有标签,方括号应为全角

antonomasia条:eg中<cn>标签应改为<zh>标签,[英国作家狄更斯小说中的老吝啬鬼],同上

Calvinism:[卒于 1564 年],同上

form criticism条:[如格言、神话],同上

sextillion

septillion

trillion

quadrillion

quintillion

数字之间的</sup><sup>应删除

crenate: & </prx>,类似问题有93处

双解版其他问题

双解版把附录部分(国家、地区、人名等)作为主词条录入;

英文版部分是斜体词头的,双解版缺失标签;

对双解版的修改

针对有差异部分,总体上以英文版为准。

附录部分(国家、地区、人名等)词头以颜色与主词头作区分;

英文版的斜体词头在双解版中加上斜体标签;

合并相同词头(仅大小写不同仍视作不同词头,不作合并);

短语词组和派生词区分开,各为独立一部分。

因为派生词基本都没释义,作独立词头再点击跳转到主词头反倒多了一步,所以直接使用“@LINK=”形式,查询时直接跳转到主词条(个别派生词对应两个主词条的除外);

重新提取短语词组并对其分割,如“make a (or one’s) fortune”分割为“make a fortune”和“make one’s fortune”两条,以前者为主词条,后者跳转到前者。因为这个分割是我用脚本完成的,对于正则无法匹配到的地方,就无能为力了,所以还是会遇到词头没有分割或分割错误的地方;

中文标签“<cn></cn>”在css中作了隐藏;

排版根据自己的喜好做了调整;

总体效果如图:

下载地址

链接: https://pan.baidu.com/s/19cEFMHKyJiS2aY9onV60Ag?pwd=a1bv 提取码: a1bv

评论

  1. null
    3月前
    2022-9-04 21:27:19

    灰常感谢 可作参考 => https://forum.freemdict.com/t/topic/10262

  2. eBoy
    3周前
    2022-11-13 8:59:12

    煩請大佬方便時也更新一下這個鏈接,多謝!

  3. 你好tsiank!
    已编辑
    2周前
    2022-11-21 19:14:28

    印象中, mdx.txt 里
    应该处理成语体的 cookery , 被处理成了普通文字。

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇