WeHack BBS
我觉得自由软件词典可以研究一下 - 可打印的版本

+- WeHack BBS (https://bbs.wehack.space)
+-- 版块: 计算机技术 (https://bbs.wehack.space/forum-5.html)
+--- 版块: GNU/Linux 讨论区 (https://bbs.wehack.space/forum-6.html)
+--- 主题: 我觉得自由软件词典可以研究一下 (/thread-30.html)



我觉得自由软件词典可以研究一下 - vimacs - 01-30-2018

主要是词典格式比较多,GoldenDict就支持至少4种 http://goldendict.org/wiki/index.php/Supported_dictionary_formats
  • Babylon (.bgl)
  • StarDict (.ifo / .dict / .idx / .syn)
  • Dictd (.index/.dict [.dz])
  • ABBYY Lingvo. Dsl-dictionaries
GNU 有一个词典项目 GCIDE. https://ftp.gnu.org/gnu/gcide/ 它用的又是一种格式。


RE: 我觉得自由软件词典可以研究一下 - helloworld - 01-31-2018

看到最近有人发了几个Casio词典,我下载了试下不知道怎么解出纯文本。版主能试试么?

https://www.reddit.com/r/ReverseEngineering/comments/7trezf/hacking_the_fxcp400_part_2_exploring_the_firmware/dtezguy/


RE: 我觉得自由软件词典可以研究一下 - vimacs - 02-02-2018

(01-31-2018, 02:58 AM)helloworld 提到: 看到最近有人发了几个Casio词典,我下载了试下不知道怎么解出纯文本。版主能试试么?

https://www.reddit.com/r/ReverseEngineering/comments/7trezf/hacking_the_fxcp400_part_2_exploring_the_firmware/dtezguy/

最近我时间不是很多。而且reddit那贴里面那里磁力链接似乎是一份完整固件,还要先提取词典出来。


RE: 我觉得自由软件词典可以研究一下 - helloworld - 02-02-2018

(02-02-2018, 10:27 AM)vimacs 提到:
(01-31-2018, 02:58 AM)helloworld 提到: 看到最近有人发了几个Casio词典,我下载了试下不知道怎么解出纯文本。版主能试试么?

https://www.reddit.com/r/ReverseEngineering/comments/7trezf/hacking_the_fxcp400_part_2_exploring_the_firmware/dtezguy/

最近我时间不是很多。而且reddit那贴里面那里磁力链接似乎是一份完整固件,还要先提取词典出来。

我看了下第一个磁力链,应该是已经提取了的词典。但只有些HTM文件是明文的,其余怎么解?

$ find */*.HTM
引用:ZH008/DICTION.HTM
ZH008/INFDPCN6.HTM
ZH008/INFGTCN6.HTM
ZH009/DICTION.HTM
ZH009/INFDPCN6.HTM
ZH009/INFGTCN6.HTM
ZH010/DICTION.HTM
ZH010/INFDPCN6.HTM
ZH010/INFGTCN6.HTM
ZH011/DICTION.HTM
ZH011/INFDPCN6.HTM
ZH011/INFGTCN6.HTM
ZH012/DICTION.HTM
ZH012/INFDPCN6.HTM
ZH012/INFGTCN6.HTM
ZH013/DICTION.HTM
ZH013/INFDPCN6.HTM
ZH013/INFGTCN6.HTM

$ cat */DICTION.HTM > cathtm.txt

引用:<html>
<head>
<title>日汉大辞典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>新编现代日语外来语词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>拉鲁斯法汉双解词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>精编汉法词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>新德汉词典(第三版)</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>现代汉德词典(第二版)</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>



RE: 我觉得自由软件词典可以研究一下 - vimacs - 02-02-2018

那其他的HTM文件是什么内容?


RE: 我觉得自由软件词典可以研究一下 - helloworld - 02-02-2018

(02-02-2018, 07:32 PM)vimacs 提到: 那其他的HTM文件是什么内容?

其它两种HTM文件是这种内容,另外其他后缀的文件好像都不是纯文本了

$ cat */INFDPCN6.HTM
引用:reference="title:titl_cn.gra,graph:main.gra"
gaiji="jc_j12z.cjf"
gaiji="jc_j16z.cjf"
gaiji="jc_j24z.cjf"
gaiji="jc_j48z.cjf"
gaiji="jc_s12b.cjf"
gaiji="jc_s12h.cjf"
gaiji="jc_s12z.cjf"
gaiji="jc_s16b.cjf"
gaiji="jc_s16h.cjf"
gaiji="jc_s16z.cjf"
gaiji="jc_s24b.cjf"
gaiji="jc_s24h.cjf"
gaiji="jc_s24z.cjf"
gaiji="jc_z12h.cjf"
gaiji="jc_z12z.cjf"
gaiji="jc_z16h.cjf"
gaiji="jc_z16z.cjf"
gaiji="jc_z24h.cjf"                                                                                                                                                                                                              
gaiji="jc_z24z.cjf"                                                                                                                                                                                                              
                                                                                                                                                                                                                               
dicapl="699"                                                                                                                                                                                                                    
id="ZH008"                                                                                                                                                                                                                      
code="en"                                                                                                                                                                                                                        
accent="seion.txt"                                                                                                                                                                                                              
kjump="ON"                                                                                                                                                                                                                      
mode="01"                                                                                                                                                                                                                        
                                                                                                                                                                                                                               
#switch;                                                                                                                                                                                                                        
reference="title:titl_cn.gra,graph:main.gra"
gaiji="jlw_j12z.cjf"
gaiji="jlw_j16z.cjf"
gaiji="jlw_j24z.cjf"
gaiji="jlw_s12b.cjf"
gaiji="jlw_s12z.cjf"
gaiji="jlw_s16b.cjf"
gaiji="jlw_s16z.cjf"
gaiji="jlw_s24b.cjf"
gaiji="jlw_s24z.cjf"
gaiji="jlw_z12z.cjf"
gaiji="jlw_z16z.cjf"
gaiji="jlw_z24z.cjf"

dicapl="699"
id="ZH009"
code="en"
accent="seion.txt"
kjump="OFF"
mode="01"

#switch;
reference="title:titl_cn.gra,graph:main.gra"
gaiji="lffc12sz.cjf"
gaiji="lffc16sz.cjf"
gaiji="lffc24sz.cjf"
gaiji="lffc12sb.cjf"
gaiji="lffc16sb.cjf"
gaiji="lffc24sb.cjf"
gaiji="lffc12zz.cjf"
gaiji="lffc16zz.cjf"
gaiji="lffc24zz.cjf"

dicapl="699"
id="ZH010"
code="fr"
accent="seion.txt"
kjump="OFF"
mode="01"

#switch;
reference="title:titl_cn.gra,graph:main.gra"
gaiji="dcf_z12z.cjf"
gaiji="dcf_z16z.cjf"
gaiji="dcf_z24z.cjf"
gaiji="dcf_z48z.cjf"

dicapl="699"
id="ZH011"
code="zh"
accent="seion.txt"
kjump="ON"
mode="01"

#switch;
reference="title:titl_cn.gra,graph:main.gra"
gaiji="ext_sf12.cjf"
gaiji="ext_sf16.cjf"
gaiji="ext_sf24.cjf"
gaiji="ext_zf12.cjf"
gaiji="ext_zf16.cjf"
gaiji="ext_zf24.cjf"

dicapl="699"
id="ZH012"
code="de"
accent="seion.txt"
kjump="OFF"
mode="01"

#switch;
reference="title:titl_cn.gra,graph:main.gra"
gaiji="ext_sf12.cjf"
gaiji="ext_sf16.cjf"
gaiji="ext_sf24.cjf"
gaiji="ext_zf12.cjf"
gaiji="ext_zf16.cjf"
gaiji="ext_zf24.cjf"
gaiji="ext_zf48.cjf"

dicapl="699"
id="ZH013"
code="zh"
accent="seion.txt"
kjump="ON"
mode="01"

#switch;

cat */INFGTCN6.HTM

引用:tts_lang="jp"
plural="jp,jk,en"
addin="ON,zh008d.d01"
jp_lang="en"
divid_srch="jp,en"
japjp_lng="jp"
chijp_lng="jp"
tts_lang="en"
plural="jp,en"
addin="ON,zh009d.d01"
jp_lang="en"
divid_srch="jp,en"
japjp_lng="jp"
chijp_lng="of"
tts_lang="fr"
plural="en,ex,ph"
addin="ON,zh010d.d01"
jp_lang="fr"
divid_srch="en"
japjp_lng="en"
chijp_lng="en"
tts_lang="fr"
plural="zh,zk"
addin="ON,zh011d.d01"
jp_lang="of"
divid_srch="zh"
japjp_lng="zh"
chijp_lng="zh,pn"
tts_lang="de"
plural="en,ex,ph"
addin="ON,zh012d.d01"
jp_lang="de"
divid_srch="en"
japjp_lng="en"
chijp_lng="en"
tts_lang="de"
plural="zh,zk"
addin="ON,zh013d.d01"
jp_lang="of"
divid_srch="zh"
japjp_lng="zh"
chijp_lng="zh,pn"



RE: 我觉得自由软件词典可以研究一下 - vimacs - 02-03-2018

(02-02-2018, 02:30 PM)helloworld 提到:
(02-02-2018, 10:27 AM)vimacs 提到:
(01-31-2018, 02:58 AM)helloworld 提到: 看到最近有人发了几个Casio词典,我下载了试下不知道怎么解出纯文本。版主能试试么?

https://www.reddit.com/r/ReverseEngineering/comments/7trezf/hacking_the_fxcp400_part_2_exploring_the_firmware/dtezguy/

最近我时间不是很多。而且reddit那贴里面那里磁力链接似乎是一份完整固件,还要先提取词典出来。

我看了下第一个磁力链,应该是已经提取了的词典。但只有些HTM文件是明文的,其余怎么解?

$ find */*.HTM
引用:ZH008/DICTION.HTM
ZH008/INFDPCN6.HTM
ZH008/INFGTCN6.HTM
ZH009/DICTION.HTM
ZH009/INFDPCN6.HTM
ZH009/INFGTCN6.HTM
ZH010/DICTION.HTM
ZH010/INFDPCN6.HTM
ZH010/INFGTCN6.HTM
ZH011/DICTION.HTM
ZH011/INFDPCN6.HTM
ZH011/INFGTCN6.HTM
ZH012/DICTION.HTM
ZH012/INFDPCN6.HTM
ZH012/INFGTCN6.HTM
ZH013/DICTION.HTM
ZH013/INFDPCN6.HTM
ZH013/INFGTCN6.HTM

$ cat */DICTION.HTM > cathtm.txt

引用:<html>
<head>
<title>日汉大辞典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>新编现代日语外来语词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>拉鲁斯法汉双解词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>精编汉法词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>新德汉词典(第三版)</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>现代汉德词典(第二版)</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>

我昨晚下了一份,解开了ZH008.7z看了一下,我觉得有我们感兴趣的数据的应该是体积最大的SD_CMP.CJD这样的文件,但是里面的数据的确不知道怎么认出来。


RE: 我觉得自由软件词典可以研究一下 - helloworld - 02-03-2018

(02-03-2018, 01:54 PM)vimacs 提到:
(02-02-2018, 02:30 PM)helloworld 提到:
(02-02-2018, 10:27 AM)vimacs 提到:
(01-31-2018, 02:58 AM)helloworld 提到: 看到最近有人发了几个Casio词典,我下载了试下不知道怎么解出纯文本。版主能试试么?

https://www.reddit.com/r/ReverseEngineering/comments/7trezf/hacking_the_fxcp400_part_2_exploring_the_firmware/dtezguy/

最近我时间不是很多。而且reddit那贴里面那里磁力链接似乎是一份完整固件,还要先提取词典出来。

我看了下第一个磁力链,应该是已经提取了的词典。但只有些HTM文件是明文的,其余怎么解?

$ find */*.HTM
引用:ZH008/DICTION.HTM
ZH008/INFDPCN6.HTM
ZH008/INFGTCN6.HTM
ZH009/DICTION.HTM
ZH009/INFDPCN6.HTM
ZH009/INFGTCN6.HTM
ZH010/DICTION.HTM
ZH010/INFDPCN6.HTM
ZH010/INFGTCN6.HTM
ZH011/DICTION.HTM
ZH011/INFDPCN6.HTM
ZH011/INFGTCN6.HTM
ZH012/DICTION.HTM
ZH012/INFDPCN6.HTM
ZH012/INFGTCN6.HTM
ZH013/DICTION.HTM
ZH013/INFDPCN6.HTM
ZH013/INFGTCN6.HTM

$ cat */DICTION.HTM > cathtm.txt

引用:<html>
<head>
<title>日汉大辞典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>新编现代日语外来语词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>拉鲁斯法汉双解词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>精编汉法词典</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>新德汉词典(第三版)</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>
<html>
<head>
<title>现代汉德词典(第二版)</title>
<meta name="soft" content="OFF">
</head>
<body>
</body>
</html>

我昨晚下了一份,解开了ZH008.7z看了一下,我觉得有我们感兴趣的数据的应该是体积最大的SD_CMP.CJD这样的文件,但是里面的数据的确不知道怎么认出来。

确实估计*.CJD就是词条内容,但就是不知道什么压缩方式。


RE: 我觉得自由软件词典可以研究一下 - vimacs - 11-12-2019

前段时间找到一个自由的英汉词典,质量还行。
https://github.com/skywind3000/ECDICT