笔趣阁

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第2页)

林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?

我同时会俄语、德语、英语和汉语。”

多语言大师的身份,给林燃的理论增添了几分可信度。

在这个时代,科学家们会几门语言并不奇怪。

当然一些敏感部门会提高对你的怀疑。

以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。

“另外翻译过程,应该是模块化设计,而不是简单的映射关系。

它应该分成预处理、翻译、后处理三部分。

预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。

这样来降低单次计算的复杂度,提高规则的复用率!”

林燃的话给了在座研究团队的成员们非常多的灵感。

就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。

大家都有点迫不及待去尝试了。

所有研究人员都疯狂在笔记本上记录下林燃所说的。

虽然不确定教授的方法是否管用,但有路总比之前没有好。

再者,如果你不好好记下来,到时候被开除只是教授一句话的事。

“好了刚才我们讲了一些简单的内容,现在才是最难的。

因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

我把它叫做基于频率的词对齐。

这也是我们引入统计模型的核。

我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。

俄语句子Мыговоримомире

英语翻译:“Wespeakaboutpeace

对齐结果:“мы”

对应“we”

“говорим”

对应“speak”

“о”

对应“about”

“мире”

对应“peace”

然后我们需要对这种对齐的频率进行统计。

统计每个俄语词或短语在英语中的对应翻译出现的频率。

例如,在语料中,“говорим”

在80%的句子中翻译为“speak”

,20%翻译为“talk”

这样对于我们就可以构建概率表了。

将这些概率整理成表格,供机器进行查询。

热门小说推荐
诸天之掌控天庭

诸天之掌控天庭

常威莫明来到一片死寂的天庭南天门外,发现此门可勾连万界,穿梭时空!射雕英雄倚天屠龙大唐双龙三国群英命运之夜圣域传说穿行于幻想与现实之界,铸就君临九霄的不朽传说!...

空间之心

空间之心

天地之间有无穷位面无穷空间在这无限广阔神奇的世界中有无数妖精魔兽智慧种族万载之下英雄王者不甘消逝在岁月中挣扎求存其中又有传奇强者行走万千位面以求点燃神火得以长生所追求者不外永恒...

豪门隐龙鹿有梦

豪门隐龙鹿有梦

九代单传的叶辰接到了爷爷的电话,要给他安排相亲!爷爷您别闹!什么,给我一个亿去相亲?美女校花我未婚妻!?集团总裁要倒贴?清纯明星高调示爱!?这么多美女,叶辰有点慌!叶辰弱弱的问爷爷,还有相亲的吗?...

亿万星辰说爱你莫凝易烨泽TXT

亿万星辰说爱你莫凝易烨泽TXT

内容介绍亿万星辰说爱你莫凝易烨泽被老公出卖,我和陌生男人一夜迷情各位书友要是觉得亿万星辰说爱你莫凝易烨泽还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...

惊世毒妃:傲娇王爷强势宠

惊世毒妃:傲娇王爷强势宠

上一世南宫湘湘身为月国最高贵的公主,却沦为丈夫夺嫡的工具,闺蜜利用的棋子,以致族灭身死。转世为人,她强势归来,发誓不会再相信男人。改变不了和亲的命运?好办!嫁个死人!渣男出逃敌国了?好办!江湖追杀!美貌?功夫?她若是第二,天下无人敢称第一!今生今世,挡我者杀,害我者死,灭我者诛,且看她如何步步为营,将这天下收入囊中。不过说好的死人呢?眼前床上躺着的美男又是谁?呀呀呀!你脱衣服做什么?快快穿起来...

开局空降一个妈

开局空降一个妈

开局满级,吊打富二代。脚踩坏蛋。生活美滋滋!这就是我的,不一样的非凡人生!...

每日热搜小说推荐