手机浏览器扫描二维码访问
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”
对应“we”
“говорим”
对应“speak”
“о”
对应“about”
“мире”
对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”
在80%的句子中翻译为“speak”
,20%翻译为“talk”
。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。
一不小心怀了三胞胎,却不知生父是谁,被渣男背叛,被家族驱逐。华丽转身,带萌宝归来,她发誓夺回自己失去的一切。女总裁霸气上线,却半路杀出个程咬金。妈咪,这个爹地我要了!爹地,这个富婆妈咪,我们帮你追!三小只密谋牵线。...
超凡兵王他是横扫千军的无敌兵王,他是人形美女收割机,花都纵横,肆无忌惮。而超凡者凌驾于一切之上,摆布天下。且看箫剑如何在超凡者的征途上,踏平一切,无敌天下!...
妖魔怪三界来袭,人间正道惨遭荼毒。为保道家至宝昆仑诀不至于被妖魔怪三界染指,昆仑掌门将其送入无尽虚无之中,苍天有眼,得保人间正道,昆仑诀九州大陆再现光彩。愿以我原气为引,重铸昆仑辉煌。...
...
她阴差阳错和他发生关系,错位的感情让人心力交瘁说好的没有未来的关系呢???这突如其来的甜蜜惊喜是怎么回事???欧总,我觉得我们还是保持距离吧,别人误会我们是一对,你不就找不到女朋友了吗?!加油,我看好你鸭!霍思琪承受不住糖衣炮弹了啊!再这么下去一失足成千古恨!呵女人,得了便宜还卖乖?他将她禁锢,拒绝了女人的犹豫,道听说民政局只要九块九,你敢开么?展开收起...
刮风减半,下雨全完。地摊少年林淼看着天空瓢泼的大雨,只能无奈收摊回家。不过就在这时候,林淼却遇到了云曦儿,得到了连通异界的机会!两界之间互相穿梭着做买卖。林淼赫然成为了自古至今最强的地摊王者!...