Text-2014-08-28

From cslt Wiki
Jump to: navigation, search

一 Bilingual word embedding for phrase-based machine translation:

   1.获得思路:
       以前是先分别训练词向量,再做transform.这篇文文章在训练词向量的同时,还利用了语料中的对齐信息.
        1.1 学习对齐信息,即学习A(对齐矩阵)
        1.2 先学习transform,在学习词向量,进行迭代学习。
        1.3 将论文中的公式(5)和公式(6)同时考虑放在学习中。

二 Continuous space translation models with NN

  1. 利用标准的wsj语料训练RNNLM,看测试结果是否变好.
      1.1 训练语料:/nfs/disk/perm/data/corpora/wsj/data/wsj0/doc/lng_modl/lm_train
  2. 标准化测试集和训练集
  3. 查看邢超推荐的NNLM的训练流程


Recorded by Rong Liu