Spell check

From cslt Wiki
Jump to: navigation, search

评价标准

拼写检查的评价标准:

正确率=正确识别出需要修改的个体总数 / 识别出需要修改的个体总数.

召回率=正确识别出需要修改的个体总数 / 测试集中存在的需要修改的个体总数.

准确率 = 修改对的个体总数/个体总数

注:正确识别的个体为拼写检查正确的个数,识别出的个体总数为所有进行拼写检查动作的总数.

举例:

正确:我 真 想 办理 身份证 呀. 测试用例: 我 挣 像 办理 神风证 压. 结果:我 证 想 班里 身份证 压.

动作:我->我(correct) 像->想(correct) 办理->班里(false) 神风证->身份证(correct) 挣->证(false) 压->压(false)

需要修改: 正确率=3/4. 召回率=3/4.

不要修改:正确率=1/2. 召回率=1/2.

准确率:3/6

some source

  • some algorithms of spelling correction [1][2]
  • How to Write a Spelling Corrector [3]

result

2014-11-18

2014-11-19