博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.9 拼写纠错
阅读量:5758 次
发布时间:2019-06-18

本文共 460 字,大约阅读时间需要 1 分钟。

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.9节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.9 拼写纠错

虽然并不是所有的NLP应用都会用到拼写检查器(spellchecker),但的确有些用例是需要执行基本的拼写检查的。我们可以通过纯字典查找的方式来创建一个非常基本的拼写检查器。业界也有专门为此类应用开发的一些增强型的字符串算法,用于一些模糊的字符串匹配。其中最常用的是edit-distance算法。NLTK也为我们提供了多种内置了edit-distance算法的度量模块。

>>>from nltk.metrics import edit_distance>>>edit_distance("rain","shine")3

我们将会在后续章节中更具体地介绍该模块。我们还会看到拼写检查器最优雅的实现代码之一,它出自Peter Norvig之手,这是一段用纯Python实现的、非常易于理解的代码。

转载地址:http://vltkx.baihongyu.com/

你可能感兴趣的文章
如何成为一个C++高级程序员
查看>>
ant android 打包签名和渠道
查看>>
一个简单的接口,被调用并同步给出响应的方法
查看>>
Hadoop序列化与压缩
查看>>
我的友情链接
查看>>
显式锁(第十三章)
查看>>
SCCM的证书配置PKI
查看>>
看linux书籍做的一些重要笔记(2011.07.03更新)
查看>>
CString、Char* ,char [20]、wchar_t、unsigned short转化
查看>>
从案例学RxAndroid开发(上)
查看>>
Redis学习手册(内存优化)
查看>>
浅尝TensorFlow on Kubernetes
查看>>
springboot系列十 Spring-Data-Redis
查看>>
Confluence 6 注册外部小工具
查看>>
excel进行矩阵计算
查看>>
基于Android平台的动态生成控件和动态改变控件位置的方法
查看>>
linux 死机分析
查看>>
BOM
查看>>
LeetCode:Nim Game - 尼姆博弈
查看>>
iOS: Block的循环引用
查看>>