跳至内容
Python 俱乐部
用户工具
登录
站点工具
搜索
工具
显示页面
修订记录
反向链接
最近更改
媒体管理器
网站地图
登录
>
最近更改
媒体管理器
网站地图
您的足迹:
modules:readability
本页面只读。您可以查看源文件,但不能更改它。如果您觉得这是系统错误,请联系管理员。
====== Python Readability ====== Readability是用[[html:JavaScript:start]]写的程序,能够自动识别HTML页面中的正文内容,将导航、菜单、广告、页脚等非正文内容剔除掉,从而留下一个HTML页面最有用的信息。 Readability有Python、php、ruby等语言的实现,这里就给大家介绍一下Readability的Python实现。 Python Readability 是基于[[modules:beautifulsoup:start|BeautifulSoup]]的,所以可移植性很好,可以在GAE上面直接使用,但是速度会稍微慢一些。 ===== 参考 ===== * Python Readability https://github.com/gfxmonk/python-readability * Readability https://www.readability.com/ * decruft http://www.minvolai.com/blog/decruft-arc90s-readability-in-python/
modules/readability.txt
· 最后更改: 2011/02/10 14:05 (外部编辑)
页面工具
显示页面
修订记录
反向链接
回到顶部